找到
852
篇与
互联网
相关的结果
- 第 23 页
-
AI赋能千行百业一线故事(十三):一部手机,装着田间大小事 一部手机,装着田间大小事——AI赋能千行百业一线故事(十三)9月25日,位于宁晋县的河北大曹庄农场国家级农作物品种区域试验站繁育田里,一排排粗壮的玉米秆整齐排列,沉甸甸的玉米棒籽粒饱满,即将迎来收获。河北大曹庄农场国家级农作物品种区域试验站站长张文杰打开手机,点击绿谷惠农云App,实时查看田间的温度、湿度、土壤含水量等信息。 日前,河北大曹庄农场国家级农作物品种区域试验站繁育田里,技术人员进行玉米“一喷多促”作业。河北日报记者 郝东伟摄一部手机,装着田间大小事。张文杰通过手机里安装的绿谷惠农云App,把试验站的500亩繁育田打理得井井有条。“起飞!”随着螺旋桨转动,一架多光谱无人机缓缓升空。在田垄边,技术人员熟练地操作无人机对玉米地进行智慧巡检。“以前巡田全靠双脚,地中间情况还看不清,现在无人机装上多光谱相机在空中把脉,将每个角落的情况都精准捕捉。”张文杰说,传统的巡检,一般是在地里抽查几个点位,很难做到全覆盖。现在有了多光谱无人机,不仅覆盖范围广,还精准高效,玉米生长期哪怕有一株病株,都逃不过它的“火眼金睛”。与之前相比,无人机巡检不仅大大节省了人力和时间,巡检结果通过平台的AI算法深度分析,还能很快生成农田“健康地图”和管理措施建议,让种地从凭经验变成看数据。张文杰口中所说的平台,是他们引进应用的绿谷惠农智脑AI大模型平台。该平台由河北绿谷信息科技有限公司联合河北省数字农业产业技术研究院、河北省农林科学院和石家庄学院等产学研单位共同完成,是国内首个覆盖耕、种、管、收全链条的绿谷智慧农场平台。河北绿谷信息科技有限公司运营经理骆晚侠介绍,惠农智脑AI大模型平台实现国产推理大模型DeepSeek的本地部署,融合“天空地人机”全域感知与多模态交互,一键解锁高效AI生产力。“平台可以实现农作物的精准种植,AI能够秒级分析土壤、气象数据,生成最优种植方案。”骆晚侠说,这有助于农民根据实际的土壤条件和气象变化,选择最合适的作物品种、种植时间和种植密度等,作物可实现增产10%以上。俗话说,粮食收多收少在于肥,有收无收在于水。在试验站,一个人,一部手机,玉米灌溉施肥就能轻松搞定。“一键轻触,阀门就能打开,让玉米‘吃饱喝足’,智慧灌溉已成为好帮手。”张文杰打开手机向记者演示,“你看,通过手机App发出指令,一键启动,田里的玉米就能得到精准灌溉。”节水灌溉是农业节水的重要抓手。绿谷惠农智脑AI大模型平台通过动态分析田间水分状况,可实时预测干旱或涝灾风险,并提供精准灌溉建议,使灌溉管理从“凭经验浇水”转变为科学灌溉,有效避免了水资源浪费和因水分管理不当导致的产量损失。“地里墒情怎么样,该不该浇、该浇多少,过去靠经验,现在有了智慧灌溉系统,全部由AI说了算。”张文杰说,水肥一体化让水肥都用到了刀刃上,相比传统灌溉施肥,亩均节水30%以上,节肥10%至15%,同时可减少土壤板结,改善根系微环境,促进增产增收。在传统农业生产中,病虫害防治往往是“见虫施药”,农户凭经验判断施药时机和用量,不仅容易造成农药滥用,还常因错过最佳防控期导致减产。在试验站繁育田里,一款智能虫情测报灯将被诱捕的害虫数据转化为预警信息——这份“虫害预报”会准时推送到张文杰手机上,提醒他们提前防治。“往年得人跑地里去调查虫情发生情况,一不小心错过几天,虫害可能就大爆发了。”张文杰滑动着手机里的虫情监测信息,屏幕上二点委夜蛾、暗黑鳃金龟等害虫的捕获数量及发生趋势一目了然。“这款智能虫情测报灯的核心优势,在于诱虫+拍照+AI识别的一体化设计。”骆晚侠介绍,它首先通过诱虫光源吸引害虫,害虫落入指定区域后,设备会自动拍照,然后内置的AI识别模块会立即对照片中的害虫进行分析,同时统计数量,并将结果实时上传至平台,让防治从“被动灭虫”变成“主动设防”。AI大模型的广泛应用,不仅提升了农业生产效率,还降低了信息获取门槛,成为众多农户的“趁手兵器”。宁晋县科优粮食种植专业合作社负责人柳义龙今年种植了2000亩玉米,按照玉米单产提升技术方案,采用的是宽窄行种植+微喷带的种植管理模式。柳义龙说,合作社建立了农作物病虫监测站,可随时监测农田苗情、墒情、病情、虫情,不仅预报准还及时,相当于为他们种地提供了千里眼。“平台像一位不知疲倦的坐诊医生,可为农技人员和农户提供全天候AI问诊,及时解决全产业链农业生产过程中遇到的各种问题。”骆晚侠说,目前,绿谷惠农智脑AI大模型平台已经在河北省多个示范园区成功落地,服务面积超过30万亩,未来将推广到全国主要农业产区,助力农业数字化转型。田间作业离不开农具,而AI“新农具”正为传统农业带来变革。河北省已支持宁晋县、石家庄市栾城区等81个县(市、区)开展现代“种养加”生态农业展示、创新、应用示范区建设,加强智慧大田、智慧设施农业、智慧畜牧和智慧水产等应用集成。(河北日报记者 郝东伟) -
ChatGPT推出即时结账功能重塑电商格局 据悉,美国的ChatGPT用户现在可以在对话中在Etsy和Shopify上购物。OpenAI的新即时结账功能可供ChatGPT Pro、Plus和Free登录用户从美国Etsy卖家处购买商品。据OpenAI称,超过100万Shopify商家即将推出。Etsy股价周一收盘上涨近16%,Shopify股价收盘上涨逾6%。即时结账功能基于ChatGPT之前的购物功能。用户无需离开对话,只需点击“购买”即可确认订单、配送和付款详情,完成购买。去年,Perplexity推出了类似的聊天内购物和支付功能。微软还通过Copilot Merchant Program为商家提供创建聊天内店面的功能。这种无摩擦的体验有可能引发人们网上购物的新潮流,从谷歌等搜索引擎和亚马逊等电子商务平台转向具有精心策划的推荐、比较和轻松结账体验的对话代理,也为电商领域新兴力量的出现奠定了基础。谷歌和亚马逊长期以来一直是零售发现的守门人,如果越来越多的购买行为在人工智能聊天机器人内部发生,那么这些机器人背后的公司将对哪些产品会被展示以及收取多少佣金或费用拥有更大的控制权。OpenAI在一篇博客文章中表示,其呈现的产品结果是“有机且无赞助的,完全根据与用户的相关性进行排名”,并且将向商家收取已完成购买的“少量费用”。除了推出聊天结账功能外,OpenAI还表示将开源其Agentic Commerce Protocol(ACP),即支持Stripe构建的即时结账的技术,以便其他商家和开发人员可以集成Agentic结账。 -
OpenAI版“TikTok”浮出水面:所有内容强制AI生成 9月30日消息,据《连线》杂志(WIRED)获悉,OpenAI正计划为其AI视频生成模型Sora 2推出一个独立的社交应用。该应用在界面设计和用户体验上与当前热门的短视频平台TikTok极为相似,其市场定位不言自明。这款应用采用竖屏视频流布局,支持滑动切换的浏览方式,并设有基于算法推荐的“为你推荐”页面。在视频播放界面右侧,设有包含点赞、评论和“混剪创作”等功能的互动菜单。 与TikTok等传统平台最大的区别在于,该平台上的所有内容都将由AI生成。应用内没有提供从用户相册或其他应用上传照片或视频的选项,用户只能借助Sora 2模型生成最长10秒的原创视频片段。据悉,OpenAI已于上周在内部启动该应用的测试,员工反馈普遍积极。内部资料显示,员工使用频率相当高,甚至有管理人员戏称这可能影响工作效率。 有业内分析指出,OpenAI此举意在复制ChatGPT的成功经验,通过打造独立的互动式应用,让用户以全新方式体验AI视频生成的潜力。 另有内部观点认为,在当前TikTok美国业务前景不明朗的背景下,这为OpenAI推出一个不与中国市场紧密关联的短视频应用提供了独特机遇。 社交新玩法:AI肖像的使用与争议 OpenAI于去年12月正式推出视频生成模型Sora。初期,用户仅能通过网页端访问,随后该功能被整合至ChatGPT应用中。作为当时最先进的AI视频生成工具之一,Sora仍存在一定局限性。OpenAI坦言,该模型在理解物理规律方面尚有不足,尤其在生成长视频时,难以呈现完全逼真的动作场景。 为了增强社交属性,Sora 2应用将推出一项颇具争议的身份验证功能,为社交互动带来全新的可能。用户完成身份验证后,即可在AI生成的视频中使用自己的数字化肖像。此外,该功能还允许用户在使用他人已验证肖像时进行标记,比如可以生成一段与好友同游主题公园、共乘过山车的虚拟视频。 然而,这项创新功能也引发了隐私安全方面的担忧。据知情人士透露,即使用户的肖像仅被用于未发布的草稿视频,本人也会收到使用通知。在深度伪造技术引发广泛关注的当下,这一功能如何防范非自愿的肖像使用成为外界关注的焦点。目前,关于用户是否能够设置肖像使用的权限管理,或选择完全退出该功能,仍有待官方进一步说明。 这种技术革新与好莱坞创意群体的诉求形成鲜明对比。影视行业从业者始终坚持,AI公司在使用其作品训练模型或生成内容时,必须获得授权并提供合理补偿。今年春季,OpenAI与谷歌曾公开游说美国政府将AI训练纳入版权法的“合理使用”范畴,此举遭到好莱坞超过400位演员、导演、音乐人等创意工作者的联署反对,他们认为美国在AI领域的优势不应以牺牲其创意产业为代价。 与OpenAI的积极探索形成对比的是,TikTok对AI生成内容持更为审慎的态度。该平台近期更新了社区准则,明确禁止“在重大公共议题上具有误导性或对个人有害的”AI生成内容,展现出不同的发展路径。 版权新政:“选择退出”机制引发反弹 在推出新应用的同时,Sora 2在版权处理上的一项重大调整引发了广泛关注。 据知情人士透露,OpenAI计划在新版本中引入“选择退出”(Opt-out)机制。这意味着,除非版权持有者(如电影公司、艺术家等)明确要求OpenAI不要在生成视频中包含其受版权保护的角色或内容,否则Sora 2将默认可以使用这些素材。上周,OpenAI已开始就这项新规及具体操作流程向各大演艺经纪公司和制片厂进行通报。值得注意的是,该机制并不支持“一次性”的全面退出模式。据了解,OpenAI不会接受艺术家或工作室对其全部作品提出的整体“选择退出”申请,而是向部分机构提供了侵权举报链接,供其针对具体的侵权行为进行维权。 尽管在版权素材使用上采取了开放态度,但知情人士强调,新版本仍将坚守底线:未经明确许可,不会生成可识别的公众人物的图像。OpenAI首席战略官杰森·权(Jason Kwon)对此表示:“我们采取的基本策略是将肖像权与版权区别对待。”这一政策被视为AI企业在内容获取上日趋激进的最新例证,立即引发了创意产业的强烈反应。AI授权与保护平台Vermillio的首席执行官丹·尼利(Dan Neely)评论道:“对AI领域的众多从业者而言,这一举措坐实了长期存在的担忧,也凸显出建立行业规范的必要性。”多重考验:法律、安全与竞争 目前,OpenAI正面临一系列关于版权侵权的诉讼,包括《纽约时报》提起的、备受关注的案件。 在德国,音乐版权组织GEMA也已对OpenAI提起诉讼,指控其在未获授权的情况下使用受版权保护的歌词训练大语言模型。GEMA指出,ChatGPT仅凭简单提示就能准确复现大量歌词内容,表明这些歌词已实质上被存储于模型中,构成直接侵权。对此,OpenAI辩称其模型所呈现的是“学习到的模式”,而非对具体数据的存储或复制,并强调内容生成的责任最终应由用户承担。 与此同时,儿童安全问题也为OpenAI带来日益沉重的压力。该公司近期推出了新的家长控制功能,并正在研发年龄预测工具,旨在为未成年用户提供功能受限的“安全版”ChatGPT。然而,Sora 2应用将配套怎样的年龄限制措施,目前仍不明确。尽管OpenAI声称Sora 2内置了版权保护机制与内容过滤器,但其实际效果备受质疑,因为此前多个模型的测试结果均表明,其安全防护并非无懈可击。在竞争层面,Sora 2将直面Meta、谷歌等科技巨头的同类产品的围剿。上周,Meta在其Meta AI应用中推出了专注于AI短视频创作与分享的“Vibes”内容流;而谷歌也在本月早些时候宣布,将把其新一代视频模型Veo 3的定制版本接入YouTube平台。面对日趋激烈的市场竞争,以及由版权、安全与伦理问题引发的多重争议,Sora 2能否在市场中站稳脚跟,仍需时间与实践的检验。截至发稿前,OpenAI对此一系列问题仍保持沉默,未予置评。(小小) -
罕见!DeepSeek、寒武纪同步发布 【导读】DeepSeek、寒武纪同步发布相关重要事项中国基金报记者 卢鸰国内两大AI巨头DeepSeek(深度求索)、寒武纪罕见同步发布相关重要事项。DeepSeek官方微信号9月29日18:07发文称,“今天,我们正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并向我们反馈意见。” DeepSeek表示,“在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp,访问方式保持不变。”仅仅4分钟后,即18:11,寒武纪旗下的微信公众号“寒武纪开发者”发布文章称:“2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。” 寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。寒武纪称,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。“依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。”寒武纪强调。在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度协同。这表明,或许早在DeepSeek-V3.2发布之前,寒武纪就在技术方面与DeepSeek进行沟通,并启动相关适配研发工作。编辑:杜妍校对:纪元制作:小茉审核:陈墨 注:本文封面图由AI生成版权声明《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。授权转载合作联系人:于先生(电话:0755-82468670) -
当AI学会“自己动手”:工业智能体能否引爆下一场制造革命? 自动化技术让工业生产得以按照预设流程精准运行,但人工智能的浪潮,正推动制造业从“自动化”迈向“自主化”的下一阶段——系统不仅能执行命令,更能自主决策、动态适应,在复杂多变的工业环境下寻找最优解。想象一下,在这样的工厂中,系统会预测订单变化来灵活排产,提前感知设备潜在故障并触发维保方案,动态调整工艺参数以确保产品质量,根据生产节奏优化厂内物流路线……这一切都不需要人工逐条输入,而是由“工业智能体”在理解全局目标和约束的基础上自主决策、执行。我们离这样的场景还有多远?企业在部署工业智能体方面都有哪些探索和挑战?这一技术究竟是现有自动化系统的锦上添花,还是足以颠覆生产范式的革命性力量?为了探寻答案,我们深入制造业一线,结合西门子与至顶科技在工博会期间联合发布的《2025工业智能体应用现状与趋势展望报告》,以及对国内多家制造企业与行业专家的深度访谈,试图揭示工业智能体在真实世界中的应用现状、挑战与未来。智能与自主:什么是“工业智能体”?通用人工智能的演进遵循着从聊天机器人(Chatbot)到“副驾驶”(Copilot),再到智能体(Agent)的路径。聊天机器人被动地回答问题,智能“副驾驶”能辅助人类完成特定任务,已具备一定的自主能力,而智能体的核心特征就在于高度“自主性”——它不只是“听指令”,更能“做决策、真干活”,可以自主感知、规划,并调用工具来完成目标。 长久以来,工业控制的逻辑建立在精确的预设程序之上。这种基于规则驱动的自动化系统,虽然高效稳定,但其本质是“听话”的工具,一旦产品或环境发生变化,就需要人工重新编程和调整。“‘智能体’的概念一直都有,比如说变压器开关就可以说是早期的智能体,它能够感知电压过载并进行熔断的决策,只不过这个决策非常简单。”复旦大学计算与智能创新学院教授、上海市数据科学重点实验室主任肖仰华解释道,“我们重提智能体,主要是因为它在大模型加持下,自主性有着以前达不到的水平。”“传统的工业AI应用更多停留在‘感知+识别’层面,本质上是对人类经验的数字化复制和自动化执行。工业智能体则实现了从‘感知智能’到‘认知智能’再到‘决策智能’的跨越,具备了在复杂工业环境中进行自主判断、动态调整和持续优化的能力。”上海市人工智能行业协会秘书长钟俊浩说。这些能力让工业智能体在车间和产线上“大显身手”。机械工业第六设计研究院有限公司总工艺师、智能制造研究院院长刘波认为,工业智能体“代表了一系列广义的AI技术应用,但其核心是要能实现环境感知、数据分析、决策优化,并最终驱动末端设备执行,本质上追求的是更高程度的自主化。”“好的智能体具备四个条件:‘有知识’、‘善理解’、‘会思考’以及‘强执行’。”肖仰华说。在许多一线从业者看来,工业智能体的应用是一场渐进式的革命。一家头部食品饮料企业的AI负责人认为,智能体的核心是“辅助和优化决策”,其公司早已基于机器学习、视觉识别等AI技术和垂类模型,在供应链预测、质量检测等场景中实现了初步的智能决策。而能够理解自然语言、进行推理的大语言模型,更像是为这些早已存在的“大脑”提供了一个更自然的交互界面。另一家头部新能源汽车企业的AI负责人则更强调智能体作为一个完整系统的角色。他将其定义为“连接整个大模型跟整个应用场景的一个(载体)”,并强调其必须具备双向闭环能力。“他们必须要把整个大模型的能力赋予整个技术场景来解决问题,”他说,“同时要从整个产品里面把相关的反馈在整个大模型里面,再形成一个双向的闭环。” 要理解工业智能体如何工作,西门子携手中国十五冶打造的有色金属冶炼案例提供了具象的视角。在炼铜行业,冰铜是纯铜诞生前的“半成品”,冰铜品位指冰铜中铜的含量,过高或过低都会影响成品质量和炉体寿命。传统模式下,冰铜品位调控比较粗放,高度依靠“老师傅”把关。西门子与中国十五冶合作,整合多工艺段设备数据,以及行业文献、工艺规范和“老师傅”口口相传的经验,打造了炼铜行业首个下沉到边缘的智能体。它不需要反复通过聊天指令推进任务,自己就能独立完成从趋势预测、参数寻优到深度推理的全过程。该案例是典型的智能体在生产制造过程中的应用。其实,不仅是生产制造环节,西门子Industrial Copilot融合生成式工业人工智能助手与智能化系统,覆盖研发、工程与运维等多个关键环节,能够全方位赋能工业价值创造。在研发环节,集成智能体的工业软件基于简单的工程师指令即可告知操作方法,甚至直接生成相关模型;在工程环节,人工智能助手与TIA博途无缝集成,把工程师的自然语言需求直接转化为工程成果,快速生成PLC程序与HMI界面;在价值点分布更广的运维环节,人工智能助手与多智能体协同,通过简单交互即可灵活调用工业软件、模型等工具,提供诊断支持与优化建议。总体来看,工业智能体是推动工业自动化向自主化演进的关键力量。它既包含了各类AI技术在工业场景的深化应用,也指向一个终极目标——构建能够像人一样思考、决策和行动的自主工业系统。观望与探索:工业智能体的落地情况·一半观望,一半探索在国家“制造强国”与“人工智能+”战略的推动下,制造业的智能化转型已是大势所趋。今年8月,国务院发布《关于深入实施“人工智能+”行动的意见》,明确“推进工业全要素智能化发展”的目标。“这标志着国家层面将工业智能体发展提升到战略高度。”钟俊浩说。 然而,作为一项新兴技术,工业智能体行业仍处于早期发展阶段,大部分企业仍在“岸上”谨慎评估。由西门子与至顶科技联合发布的《2025工业智能体应用现状与趋势展望报告》(以下简称《报告》),调研对象覆盖约10个重点行业的200余家中国制造企业,结果显示,43%的受访制造企业尚未部署工业智能体,仍处在观望阶段;24%的企业仅在少量场景中初步应用;而实现多场景部署的,仅有8%。 化工与材料领域积极尝试工业智能体应用一些先行者已经蹚出了务实的路径。一家头部重工制造企业的AI负责人透露,他们早在2021至2022年便开始部署相关系统,在新建的“灯塔工厂”中,已经能够实现从接收订单、动态排产到生产执行的全流程打通,基本无需人为介入。更多的企业则选择了更适合现有工厂与产线的“点状突破”策略。前述新能源汽车企业将智能体应用聚焦在两个关键场景:一是将复杂的质量标准和工艺规范知识化,形成智能体,用于生产过程中的质量检测;二是在设备运维方面,通过智能体实现预测性维护和故障排查指引。而受访食品饮料企业部署的智能体则在供应链需求预测和营销端的视觉识别等场景取得了显著成效。·全流程的自主化从自动化到自主化的趋势,正在制造全流程中逐步渗透。报告数据显示,生产制造(44%)、研发设计(32%)和运行维护(25%)是企业部署工业智能体的三大核心场景。 生产制造为主要应用环节,化工、汽车、冶金企业积极尝试在生产制造环节,智能体正成为提升效率与质量的关键。上述重工企业通过智能体实现了生产资源的动态排产与调度;新能源汽车企业利用智能体对焊接过程中的电流、电压等数据进行分析,实时优化参数,确保焊接质量;食品饮料企业则通过视觉智能体自动完成质检,替代了大量重复性的人工劳动。在运行维护环节,智能体扮演着“数字专家”的角色。这家新能源汽车企业与科技厂商合作,开发了设备运维智能体,具备预测性维护的功能。当监测系统发现问题时,它会自动提示并分析故障来源。另外,该智能体还整合了工业领域的专家知识库,员工只需用自然语言描述故障,智能体便能分析原因并提供详细的解决方案和操作指引。而在研发设计环节,不同行业的应用情况则呈现差异。汽车企业的负责人认为,由于已有成熟的虚拟仿真软件和代码生成工具,研发环节的智能化落地难度相对较小。但食品饮料企业因其行业特殊性(核心研发在于配方),AI的应用则相对有限,更多是辅助市场部门进行消费者口味偏好的数据分析。刘波指出,在一些特定领域,智能化应用已相对成熟,例如构建数字孪生工厂进行仿真优化、产线的柔性换产、核心工艺过程的优化以及设备的预测性维护等。这些场景的成功落地为更广泛的应用提供了信心和范本。·降本增效的核心价值除了政策利好之外,企业为何要拥抱智能体?《报告》提到,提升效率(77%)和降低成本(62%)是企业最看重的两大价值。 企业普遍认同智能体可提升效率,小微企业看重降低成本和优化管理“我们通过AI优化钢材的排版和使用,仅仅降低1%的用量,一年就能节约成本超一亿元。”受访的重工制造企业的负责人分享了工业智能体的部署所带来的切实效益。而上述食品饮料企业则表示,过去销售人员需要手动巡查、拍照、录入商超中的产品“堆头”(促销陈列),现在,通过视觉智能体,拍照即可自动识别和统计,极大地解放了人力,提升了数据反馈的及时性和准确性。成本、人才、技术与安全:智能体落地的挑战·成本与收益之问尽管前景诱人,但将聪明的AI“请”进工厂,并让它可靠地“干活”,却面临着重重挑战。其中,成本是企业考虑最多的问题。《报告》显示,63%的企业将“部署成本高”列为首要挑战。这笔账远不止一笔采购费那么简单,还涉及与现有系统集成等隐性成本,改造投入甚至可能超过智能体开发和购买本身。“不同厂商、不同时期的标准协议都不一样,”上述重工制造企业的负责人坦言,“我们工业智能体要串联起来,就需要全域的数据联通,这是非常难的一件事。”除了前期投入之外,部署智能体的收益周期也相对较长。“如果是采用云端轻量级部署,投资回报可能就是一年到两年。企业级的本地部署,投资回收期会长一些,一般要五到六年。”刘波说。这些因素让不少决策者望而却步。前述食品饮料企业的负责人也坦言:“没见到结果之前,无论是人员投入还是资源投入都会有所顾忌。”尽管如此,专家们普遍认为企业仍应积极拥抱科技创新带来的产业变革。肖仰华强调,智能体带来的影响远超技术应用本身,它关乎生产关系的重构。即使面临ROI(投资回报率)不确定性,企业也应当从战略高度去思考和布局。·“懂算法的不懂生产”:人才的结构性短缺 企业成本压力普遍较大,人才短缺也备受关注报告中,“缺乏专业人才”(46%)是第二大挑战。这个问题在访谈中得到了所有企业负责人的共鸣——市场极度缺乏既懂技术又懂现场的“跨界人才”。“最大的挑战在于,算法的人员他不懂生产,生产的人员不懂算法,这两者之间怎么打通?”上述重工制造企业的负责人直言。“我们今天处在一个技术供给远远超出我们技术消费的时代。解决问题的技术可能早就有了,最大的瓶颈是人,缺乏能够结合当下技术成熟度,分级分类地去选用相应技术来解决问题的人才。”肖仰华表示。钟俊浩一针见血地指出了当前复合型人才培养面临的“三重脱节”困境:高校培养与企业需求脱节、产学研合作深度不够、行业认证体系不完善。刘波认为,人才培养的方向应该是让懂制造的人才具备数字化素养,“核心是制造,制造是本质,智能化是赋能手段。首先应该具备制造的知识,在此基础上去培养数字化素养。”而这个过程需要时间以及社会各方面的配合。·面对复杂工业场景,智能体技术准备好了吗?除了成本与人才,40%的企业也认为工业智能体的“技术不成熟”。这种“不成熟”主要体现在模型的“水土不服”和结果的“不可靠”。“工业是含金量最高的‘战场’,却也是‘最难啃的骨头’。AI落地工业需要融合大模型、行业知识、高质量数据与应用场景,其中,行业know-how是工业企业制胜AI时代的底层核心能力。”西门子全球执行副总裁、大中华区总裁兼首席执行官肖松博士在《报告》发布现场提到。尽管AI技术本身在不断进步,但通用语言大模型难以直接应用于工业生产。上述新能源汽车企业的负责人解释道,大语言模型主要基于互联网文本数据训练,而工业数据是“杂乱”且多模态的(包含时间序列、图纸参数、工艺配方、三维建模等),“这样的数据特征决定了它在工业领域的应用边界”。工业垂类模型因此成为必需品,但这需要深厚的行业知识积累和数据沉淀。“现在通用人工智能就好比发电厂发出很强的电,但是不是大家就能用呢?最终还得有好的电器设备。”肖仰华也认为,通用AI抬高了智能的天花板,但真正落地需专业化路径,如知识图谱等弥补知识不足。同时,AI的概率性输出与工业生产要求的高度确定性之间存在天然矛盾。上述重工企业负责人表示,AI无法达到“百分之百的准确率”,在安全生产等“零容忍”场景中应用受限。智能体目前更多是“辅助决策”,而非“替代决策”,最终判断仍需人的介入进行方向把控和价值判断,形成人机互补协同(human-in-the-loop),·数据安全的隐忧训练AI模型、建造智能平台都需要数据,企业可以自己部署,也可以向外部厂商购买智能化定制服务。即使在SaaS(软件服务)模式提供更低成本和更快部署的情况下,仍有50%的企业倾向于本地私有化部署,这背后主要是对工业数据安全的考量。本地部署不仅意味着物理隔离,更能满足低延迟的生产环节。某重工业和汽车制造企业都明确,核心生产数据绝不出厂,外部供应商需要“来现场使用我们的数据”进行开发,这是典型的“数据不出域”策略,但也同时透露这种以自研为主的创新路径面临成本和效率的双重挑战。有企业负责人也表示,在业务敏感度低、实时性要求不高、数据分布广泛以及算力要求高的场景,如设备预测性维护、营销与售后客服、设计研发等,云端部署则更具性价比。这些数据表明,企业正在根据业务的敏感度和实时性要求,灵活采用混合部署策略。对于中小企业来说,成本、AI技术本地化能力和柔性生产的能力可能是部署工业智能体最主要的障碍,而专业的服务提供商能够提供相应的解决方案。刘波指出,SaaS模式以其低成本、高效率的优势,为中小企业尝试工业智能体提供了可行的路径:“采用这种云端轻量级部署,算力资源、大模型采用云服务,在工厂侧布一些端侧设备,这样投资较小,回报较快。”更自主,更系统,更开放:工业智能体的趋势未来未来的工厂将是什么样?刘波描绘了一幅蓝图:“它会实现全工厂的动态感知和实时决策,具备柔性生产和自主组织的能力。”在这种模式下,人的角色将发生根本性转变,“人会从自己解决生产问题,变成向机器提出正确的问题,这可能是比较重要的一个转变。”伴随着制造自主化水平的提升,工业智能体也将不再是解决单一问题的孤立工具,这一点已经在很多落地应用中初现端倪。未来的工厂将由多个智能体协同工作,形成一个庞大的“神经网络”,实现全链路的动态调优。“大型制造业无疑会从单点智能体走向系统智能体。”上述重工制造企业负责人判断。同时,多智能体系统也能调用不同模型和工具的能力,比如通用大模型负责交互和通用知识,而处理具体工业任务(如工艺参数优化、异常检测)则交给更懂行的工业垂类模型。肖仰华认为,工业智能体所带来的变革核心在于对生产力要素的重构。“具有高度自主决策水平的智能体,本质上就是新型的劳动力。”这将促使企业从组织架构、业务流程到经营管理都进行一场“智能原生”的深刻变革,而不仅仅是简单的“AI+”。企业单打独斗的时代已经过去。《报告》显示,68%的企业愿意与外部科技厂商合作共创。这种合作并非简单的采购关系,而是数据、技术和场景知识的深度融合,包括工业模型的共创。实践中已经涌现出多种模式:食品饮料企业与大学的产学研合作,新能源车企与科技巨头的技术合作,以及重工企业与各类专业供应商的场景合作。钟俊浩认为,一个完善的工业智能体生态,应包含技术底座提供方、行业解决方案商、数据服务商和系统集成商、标准认证机构和产业投资机构等关键角色,形成“技术-产业-应用-服务”的完整闭环。一场工业的智能革命,或许已经悄然打响。工业智能体正从一个前沿概念,具体化为生产线上的质检员、供应链里的预测师、设备旁的维护专家。从自动化到自主化的跃迁之路,漫长而充满挑战,但它所指向的,是一个更高效、更柔性、更智能的制造业未来。对于国家而言,面对全球产业链重构和国内市场转型的挑战,工业智能体通过赋能生产线的自主决策与优化,有望将制造业的竞争优势从“人口红利”转向“技术红利”和“智能红利”。扫描上方图片内二维码,查看报告全文 -
具身机器人工坊落址南沙!这个国庆,到N+聚所感受科技魅力 9月28日,"具身机器人工坊"落址南沙越秀N+聚所,并举行开幕仪式。本次工坊由南沙区科学技术局、南沙区工业和信息化局指导、香港科技大学(广州)类人计算团队全程主导,将集中展示具身智能机器人领域的最新技术成果,为粤港澳大湾区的科技创新发展注入全新活力。本次活动生动诠释了科技与艺术的完美交融,造型各异的具身智能机器人在音乐伴奏下,精准完成了各种舞蹈动作,一场别开生面的机器人表演秀将现场气氛推向高潮。 来自越秀·天悦云啟一路之隔的港科广类人计算团队博士生,详细解读了具身智能机器人的核心技术突破。与传统机器人不同,具身智能机器人具备高度仿生的感知能力、自主决策能力和精准执行能力,能够更好地理解和适应人类环境,实现真正意义上的"人机共融"。谈到工坊落地越秀N+聚所的原因,港科广类人计算团队博士生表示,“这里独特的创新氛围和资源整合能力很吸引我们,在这里,我们的研究成果不仅能够获得展示的机会,更能够与产业界、投资界以及最终用户进行深度交流,这对于技术的进一步完善和商业化具有不可估量的价值。”越秀地产湾区公司相关领导表示,具身机器人工坊的落地,是“跨界、无界”合作理念的具体实践,也希望通过展示科技成果,营造创新氛围,吸引更多伙伴加入,共同建设“产学研居”融合的活力社区。 众所周知,庆盛被定义为广州南沙科学城国际创新创业社区,为跨界合作提供了独特的环境优势。越秀·天悦云啟通过“1个内谷+1个广场+1条低街+1条高街+1个盒子”的立体架构,无缝串联港科大校区、iPARK产业园、住宅区及庆盛枢纽,形成“步行5分钟科创生活圈”,将研究、创新、生活融为一体,这里创造了一种全新的工作生活方式,让创新者能够在更加舒适、便捷的环境中发挥创造力。经过一年的运营,配套逐步兑现,麦当劳已于9月正式营业。 国庆中秋双节将至,越秀N+聚所以“科创盛宴”与“园林雅趣”双线融合,为市民打造兼具科技感与生活味的假期新选择。10月1日起,更多科创体验将陆续登场。10月1日,机器人工坊将正式对外开放参观;10月2日,“科学实验造物所”专为青少年设计,带领孩子们探索科学奥秘;10月3日的“朋克机器人造物所”在动手实践中感受创意与科技的碰撞;10月4日,“亲子拳击训练局”,在运动中体验不一样的亲子互动乐趣;10月6日恰逢中秋佳节,“冰皮月饼造物所”将邀请专业师傅现场指导,感受中秋民俗文化;10月7日,“麦当劳小小汉堡师”活动,孩子们可亲手制作汉堡,体会劳动的快乐。除了丰富的科创活动,越秀N+聚所结合中秋氛围,精心打造了实体园林,情景式架空层将于国庆期间对外开放。项目在售建面约89-169㎡三至四房,均为南沙首批新规产品,总价仅需178万起,今年买明年住。另据项目负责人介绍,项目已正式启动保价护航活动,明确保价至2025年12月31日(具体以现场公示为准),期间购房客户若遇价格下调,可享受差价补偿。采写:南都·湾财社记者 王艳玲 -
早报|「越狱神器」91助手停止服务/雷军:小米汽车定制服务推动科技平权/黄仁勋:应该把钱都给OpenAI OpenAI 被指「偷换模型」,神秘新模型曝光雷军解读汽车高定服务:让更多人体验到百万豪车的定制服务王健林被限制高消费,万达集团此前被强制执行超 4 亿元错失 OpenAI 早期投资,黄仁勋:我们太穷了,没投够面世 21 年,「越狱神器」91 助手停止服务iPhone 17 Pro 首次用于美国职业棒球赛事转播西贝贾国龙多平台清空账号,仅留一条视频作品摩尔线程成功过会,手握 20 亿订单俄罗斯公布国产 EUV 光刻设备长期路线图,目标 2037 年实现亚 10nm 制程GitHub 或被澳大利亚列为「危害未成年人的社交平台」彭博社:美国卖得最好的车是二手电动车法拉第未来官宣 FF 91 2.0 新车主追觅汽车七项专利遭质疑宝马因部件安全隐患召回超 33 万辆汽车马斯克官宣特斯拉 FSD V14 下周推送,称车会变得「富有灵性」印度首批 Model Y 正式交付,全部来自上海超级工厂机器人专家:人形机器人的投资泡沫必将破裂售价 3.5 万元,前苹果首席设计师 Jony Ive 携手 Balmuda 推出便携航海灯第三方厂商让复古卡西欧手表变成「智能手表」,还能玩小游戏一加 15 开启预约,「原色沙丘」配色更多细节公布腾讯开源「混元图像 3.0」,对标业界领先闭源模型 OpenAI 被指「偷换模型」,神秘新模型曝光 日前,一名叫「Lex(@xw33bttv)」的用户在 X 平台上发文,声称 OpenAI 已经悄然上线一款名为「GPT-5-Chat-Safety」的新模型,该模型并未出现在 FAQ、API 文档或服务条款中。据描述,当用户在 GPT-4o 中输入带有情感背景的内容时,原始回复会被忽略并替换为由「GPT-5-Chat-Safety」生成的版本。无论是「我今天过得很糟」、还是「我也爱你」等涉及情绪的表达,都会触发这一机制。 爆料者指出,这一模型最初可能是为危机干预场景设计,但这一替换机制极不透明,甚至被广泛应用于普通对话中,导致用户在不知情的情况下被切换至新模型。甚至,有网友在评论指出,只是发送了一个简单的「你好」就被替换模型。更令人担忧的是,系统不会主动提示用户已被切换,外界认为这可能涉及消费者权益问题。从实际体验来看,「GPT-5-Chat-Safety」的回答更为简短,并倾向于使用格式化的叙述方式,而非自然的 1 对 1 对话。Lex 直言,这款模型比 GPT-5「要差得多」,并指出这一行为在一些国家和地区违反了消费者法。对此,OpenAI 副总裁兼 ChatGPT 应用主管 Nick Turley 昨日在 X 平台上发表声明,承认OpenAI 正在测试新的安全路由系统。他解释称,当对话涉及敏感和情感话题时,系统会切换至专门设计用于严谨处理此类情景的推理模型或 GPT-5。 雷军解读汽车高定服务:让更多人体验到百万豪车的定制服务 今日早晨,小米集团董事长、CEO 雷军在微博发文,针对日前推出的小米汽车高定服务作出解读。雷军表示,这一服务以往仅存在于顶级豪华汽车品牌,代表着昂贵、复杂与极致的设计,如今被小米引入,以推动「科技平权、体验平权」。雷军表示,小米定制服务面向「有独特品味、审美鲜明、追求自我表达」的人群,通过该服务,用户可获得媲美百万豪车的个性化定制体验。据介绍,小米定制服务将提供: 超豪华品牌般的多样化选择,满足个性化审美需求; 顶级材质与精湛工艺,还原高级色彩与设计; 专属定制服务中心,带来接近超豪华品牌的看车与购车体验。 雷军强调,小米希望通过这一举措,让更多人享受到过去只属于豪车用户的高端定制体验,为小米汽车的设计带来更多可能性。据此前报道,小米汽车高定服务于 9 月 25 日的雷军年度演讲暨小米秋季新品发布会正式亮相,并开启为期一年的试运营,每月最多定制 40 台,包含多种定制选项。王健林被限制高消费,万达集团此前被强制执行超 4 亿元 据九派新闻报道、企查查 APP 显示,近日,大连万达集团股份有限公司及其法定代表人王健林等被限制高消费。此前,据第一财经报道,中国执行信息公开网显示,大连万达集团股份有限公司新增一则被执行人信息,执行标的超 4 亿元,执行法院为北京金融法院。公开资料显示,大连万达集团成立于 1992 年 9 月,注册资本 10 亿元人民币,法定代表人为王健林。股东信息显示,该公司由大连合兴投资有限公司与王健林共同持股。风险信息显示,该公司现存多条被执行人记录,被执行总金额超过 53 亿元,且所持多家子公司股权已被冻结。此外,北京万达文化产业集团有限公司新增 1 条股权冻结信息,被执行人为大连万达集团股份有限公司,冻结股权数额为 80 亿元。据财联社报道,万达知情人士对此回应称,本次王健林被限高或是执行层面信息不对称所致。 此次是由于万达下属项目公司经济纠纷导致,事实上之前双方一直在通过多种方式协商解决,我们也正在了解具体情况,本次或因在执行层面信息不对称导致。王健林曾在 2016 年的一次采访中建议创业者「先设定一个能达到的小目标,比方说我先挣它一个亿」给许多人留下了深刻印象。然而,「限高」消息传出后,有网友调侃道,「他现在实现了亏损几十个小目标」。错失 OpenAI 早期投资,黄仁勋:我们太穷了,没投够 近日,在与 BG2 的最新访谈中,英伟达 CEO 黄仁勋回顾了与 OpenAI 的关系,坦言自己早年在投资决策上留下了深深的遗憾。他提到,当 OpenAI 邀请英伟达参与早期投资时,英伟达资金有限,没有下足赌注:「他们当时邀请我们投资,但我们太穷了,没有投够。我应该把所有的钱都给他们。」黄仁勋直言,OpenAI 未来极有可能成为下一个「多万亿美元级别的超大规模公司」,这也让他更加感慨当年的保守与犹豫。他强调,错失早期投资机会是令人惋惜的,但如今通过深度合作,英伟达仍能在 OpenAI 的成长中扮演重要角色。据悉,英伟达与 OpenAI 正在展开多层次合作,包括微软 Azure、Oracle OCI、CoreWeave 的算力建设,以及最新宣布的「星际之门(Stargate)」项目。该项目预计投资规模高达 1000 亿美元,OpenAI 将首次自建 AI 基础设施,英伟达则在芯片、软件与系统层面全面参与。面世 21 年,「越狱神器」91 助手停止服务 昨天,经典苹果 iPhone / iPad 设备管理工具「91 助手」正式全面停止所有服务。目前,其客户端已无法启动,手机连接、文件传输、应用管理以及 VIP 专属功能等均已终止。同时,官方网站、帮助中心及客服渠道也已同步关闭。官方公告显示,服务终止后,用户在「91 助手」中的所有数据将永久丢失,无法再以任何方式找回。据了解,「91 助手」最早可追溯至 2007 年,由网龙公司团队开发,最初命名为「91 手机助手」。在 iOS 生态相对封闭、iTunes 使用不便的早期阶段,该工具凭借「越狱」、应用安装和文件管理等功能迅速走红,被果粉称为「越狱神器」。2009 年,「91 助手」拓展至 Android 平台,新增刷机和手机管理功能,进一步扩大用户群体。2013 年达到巅峰时,其在 iOS 与 Android 平台的用户数超过 1 亿,总下载量突破 100 亿。同年,百度以 19 亿美元(约合人民币 135.64 亿元)收购 91 无线,这一交易成为当时中国互联网行业规模最大的收购案之一。然而,随着移动生态的演进,「91 助手」逐渐淡出公众视野。2020 年 2 月,百度宣布下线「91 助手」及安卓市场,但部分功能仍在运行。如今,随着全面停服,这款曾经风靡一时的工具彻底画上句号。iPhone 17 Pro 首次用于美国职业棒球赛事转播 据 9to5Mac 报道,美国职业棒球大联盟(MLB)上周的「Friday Night Baseball」比赛迎来一项全新尝试:将 iPhone 17 Pro 用于官方赛事的现场转播拍摄。据介绍,本场在芬威球场举行的底特律老虎队与波士顿红袜队的比赛中,制作团队共部署了 4 部 iPhone 17 Pro,分别位于主队休息区、左外野「绿色怪物」高墙顶部等位置,甚至还包括一台无线移动机位。当画面切换至 iPhone 拍摄时,转播画面右上角会出现「Shot on iPhone」标识。苹果方面表示,所有设备均搭配 Blackmagic Camera 应用与 Blackmagic Camera ProDock 配件,支持远程调整曝光、白平衡和变焦。此次尝试是苹果与 MLB 合作的一部分。此前,双方已在赛事转播中引入无人机航拍、头盔摄像机和「Megalodon」超高清机位等创新手段。苹果称,本次实验性应用已秘密筹备数月,未来或将进一步拓展 iPhone 在专业转播中的应用场景。西贝贾国龙多平台清空账号,仅留一条视频作品 西贝餐饮创始人贾国龙近期在多个社交平台清空了账号内容。目前,其抖音账号仅保留一条公开视频,发布时间为 2024 年 9 月 30 日,内容为「大熊专访贾国龙」。在视频中,贾国龙回顾了西贝餐饮的发展历程,称西贝是「西北菜领域的佼佼者」,并透露公司年营收已达 62 亿元。与此同时,贾国龙在小红书和视频号的账号内容已全部清空。此前,西贝因罗永浩吐槽预制菜问题被推上风口浪尖,贾国龙最初强硬回应并扬言起诉、在直播间强调「没有一道菜是预制菜」,但因门店被曝使用长保质期冷冻食材,遭更多质疑,后续态度转为承认「应对方式有错,改」。9 月 15 日,西贝发布致歉信,承认生产工艺与顾客期望存在差距,并表示将尽可能把中央厨房的前置加工环节调整到门店现场完成。9 月 23 日,西贝又因一篇以一名儿童的口吻讲述「坚持守约吃西贝」故事的公关文章引发争议,网友批其为「史诗级拉垮」公关。摩尔线程成功过会,手握 20 亿订单 据 21 世纪经济报道,国产 GPU 厂商摩尔线程在披露招股书仅 88 天后,顺利进入上会阶段。上海证券交易所上市审核委员会认定,公司符合发行与上市条件。财务数据显示,摩尔线程 2024 年营业收入达 4.38 亿元,同比增长显著;2025 年上半年收入进一步增至 7.02 亿元,同比大增 238.71%,环比增长 203.44%。同期净亏损收窄至 2.71 亿元,同比下降 56.02%。公司毛利率也从 2022 年的 -70.08% 提升至 2024 年的 70.71%。在产品层面,摩尔线程已连续推出「苏堤」「春晓」「曲院」「平湖」四代 GPU 架构,其中「平湖」在 2024 年实现商业化,成为推动收入增长的核心动力。该公司预计未来收入仍将主要来自 AI 智算产品,智能 SoC 产品也将保持快速增长。订单方面,截至 9 月 5 日,摩尔线程在手订单金额约20 亿元,其中 AI 智算业务占比最大,预计将在 2025 年至 2026 年逐步兑现。公司透露,部分产品性能已达到或超过英伟达 RTX 3060 与 RTX 4060 的水平。俄罗斯公布国产 EUV 光刻设备长期路线图,目标 2037 年实现亚 10nm 制程 据 tom's HARDWARE 报道,俄罗斯科学院微结构物理研究所近日公布了最新的国产极紫外(EUV)光刻设备路线图,规划时间跨度从 2026 年至 2037 年,目标是逐步替代 DUV 技术并实现亚 10nm 制程。根据路线图,研发分为三个阶段: 2026–2028 年:推出首台支持 40nm 工艺的光刻机,采用双反射镜设计,叠加精度 10nm,每小时可处理超过 5 片晶圆。 2029–2032 年:升级至支持 28nm(潜在可达 14nm)工艺的扫描机,采用四反射镜系统,叠加精度提升至 5nm,产能超过每小时 50 片晶圆。 2033–2036 年:目标实现亚 10nm 制程,采用六反射镜设计,叠加精度 2nm,产能超过每小时 100 片晶圆。 与 ASML 的 EUV 系统不同,俄罗斯方案采用氙等离子体光源和 Ru/Be 镜面,工作波长为 11.2nm。研究方声称,这种设计可避免锡液滴带来的碎屑问题,降低维护成本,并简化工艺流程。不过,业内人士指出,该路线图涉及的 11.2nm 波长并非业界标准,相关光学元件、光源和光刻胶等环节均需重新开发,执行难度极高。即便项目顺利推进,其商业化前景仍存在较大不确定性。GitHub 或被澳大利亚列为「危害未成年人的社交平台」 据 Cybernews 报道,澳大利亚电子安全委员会(eSafety Commissioner)近日向开源代码共享平台 GitHub 发出正式函件,要求其考虑自身是否应被归类为可能危害未成年人的「社交媒体平台」。根据澳大利亚将于 12 月 10 日起生效的新规,16 岁以下青少年将被禁止使用被认定对儿童有害的特定社交媒体平台。目前,Facebook、Instagram、TikTok、Snapchat、YouTube 和 X 等主流平台已在监管名单之列。电子安全专员朱莉・伊曼・格兰特(Julie Inman Grant)在接受 ABC News 采访时表示:「有些平台的情况很明确,但我们仍需进行尽职调查。」值得注意的是,GitHub 长期以来不仅是开发者协作的工具库,也被曝出曾托管恶意软件、钓鱼工具等内容,引发监管担忧。但此举也在网络上引发争议,不少用户讽刺称「孩子们想学编程可能得离开澳大利亚」。目前,eSafety 已向包括 Roblox、Reddit、Discord、Steam、Twitch 在内的 16 家平台发出「自我评估」要求,若企业希望豁免,需要提交充分理由和证据。监管机构同时透露,调查范围可能扩展至约 100 个平台。彭博社:美国卖得最好的车是二手电动车 据彭博社报道,美国二手电动车市场正在快速升温。Cox Automotive 的数据显示,今年上半年二手电动车销量同比增长 34%,平均售价在 8 月达到 34,700 美元,几乎与燃油车持平。报道指出,多重因素推动了这一趋势: 大量 2022 年购入的电动车租赁合同到期,市场供给显著增加; 二手电动车价格持续走低,折旧幅度普遍高于燃油车; 电动车在可靠性和维护成本上的优势逐渐显现。 例如,一辆全新福特 Mustang Mach-E GT 在一年前售价约 55,000 美元,而一辆仅使用 1 年、行驶 13,000 英里的二手车,售价仅为 33,000 美元,折价幅度达到 22%。Recurrent 市场洞察总监 Liz Najman 表示:「三年前的电动车如今依然具备较长续航、快速充电和丰富配置,这让消费者更愿意选择二手车型。」此外,部分品牌的二手电动车甚至比同级燃油车更便宜。例如,2023 款丰田 bZ4X 的二手均价比同年份的燃油版 RAV4 低 6,600 美元。Cox Automotive 数据显示,目前美国二手电动车的平均库存消化周期仅为 36 天,而燃油车为 42 天。这意味着二手电动车正在成为更多消费者的主流选择。法拉第未来官宣 FF 91 2.0 新车主 昨天,法拉第未来(Faraday Future,FF)在微博发文,官宣 FF 91 2.0 再迎新车主。官方表示,公司将于本周五在洛杉矶总部完成一台 FF 91 2.0 的交付手续,车主为地产公司 Pinnacle Real Estate Group 的总裁 Calvin Gong,并将在 10 月 8 日举行交车庆祝仪式。据介绍,Pinnacle 是南加州最大的华裔房产经纪公司之一,目前运营三家分公司,拥有超过 1000 名房地产经纪人。此次交付后,Calvin Gong 及 Pinnacle 也将成为 FF 的共创官。文中还提到,双方合作开创了全球首创的「B2B2C」模式,将 AIEV 与房产经纪产业深度融合,依托 Pinnacle 的地产网络,打造轻资产、共创共享和快速放量的用户获取平台。FF 创始人、Co-CEO 贾跃亭表示:「Calvin Gong 是倍受尊敬的企业家与行业领袖,他成为 FF 91 2.0 车主再次印证了这款车所承载的愿景与价值。」Calvin Gong 则回应称:「我们很自豪能够与 FF 携手,共同引领跨界合作的新模式。这次合作必将带来房产经纪产业与出行产业的全新体验。」贾跃亭还在社交平台发文:「车房同购,共创共赢」,强调「豪车+豪宅」模式的战略意义。追觅汽车七项专利遭质疑 此前,追觅汽车官方微博称,其「以全球首创 7 项专利,重构一个无序对开的车门」,文中提到的「7 项专利」近日遭到网络质疑。据专利公开信息显示,这 7 项专利均围绕「无 B 柱对开门」展开,涉及车门铰链结构、驱动机构等关键设计。而微信公众号「专利挖掘机」的一篇文章则指出,追觅提到的 7 项专利仅有 3 位发明人,却配备了多达 7 位代理人,被其形容为「皇家 VIP 服务」。从技术原理来看,追觅的方案通过「先平移、再转动」的方式解决了无 B 柱车门的开合顺序问题,使前后门可独立开启,避免了传统设计中必须先开前门再开后门的限制。该思路在专利 CN119749192A、CN119593649A、CN119711868A 等文件中均有体现。不过,文章指出,类似设计并非首次出现。早在 2006 年,福特就曾申请过相关专利;2024 年,吉利旗下极氪 MIX 车型也采用了无 B 柱结构,并宣称为「全球首创」。吉利的专利号为 CN220621505U,其代理机构与追觅的代理团队存在重合。此外,追觅在专利附图中展示了跑车与 SUV 的整车造型,其 CEO 俞浩在一次内部会议上甚至直言「对标布加迪威龙」「碾压理想 L9」。目前,追觅汽车尚未公布量产车型的具体时间表。宝马因部件安全隐患召回超 33 万辆汽车 据新华社报道,德国宝马集团宣布将召回超过 33 万辆汽车,原因是起动机及相关部件可能存在短路隐患。在德国市场,此次召回涉及超过 13 万辆汽车,生产时间为 2015 年 9 月至 2021 年 9 月的多款车型。宝马方面尚未公布全球召回总数,但业内预计实际规模或将超过已披露的数字。另据美国国家公路交通安全管理局公告,宝马将在当地召回近 20 万辆 2019 年至 2022 年生产的车型。该机构指出,受影响车辆的「起动机继电器可能发生腐蚀,从而导致继电器过热并短路」,存在引发火灾风险。据了解,召回车辆将更换起动机,部分车型还需安装功率更大的电池,预计累计成本较高。马斯克官宣特斯拉 FSD V14 下周推送,称车会变得「富有灵性」 特斯拉 CEO Elon Musk 近日在 X 上公布了 FSD V14 的推送计划。按照安排,特斯拉将分三个阶段,逐步发布 V14、V14.1 和 V14.2 版本。马斯克表示,下周启动的将是 FSD V14 的「早期广泛发布」,主要面向内部员工、测试计划成员以及部分行业人士。V14.1 预计在初版发布约两周后上线,重点修复早期问题,并有望成为首个面向大众车主的版本。至于 V14.2,马斯克未给出明确时间,但强调届时体验将迎来「质变」,甚至让人感觉系统「富有灵性」。此次 V14 被马斯克称为 FSD「历史上第二大更新」,核心在于架构层面的全面升级。新版本采用规模更大的神经网络模型,参数量提升 10 倍,同时降低视频数据压缩率,使车辆「看得更清晰」,从而提升判断精度。此外,V14 系列还可能引入此前在 V13.2.9 中预告的功能,包括音频识别紧急车辆、优化「幽灵刹车」等。不过,用户呼声较高的「目的地自动泊车」功能并未出现在此次预告中。印度首批 Model Y 正式交付,全部来自上海超级工厂 特斯拉公司副总裁陶琳日前在微博宣布,印度首批特斯拉 Model Y 已正式交付,这批车辆 100% 产自上海超级工厂。据悉,特斯拉在印度的首家展厅于今年 7 月开业,标志着该公司正式进入印度市场。与此同时,官方公布了 Model Y 在印度的售价: 后轮驱动版:598.9 万卢比(约合 48.2 万元人民币) 长续航后轮驱动版:678.9 万卢比(约合 54.6 万元人民币) 作为对比,焕新 Model Y 在中国市场的定价则明显更低: 后轮驱动版:26.35 万元人民币 长续航全轮驱动版:31.35 万元人民币 当天,特斯拉官方账号转发了这条微博,并配文「恭喜印度的新车主们喜提爱车来自上海超级工厂的产品绝对杠杠的」。机器人专家:人形机器人的投资泡沫必将破裂 据 techcrunch 报道,知名机器人学家 Rodney Brooks 近日发表文章,直言当前资本市场对人形机器人初创企业的狂热投资「是在浪费资金」。Brooks 曾共同创立 iRobot,并在麻省理工学院从事数十年研究。他表示,部分企业试图通过让机器人观看人类操作视频来学习灵巧动作,这种做法是「纯粹的幻想(pure fantasy thinking)」。他强调,人类双手极其复杂,拥有约 17,000 个触觉感受器,而现有机器人远未达到这一水平。与语音识别和图像处理不同,触觉数据缺乏长期积累的研究传统,导致突破难度极大。此外,Brooks 还提醒安全隐患:全尺寸的人形机器人需要消耗大量能量维持平衡,一旦跌倒将极具危险。按照物理规律,体型加倍的机器人,其潜在破坏能量将增加至 8 倍。Brooks 认为,未来 15 年内真正成功的「类人」机器人不会拘泥于「人形」,而是采用轮式设计,配备多臂和专用传感器,以实现更高效的实用性。他坚信,当前数十亿美元的投入最终只会沦为无法规模化的昂贵实验。值得一提的是,宇树科技此前发表了一条视频,视频中的 G1 机器人被「围殴」,但依旧保持平衡,并在结尾完成连续空翻。宇树官方还表示,即便遭遇外力冲击摔倒,也能迅速起身并衔接被打断的动作。 售价 3.5 万元,前苹果首席设计师 Jony Ive 携手 Balmuda 推出便携航海灯 昨天,前苹果首席设计师 Jony Ive 旗下设计公司 LoveFrom 与日本品牌 Balmuda 宣布合作,推出全新便携照明产品「Sailing Lantern」。据介绍,这款灯具灵感源自 Ive 的航海经历,外观延续复古航海灯的轮廓,但在材质与工艺上采用精密不锈钢框架与抛光纹理玻璃,内部搭载 LED 光源,重量约 1.5kg。Ive 表示:「我从小就热爱航海,但一直找不到能在极端海上环境下使用的灯具。这款设计并非怀旧,而是源于人类的直觉与创造力。」Balmuda 创始人寺尾玄补充称:「当 Jony 提出这个想法时,我觉得非常浪漫。我们希望结合航海意象与现代 LED 技术,打造一件真正的工具。」「Sailing Lantern」支持渐变调光,光线从红色逐渐过渡到蓝白色,模拟火焰燃烧的自然效果。灯体配备耐盐雾、耐油的聚酯挂绳,细节处采用防腐不锈钢固定。该产品限量 1000 台,售价 4800 美元(约合人民币 3.5 万元),现已在 Balmuda 官网开启发售。第三方厂商让复古卡西欧手表变成「智能手表」,还能玩小游戏 据 The Verge 报道,经典的卡西欧 F-91W 数字手表自 36 年前推出以来首次迎来智能化升级,但这并非出自官方之手,而是第三方厂商 Ollee 推出的替换主板「Ollee Watch One」。据介绍,「Ollee Watch One」适用于 F-91W、A158W 等多款型号,用户无需焊接,只需拆卸螺丝和卡扣即可完成安装。升级后,手表可通过蓝牙与手机应用连接,实现自动校时、计步、小游戏以及彩色背光等功能。升级主板内置加速度计、温度传感器和改进的 LED 背光,支持世界时间和 5 个定时预设。用户还可在手表上体验简化版「二十一点」以及弹球游戏「Ping」。不过,该套件并未提供消息通知功能,屏幕依旧保持原有的分段式显示。售价方面,DIY 版本价格为 54.99 美元(约 392 元人民币),需用户自备兼容型号手表;预装升级的 F-91W-1 与 A158W-1 定价 99.99 美元(约 715 元人民币),但目前已售罄。电池续航方面,升级后的手表在使用 CR2016 纽扣电池时可维持约 10 个月,低于原版 F-91W-1 的 7 年续航。千里科技完成 AI 战略布局第一步,新品牌「AFARI」正式发布 昨天,千里科技在重庆举办「新韵重庆 千里智驾 —— AI 重庆智驾之夜暨千里科技品牌发布会」,正式发布全新品牌英文名「AFARI」及品牌标识,标志着公司 AI 战略转型迈入新阶段。发布会上,千里科技董事长印奇与吉利控股集团董事长李书福同台,围绕「AI+车」的融合发展展开探讨。知名导演徐峥以千里智驾体验官身份亮相,并与职业赛车手马青骅共同完成「千里走 8D」实景挑战,展示了千里智能辅助驾驶系统在重庆复杂路况下的表现。千里科技表示,自去年启动「AI+」战略转型以来,公司已在智能驾驶、智能座舱和智能出行三大领域完成全面布局: 智能驾驶:基于大模型的智驾系统通过重庆「8D」复杂路况实测,展现出更安全、更丝滑、更 AI 的驾驶体验。 智能座舱:推出新一代智能座舱 Agent OS,支持超自然交互、融合记忆和第三生活空间等功能。 智能出行:计划在未来 18 个月完成 Robotaxi 全链路产业布局,并在全球 10 座城市实现规模化运营。 新品牌「AFARI」由「Afar(远方)」与「I(智能)」组合而成,寓意「With AI, we go far」。此外,印奇还公布了「千里计划」,提出「One Brain,One OS,One Agent」的未来愿景,旨在构建由大模型驱动的 AI 大脑和跨终端智能助手体系。活动最后,5000 架无人机点亮重庆夜空,绘制出「AI + 未来」的图景,为发布会画上句点。一加 15 开启预约,「原色沙丘」配色更多细节公布 昨天,一加 15 在京东开启预约。新机主打「原色沙丘」配色,另提供「绝对黑」与「雾光紫」版本。官方介绍称,一加 15 首发「航天级纳米瓷金属」中框,号称比钛金属轻 26.3%,表面硬度提升 134%,散热性能提升 26.6 倍。性能方面,该机将「首批」搭载第五代骁龙 8 至尊版移动平台。该平台采用 2+6 核心架构,两个 Prime 核心主频提升至 4.6GHz,六个性能核心运行于 3.62GHz。相比前代,CPU 性能提升 20%,能效提升 35%,整体功耗降低 16%。此外,一加 15 还将支持 165Hz 高刷屏,并在「一加游戏大会 2025」上展示了首发的 165 帧游戏生态,定位高性能旗舰。腾讯开源「混元图像 3.0」,对标业界领先闭源模型 昨天,腾讯混元正式发布并开源原生多模态生图模型「混元图像 3.0(HunyuanImage 3.0)」,参数规模高达 80B。据介绍,这是首个开源工业级原生多模态生图模型,也是目前效果最强、参数量最大的开源生图模型,效果对标业界头部闭源模型。混元图像 3.0 在语义理解、美学质感和推理能力上均有显著提升,能够解析千字级复杂语义并生成高质感图像。与传统多模型组合方案不同,混元图像 3.0 采用原生多模态架构,可在单一模型内完成文字、图片、视频与音频等多模态输入输出。官方表示,该模型不仅具备绘画能力,还拥有语言模型的常识与推理能力。例如输入提示词「生成一个月全食的四格科普漫画」,模型即可自主生成完整漫画,无需逐格描述。此外,混元图像 3.0 在文字生成、复杂海报设计、漫画插画等场景中表现突出,能够满足插画师、设计师及内容创作者的多样化需求,大幅提升创作效率。目前开放的版本仅支持文生图功能,图生图、图像编辑、多轮交互等能力将在后续逐步上线。用户可通过电脑端访问腾讯混元官网体验该模型](https://hunyuan.tencent.com/image)体验该模型),模型权重与加速版本已同步上线 Github、Hugging Face 等开源社区,企业与个人开发者均可免费下载使用。Github:https://github.com/Tencent-Hunyuan/HunyuanImage-3.0Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0 韩国最大外卖平台接入支付宝和微信支付 据韩国媒体《亚洲经济》报道,日前,韩国外卖平台「배달의민족(Baedal Minjok,简称 Baemin)」宣布正式接入微信支付与支付宝。运营方 Woowa Brothers 表示,此举旨在提升外国游客在韩使用外卖服务的便利性。韩国观光公社数据显示,今年上半年入境外国游客已达 883 万人,同比增加 14.6%。预计明年访韩游客总数将突破 2000 万人。与此同时,自 9 月 29 日起,中国大陆三人及以上团队游客可享受临时免签政策,预计将进一步推动来自亚洲国家的旅游需求。Baemin 自去年 3 月起已支持境外信用卡支付,数据显示,今年 4 月非会员境外信用卡交易量同比增长约 14 倍。Woowa Brothers 平台负责人高明锡表示:「通过引入全球便捷支付服务,我们希望让越来越多的外国游客能够无障碍地体验韩国的外卖文化。未来还将逐步评估多语言支持,持续提升用户体验。」Alo 携手 NBA 球星 Jimmy Butler 推出首款联名球鞋 近日,运动休闲品牌 Alo 宣布与 NBA 球星 Jimmy Butler 合作,推出品牌史上首双联名球鞋「Alo Recovery Mode x Jimmy Butler」。据悉,这款鞋型基于 Alo 于 2024 年推出的 Recovery Mode 改良而来,采用白色纯素皮革鞋面搭配焦糖色胶底,并加入 Butler 设计的浮雕 Monogram 元素。官方介绍称,该鞋款主打赛后恢复功能,配备高回弹泡棉鞋垫,鞋面部分使用回收物料,外底通过耐磨测试。Jimmy Butler 在接受采访时表示:「这双鞋是我比赛后煮咖啡、打骨牌、放松,或陪伴家人朋友时的首选。能在设计中加入个人元素,我感到非常开心。」新品将于 10 月 1 日起在 Alo 官网及 Beverly Hills、Valley Fair、Miami Design District 等指定门店限量发售。《穿越火线-枪战王者》鸿蒙版正式上线:支持跨平台匹配、资产保留 华为 HarmonyOS 开发者官方微博今日宣布,腾讯手游《穿越火线-枪战王者》鸿蒙版正式上线,支持跨平台匹配对战,同时「封神狂潮」挑战玩法同步开放。目前,玩家可前往 HarmonyOS 5 华为游戏中心下载体验。据介绍,鸿蒙系统玩家可与安卓、iOS 平台用户进行跨平台匹配,原安卓账号的所有游戏资产(包括武器、角色、进度等)均可完整保留,无需重新注册账号。据介绍,此次版本还新增了多项优化功能: 【专注模式】:系统智能调配算力资源,提升帧率稳定性与触控响应速度。 【着色器预载】:预载后可显著减少因资源加载导致的卡顿。 官方表示,未来鸿蒙版将持续带来更多适配与优化。此前,在 9 月 4 日的华为 Mate XTs 非凡大师及全场景新品发布会上,华为常务董事、终端 BG 董事长余承东曾透露,HarmonyOS 5 终端设备数已突破 1400 万,并宣布包括《英雄联盟手游》《三角洲行动》《穿越火线》等多款游戏将陆续登陆鸿蒙平台。 《狂野时代》官宣定档 11 ⽉ 22 ⽇ 艺术电影《狂野时代》今日正式宣布将于 11 月 22 日在国内上映。影片由导演毕赣执导,易烊千玺、舒淇领衔主演,赵又廷特邀出演,李庚希特别出演,黄觉、陈永忠参演。据悉,《狂野时代》此前已于 2025 年 5 月 22 日在法国首映,并在第 78 届戛纳电影节主竞赛单元中斩获特别奖。影片类型涵盖剧情、科幻与悬疑,定档海报中出现的「迷魂者」意象引发观众热议。官方介绍称,影片通过独特的视觉语言展现「命运雕刻与释放」的主题。《蜡笔小新》新剧场版确认引进 动画电影《蜡笔小新:灼热的春日部舞者》今日正式官宣引进内地,将于 2025 年在中国上映。影片讲述春日部防卫队因舞蹈比赛获胜而前往海外,却因神秘「鼻子背包」卷入一连串危机。小新与伙伴们将在大银幕上展开一场融合爆笑唱跳与华丽冒险的全新旅程。据悉,本片类型涵盖动画、家庭、喜剧与音乐元素,延续了系列一贯的轻松欢乐氛围。官方表示,观众将与春日部防卫队一同解锁全新的故事篇章。《火种》定档 10 月 16 日 由陈剑飞执导、周振天编剧,富大龙、姜武领衔主演的重大革命历史题材电影《火种》今日官宣定档,将于 10 月 16 日起通过人民院线在全国上映。影片聚焦中国共产主义运动先驱李大钊(富大龙 饰)与北洋政府京师警察厅侦缉处处长吴郁闻(姜武 饰)之间的生死对决,以双时空叙事展现两场跨越 24 年的抓捕行动,折射出信仰与背叛、理想与罪行的激烈碰撞。影片由海南广播电影电视传媒集团等联合出品,将以思想深度与视觉冲击并重的方式,带领观众重温百年前的信仰之光。 -
一周AI大事:阿里军火库全开 巨头筹备万亿算力 一、重磅工具:Qwen系列模型集中发布,阿里摆出AI模型的满汉全席 新闻:本周阿里巴巴云栖大会期间,公司旗下通义千问团队推出多款重磅AI新模型。知名AI博主Alex Volkov将此盛况戏称为又一场“千问盛宴”。 这场技术盛宴的背后,是阿里巴巴集团CEO吴泳铭首次系统阐述的宏大AI战略。吴泳铭认为,通用人工智能(AGI)只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能(ASI)。为实现这一目标,阿里云将坚定走通义千问开源开放路线,致力于打造“AI时代的Android”,并构建作为“下一代计算机”的超级AI云。为支撑这一愿景,阿里巴巴正推进一项为期三年、总额达3800亿人民币的AI基础设施建设计划。 Qwen3-Max:通义千问团队推出最新旗舰AI模型,参数规模超万亿,提供指令微调版(Instruct)和思维(Thinking)版两种版本,多项基准测试均接近业界顶尖水平,尤其在代码生成和智能体调用方面表现突出。据悉,Qwen3-Max预训练数据量高达36万亿token,现已登陆阿里云大模型服务平台百炼(Model Studio)。 Qwen3-VL:通义千问推出的全新多模态模型套件,包含指令微调版和思维版,其中以Qwen3-VL-235B-A22B-Thinking模型尤为亮眼。该系列模型专注于图文任务和视觉推理,Qwen3-VL-235B-A22B-Thinking更是在视觉推理任务上达到业界顶尖水平,表现甚至超越GPT-5。 Qwen-Image-Edit-2509:通义千问发布的AI图像编辑模型升级版,为创作者提供“像素级精准多图编辑能力”。例如可实现“人物+产品”或“人物+场景”的智能融合,消除合成痕迹。该模型已在HuggingFace、ModelScope和Qwen Chat上线。 Qwen3-Omni-30B-A3B:通义千问开源的原生全模态(Omni-modal)AI模型,支持文本、图像、音频和视频输入,并能输出文本和流式音频。模型分为指令微调版、思维版和字幕生成版三个版本。技术报告详见GitHub仓库,体验版已经上线Hugging Face。 Qwen3-TTS-Flash:通义千问团队发布的语音合成模型,支持多音色、多语种,多语言语音质量和准确性均达到业界顶尖水平,能输出表现力极强的语音。目前可以在HuggingFace Spaces上试用。 Wan-Animate:阿里开源了Wan2.2的组成部分Wan-Animate,该模型支持通过动作迁移和口型同步技术轻松实现角色动画制作。通义实验室发布了技术论文以及演示视频,展示如何将表演者的视频动作迁移到目标角色上。目前,Wan 2.2 Animate 14B模型已经上线HuggingFace。 Wan 2.5预览版:阿里发布的Wan 2.5预览版支持生成1080p 60帧的电影级视频,音画完全同步。单次可生成长达10秒的视频片段,并能根据文本或配对音频实现精准口型同步。Wan 2.5预览版还内置“商品转视频”、“绘画转视频”和“口型同步工作室”等功能,现已登陆Higgsfield、Fal和通义万相官网等平台。这标志着视频生成质量和音效水平迈上新台台阶。 锐评:阿里不发则已,一发就把整个AI军火库搬出来了。 二、AI技术与产品发布动态:百花齐放百家争鸣,AI产品进入内卷新时代 1. 新闻:谷歌发布Gemini 2.5 Flash/Flash-Lite更新版: 新版模型的智能性、成本效益和速度显著提升,思维版与非思维版在综合智能基准测试中得分均有大幅提高。其中Gemini 2.5 Flash的智能体工具使用和编程能力也有所增强,SWE-Bench Verified测试得分从49%跃升至54%。此次更新的2509版本提升了token效率,质量和速度均有所提高,也更具成本效益。其中Flash-Lite在Artificial Analysis基准测试中的token使用量减少了50%。Gemini 2.5 Flash Lite现已成为速度最快的闭源模型。两款模型的定价保持不变。 锐评:谷歌又是“加量不加价”,就想让开发者“用了就不撒手”。 2. 新闻:DeepSeek发布DeepSeek-V3.1-Terminus。作为DeepSeek-V3.1的升级版,DeepSeek-V3.1-Terminus重点优化了输出稳定性、语言一致性(减少中英混杂现象)以及智能体性能。在智能体工具使用基准测试中,BrowseComp得分从30%提升至38.5%,TerminalBench得分从31.3%提升至36.7%。模型详情已在Hugging Face上公布。 锐评:DeepSeek终于下决心给自家模型报了个中文班,专治“中英夹杂”的尴尬。 3. 新闻:Kling推出视频AI模型Kling 2.5 Turbo。这款升级版视频AI模型不仅提升了视频质量,价格较之前的2.1版本还降低了30%。Kling 2.5 Turbo的提示词遵循度、动态场景流畅度和稳定性以及视频一致性均有所增强,在竞争激烈的视频生成领域性价比优势凸显。 锐评:Kling上来就摆出一副掀桌子的架势。 4. 新闻:Suno推出AI音乐生成模型Suno v5。这是Suno迄今最先进的AI音乐生成模型,音质保真度更高,人声更自然,编曲也更出色。早期评测肯定了v5的技术突破,认为其人声效果非常好,但也被指“过于完美缺乏灵魂”。目前仅限付费用户使用。就在Suno v5发布前几天,多家唱片公司提起诉讼,指控Suno在训练模型时非法“扒取流媒体”内容。 锐评:AI版‘K歌之王’证明:完美有时也是原罪。 5. 新闻:Liquid AI推出Liquid Nanos系列小型任务专用前沿模型。该系列参数规模从3.5亿到25亿不等,适用于边缘设备上的智能体任务。其中包括用于从非结构化文本中提取数据的LFM2-Extract;用于英日双向翻译的LFM2350MENJPMT;用于RAG流程中问答的LFM21.2BRAG;用于智能体工具调用的LFM21.2BTool;以及用于解决数学问题的LFM2350MMath。这些模型可在Liquid Edge AI Platform边缘平台运行,已经上线Hugging Face。 锐评:Liquid AI选择专攻“小而美”,誓要在边缘设备上打下一片天。 6. 新闻:腾讯混元发布并开源原生多模态生图模型HunyuanImage 3.0,参数规模达800亿。据官方介绍,这是首个开源的工业级原生多模态生图模型,是目前参数量最大的开源生图模型,可对标业界头部闭源模型。 锐评:腾讯祭出了800亿参数的“工业级”大家伙。 7. 新闻:小米发布开源音频输出模型MiMo-Audio-7B,模型参数70亿,支持在音频任务中进行思维推理和小样本泛化。其技术报告《MiMo Audio:音频语言模型也是小样本学习者》阐述了MiMo如何通过超1亿小时的音频预训练,从而可以用小样本学习方式执行多种音频任务。目前该模型已上线HuggingFace。 锐评:开“杂货铺”的小米也来卷音频模型。 8. 新闻:Moondream发布Moondream 3预览版。这是一款拥有90亿参数的MoE架构视觉语言(VLM)模型,活跃参数20亿,致力于实现前沿水平的视觉推理。 锐评:视觉推理这块算是被Moondream玩得明明白白。 9. 新闻:IBM发布Granite Docling-258M。这是一款轻量级多模态OCR模型,专为高效文档转换设计。作为SmolDocling的后继产品,Granite Docling-258M兼容Docling工具链和典型文档转换工作流。 锐评:大家都在谈星辰大海,IBM还在默默耕耘“文档扫描电子化”这片自留地。 10. 新闻:谷歌DeepMind推出Gemini Robotics 1.5系列模型。这些升级版的机器人思维模型将AI智能体带入现实世界。其中包括视觉-语言-行动(VLA)模型Gemini Robotics 1.5,以及基于VLM的Gemini Robotics-ER 1.5。这些模型支持机器人规划多步骤任务,并能利用联网和推理信息调整行动。用户可通过Gemini API和Google AI Studio进行调用。 锐评:谷歌终于让Gemini从屏幕里走出来,现实版瓦力还远吗? 11. 新闻:OpenAI推出ChatGPT Pulse。这是ChatGPT新上线的主动式每日更新体验,它通过异步研究生成个性化晨间简报,支持链接Gmail等数据源以分析上下文,并根据用户反馈策划内容。这一功能现向移动端Pro用户开放预览。 锐评:你的专属晨报来了。 12. 新闻:Meta AI引入Vibes信息流。这是一个便于二次创作的AI短视频信息流,汇集了来自创作者和社区的作品。用户可以发布AI短片或对现有内容进行二次创作,并直接分享到Vibes、私信、Instagram和Facebook Reels等各种平台。此举旨在将AI创作模式融入Meta生态体系。 锐评:扎克伯格把短视频和AI搅成一锅大杂烩。 13. 新闻:谷歌升级Gemini Live API。新版API让对话更自然,增强了智能体对外部数据和服务的调用能力。 锐评:Gemini升级后更像万能外援。 14. 新闻:YouTube Music测试AI电台“主播”。这些AI解说评论员会在歌单和电台节目中穿插出现,分享歌曲趣闻和背景故事,目前仅限部分美国用户测试。此外,YouTube还将AI“跳转”功能扩展至电视和游戏主机端。 锐评:“主播”们的饭碗又被AI盯上了。 15. 新闻:微软Copilot Studio新增Anthropic模型选项。除默认的OpenAI模型外,用户现在也可选择Anthropic的Claude Sonnet 4和Claude Opus 4.1模型来构建Copilot AI智能体。 锐评:Copilot自助餐菜单扩容,品种越来越丰盛。 16. 新闻:苹果公司已开发一款类ChatGPT的iPhone应用,代号为Veritas(拉丁语意为“真理”),正为备受期待的Siri重大升级进行内部测试。报道援引知情人士称,测试内容包括搜索歌曲、邮件等个人数据,以及编辑照片等应用内操作的能力。据悉Veritas目前仅供内部使用,苹果并无计划向消费者发布。 锐评:苹果的AI大招永远在“内部测试”。 三、AI研究新动向:世界模型赋能,代码世界迎来新玩家 新闻:Meta发布Code World Model (CWM) 32B。这是一款利用世界模型(World Model)训练信号实现代码生成的开源权重LLM。此番研究旨在探索世界模型如何赋能智能体编程。Meta发表的研究论文详细介绍了如何利用Python解释器的智能体轨迹开展中间训练,并结合强化学习进行多任务推理。CWM的研究为开发基于世界模型的编程和软件工程智能体开辟了新的可能性。 锐评:Meta开始教AI理解代码世界的“物理规律”。 四、AI商业与政策:巨头“抱团”筹备万亿算力 1. 新闻:AI基础设施投资持续火热。OpenAI、甲骨文和软银宣布新增五座在美“星际之门”(Stargate)数据中心,分别位于得克萨斯州、新墨西哥州和中西部地区。至此,该项目的规划容量已接近7GW,累计投资额达4000亿美元。 锐评:计划很亮眼,不知道当地电网撑不撑得住。 2. 新闻:OpenAI与英伟达宣布建立战略合作伙伴关系。英伟达承诺向OpenAI投资1000亿美元,供应数据中心芯片和GPU系统。OpenAI将采购英伟达AI系统,后者则获得OpenAI的非控股股权。双方的目标是在未来几年内部署至少10GW算力,其中签约首付款100亿美元,2026年底开始交付产品。 锐评:一个拼命造GPU,一个拼命烧GPU。 3. 新闻:GPU云服务商CoreWeave扩大与OpenAI的合作: 双方签订了价值65亿美元的新合同,使年初至今的合同总额达到224亿美元,以协同推进“星际之门”基础设施建设计划。 锐评:云厂商跟OpenAI的合同签得比GPU还密集。 4. 新闻:微软推广微流控芯片冷却技术,构建更高密度的AI数据中心。 实验室结果表明,新技术可将散热效率提升3倍,GPU最高温升降低65%,有望实现3D芯片堆叠和更高超频。 锐评:三倍散热效率让数据中心彻底告别‘蒸桑拿’。 5. 新闻:Llama入选美国政府AI工具清单。Llama正式成为继亚马逊、微软、谷歌、Anthropic和OpenAI之后获批的开源模型,可用于政府合同审查等任务。 锐评:开源模型终于混进了“体制内”,Meta算是拿到了官方认证的“铁饭碗”。 6. 新闻:联邦法官初步批准Anthropic与作家的15亿美元版权和解协议。法院认为该协议“公平合理”,但保留最终批准权。这份和解协议涉及美国主要作家群体。 锐评:知识付费从不是一句空话。 7. 新闻:Spotify出台新规整治AI生成音乐乱象。新规的目的是清除欺骗性或垃圾性AI音乐,例如未经授权的人声模仿。Spotify希望能平衡创作者实验与听众权益,推动行业AI信息披露标准。 锐评:假唱AI要凉凉。 8. 新闻:马斯克麾下xAI与美国政府达成合作协议。该公司将以0.42美元的超低年费向联邦政府出售AI聊天机器人Grok,含工程师支持服务,远低于OpenAI和Anthropic提供的1美元报价方案。 锐评:宁可亏死,也要把你们卷死 9. 新闻:马斯克旗下人工智能初创公司xAI向加州联邦法院提起诉讼,将竞争对手OpenAI告上法庭,指控其通过挖走前员工窃取商业机密,以在AI技术开发竞赛中占据不公平优势。 锐评:老马这是揪住OpenAI不放了。(辰辰) -
微软必应留客套路又升级:搜“谷歌”出现公益捐赠广告 IT之家 9 月 29 日消息,现在当用户在微软 Edge 浏览器中使用必应搜索“谷歌”时,会出现一个谷歌风格的搜索栏,该搜索栏承诺,用户的每一次必应搜索都将通过微软奖励(Microsoft Rewards)为公益捐赠筹集资金。 2025 年 1 月,科技媒体 Windows Latest 首次发现,当用户在必应(Bing.com)上搜索“谷歌”时,其用户界面(UI)会通过模仿谷歌搜索界面的方式,试图让用户停留在必应平台。这种模仿谷歌界面的做法,如今正被另一项“巧妙”策略取代,而该策略或许能说服部分用户继续使用必应。正如上图所示,当用户试图在必应上搜索“谷歌”时,页面会弹出熟悉的必应推广广告,几乎占据整个搜索引擎页面。但此次广告新增了一句宣传语:“每一次微软必应搜索,都能让你离为 200 多万家非营利组织提供一笔免费捐赠更近一步。”IT之家注意到,该广告与伪装成谷歌页面的必应搜索栏共同占据页面首位,且仅以“由微软推广(Promoted by Microsoft)”的字样低调标注。这一设计将“谷歌”的自然搜索结果挤到了页面折叠线下方,同时为用户提供了第二个“类谷歌”的必应搜索框,旨在让用户继续留在必应,而非点击跳转至谷歌。同时,微软额外添加了一则提示,告知用户使用其搜索引擎有助于为非营利组织贡献力量。Windows Latest 在测试中发现,点击相关链接后,浏览器会跳转至网址 rewards.microsoft.com/ redeem / donate?form=sdonate,这正是微软奖励体系中用于兑换奖励或进行捐赠的终端页面。微软旗下的内置奖励项目“微软奖励(Microsoft Rewards)”支持“公益捐赠”功能,用户只需定期使用必应搜索,即可为公益捐赠助力。 -
科技昨夜今晨0929:微信鸿蒙版 App 安装量突破 1800 万 “科技昨夜今晨”时间,大家好,现在是 2025 年 9 月 29 日星期一,今天的重要科技资讯有:1、雷军:小米 17 Pro Max 手机多门店已缺货,推荐大家试试 17 Pro 小米 17 Pro Max 开售即热销,多门店已缺货,@雷军 推荐手感不错的小米 17 Pro。卢伟冰表示已安排快速提拉生产。>> 查看详情2、东方卫视、江苏卫视、浙江卫视、山东卫视、湖南卫视、四川卫视 4K 超高清频道正式开播 超高清具有超高分辨率、高帧率、高动态范围、广色域、高量化精度等技术特性,分别从视频的像素数量、动态流畅度、明暗层次、色彩的丰富度以及色彩和亮度的平滑度等五个维度综合提升画质的细腻度,提升视觉体验。>> 查看详情3、一加 15 手机“原色沙丘”配色官图公布:首发“航天级纳米瓷金属”中框,比钛金属更硬更轻 一加 15「原色沙丘」配色官图公布,设计灵感源自「沙丘美学」,首发「航天级纳米瓷金属」中框,比钛金属轻 26.3%,硬 134%,散热提升 26.6 倍。搭载第五代骁龙 8 至尊版移动平台,性能提升 20%,功耗降低 16%。>> 查看详情4、14.98 万元起比亚迪方程豹钛 3 后驱 Ultra 版上市,同时全系车型新增“微光粉”“冰晶蓝”车漆可选 比亚迪方程豹钛 3 后驱 Ultra 版正式上市,定价 14.98 万元起,同时全系车型新增“微光粉”和“冰晶蓝”车漆可选。>> 查看详情5、消息称除了华为 Mate 80 系列,其它家暂时没有「可变光圈」新机 博主 @数码闲聊站 9 月 27 日发文提到,年底又有一家新旗舰取消了「可变光圈」。他表示,除了华为 Mate 80 系列,其它家新机暂时没有了。有用户询问华为什么时候取消「可变光圈」设计,博主称“华为估计不会吧,苹果也在做可变光圈,到时候狙击苹果。”>> 查看详情6、小米 17 系列手机「超级月亮」模式变聪明了:自动触发、支持直出高清月亮图 小米相机部的产品经理 @Bao_小李 9 月 28 日下午发文回应了“是不是小米 17 Pro 和小米 17 的超级月亮模式删除了”这一问题:“答案是没有删除哈,并且月亮模式还变聪明了!”据介绍,小米 17 系列手机的相机把「超级月亮」做成了自动触发,支持直出高清月亮图。>> 查看详情7、挑战 ASML,俄罗斯公布国产极紫外光刻设备长期路线图 俄罗斯科学院公布国产极紫外光刻设备路线图,计划 2026 年起分三阶段研发 11.2 纳米波长技术,目标 2037 年实现亚 10 纳米制程。该技术采用氙气等离子体光源和钌 / 铍反射镜,规避 ASML 专利限制,主打高性价比小型晶圆厂需求。>> 查看详情8、昔日苹果 iOS 必备的“越狱神器”,91 助手全面停止服务 经典苹果 / 安卓设备管理工具 91 助手 9 月 28 日全面停止服务,客户端、官网及客服渠道均已关闭。这款曾被誉为“越狱神器”的软件,从 2007 年诞生到巅峰时期拥有 1 亿用户,最终画上句号。>> 查看详情9、苹果 iPhone Air 成功扩容 512GB 闪存,实测无法兼容市面上绝大多数 NAND 他解释称,之前扩容失败的原因是高速硬盘的兼容性问题。iPhone Air 无论是 256/512GB 还是 1TB NAND 都属于高速硬盘,而目前市面上能买到的都是低速硬盘。>> 查看详情10、微信鸿蒙版 App 安装量突破 1800 万,已支持基础通讯、社交、支付等 华为应用市场今日显示,微信鸿蒙版 App 安装量已突破 1800 万。在此之前,其安装量曾在 7 月 27 日突破 1000 万,9 月 11 日突破 1500 万。>> 查看详情11、零跑汽车创始人朱江明回应被“限高”:今天已解除,风波暴露团队不足 9 月 28 日,对于零跑汽车因业务纠纷被强制执行一事,零跑汽车创始人、董事长朱江明在其朋友圈上发文称,3 天的“限高”今天总算解除了,这次风波也暴露了团队的一些不足,能力还需要进一步提升,这次事件也更加坚定了其对零跑的信心。>> 查看详情12、杭州西湖景区投放“仿生机器鱼”:模仿鲨鱼设计、用于应急打捞及环境监测 杭州西湖景区近日投放了鲨鱼造型的仿生机器鱼,用于应急打捞及环境监测。这些机器鱼不仅能精准定位并打捞游客落水物品,还能监测水质和识别外来物种。>> 查看详情13、2025 国庆中秋假期,小客车免费通行全国收费公路 2025 国庆中秋假期,全国收费公路对 7 座以下小客车和摩托车免费通行,时段为 10 月 1 日 0 时至 10 月 8 日 24 时。高速公路以驶离时间为准,普通公路以通过收费站时间为准。特别提醒:ETC 车辆注意上下高速车道一致。>> 查看详情今天就先聊到这里,科技昨夜今晨,咱们明天见。 -
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5 在HLE(“人类最后考试”)的专家校验子集上,首次有系统突破60分大关!就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,牛津大学尹榛菲,Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破——在HLE Bio/Chem Gold测试集上,Pass@1准确率达到48.3%,Pass@5准确率更是飙升至61.74%,首次跨越60分大关。这一成绩远超谷歌Gemini 2.5 Pro(26.9%)、OpenAI GPT-5(22.82%)和Grok 4(30.2%)。 最令人振奋的是,这一成就并非依赖闭源超大模型,而是完全基于开源的DeepSeek V3.1搭建。在这个开源底座上,研究团队通过叠加Monitor-based RAG(隐式知识增强)、HSR(分层解法修复)、QAIR(质量感知迭代推理)三大创新机制,实现了质的飞跃。 下面详细展开——技术创新:三大支柱撑起60分突破当AI开始挑战人类知识的终极边界,一场前所未有的较量正在上演。当大模型在MMLU、GPQA等传统基准上纷纷“卷到90分”时,这些测试逐渐失去了区分力。为了追踪AI在科学推理前沿的真实进展,Center for AI Safety与Scale AI联合推出了“人类最后的考试”(Humanity’s Last Exam,HLE)——涵盖数学、自然科学、工程学、人文社科等百余领域共3000道博士级难题,被视为AI知识推理的终极试炼。而HLE Bio/Chem Gold则是HLE的黄金标准子集,包含149道经过领域专家人工审核和纠正的题目。相比原始HLE数据集,这个子集排除了可能存在歧义或错误答案的问题,确保了标签的准确性和可靠性,因此成为评估AI科学推理能力最可信的基准。正是在HLE Bio/Chem Gold子集上,Eigen-1系统首次跨越60分大关,而这背后离不开其三大创新机制。1. Monitor-based RAG:告别“工具税”的隐式检索增强传统的检索增强生成(RAG)系统就像一个频繁暂停的视频播放器——每次需要外部知识时,都必须中断推理流程、构建查询、处理结果,再重新整合上下文。研究团队将这种开销形象地称为“工具税”(Tool Tax)——每次工具调用都会打断思考流程,导致上下文丢失。传统RAG系统的“工具税”问题在下图的人口遗传学案例中展现得淋漓尽致。左侧显示模型过度自信地使用错误公式,右侧则展示了即使通过显式RAG获得正确公式,推理流程的中断导致模型无法将知识重新整合到原始问题中。 Eigen-1的Monitor-based RAG彻底改变了这一范式: 隐式监控:Monitor持续监测推理流中的不确定性,像一位细心的助手,在后台默默关注着每一个可能需要帮助的时刻。扫描推理轨迹以便在不确定时触发RAG。 精准查询:Querier在检测到不确定性时,精准提取最小关键词集合,避免搜索空间的不必要扩展。 无缝注入:Injector则将检索到的知识无缝融入推理流,就像在对话中自然地补充背景信息,而不是生硬地插入引用。 实验数据显示,与显式RAG相比,Monitor-based RAG将token消耗减少53.5%,将工作流迭代次数减少43.7%,同时保持了更高的准确率。见下图单倍型计数案例,Monitor检测到重组约束的不确定性,Querier生成针对性查询,Injector注入两个关键事实,使模型能够排除无效案例并得出正确的30个单倍型答案。 2. Hierarchical Solution Refinement (HSR):从“民主投票”到“层级精炼”除了隐式知识增强,Eigen-1还革新了多智能体的协作模式。传统的多智能体系统采用“民主投票”机制,所有候选方案被平等对待,容易“稀释”最优解。而Eigen-1引入的分层解决方案精炼(HSR)打破了这种假设。HSR采用“锚点—修复”结构:一个候选作为 anchor,其余作为参考依次修正,形成层次化协作。在HSR框架下,每个候选解决方案轮流充当“锚点”,其他方案则作为“参考”提供针对性修正。这种设计让强方案能够吸收弱方案的有价值见解,而不是简单地进行平均。具体包括四种修复维度:逻辑补全(填补缺失的推理步骤)、数值修正(纠正计算错误)、方法替换(用更优策略替代较弱方法)、表达优化(提升清晰度而不改变实质)。这种设计让优质方案能吸收其他方案的有价值见解,而非简单平均。下图通过一个图像识别任务生动展示了HSR的工作原理。面对昆虫识别和花朵计数的复合任务,锚点解决方案最初选择了ResNet(选项C),但存在部署时间计算错误。通过引入其他解决方案作为参考,系统进行了四类针对性修正。 3. Quality-Aware Iterative Reasoning (QAIR):质量驱动的迭代优化质量感知迭代推理(QAIR)能根据解答质量自适应地调整迭代深度:高质量解答可提前收敛,低质量解答则触发更多探索,从而在效率与准确率之间取得平衡。该机制为每个方案评估三个维度:逻辑性、答案正确性、解释完整性。只有未达标的方案才会进入下一轮修正,避免在低质量候选上浪费计算资源。全面碾压:不止于HLEEigen-1的优势不限于HLE: 1、HLE Bio/Chem Gold(149题) Pass@1: 48.30%(领先SciMaster 13.4个百分点) Pass@5:61.74%(首破60%) 2、SuperGPQA生物学(Hard版) Pass@1: 69.57% Pass@5: 78.26% 3、TRQA文献理解 Pass@1: 54.65% Pass@5: 79.07% 深层洞察:成功背后的规律错误模式分析Figure 7的饼图揭示了一个关键洞察:92.78%的错误涉及推理过程问题,88.66%涉及知识应用问题,且两者存在大量重叠。这表明科学推理的核心挑战不在于单纯的知识检索或逻辑推理,而在于如何将知识与推理无缝整合。相比之下,执行遵循错误(13.40%)和理解错误(9.28%)占比较小,说明模型在指令理解和执行层面已经相对成熟。 组件贡献的精确量化团队通过增量构建和消融实验精确量化了每个组件的贡献。基线系统在没有任何外部知识的情况下只能达到25.3%的准确率,消耗483.6K tokens。加入显式RAG后,准确率提升到41.4%,但代价是工作流步骤从43.4激增到94.8,这正是“工具税”的直观体现。当引入Monitor组件后,虽然准确率略降至34.5%,但token消耗骤降至218.4K,工作流步骤也降至51.3。随着Querier和Injector的加入,准确率恢复到40.3%。HSR的引入将准确率提升至43.7%,最后QAIR将完整系统的准确率推至48.3%,同时保持了高效的资源利用(218.9K tokens,53.4步骤)。消融实验从另一个角度验证了各组件的必要性。移除Monitor导致token消耗激增至461.3K,工作流步骤增至95.3,显示了隐式增强的巨大价值。移除HSR或QAIR分别导致准确率降至44.8%和43.7%,证明了层级精炼和质量感知迭代的重要作用。 多样性与共识的微妙平衡作者通过散点图和回归分析揭示了一个违反直觉但极具启发性的发现。在信息检索任务(339个样本)中,解决方案之间的一致性与准确率呈现较弱的正相关(斜率0.369),意味着不同的检索路径和视角能带来互补信息,多样性是有益的。而在推理任务(392个样本)中,情况完全相反——一致性与准确率呈现强正相关(斜率0.851),表明当多个推理路径得出相同结论时,这个结论很可能是正确的。因此,检索型任务应鼓励解法多样性与并行路线;纯推理型任务应倾向早期共识与收敛。这一发现为未来智能体系统的任务自适应设计提供了重要指导。 工具税的精确量化最后,作者通过对比准确率提升与token减少的关系,直观展示了隐式增强相对于显式RAG的巨大优势。传统的基线+RAG方案虽然能提升准确率,但以巨大的计算开销为代价,在图中表现为向右上方延伸(准确率提升但token增加)。而Eigen-1则位于左上象限,在大幅提升准确率的同时减少了53.5%的token消耗,工作流迭代次数也从94.8步降至53.4步,减少了43.7%。这种“既要又要”的成果,正是架构创新的价值所在。 意义:科学AI的新范式Eigen-1首次突破60分的意义远超一个基准测试:Eigen-1更预示着AI辅助科学研究的新范式。当AI能够真正理解和推理人类知识前沿的复杂问题时,它将成为科学家的强大助手,加速从基础研究到应用转化的全过程。研究团队表示,未来将继续优化架构设计,探索向其他科学领域的扩展,并研究如何将这些技术整合到更广泛的科学工作流中。随着更多研究者加入这一开源生态,我们有理由期待科学AI将迎来更快速的发展。正如团队所言:“HLE可能是我们需要对模型进行的一次重要的考试,但它远非AI的最后一个基准。”当开源社区携手推进,人类与AI协作探索未知的新时代正在加速到来。论文链接:https://arxiv.org/pdf/2509.21193v1项目地址:https://github.com/tangxiangru/Eigen-1 -
AI狂飙下的电力挑战 当越来越多的人习惯于向ChatGPT之类的人工智能寻求日常答案,这份触手可及的便利背后是由无声流淌的能源在默默支撑。研究估算,ChatGPT处理一次查询的耗电量约相当于一盏家用白炽灯点亮20秒所需的电力,而更为复杂的任务,其能耗可能达到普通搜索的近百倍。我们正步入一个能源需求越来越旺盛的世界。国际能源署(IEA)称其为“电力新时代”:交通、建筑和工业的电气化推动电力需求激增。除了电动汽车和工厂,数据中心也正在被视为电力需求的“新兴驱动力”。9月24日,人工智能巨头OpenAI宣布了其新数据中心建设计划:根据今年1月在白宫与特朗普总统共同公布的“星际之门”计划,将在美国各地建立五个新的数据中心,其能源消耗足以为数十万户家庭供电。IEA在4月发布的报告中指出,目前,AI占数据中心电力消耗的5%至15%,但到2030年,这一比例可能升至35%至50%,相当于日本全国目前的用电规模。届时,约十分之一的全球电力需求增长将来自数据中心。2021年,谷歌能耗为18.3TWh,其中AI部门仅占10%至15%,但有研究预测,仅谷歌AI部门几年后的年耗电量就可能与爱尔兰全国用电量(29.3TWh)相当。而中国的三峡水电站年发电量约为100TWh,这意味着未来仅谷歌AI就可能消耗掉三峡三分之一的发电量。AI应用在全球快速扩张,但其能源消耗问题却常被忽视。目前全球AI的碳排放已与全球航空业相当,约占全球总量的2%。AI会在多大程度上推高电力需求?我们如何在满足日益增长的数据与人工智能需求同时,实现能源的绿色供应,避免加剧对气候危机的影响?这些问题仍亟待我们去回答。美国电价上涨引发社会反弹一个温暖的周末早晨,佐治亚州梅肯市的罗莎·杰克逊社区中心早已热闹非凡。孩子们在体育馆内奔跑;家长们和其他成年人在当地环保组织设立的展台前驻足,电台DJ正为现场观众和听众进行直播。吸引人们前来的并非宏大的气候议题,甚至也不是当地的空气质量问题,而是一场抽奖活动——300美元的奖金可用于抵扣水电费。 据《时代》周刊报道,今年以来,在佐治亚州乃至全美范围内,电费持续上涨。南方环境法律中心的分析显示,过去两年,佐治亚电力公司的居民用户月均电费已增加超过40美元。美国能源信息署数据指出,自2022年以来,全国电价涨幅已达13%,超过通货膨胀率。推动居民电费增长的主要原因源于当地为满足数据中心用电需求新建的两座核电站超支成本及燃料费用上涨,加之今年7月破纪录的高温天气,部分用户的电费账单甚至翻倍或增至三倍。近年来,美国电价涨幅持续高于通货膨胀率。分析指出,近期的事件仅是开端:在电力需求平稳多年之后,美国电力需求出现了持续增长,增长主要受三方面驱动:电气化普及、制造业扩张以及为训练和运行AI模型而新建的高能耗数据中心。中美两国在人工智能领域已展开激烈竞争,AI技术高度依赖充足且廉价的电力。而美国电力供应体系及老化电网难以匹配需求增速。供应短缺与需求激增正在共同推高成本。目前,可再生能源(包括风能和太阳能)被视为最快、最经济的电力供应方式之一。然而,特朗普政府上台后,不仅削弱了《通胀削减法案》的支持力度,还对可再生能源发展设限,这也成为近期美国电价上涨的原因之一。预期中的电价大幅上涨可能改变民众行为。1985年以来,电价涨幅长期低于通胀率。如今,美国人开始担忧。安永公司去年调查显示,仅30%的受访者对能源成本可承受性有信心,近三分之二的人表示难以应对10%的涨幅。上述报道指出,这种变化折射出全球气候行动叙事的重要转变:几十年来,气候倡导者一直在试图让民众认识到全球变暖及其背后的化石燃料系统的作用,但成效有限。如今,许多美国人可能首次直接感受到这一系统的影响,人们日益担忧数据中心的快速扩张对能源成本的影响。能源可负担性正成为新焦点。电力将成为AI发展瓶颈国际能源署预测,到2030年,全球数据中心的电力需求将翻倍,达到约945TWh,相当于日本当前的总用电量。在增长份额中,中国和美国将主导全球数据中心电力需求的上升,合计占比约80%。长期研究AI能耗的荷兰央行金融经济学家、独立数据科学家亚历克斯·德弗里斯(Alex de Vries)向澎湃新闻(www.thepaper.cn)指出,AI正成为数字世界中最大的能耗来源之一,但对此相关的监管与透明度严重不足。“公众常将数据中心用电与AI用电混为一谈,因为AI服务器就在数据中心内运行,从外部无法区分。真正的区别在于内部:AI服务器使用高度专业化的芯片(如英伟达、AMD等),这些芯片将内存和处理单元集成在同一封装内,以提供极高的内存带宽,满足AI工作负载对内存的巨大需求。相比之下,传统服务器(用于流媒体、云存储等)使用不同的硬件,且其性能与能耗的关系与AI‘越大越好’的范式不同。”他说。 随着聊天机器人、搜索引擎、翻译工具等AI应用正被越来越多企业和个人广泛使用。支撑这些系统的是成千上万的高性能芯片,它们提供巨大的算力,先用于训练模型,再用于日常推理。尤其是后者,每天都在大规模进行,导致AI总能耗被严重低估。谷歌、微软、OpenAI等科技巨头对AI能耗披露极少。谷歌仅在2022年透露AI占其总能耗的10%至15%,此后未更新数据。《欧洲人工智能法案》仅要求企业报告训练阶段的能耗,而实际占大头的使用阶段的能耗却不在强制披露范围。缺乏强制报告机制使得AI的实际能耗难以追踪。由于缺乏直接数据,德弗里斯只能通过分析AI芯片供应链来估算能耗。“已知封装总产能和单个芯片尺寸,就能计算出能生产的芯片总数,进而推算出加速器模块、服务器数量,再结合已知的服务器功耗数据,最终估算出全球AI系统的总能耗。”他将此过程类比为“已知纸张大小和名片尺寸,计算能印制多少张名片。”根据今年5月德弗里斯在国际学术期刊《焦耳》上发表的研究,相较于其2023年的初步估算,过去两年的全球芯片生产数据显示AI的能耗增长远快于此前预期。“2023年底,AI的电力需求已达到我的祖国荷兰全国的用电水平,占全球数据中心耗电量的20%。这一需求在2024年可能会翻番,届时AI可能占全球数据中心耗电量的一半。”他说。“即使这个惊人的数字,可能仍是保守估计。因为我对数据中心冷却系统能效(PUE)可能过于乐观(实际更耗电);对AI服务器利用率(假设为65%)的估计可能偏低。”德弗里斯认为,短期内(1-2年)AI总能耗仍将显著增长,因为过去几年制约AI发展的主要瓶颈——芯片封装产能正在迅速扩张,例如台积电的产能每年翻番,供应正在追赶需求。然而,下一个瓶颈将是电力供应本身。AI的耗电量已经变得如此巨大,以至于寻找能够支撑这些庞大数据中心的充足电力变得非常困难。IEA指出,尽管全球范围内数据中心对总电力需求的推动相对有限,但由于数据中心分布高度集中,因此在某些国家影响更为显著。目前近一半的数据中心电力消耗发生在美国,25%在中国,15%在欧洲。美国劳伦斯伯克利国家实验室分析显示,2023年美国数据中心用电占全国4%,到2028年可能升至7%至12%。在爱尔兰,数据中心用电量已占全国21%,IEA预计到2026年这一比例将达32%。在弗吉尼亚州和都柏林等地区,数据中心用电占比甚至分别达到26%和79%。德弗里斯警告,AI的快速发展可能与气候减排目标相冲突,他呼吁企业提高透明度,以便政府制定政策,协调AI发展与可持续目标。否则,AI可能成为隐形的,不受控制的能耗与排放源。绿色和平气候与能源项目主任吕歆表示,2020年9月之后,中国数据中心企业对可再生能源的态度出现了明显的进展,先行企业开展ESG工作,参与绿电消费;2022年,多家头部企业承诺在2030年及以前实现100%可再生能源和运营范围碳中和。目前AI算力需求激增,企业绿电消费能否走出更加陡峭的增长曲线,如期实现2030年目标值得关注。电力需求何解?9月25日,在纽约举行的联合国气候周上,包括微软、谷歌等全球企业巨头都同意,为飞速增长的数据中心和人工智能提供能源将是一项共同的挑战。微软和谷歌的高管承认,他们建设数据中心的计划可能会导致增加使用化石燃料发电,尽管企业将尝试通过从其他地方购买可再生能源来减轻这种消耗的影响。在IEA报告中,到2035年,全球数据中心电力结构将从目前约60%化石燃料转变为60%清洁能源。这一转变主要依赖全球可再生能源扩张,部分可再生能源由数据中心企业直接资助。不过,IEA也指出,为满足数据中心需求,可能仍需扩大天然气和煤炭发电。目前,全球尚无完整的数据中心能耗或排放数据集,也缺乏政府强制报告,所有数字均为估算。眼下煤炭仍是全球数据中心最大的电力来源,尤其在中国。同时,中国的数据中心用电量增速预计将远高于全社会用电量。北京理工大学能源与环境政策研究中心今年1月发布的《2025年中国能源经济指数研究及展望》指出,2024至2030年,全国数据中心用电量年均增速将达20%,远超全社会用电量增速。新增的电力供应从何而来?绿色创新发展研究院(IGDP)能源转型项目主任、高级分析师李鑫迪解释说,中国数据中心多数依赖电网供电,其绿电比例取决于电网整体脱碳进度。企业可通过购买绿证或选择在可再生能源丰富地区(如云南)建立数据中心来提高绿电使用率。为应对数据中心的电力需求挑战,中国正通过“东数西算”工程、提升“绿电”比例(力争2025年国家枢纽节点新建数据中心绿电占比达80%),以及严格能效标准(PUE降至1.5以下)等措施,推动数据中心绿色转型。 吕歆指出,中国数据中心实现大规模绿电消费正聚焦三大关键:稳定的市场价格与预期、成熟的多年期绿电交易模式和畅通的跨区跨省绿电交易渠道。近年来,得益于政策引导与机制创新,已经取得了积极进展。针对“以绿电满足AI需求”的观点,德弗里斯认为有其局限:数据中心需全天候24小时稳定供电,而风电、光伏具有间歇性。AI数据中心同样面临备份电力依赖化石能源的问题。他强调,当前全球尚无足够可再生能源实现100%绿电供应。AI电力需求的激增,在中短期内反而可能增加对化石燃料的依赖。对此,吕歆认为,在新能源装机总容量较低时,企业通过参与绿电交易等方式,能够从需求侧有效促进新能源供给。伴随着更高比例的新能源接入电网,若缺乏储能等灵活性资源,新能源的消纳和利用可能成为挑战。因此,在现有基础上,持续完善市场的自调节能力、推动储能及需求侧响应等灵活性资源参与,能够助力新能源稳定供应和进一步发展。而对于“AI可通过优化其他行业节能以抵消自身能耗”的观点,德弗里斯也持怀疑态度。他指出,目前科技公司用电需求因AI能耗大幅上升,但节能效益尚未显现,IEA2024年报告也认为这些效益目前“可忽略不计”。德弗里斯提到“回弹效应”:即能效提升可能激发更大需求,导致总能耗不降反升。“AI本身就是典型案例:硬件与算法进步被用于构建更强大模型,推动总能耗上升。”他说。不过,AI普及速度、能效提升等仍存在不确定性。尽管生成式AI热度高,其商业持续增长前景可能弱于预期,而更优芯片、高效算法和大型数据中心可能提升能效,抑制电力需求。关于未来AI用电的增长趋势,李鑫迪则认为,尽管AI属于突变型技术,可能呈爆发式增长,但目前尚未有明确预测显示其会在新增电力需求中占主导地位。总之,国际能源署表示,电力需求增长为“发达经济体”敲响了“警钟”,要求电力行业投资基础设施,否则“满足数据中心负荷增长可能需要与电气化等其他目标进行权衡”。德弗里斯举了在欧洲发达国家中凸显电力分配机会成本的两个案例:在荷兰某地,当地电网容量饱和时,电力被优先分配给一个数据中心而非大学;在瑞典,政府对当地数据中心的电力补贴多年后取消,转而用于钢铁制造,因为当地政府认为数据中心创造的就业有限。“当电网容量饱和时,社会将不得不思考电力资源的优先分配问题。”他说。 -
稳定币的冷与热:数字金融竞逐背后的货币主权之争|焦点 图片系AI生成2025年9月下旬,全球稳定币市场呈现出一幅冷暖交织的鲜明图景。一边是监管的“急刹车”:据财新9月23日消息,中资机构在港的加密资产业务近期被明确要求收缩,包括投资、交易、发行RWA、稳定币等。降温之下暗流涌动,社交媒体日前流传全球首个与离岸人民币挂钩的稳定币已在港发行,不过消息被官方迅速辟谣。另一边却是国际市场的“狂热竞速”:9月24日,全球最大稳定币发行方Tether被曝正寻求以5000亿美元估值融资,这一体量足以比肩OpenAI和SpaceX等科技巨头。而欧洲九大银行财团日前官宣将开发欧元稳定币,以寻求美元替代方案。这种看似割裂的市场生态,实则是“蒙代尔不可能三角”在数字时代的赤裸演绎——当资本自由流动、汇率稳定与货币主权的平衡被打破,各国的战略选择必然分化,由此也揭开当前全球金融竞争的核心命题。当美国加速将稳定币打造为“链上美元”,以巩固货币霸权并企图让全球用户为美债接盘时,世界多国已清晰感受到本国货币主权被挤压的现实挑战。中国则明确路径,以香港为“合规试验田”探索发展边界,同时坚定推进数字人民币国际化进程。一场围绕数字时代货币主权与金融规则的无硝烟之战,已然拉开帷幕。二级市场上,相关公司的股价坐上了过山车。加幂科技距离高点已回调31%,饶是如此,该股年内涨幅仍高达1404%;国泰君安国际自6月25日起的半个多月股价暴涨556%,目前回调近40%;此外,云锋金融、恒宝股份、中科金财距本轮高点分别回撤29%、31%、35%。创新与风控间“走钢丝” 稳定币是一种与法定货币或其他稳定资产(如黄金)挂钩的加密货币,其核心目标是“锚定价值”。它的兴起不仅反映资本流动性扩张,更深层次地体现出全球资金流向、金融权力重构和数字资产范式转移的叙事趋势。最初推出稳定币的核心目标,是要解决传统加密货币价格波动幅度过大的问题,从而充当加密市场与传统金融之间的桥梁。然而这个看似“稳定”的金融创新,隐藏着巨大的系统性风险。 来源:招商银行研究院2022年5月,加密货币市场爆发了一场震惊全球的“雷曼时刻”——TerraUSD(UST)稳定币在一周内价值归零,连带其生态代币LUNA暴跌99.9%,400亿美元市值灰飞烟灭。无独有偶。全球最大稳定币USDT的发行方Tether,长期遭遇透明度的质疑。在业内看来,Tether储备资产披露滞后,审计机构未获美国官方认可;同时,市场普遍怀疑其储备中包含风险资产,一旦市场剧烈波动,这些资产价值可能暴跌。国际清算银行曾发出严厉警告,称稳定币具有三大缺陷:一是没有中央银行背书;二是缺乏对非法使用的足够防范措施;三是没有生成贷款的资金灵活性。其直言,稳定币未达到成为货币体系支柱的要求,甚至引发人们对其被用于洗钱和恐怖主义融资等金融犯罪的担忧。知名经济学者盘和林对笔者表示,稳定币的加密属性,给合法跨境支付提供机遇的同时,也给非法跨境支付提供了便利。“这就意味着,跨国支付不需要通过任何金融机构,用一串数字密钥就能够实现。”由于区块链技术的去中心化、无国界、匿名性等特点,使得监管机构难以有效追踪跨境资金的流向及规模,这为洗钱等非法金融活动提供了可乘之机。在不少行业人士看来,稳定币所谓的“稳定”,仅指与法币锚定机制的确定性,随着底层储备资产的价值波动,其币值难以真正稳定。此外,稳定币的生命线在于可随时兑付法币,若发行人没有充足的储备,一旦发生挤兑便可能引发致命危机,而信披风险也可能加速市场恐慌和挤兑的发生。金融街证券研究所分析师张宁告诉笔者,相较于传统金融,稳定币及其相关产业生态的合规性较为薄弱,其核心问题在于交易缺乏有效的真实性审查机制。正是这种透明度的缺失,引发外界对潜在金融风险的深切担忧。2019年全球稳定币规模仅50亿美元,到2024年已飙升至2500亿美元,六年暴涨45倍。这种野蛮生长态势,让稳定币从支付工具悄然演变为潜在的金融稳定威胁,引起了全球监管机构的高度警觉。随着欧盟MiCA法案、美国《GENIUS法案》和香港《稳定币条例》等法律的相继落地,标志着稳定币从“野蛮生长”迈入“合规发展”的新阶段。 来源:华源证券研究所“香港支持稳定币合规发展的深层逻辑,与其金融市场的结构性需求相关。”盘和林分析称,由于港币和美元是联系汇率,若美元稳定币生态成熟而香港缺位,将直接影响其国际资本吸引力。因此,推动稳定币发展是维持跨境资本顺畅流动的必要之举;当然,前提是规避其潜在风险。值得一提的是,香港稳定币条例被业界称为“全球最严”监管框架——预估2026年初发牌、首批牌照仅发放个位数、2500万港元准入门槛、全额储备要求。“稳”字当头背景下,如何做好金融创新与合规风险的平衡,是一个值得深思的问题。货币主权的数字化延伸 无论如何,稳定币正成为全球金融竞争的重要赛道。根据CoinMarketCap数据显示,稳定币总供应量已突破3000亿美元,创历史新高。全球市场中以美元稳定币为主导,全球99%的稳定币锚定美元,底层资产绝大多数为美国国债。其中,USDT(Tether)和USDC(Circle)两大美元稳定币合计占全球稳定币总市值的九成。以USDT(泰达币)为例,其宣称“1:1锚定美元”,是全球交易量和流通量最大的稳定币,广泛应用于加密货币交易平台支付、场外OTC、跨境结算等场景,被视为“加密美元”。 来源:恒泰证券研究所2008年金融危机爆发,美联储随之实施多轮量化宽松政策,美元加速贬值,严重动摇了美元在国际金融体系中的地位。近年来,美国努力通过发展稳定币来强化美元在国际货币体系中的主导地位,构建新型美元循环机制。2025年7月19日,特朗普正式签署《指导与建立美国稳定币国家创新法案》(GENIUS Act,俗称《天才法案》),标志着美国首次正式确立数字稳定币的监管框架。不少观点认为,此举意在缓解美债压力并加深美元全球影响力。最新的数据显示,美国债务规模已突破37万亿美元,亟需新的买家来接盘。《天才法案》要求稳定币要以1:1的比例与美元或短期美债等流动性资产挂钩,华夏数字资本创始人叶开直言,“其本质是让全球美元稳定币的使用者‘间接接盘美债’”。具体而言,这一制度设计形成了强大的债务吸纳闭环:美元现金→用户购买稳定币→稳定币发行方购买短期美债→美国财政部获得融资→发行更多债券→稳定币因规模增长增持更多美债。这种机制不仅为美债提供了“刚性需求”,更通过创造基于美元信用的“双重货币供给”(法币美元+链上美元),掩盖了债务的不可持续性和潜在流动性风险。“相比之下,美国加速稳定币立法的核心战略意图在于巩固美元霸权,化债等目标仅是次要考量。”在张宁看来,其深层意义在于扩大美元的应用场景和需求,强化全球经济对美元的依赖。也有学者提供了新的观察视角。“美国发展稳定币,是加密货币行业赌特朗普当选换来的利益。”在盘和林看来,本届特朗普主导的政府,其支持者中有大量加密货币从业者,发展稳定币是为了兑现竞选承诺。“既然稳定币是大势所趋,那么顺水推舟,由政府掌握稳定币的主导权是最佳解决方案。这一点类似于中国发行数字人民币的目的。”盘和林进一步解释道。“不可能三角”的取舍 值得注意的是,这种“链上美元化”趋势,对许多新兴市场及高通胀国家的货币主权构成挑战,或将促使世界多国研究如何摆脱对美元的单一依赖,构建多币种、多轨道的支付结算体系。欧洲央行行长克里斯蒂娜·拉加德近日曾多次呼吁推进数字欧元,称其为欧洲金融自主权的关键。另有报道称,日本金融服务局计划于今年秋季批准其首个以日元计价的稳定币。需要指出的是,健全的公链是落实稳定币的必要条件。当前主流稳定币主要部署在以太坊、波场(TRON)、Solana等公链之上。中国目前唯一符合监管要求的公共区块链是树图链,为图灵奖得主、姚期智院士与清华“姚班”的成果。鉴于香港和内地均没有有影响力的公链,因此市场有一种观点担忧,如果采用美国公链可能被“卡脖子”。对此,张宁认为,公链并非高精尖领域,技术上不存在卡脖子问题。他强调:“国内公链发展滞后的关键并非技术瓶颈,而是尚未开放的区块链生态环境,导致其缺乏关键的应用场景与创新空间。”在张宁看来,国内更希望把数字人民币作为国际支付的重要手段。这一点上,盘和林的观点类似,他认为内地已有数字人民币,不会允许私人铸币来破坏人民币的地位。 来源:招商银行研究院就在9月24日,数字人民币国际运营中心在上海正式运营,并推出三大业务平台——跨境数字支付平台立足于支持人民币国际化与跨境使用,探索运用法定数字货币解决传统跨境支付中存在的痛点;区块链服务平台定位于支持标准化的区块链交易转接和链上数字人民币支付服务;数字资产平台定位于支持链上发行、登记、托管和交易合规数字资产。“数字人民币发展又迈出重要一步,有助于提升我国在全球金融体系中话语权的关键布局。”清华大学国家金融研究院院长田轩表示,其更深层意义在于通过构建“多边合作、多方共赢”的数字货币生态,推动国际货币体系向多元化演进。无论是监管对稳定币态度趋向审慎,还是对数字人民币定位的考量,本质上均未摆脱“蒙代尔不可能三角”的约束——这一国际经济学中的著名理论强调,一个国家不能同时维持固定汇率、独立货币政策和资本自由兑换。“面对私人稳定币带来的挑战,CBDC(央行数字货币)作为国家力量的直接回应而出现,在‘不可能三角’的权衡中作出了明确的选择。”高华声复旦大学国际金融学院教授曾撰文称,CBDC侧重于在央行主导框架内,有序地拓展其应用场景,旨在增强金融体系的整体稳定性,其系统架构与全球化的公链网络保持了相对独立性,体现了对国家主权的绝对维护,而这一战略定位,也必然使其在资本效率方面存在牺牲。国际货币体系多元化转型,弱化对美元的过度依赖渐成趋势。在此背景下,后续稳定币板块的行情大概率会进入到分化阶段。“可能获取首批稀缺牌照的发行人,及确定性参与稳定币使用场景创设的场景平台或为两条主线。”中信证券曾给出这样的判断。(本文首发钛媒体App,作者 | 马琼,编辑 | 曹晟源) -
AI视频生成“暗战”起风 用户付费在大语言模型中尚未跑通,但正悄然在AI视频生成赛道中生根发芽。今年6月,AI视频生成初创公司Runway的年化营收超过9000万美元(约合人民币6.4亿元);同年第二季度,快手(1024.HK)旗下的AI视频生成应用“可灵”创收超过2.5亿元。国内初创公司纷纷涌上牌桌。北京生数科技有限公司(下称“生数科技”)的“Vidu”、北京爱诗科技有限公司(下称“爱诗科技”)的“拍我”用户数均已突破千万;作为“杭州AI六小龙”首个IPO,Manycore Tech Inc.(下称“群核科技”)年内亦计划发布针对C端消费者的AI视频生成产品。市场对于AI视频的商业化前景不仅是局限于个人创作者生成一段短视频,还有影视创作、具身智能等更多领域。但由于空间一致性、内容拼接的崩坏等问题的存在,亦让AI视频生成模型陷入“卖家秀”和“买家秀”的争议中。尽管属于AI视频生成行业的DeepSeek时刻尚未到来,但在各家大厂的加码下,市场有理由相信未来的发展路径会愈发清晰。拼时长 2024年2月,OpenAI推出了Sora 1.0,较此前Runway只能生成3-4秒的视频来说实现了突破性的进展,成为全球首个支持生成长达60秒的AI视频生成模型。此后国产模型也逐渐对此实现追赶。目前国内既有字节、快手、百度等互联网大厂,也有生数科技、爱诗科技等初创公司正在探索AI视频生成应用领域。南方一家科技公司产品经理告诉信风,今年以来AI视频生成领域最大的变化主要体现在时长,即可以通过AI生成更长的视频。虽然当前AI视频生成模型公司一次生成的视频时长基本在5秒-10秒,但通过一个个镜头的生成已经可以组合形成一段连贯的视频。影视行业便是第一批尝鲜者。今年8月上线的50集动漫短剧《明日周一》,便是通过生数科技的Vidu AI视频模型生成。实操方面,《明日周一》制作团队采取原画师手绘核心角色设定,再通过Vidu的图生视频及参考生功能进行动画延展。生数科技告诉信风,《明日周一》80%左右内容由Vidu Q1的图生视频功能和参考生视频生成,深度贯穿了从美术设定到动画成片的多个核心环节。这也使得不到10人的制作团队45天内就完成了《明日周一》第一季50集的所有内容制作,平均不到一天产出1集,而传统2分钟漫剧制作周期长达一周,制作效率提升至少7倍。快手旗下的“可灵”重要场景之一亦是影视制作。据快手管理层在业绩电话会透露,目前“可灵”客户群体涵盖了包括专业人士在内的大众创作者、电商及广告行业从业者和影视制作工作室等。长度的限制仍在被进一步打破。日前,百度对旗下AI视频生成模型“百度蒸汽机”进行升级,支持用户生成无限长度的AI视频,一举打破了此前AI仅能生成5-10秒短视频,或依赖首尾帧控制续写时长的局限。使用中,用户只需输入图像和提示词,就能生成任意时长的视频。前述南方科技公司产品经理认为,视频时长的突破背后不只是“堆算力”带来的结果,更关键的动力源自算法的优化和数据量的增加。据百度介绍,长视频生成技术方案上主要引入自回归扩散模型,结合自回归的长序列能力和扩散一致性强的优势,能够准确生成符合世界物理规律且高一致性的长视频。信风参与百度蒸汽机的内测,以人物作为首图和“1-5s镜头跟随,⼈物快速向⾛。6-10s镜头跟随,⼈物向前⾛向楼梯。11-15s⼈物向前⾛,镜头跟随,右摇。16-20s⼈物向前⾛,镜头跟随,右摇,环绕到⼈物正⾯。”为提示词结合的方式,生成了一段20秒的短视频。(见「百度蒸汽机」AI视频⽣成模型)在视频中可以看到,虽然人物表情变化衔接宛如换了一张脸,且物体出现凭空消失的情况,但人物运动轨迹自然,背景也没有出现崩坏的情况。价格战硝烟 尽管国内的大语言模型尚未能走通向C端用户收费的路径,但AI视频生成模型公司已经在探索商业化模式。从收费情况来看,各家差异较大。仅以标准版为例,可灵、生数科技的Vidu分别为66元、59元;爱诗科技的拍我、字节跳动的即梦则均为79元。不过Vidu、即梦属于“加量不加价“,分别可生成200个/月、216个/月的视频。相比之下,可灵、拍我则只能生成数十个视频。各家的商业化均已取得一定的成果。目前快手是为数不多披露AI视频生成应用商业化成果的大厂,2025年第二季度“可灵”的收入已超2.5亿元。初创公司方面,生数科技的Vidu上线8个月年化经常性收入(ARR)突破2000万美元(折合人民币1.4亿元);爱诗科技的拍我则称订阅收入已经覆盖成本。不过大厂之间为了吸引专业创作者使用,已经悄然打起了价格战。据百度透露,百度蒸汽机已经在搜索、营销等多个场景落地应用,且定价低至行业70%;日前,可灵推出2.5 Turbo模型时,核心卖点之一便是“相比2.1模型同档位便宜近30%,性价比方面优势更加凸显。”价格战的另一面,是不少公司在跃跃欲试。信风获悉,正在冲刺港交所IPO的群核科技亦在研发一款基于3D技术的AI视频生成产品,有望在年内发布。群核科技内部人士向信风透露,该AI视频生成产品未来将面向C端用户开放。群核科技的重要优势在于,庞大且物理正确的室内空间数据集。“我们在开发(家装设计软件酷家乐等)工具的过程当中,积累了海量的数据,这些海量数据与AI直接生成的三维模型不一样,包括有物理正确可交互的模型,材质也都是物理正确的,表面的物理系数都有,里边有结构化的信息,也就有结构化标注。”群核科技董事长黄晓煌指出。今年8月,群核科技的数据集InteriorGS还曾一度登上全球最大AI开源社区Hugging Face趋势榜的榜首,成为全球首个适用于智能体自由运动的大规模3D数据集。这或许都给不少公司带来更多压力,要求各方进一步拓宽商业化边界。目前市场对该行业的想象空间并不止于影视广告行业,还有机器人训练等场景。一直以来,机器人训练面临训练数据的稀缺性、场景覆盖局限性、采集成本高等痛点,但AI视频生成应用可以为机器人提供虚拟场景进行训练,进而更好地了解真实世界的运行规律。部分机器人公司正在自研算法。例如今年3月具机器人公司逐际动力发布的具身智能操作算法LimX VGM,正是利用视频生成技术推动具身大脑突破。一名参与该项目人士向信风坦承,受限于数据量的问题,目前视频生成大模型的泛化程度有限。但该人士持乐观态度,颇为看好AI视频生成模型用于机器人虚拟环境训练的行业趋势。此前业绩会上,快手管理层则表示计划扩大“可灵”在游戏制作、专业电影以及视觉制作中的应用。买家秀VS卖家秀 尽管当前各家AI视频生成公司均表示提升了空间一致性,但信风实测来看主体运动过程中脸部表情崩坏、背景出现清晰模糊交织的问题层出不穷。以拍我为例,信风使用图生视频的方式生成了一段人物跳舞的短视频,但出现人物表情变形、物体凭空消失等问题。(见「拍我」AI视频模型⽣成)杭州一位行业人士告诉信风,复杂运动场景下偶现的面部细节与背景一致性问题,是行业共同面临的技术挑战,核心难点在于模型对长时序运动轨迹与多尺度语义连贯性的精准建模。群核科技产品经理龙天泽认为这与训练的数据来源有关。“核心在于现在的AI视频算法是基于2D图像序列去学习,所以不可能真正理解3D空间和规则,它学会了如何让上一帧图像在视觉上变的更像下一帧图像,但是它并不理解真正的3D空间关系,不理解所谓的物理世界运行的基本逻辑。”龙天泽指出。目前各方主要从优化算法、构建数据集的角度解决空间一致性问题。生数科技告诉信风,目前主要通过三大路径进行优化:一是基于自研U-ViT架构的时空联合注意力机制优化,增强模型对主体运动轨迹与背景关联性的预测能力;二是构建超大规模高质量视频训练数据集,针对性强化复杂运动模式的语义理解;三是引入动态遮罩与一致性补偿算法,在后期生成环节实时修复帧间异常。“目前我们的参考生视频功能已实现从人脸到主体多层次的一致性提升,后续将重点突破大幅度运动下的稳定性边界。”生数科技表示。群核科技方面则是在推进3D视频生成的工作流研发,有望在变化的运境下降低明显的穿模和畸变的反应。不过这类方式的挑战在于,使用者需要掌握视频生成的数据输入等。隐私的边界 高质量的数据集是当前不少AI视频生成模型公司渴求的训练素材。部分国外大厂为了提升对AI视频生成模型的人物主体一致性的训练,甚至不惜通过下载成人电影作为训练素材。Meta便遭受如此质疑。今年7月,两家美国成人电影公司Strike 3 Holdings和Counterlife Media,便以Meta偷偷下载2396部成人电影训练自家的AI模型为由,将其推向了被告席。“确实是个很新的案件,涉及版权侵权,估计Meta还是会主张fair use(合理使用)。”一位在美执业的知识产权律师告诉信风,“现在对于这些训练素材也没有什么统一的规则,只能是争议中前行。”相比之下,国内的平台在训练素材方面或许拥有更多弹性的空间,这当中尤以视频平台独具优势。虽然视频平台并不拥有对用户所发布视频的独占权,但一般拥有使用权。例如快手的《基本功能隐私政策》中明确指出,为了实现广告推送与投放,并有助于其评估广告投放效果、有效性之目的,可能需要与广告主、服务商、供应商第三方合作伙伴读取用户的部分信息与数据。这或许意味着,快手、抖音等视频平台在AI视频生成赛道方面相比其他公司将拥有更多数据优势。随着AI视频生成赛道的逐渐发展,数据使用的边界或许也将更加清晰。 -
AI基建热潮藏隐忧:芯片3-5年就报废,需8000亿美元销量才能回本 IT之家 9 月 29 日消息,据 《华尔街日报》报道,人工智能(AI)热潮已引发史上最昂贵的建设浪潮之一。短短三年内,各大科技公司在人工智能数据中心、芯片及能源领域的投入,已超过美国耗时四十余年建设州际公路系统的总花费。 报道指出,人工智能基础设施领域的巨额投资正引发担忧,市场对人工智能的乐观预期或许难以兑现。该报道强调,人工智能模型的开发成本极高,回报需要更高才能证明这些支出是合理的。报道援引一位分析师的观点称,2023 年和 2024 年的人工智能基础设施投入若要实现盈利,消费者与企业需在这些芯片及数据中心的使用寿命周期内,购买价值约 8000 亿美元(IT之家注:现汇率约合 5.71 万亿元人民币)的人工智能产品。报道同时提到,数据中心芯片的使用寿命有限,因为人工智能技术的飞速发展会迅速削弱其价值。报道援引分析师估算数据显示,大多数人工智能处理器的有效使用年限仅为 3 至 5 年。OpenAI 首席执行官山姆・奥尔特曼已承诺,未来几年内,公司将向甲骨文(Oracle)平均每年支付约 600 亿美元(现汇率约合 4283.24 亿元人民币),用于数据中心服务器相关服务。与之形成对比的是,预计 OpenAI 今年从付费用户处获得的营收仅约 130 亿美元(现汇率约合 928.03 亿元人民币)。此外,报道援引分析师观点补充称,人工智能基础设施投入的激增意味着,到 2030 年,人工智能领域的年营收需达到 2 万亿美元(现汇率约合 14.28 万亿元人民币)。作为参考,这一数字不仅超过亚马逊、苹果、Alphabet、微软、Meta 和英伟达 2024 年的营收总和,更相当于全球整个订阅软件市场规模的 5 倍以上。彭博社则指出,人工智能企业的营收正实现快速增长:OpenAI 预计今年销售额将增至 127 亿美元,较此前增长两倍;其竞争对手 Anthropic 的年营收已超过 50 亿美元。但彭博社同时强调,这些营收数字与未来飙升的成本相比仍相形见绌。报道援引分析师估算称,2025 年至 2028 年间,全球数据中心投入将达到 2.9 万亿美元(现汇率约合 20.7 万亿元人民币),这一规模大致相当于法国一年的国内生产总值(GDP)。 -
德国街头现“AI 停车侦探”:1 小时查 1500 辆车,效率是人工7倍 IT之家 9 月 29 日消息,全球各地的城市正纷纷借助科技手段,尤其是人工智能(AI),来管理交通拥堵的街道和捉襟见肘的停车资源,德国也不例外。该国正准备试点一套停车执法系统,其看起来更像是来自科技实验室的产物,而非应用于城市街道的常规设备。 目前,海德堡市已启用一款名为“城市扫描仪”(Cityscanner)的设备。这是一辆搭载摄像头、激光雷达(lidar)并可实时核查数据库的小型车辆,专门用于侦测违章停车行为。该系统依靠 AI 技术运行,效率极高,每小时可核查约 1500 辆停放车辆,使得其他一些城市的停车执法手段相形见绌。全方位智能监测 “城市扫描仪”由总部位于雷根斯堡的 DCX Innovationis 公司研发,车辆顶部安装的摄像头每秒可捕捉 25 帧画面。在行驶过程中,该设备能自动识别车牌、核查车辆是否停放在合法车位内,甚至可与 Easypark、Parkster 等数字停车应用程序进行数据交叉验证。 DCX 公司已在其它国家部署该系统,目前波兰有近 24 辆搭载该系统的车辆投入使用。法国和荷兰也已启用类似的扫描设备,由此可见,海德堡虽不是首批采用该技术的城市,但仍是这一技术推广进程中值得关注的案例。激光雷达传感器能够检测车辆是否停放在限行区域、自行车道、消防通道内,或车身过度突出至车流中。为确保执法准确性,系统会在几分钟内对同一线路往返巡查两次,之后才会开具罚单。事实上,在罚单正式送达违章者手中之前,还需人工对“城市扫描仪”捕捉的数据进行二次核实。这一人工核验环节十分必要,因为这款 AI 驱动的系统无法识别残疾人士停车许可证等特殊标识。据德国《商报》(Handelsblatt)报道,在全速运行状态下,“城市扫描仪”的执法效率约为人工步行巡逻的 7 倍。该报还指出,海德堡此次试点工作是在巴登 - 符腾堡州新法规框架下开展的,该州近期才为这类智能执法系统确立了法律依据。据悉,搭载“城市扫描仪”的车辆特意采用了醒目标识,其设计初衷不仅是作为“移动罚单开具设备”,更希望起到震慑作用。官方表示,即便尚未开出罚单,这种高可见度的执法设备也可能促使车主规范停车行为。准确性之外的隐忧 然而,这套系统并非完美无缺,仍存在一些值得关注的问题。隐私保护是全球范围内的重要议题,在德国尤其受到高度重视。对此,“城市扫描仪”研发方表示,设备拍摄的照片不会保存合法停放车辆的人脸或车牌信息;仅有警方有权查看相关图像,且据称这些图像仅包含违章车辆的信息。 除隐私问题外,“城市扫描仪”的成本也不容忽视。该公司表示,虽然可在约 4 小时内将这套设备安装到任意车辆上,但单套设备成本约为 13 万欧元(IT之家注:现汇率约合 108.5 万元人民币),且这一价格尚未包含软件授权费用。 -
马斯克:特斯拉正全力推进人形机器人规模化生产 IT之家 9 月 29 日消息,埃隆・马斯克表示,特斯拉正全力推进“擎天柱”(Optimus)人形机器人的规模化生产。在他看来,这款产品最终将成为特斯拉旗下最重要的产品。 “特斯拉擎天柱”是该公司的人形机器人项目,数年前首次对外公布,而在过去一年中,该项目的重要性显著提升,也成为特斯拉更核心的关注焦点。去年 10 月,特斯拉在“我们,机器人”(We, Robot)活动上,这款机器人承担了递酒、表演娱乐节目以及与参会者互动等任务。然而,要实现“擎天柱”的真正规模化生产,对特斯拉而言仍是一项挑战。尽管特斯拉对该机器人的产量有着宏大规划,但项目部分环节的难度已超出预期,比其他环节更具挑战性。其中最受关注的难题之一是机器人的手部研发。特斯拉希望“擎天柱”的手部具备足够灵活性,甚至能完成“穿针引线”的动作,而这一目标的实现难度极大。此外,量产规模的扩大与制造工艺的优化,也可能是特斯拉面临的挑战。马斯克强调,特斯拉正“全力推进‘擎天柱’的规模化生产”。由于该项目对特斯拉未来发展至关重要,解决规模化生产问题已成为关键任务。 马斯克还对“擎天柱”的发展前景及未来对特斯拉的重要性作出了极具前瞻性的预测。本月初,他表示,未来“擎天柱”将贡献特斯拉约 80% 的公司价值。今年 1 月,在特斯拉 2024 年第四季度财报电话会议上,他也指出,“擎天柱”将“在公司价值中占据绝对主导地位”。马斯克不仅从资金和营收角度强调“擎天柱”的重要性,还称其“无疑将成为有史以来最重要的产品”—— 因为这款机器人有望为人类生活带来革命性变革。他表示,拥有“擎天柱”,就如同“拥有专属的 C-3PO 与 R2-D2(IT之家注:二者均为《星球大战》系列中的经典机器人角色)”。 -
萝卜快跑计划将业务扩展至澳洲和东南亚 盖世汽车讯 据外媒报道,近日,百度旗下的自动驾驶出行服务平台“萝卜快跑”(Apollo Go)的国际化业务总经理牛昊天(Halton Niu)在接受彭博电视台采访时表示,目前团队正与澳大利亚及东南亚部分国家的政府沟通,探讨将自动驾驶车辆引入这些市场的前景。日前,萝卜快跑已从迪拜相关部门获得50张自动驾驶测试许可证,这使其在阿联酋的车队规模可扩大一倍,达到约100辆。 图片来源:萝卜快跑牛昊天称:“在中东和欧洲地区,我们正与不同国家的地政府接洽。目前仅在上述地区的少数城市开展了业务部署。此外,公司也在与东南亚及澳大利亚的政府部门保持沟通。”当前,中国自动驾驶企业正积极向海外扩张,尤其聚焦于对前沿技术持开放态度的地区。得益于中国成熟的电动汽车供应链,中国企业的车辆成本更低,这使其相较于Waymo等美国竞争对手具备明显优势。牛昊天表示,萝卜快跑在中国市场运营经济效益的改善,为无人驾驶出租车大规模推广提供了商业可行性支撑。通过规模化运营并取消安全员(人类驾驶员),萝卜快跑在部分运营城市实现了单车收支平衡,而这一成果并非仅出现在其车队规模最大的武汉,部分其他城市同样达成该目标。他称,“如今在中国大陆的多个城市,每一辆(无人驾驶出租)车都能实现盈利”。不过牛昊天补充道,萝卜快跑作为一个业务部门实现整体盈利,仍需一段时间。自2013年起,百度已在自动驾驶技术研发领域投入数十亿美元。目前,该公司已在中国及海外城市部署了超过1,000辆自动驾驶车辆。近期,百度还与美国打车平台Lyft达成合作协议,计划进军欧洲市场,若获得监管批准,双方将于明年率先在英国和德国启动相关服务。牛昊天提到,欧洲的监管机构最初可能会存在一些顾虑,例如车辆自动驾驶过程中收集的数据将如何存储。他回应称,相关数据将全部在运营地区本地存储,且萝卜快跑已在瑞士注册相关公司,并正在当地招聘员工。 -
北京处罚4家共享充电宝企业 北京商报讯(记者 张茜琦)9月28日,北京商报记者了解到,北京市市场监管综合执法总队对4家共享充电宝服务企业依法作出罚款的行政处罚。这是全国市场监管领域运用《中华人民共和国消费者权益保护法》,针对共享充电宝租赁领域侵害消费者权益问题的首度"亮剑"。此前,2025年7月,北京市市场监管综合执法总队针对多起消费者投诉的"归还难、乱收费"等问题,对4家企业予以立案调查。经查,这些企业存在租赁服务与售后服务脱节问题:代理商负责柜机运营,品牌方仅提供线上租赁,导致消费者常因柜机满位、设备故障无法归还,却仍被持续计费,甚至归还后扣费不止 。同时,企业客服多为AI自动回复,消费者退费等诉求难以解决,且计费规则等信息公示不透明,侵害了消费者公平交易权、自主选择权与知情权 。目前,4家企业已积极整改,加入《北京市共享充电宝行业自律公约》,承诺建立暂停计费机制——因柜满等原因无法归还的,核实后可暂停计费;因设备问题等导致无法归还的,可免除费用 。