找到
852
篇与
互联网
相关的结果
- 第 25 页
-
科幻!谷歌放出Gemini Robotics-ER 1.5:机器人有了真正的思考力 谷歌刚刚放出了其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5。这是首个被广泛开放给所有开发者的Gemini机器人系列模型,它将作为机器人的高级推理大脑 Gemini Robotics-ER 1.5(简称 Gemini Robotics-Embodied Reasoning)是一种视觉-语言模型 (VLM),可将 Gemini 的智能体功能引入机器人技术领域。Gemini Robotics-ER 1.5 是一款思考型模型,能够推理物理世界、原生调用工具,并规划逻辑步骤来完成任务 虽然 Gemini Robotics-ER 1.5 与其他 Gemini 模型类似,但它是专门为增强机器人感知能力和现实世界互动能力而构建的。它通过以下方式提供高级推理功能来解决物理问题:解读复杂的视觉数据、执行空间推理,以及根据自然语言命令规划行动 在操作方面,Gemini Robotics-ER 1.5 旨在与现有的机器人控制器和行为配合使用。它可以按顺序调用机器人的 API,使模型能够编排这些行为,以便机器人完成长时程任务 借助 Gemini Robotics-ER 1.5,可以构建以下机器人应用: 让人们能够使用自然语言分配复杂的任务,从而使机器人更易于使用 通过使机器人能够推理、适应和响应开放式环境中的变化,提高机器人的自主性 Gemini Robotics-ER 1.5 为各种机器人任务提供统一的模型:定位和识别对象 1.准确地指向并定义环境中各种项目的边界框。了解对象关系 2.推理空间布局和环境背景信息,以便做出明智的决策。规划抓取和轨迹 3.生成用于操纵物体的抓取点和轨迹。解读动态场景 4.分析视频帧,以跟踪对象并了解一段时间内的动作。编排长时程任务 5.将自然语言命令分解为一系列逻辑子任务,并对现有的机器人行为进行函数调用。人机交互 6.通过文本或语音理解以自然语言给出的指令 Gemini Robotics-ER 1.5预览版现已开放。可以通过以下方式开始体验:启动 Google AI Studio 来实验该模型。 阅读开发者文档获取完整的快速入门和API参考 https://ai.google.dev/gemini-api/docs/robotics-overview?utm_source=gemini-robotics-er-1.5&utm_medium=blog&utm_campaign=launch&hl=zh-cn 官方的 Colab notebook 查看实际应用案例 https://github.com/google-gemini/cookbook/blob/main/quickstarts/gemini-robotics-er.ipynb?utm_source=gemini-robotics-er-1.5&utm_medium=blog&utm_campaign=launch完整技术报告:https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf这个模型专为那些对机器人来说极具挑战性的任务而设计。想象一下,你对一个机器人说:“请把这些物品分类到正确的厨余、可回收和普通垃圾桶里。”要完成这个任务,机器人需要: 1.上网查找本地的垃圾分类指南。 2.理解眼前的各种物品。 3.根据本地规则规划出分类方法。 4.执行所有步骤,完成投放。像这样的日常任务,大多需要结合上下文信息并分多步才能完成。Gemini Robotics-ER 1.5正是首个为这种具身推理(embodied reasoning)而优化的思考模型。它在学术基准和内部基准测试中都达到了业界顶尖水平 Gemini Robotics-ER 1.5有哪些新能力? Gemini Robotics-ER 1.5专为机器人应用进行了目标性微调,并引入了多项新功能:快速强大的空间推理:以Gemini Flash模型的低延迟,实现顶尖的空间理解能力。该模型擅长生成语义精确的2D坐标点,这些坐标点基于对物品尺寸、重量和功能可供性的推理,从而支持如“指出所有你能拿起的物体”这类指令,实现精确、快速的交互协调高级智能体行为:利用先进的空间和时间推理、规划和成功检测能力,可靠地执行长周期任务循环(例如,“按照这张照片重新整理我的书桌”)。它还能原生调用谷歌搜索和任何第三方自定义函数(例如,“根据本地规定将垃圾分类”)灵活的思考预算:开发者现在可以直接控制模型的延迟与准确性之间的权衡。这意味着,对于像规划多步组装这样的复杂任务,你可以让模型“思考更长时间”;而对于探测或指向物体等需要快速反应的任务,则可以要求更快的响应改进的安全过滤器:模型在语义安全方面进行了改进,能更好地识别并拒绝生成违反物理约束的计划(例如,超出机器人的有效载荷能力),让开发者可以更自信地进行构建智能大脑 你可以将Gemini Robotics-ER 1.5视为机器人的高级大脑。它能理解复杂的自然语言指令,对长周期任务进行推理,并协调复杂的行为。当收到一个像“把桌子收拾干净”这样的复杂请求时,Gemini Robotics-ER 1.5能将其分解成一个计划,并调用正确的工具来执行,无论是机器人的硬件API、专门的抓取模型,还是用于运动控制的视觉-语言-行为模型(VLA)。高级空间理解能力 为了与物理世界互动,机器人必须能够感知和理解其所处的环境。Gemini Robotics-ER 1.5经过微调,能够生成高质量的空间结果,为物体提供精确的2D坐标点在指向精度方面,Gemini Robotics-ER 1.5是目前最精确的视觉语言模型 例如,在2D坐标点生成任务中,给定一张厨房场景的图片,模型可以提供每个物品的位置 提示: 指出图中的以下物品:洗洁精、碗碟架、水龙头、电饭煲、独角兽。坐标点格式为[y, x],数值归一化到0-1000。只包括图中实际存在的物品。值得注意的是,提示要求模型只标记图中出现的物品,这可以防止模型产生幻觉(比如为不存在的“独角兽”生成坐标),使其始终基于视觉现实 时间推理能力 真正的时空推理不仅要定位物体,还要理解物体与行为之间随时间展开的关系。Gemini Robotics-ER 1.5通过处理视频来理解物理世界中的因果关系。例如,在一个视频中,机械臂先将一支绿色记号笔放入木盘,再将蓝色和红色的笔放入笔筒。当我们要求模型按顺序描述任务步骤时,它给出了完全正确的答案 提示: 详细描述完成任务的每一步。按时间戳分解,以json格式输出,包含 "start_timestamp", "end_timestamp" 和 "description" 键。响应:[ { "start_timestamp": "00:02", "end_timestamp": "00:13", "description": "左机械臂从桌上拿起绿色记号笔,并将其放入木盘中。" }, { "start_timestamp": "00:15", "end_timestamp": "00:22", "description": "左机械臂从桌上拿起蓝色笔,并将其放入黑色网状笔筒中。" }, { "start_timestamp": "00:23", "end_timestamp": "00:28", "description": "右机械臂从桌上拿起红色笔,并将其放入黑色网状笔筒中,完成了整理书写工具的任务。" } ]模型甚至可以根据要求,对特定时间段(如第15秒到22秒)进行更细致的逐秒分解,输出结果在时间上非常精确 基于可操作性推理来协调长周期任务, 当启用思考功能时,模型可以对复杂的指向和边界框查询进行推理。下面是一个制作咖啡的例子,展示了模型如何理解完成任务所需的“如何做”和“在哪里做” 1. 问: 我应该把杯子放在哪里来冲咖啡? 答: 模型:在咖啡机下方标记出一个边界框 2. 问: 咖啡胶囊应该放在哪里? 答: 模型:在咖啡机顶部的胶囊仓位置标记出边界框 3. 问: 现在,我需要关上咖啡机。请绘制一条由8个点组成的轨迹,指示盖子把手应如何移动以关闭它 答: 模型:生成了一条从开启到关闭位置的精确路径 4. 问: 我喝完咖啡了。现在应该把杯子放在哪里清洗? 答: 模型:在水槽中标记了一个点 通过结合规划和空间定位,模型可以生成“空间锚定”计划,将文本指令与物理世界中的具体位置和动作联系起来 灵活的思考预算 下图展示了调整Gemini Robotics-ER 1.5模型思考预算对延迟和性能的影响 模型的性能随着思考token预算的增加而提升。对于像物体检测这样的简单空间理解任务,很小的预算就能达到高性能;而更复杂的推理任务则需要更大的预算这使得开发者可以在需要低延迟响应的任务和需要高精度结果的挑战性任务之间取得平衡。开发者可以通过请求中的thinking_config选项来设置思考预算,甚至禁用它参考:https://developers.googleblog.com/en/building-the-next-generation-of-physical-agents-with-gemini-robotics-er-15/ -
重磅开场!2025网易未来大会今日开幕 9月27日,2025网易未来大会正式开幕。本届大会是“第四届全球数字贸易博览会”的组成部分之一,汇聚了国内外顶尖院士、AI创业者、投资人及行业领袖,共同探讨AI技术的前沿趋势与产业机遇。 从大模型突破到具身智能革命,从AI消费品爆款到全球投资风向,这场大会不仅是一场思想碰撞的峰会,更是一次触摸未来的体验之旅。 上午场:顶尖院士领衔, AI与人类共谋共生 上午场,中国工程院潘云鹤,加拿大工程院院士孟庆虎领衔,具身智能领域泰斗王田苗教授、知名经济学家付鹏同台,从AI和人类关系、硅基生命和碳基生命的共生、具身智能的挑战、AI和经济的关系等议题展开。 提出“人工智能2.0”等前沿概念的潘云鹤院士将会带来《AI发展的新趋势》主题演讲,一起期待潘院士如何为中国AI的未来“出谋划策”。 机器人领域权威专家孟庆虎院士将会带来极具辩证意义的《人工智能时代的手术机器人还是机器人手术?》的主题演讲;具身智能领域泰斗王田苗教授则会带来《2025具身智能破局之路》的主题演讲,金融圈“全能型选手”付鹏将分享《全要素生产力的AI时代》相关话题内容。精彩纷呈,备受期待。 下午场:叩问AI, 一线顶流创业者齐聚 下午场,香港理工大学人工智能高等研究院院长、加拿大工程院及加拿大皇家学院院士杨强,以及昆仑万维董事长兼CEO方汉、智谱副总裁吴玮杰等产业翘楚,智平方科技创始人郭彦东、VAST创始人宋亚宸、Rokid联合创始人蔡国祥、Haivivi联合创始人高峰等AI创业先锋,阿尔法公社创始合伙人许四清、丰元资本创始合伙人李强、九合创投创始人王啸等知名投资人,将会共同探讨AI的创业投资大机遇。 杨强院士将带来《AI落地的数据难题与联邦大模型的解决方案》开场演讲;方汉则会发表《昆仑万维AI全球化应用探索》的主题演讲;智平方郭彦东将会带来《具身大模型:驱动机器人进入通用智能新时代》的主题演讲,讲述通用机器人如何到来;VAST创始人兼CEO宋亚宸将会发表《通往AI 3D的“抖音”时代》相关的主题演讲。 现场,网易未来大会还特别设置圆桌论坛,原CCTV 财经主持人杨晋将主持《人工智能的下一步》为主题的圆桌论坛,阿尔法公社创始合伙人许四清、GMI Cloud 中国区总裁蒋剑彪以及安利(中国)数字创新中心总经理李阳将就人工智能热门话题展开激辩。 在“AI大创业时代”议题下,Rokid联合创始人、副总裁蔡国祥将会分享《AI眼镜开启眼镜行业全球升级》;Haivivi联合创始人高峰则会分享《如何做好一款 AI 玩具》;九合创投创始人王啸将会带来《AI 下半场:寻找技术与场景的最佳契合点》的主旨演讲;丰元资本创始合伙人李强将带来《硅谷AI创业者在追什么 如何在AI时代活出独特版本的自己》主题分享。 “触摸”AI爆品 AI榜单首发布 在精彩绝伦的主题演讲之外,网易未来大会将特别设置沉浸式产品体验区。 在今年最火的【AI眼镜区】,你可以体验Apple Vision Pro、小米AI眼镜、Rokid Glasses、XREALAR眼镜;在【机器人区】,你会看到宇树机器人、迪士尼IP的下棋机器人进行“人机对弈”,在【Agent硬件区】,可以看到可爱的Haivivi AI玩偶,以及灵宇宙、听力熊等带来的AI产品。 毫无疑问,2025是智能体落地的元年,我们看到不仅仅有AI助手风靡全球,更有越来越多的智能体硬件开始爆发,有AI眼镜、有XR设备、有具身智能机器人,它们都跃跃欲试、来势汹汹,那么,人类下一代计算平台究竟是什么?现场等你来找答案。 当然!我们还有“One More Thing”! 大会将在现场揭晓“2025网易未来大奖”系列奖项,以权威视角盘点和表彰2025年度最具影响力的AI企业、创新产品和行业人物。未来大奖将成为2025年度中国科技领域最具影响力的AI榜单之一。 本届奖项包括年度人工智能影响力企业TOP10、具身智能先锋企业TOP10、AI智能体创新企业 TOP10、AI基础设施创新企业 TOP10、年度影响力AI产品TOP10、AI十大影响力人物,还有年度人工智能影响力企业、新一代信息技术服务引领者奖、人工智能产业特别贡献奖等等。 本场论坛,您可以通过网易新闻客户端、网易科技视频号等平台收看直播,欢迎关注。 -
苹果官方旗舰店也放假,商品不发货;腾讯推「老年打车」服务;车主酒驾,智能驾驶「报警」|极客早知道 OpenAI CEO 奥尔特曼:2030 年前通用人工智能将来,未来 AI 接管人类 40% 工作 9 月 26 日消息,OpenAI CEO 萨姆・奥尔特曼接受了德媒《世界报》采访,聊及未来的 AI 世界、下一代人类的生活等。奥尔特曼在采访中预测,通用人工智能(AGI)将在 2030 年前到来,这种 AI 将「远比人类聪明」,号称是「超级 AI」,他还拿 AI 当前的发展情况做出了畅想:「目前 GPT5 模型已经比许多人聪明,如果 2030 年人类没能开发出具备能力超凡、能做人类无法做到之事的大模型,那我会十分不解」。谈及「AI 抢人类饭碗」话题时,奥尔特曼认为人们不应以悲观的视角看待 AI,他指出,即使没有 AI,很多 30 年前的工作如今也不复存在,他声称 AI 将在未来接管人类经济社会中 30-40% 的工作。随后主持人抛出了一个颇为尖锐的问题:「你会给你儿子什么建议,避免他在 30 年后被 AI 取代?」,奥尔特曼回应道:「我会教他学会『如何学习』的原始技能,学会适应这个世界,弄清人们需要什么,为他们打造有用的产品和服务」。随后在关于「AI 是否会毁灭人类」的问题中,奥尔特曼表示,通用人工智能会像慈母般对待人类,但他也承认 AGI 可能会有人类无法理解的副作用和后果,但整体上人类有机会给 AGI 灌输正确的价值观,AGI 最终并不会毁灭人类。最后奥尔特曼还表示,他不会用 ChatGPT 来解决情感问题。(来源:IT之家) OpenAI 推出全新 AI 功能 ChatGPT Pulse 9 月 26 日,OpenAI 宣布推出新功能 ChatGPT Pulse,让 ChatGPT 从被动问答工具转变为主动式个人助手。该功能以预览版的形式在移动端上线,现阶段仅限 Pro 订阅(月费 200 美元)用户使用。 根据介绍,Pluse 是 ChatGPT 的新体验,目前在移动端面向 Pro 用户提供。它会根据你的聊天、反馈和已连接的应用(如日历),主动为你做研究,每天推送个性化的更新卡片。你可以快速浏览这些卡片,也可以点开查看详情。Pulse 旨在让 ChatGPT 从「被动问答」转变为「主动助手」,让你不用总是自己提问,AI 会提前为你准备好有用的信息。OpenAI 表示,由于该功能计算成本较高,因此优先提供给 Pro 用户。公司计划在优化产品和提升效率后,尽快向更广泛的用户群体(包括 Plus 订阅者)开放。OpenAI 首席执行官 Sam Altman 称其为「迄今最喜欢的功能」,并强调 Pulse 会在夜间持续思考用户的兴趣和数据,这暗示着随着用户分享偏好的增多,个性化程度将进一步加深。(来源:新浪科技)苹果官方旗舰店国庆放假说明:五天时间 iPhone 17 等所有商品不发货 9 月 26 日,苹果官方旗舰店在产品页发布了《2025 年国庆节放假温馨提示》,其中指出,9 月 28 日、10 月 1 日、10 月 2 日、10 月 4 日、10 月 6 日所有商品不发货,电子发票服务也将在同一时段暂停。 除了发货之外,退货上门取件将于 10 月 1 日至 10 月 3 日、10 月 5 日暂停,退货返仓验收将于 10 月 1 日、10 月 6 日、10 月 11 日暂停。退货退款处理将于 10 月 1 日至 10 月 2 日、10 月 6 日、10 月 11 日暂停。(来源:腾讯新闻)Anthropic:国际员工将增长两倍,AI 团队扩张五倍 9 月 25 日,Anthropic 表示,商业客户基数在短短两年内从不足 0.1 万激增至超过 30 万,对旗下 Claude AI 模型的需求呈现出跨行业、跨地区增长。因此该公司决定,将在 2025 年将其国际员工人数增加两倍,并将其应用人工智能团队扩大五倍。(来自:华尔街见闻) 转转集团:iPhone17 系列新机发售带动 16 系列官方回收量大涨 9 月 26 日,转转集团公布数据显示,iPhone17 系列新机发售带动 16 系列官方回收量大涨,同比涨幅达到 609%。苹果正式发售当日,转转官方回收 iPhone 系列手机订单总交易额破亿元,创下单日历史新高。手机之外,带动耳机手表、耳机、摄影摄像、游戏配件为代表的多品类业务回收量也实现翻倍增长。(来源:36Kr)雷军:小米汽车用户接近半数都是女性 9 月 26 日消息,在 25 日的 2025 雷军年度演讲活动结束后,小米集团董事长、CEO 雷军与媒体对话。雷军表示,其实小米最初定位成一个极客品牌,为网络发烧友准备的。我们谁也没有想到,小米的成长速度超出了想象,很快变成大众品牌。他表示,今天的小米汽车接近半数都是女性,用户结构发生了翻天覆地的变化,这就是 5 年前高端化推动的。雷军还称,「加入汽车行业后,我们一直强调合作共赢。过去一年半里,大家看到我们还是有效推动了行业之间的合作。我觉得今天国产汽车都在进步之中,其实没必要搞的很难看。」(来源:IT之家)高德地图公布国庆假期十大热门驾车景区、十大最堵商圈 9 月 26 日,2025 年国庆中秋假期临近,高德地图发布「扫街榜」,揭晓十大热门驾车景区与十大最堵商圈。在热门驾车景区方面,杭州西湖、大唐不夜城、凤凰古城位列前三甲,成为「夜行」热门目的地代表。此外,九寨沟、平遥古城、南澳岛等景区也跻身前十,涵盖自然风光、历史人文、海滨度假等多种类型。 而在十大最堵商圈中,中西部城市表现亮眼,成都春熙路商圈、长沙五一广场商圈、重庆解放碑商圈占据拥堵前三。天津和平路商圈、杭州湖滨商圈、佛山祖庙商圈等也位列其中,覆盖了南北多个城市的核心商业区域。高德地图提醒,国庆假期出行可参考「错峰吃行」策略,避开热门景区和商圈的高峰时段。(来源:快科技)宇树科技王兴兴:R1 机器人明年会成为全球最畅销人形机器人 9 月 26 日,宇树科技创始人兼 CEO 王兴兴在第四届数贸会上表示,Unitree R1 机器人明年会成为全球最畅销的人形机器人。同时,今年上半年国内机器人行业发展火热,「中国智能机器人相关企业平均增长率达 50% 到 100%」,宇树科技预计下半年将发布身高 1.8 米的人形机器人。今年 7 月 25 日,宇树科技正式发布第三款人形机器人 Unitree R1,该机器人售价 3.99 万元起,支持开发/改制,重量约 25 公斤,集成语音和图像多模态大模型。(界面)《南京照相馆》代表中国内地申报奥斯卡最佳国际影片 9 月 26 日,电影《南京照相馆》官方微博发文:电影《南京照相馆》代表中国内地角逐第 98 届奥斯卡最佳国际影片。(来源:微博) 李开复:AI Agent 是 CEO 最需要关注的核心技术 9 月 26 日,零一万物 CEO、创新工场董事长李开复在零一万物「『元启上海』华东数智大会」上表示,从「大模型」到「智能体」,从理解到执行与交付,AI 将重塑企业的组织结构,形成「超级员工」模式,创造万亿级价值。李开复指出,企业「不是为了 AI(人工智能)而 AI,是为了增长而 AI」。他认为,当企业不再为模型买单,而是为「结果」与「价值」付费时,AI 创造的价值将从降本转向增效。在零一万物看来,Agent 有望成为推动企业智能化变革的核心力量。他强调,Agent 是公司 CEO 最需关注的核心技术,这也就是零一万物所强调的「一把手工程」战略:「Agent 带来的不是一个软件工具,不是一个效率的提升,而是能够创造一个有史以来最高效的组织架构。」(来源:开源中国) 腾讯推出「老年打车」服务,已在全国上线 9 月 26 日,腾讯出行服务正式上线「亲属打车」小程序,帮助老年人解决线上打车不便的问题,用户打开微信,搜索「亲属打车」即可体验。 作为腾讯出行服务的新尝试,该产品通过子女端设置、长辈端简化操作的方式,实现子女帮助、长辈自主的出行体验。实际操作中,子女可通过微信为长辈远程设置好常用出发地、目的地和支付方式,长辈只需打开微信页面,一键点击即可发起叫车。(来源:广角观察)美团外卖宣布升级「1 对 1 急送」,提前 5-20 分钟送达 9 月 26 日,美团外卖正式宣布升级「1 对 1 急送」,用户使用美团外卖点餐时可勾选「1 对 1 急送」服务,让午高峰的「锅气」提前 5-20 分钟送达。 目前,美团外卖超八成餐饮商家可调用「1 对 1 急送」运力。数据显示,已有数百万用户体验过「锅气急达」的新服务,超过一半用户在第二次点单时,再次选择了这一服务。(来源:第一财经) 醉酒男子用「智驾神器」开车后睡觉车辆自动停下并提示路人报警 9 月 26 日,浙江杭州「临平检察」披露了一起「男子醉酒后使用辅助驾驶开车」的案件,引起网友关注。据介绍,9 月 13 日凌晨 2 时许,浙江杭州,一辆打着双闪灯的 SUV 停在道路中央,阻拦后方车辆通行。过路群众发现异常前来查看,发现该车辆主驾驶位空着,仅有副驾驶座上躺着一名男子,车内中控台还显示着「报警」提示,便报了警。 图片警察到达后,唤醒驾驶员后发现对方有饮酒嫌疑,结果抽血检测后,驾驶员王某某血液中乙醇含量达 114.5mg/100ml。王某某承认其于 9 月 12 日晚至次日凌晨与朋友吃夜宵,喝多了酒,因此抱着侥幸心理让车辆自动驾驶。王某某交代,他这辆车配备有 L2 级辅助驾驶系统,可以在监管下实现一定程度的领航自动驾驶。但如果双手离开方向盘的话,辅助驾驶系统只能保持 2 分钟,超时后系统会提醒接管,否则车辆主动降速停车并退出系统。但为了欺骗车辆的检测系统,王某某在网上购买了一种「智驾神器」的配件,安装在方向盘上后,能够让系统误认为驾驶员未脱离方向盘,让车辆继续保持无人驾驶状态。9 月 19 日,经法院审理,被告人王某某被判犯危险驾驶罪,处拘役一个月十五日,并处罚金 4000 元。(来源:腾讯新闻)*图片来源:视觉中国 播客上新极客公园的播客节目「开始连接 LinkStart」持续更新中~一直以来,极客公园忠诚于记录创新。我们愿意走近创新者、创业者,聆听和记录他们创造价值、改变世界的故事;同时,我们也愿意近距离观察创新的阻力、代价,以及时代中被科技潮流裹挟的个体。如果你也想「聆听」这些声音,欢迎长按下方「卡片二维码」关注我们的播客「开始连接 LinkStart」~ -
浪潮信息发布面向智能体优化AI计算系统 9月26日消息,在2025人工智能计算大会上,浪潮信息公布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度;而最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。 据介绍,元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。 与此同时,浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。 据了解,元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。(定西) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 -
对话雷军:小米早已放弃了速胜 “小米要从互联网公司坚定地走向智能制造新战场,转型成硬核科技公司。” 文|《中国企业家》记者 赵东山编辑|何伊凡见习编辑|李原头图来源|受访者“小米内部经常吵得死去活来,翻天覆地,甚至为一个问题争执一年。但这样,老板才不容易犯错误。”9月25日晚,小米董事长雷军在接受《中国企业家》等媒体采访时称。9月25日19时,小米CEO雷军发表了自己的第6次年度演讲,主题是《改变》。发布会前,雷军在微博上曝光了身穿印有“正是闯的年纪”字样T恤的照片。雷军专门在演讲中拿出时间,表示这个slogan的灵感来自于他28年的好友,二次创业、转型直播电商的凡客CEO陈年——雷军讲到这些时,正在抖音直播的陈年掩面流泪不已。 来源:受访者 今年的演讲,雷军带来的是小米玄戒芯片、小米造车背后的故事。从2020年首次演讲,雷军年度演讲不仅是他个人思想的分享,更是观察小米在特定发展阶段,所面临挑战与转型思考的窗口。去年,雷军以《勇气》为主题,宣扬的是一个意气风发、英雄主义的造车故事。但今年,各大平台的直播评论中,滚动着不少批评小米的声音。2025年,对小米和雷军而言,都是成就与挑战并存的一年。在数字层面,小米刷新了各种纪录:小米财报、市值表现亮眼,首款SUV 小米YU7上市后销量强劲:3分钟大定超20万辆,18小时锁单量突破24万辆。今年5月,小米发布了首款自研3nm手机SoC芯片“玄戒O1”,成为全球第四家具备该能力的企业。但同时,小米的品牌形象也因意外事件出现松动。今年3月,小米SU7在安徽的交通事故导致三名乘客不幸遇难,进而引发全行业对辅助驾驶系统安全性的广泛关注。随后,小米SU7 Ultra车主们又针对挖孔版前舱盖,在各大社交平台发起了维权行动。近日,小米汽车召回了11.7万辆小米SU7。国家市场监管总局产品召回技术中心称:本次召回范围内部分车辆在L2高速领航辅助驾驶功能开启的某些情况下,对极端特殊场景的识别、预警或处置可能不足,若驾驶员不及时干预可能会增加碰撞风险,存在安全隐患。虽然雷军没有对此明确回应。但他在演讲中回顾了小米过去5年的发展历程,坦陈自己曾面对焦虑、黯淡的时刻,并最终“逆天改命”的故事,都无疑宣示着,雷军相信小米能够通过技术成长与蜕变,赢得公众信任的决心。 摄影:赵东山 会后采访中,雷军表示:小米要从互联网公司坚定地走向智能制造的新战场,转型成一个硬核的科技公司。“硬核的科技公司跟互联网公司不一样。互联网是机会驱动的,科技公司是使命驱动的。”为此,2020年小米设定了“5年技术投资1000亿元”的计划。站在2025年的节点,小米对未来5年的规划是,投入2000亿元的研发费用。雷军也多次谈及:公众对于小米还有不少误解和刻板印象。不久前,小米17跳过“16”命名,直接对标iPhone 17的代际,引发了全网热议。“今天大家需要重新认识一下小米手机,跟iPhone17全系列相比,有很多地方都超越了。”雷军在采访中称。当下,高端化、对标乃至超越苹果,仍是小米的生死之战。《中国企业家》统计:2021年雷军在演讲中,提到“高端”31次,2022年有22次,2023年高达46次,提及iPhone及苹果也达到了22次之多。在过去5年的高端化探索过程中,雷军表示,小米一步步积累形成了高端化的方法论。“我们有三大引领:科技引领、认知引领、审美引领。每个季度都会组织研讨,在高端化的过程中有哪些成绩,遇到了哪些困难,或者掉到了哪些坑里去。”但要超越苹果,仍是一场“漫长而痛苦”的马拉松。“我们还是要全心全意向苹果学习,一步一步地把每一个细节做好。苹果是360度无死角,在每个领域里面他们都下了很大的功夫。我们现在可能是先找10个点突破,接着找20个点突破,然后一步一步覆盖更多的角度。”雷军说。在大众最为关心的造车层面,雷军透露:小米YU7已交付超4万台。他也再次强调小米造车要对标特斯拉和保时捷,打造全球最强纯电性能车的初衷。不过,产能仍是困扰小米造车的最大痛点。近日网络上对小米非议的增加,也意味着随着时间推移,小米已告别新手保护期。雷军表示:小米离大家的需求和要求差距还很远。“我跟同事们说,高标准、高要求是好事,我们不要老觉得自己是汽车行业的新兵。我们正在快速提升生产效率。”以下为《中国企业家》等媒体采访雷军实录: 谈与苹果的竞争:对标苹果,超越苹果 问:小米直接从16跳到17,引发了热议。你说小米要全面对标iPhone,怎么理解这句话和这次改名?雷军:我们从小米16改名小米17引起的舆情,令我挺惊讶的。我们做手机15年,有很多人对小米还有一些刻板的印象,甚至看法很固执。今天大家需要重新认识一下小米手机,我觉得小米手机这一代的产品力是跨代升级的,跟iPhone17全系列相比,有很多地方都超越了。5年前我们提出对标苹果,首先是要有勇气,敢于对标世界第一。只有对标,你才能一步一步地接近,并跑到领跑。在电池技术、屏幕技术包括散热等方面,5年前我们就开始用VC均热板。今天我们的传感器、潜望镜,很多计算包括空间堆叠,都有非常多创新。 来源:受访者 我想通过改名这个行动,让大家重新认识一下小米手机,重新表达我们敢于挑战世界第一的决心。问:长期来看,你认为小米以及国产手机厂商与iPhone的竞争会呈现一个怎样的走向和态势?雷军:苹果是一家非常伟大的公司,需要我们每一家公司都潜心学习,我觉得这一次 iPhone17系列卖得非常好,网上的评价叫“牙膏挤爆了”,他们相对过去的iPhone往前迈了一大步。但讲实话,在很多技术领域里面小米17都领先,这就是我们为什么有信心全面对标。我们跟苹果的竞争可能还是一个漫长而痛苦的过程,我们还是要全心全意向苹果学习,一步一步地把每一个细节做好。苹果是360度无死角,在每个领域里面他们都下了很大的功夫。我们现在可能是先找10个点突破,接着找20个点突破,然后一步一步覆盖更多的角度。我们提的全面对标,不仅仅是对标主要配置和参数,更多要在科技引领,在更多的体验方面,要对标苹果甚至超越苹果。 谈汽车产能提升 问:在产能提升上,小米汽车有哪些计划?今年四季度的订单消化能够到达一个什么样的程度?雷军:小米的汽车工厂整个自动化率一直做得非常好,同时我们也在不断技改,不断提高效率,调整排班。我们在2个月20天的时间,整个YU7交付了超过4万辆。当然,距离广大准车主的需求还有巨大的差距,但我们会不断地努力提升。到今天为止,小米进入汽车行业满打满算不到1年半,我们是去年4月3号才交的第一辆车,我认为我们干得还不错,但离大家的需求和要求差距还很远。我跟同事们说,高标准、高要求是好事,我们不要老觉得自己是汽车行业的新兵。这里也跟大家做一个解释和说明,我们正在快速提升生产效率。问:小米汽车发布之后,市场和用户的反馈非常热烈,但也引起一些质疑,你如何看?雷军:小米汽车发布以后,成为了全网被黑的最惨的品牌之一。这次6部委联合行动打击黑水军黑公关,我们举双手支持。我们觉得整个汽车产业还是需要一个风清气正的环境才能持续发展。 谈高端化:还需要时间一点点学习 问:小米这5年发生了很大变化,你最大的变化是什么?雷军:小米15年前创办的时候,我们的使命就是坚持做感动人心、价格厚道的好产品,让全球的每个人都能享受到科技带来的美好生活。15年前我进入制造业,就是想用互联网的技术和方法,推动科技的普及。5年前,我们发现智能手机已经普及,大家不再是稀缺时代,进入到了产能过剩、希望进一步升级的阶段。所以我们经过反思以后,坚定地提出了高端化战略,全面对标苹果,希望能更好地满足用户需求。其实我们这5年,在手机的高端发展上下了很大功夫,跌跌撞撞摸索了很多经验。我们在做汽车的时候,坚定地做了高端车。今年我们公布的第二季度财报,大家能看得到,小米汽车的含税均价为289000元,这跟BBA的价钱是差不多的。所以今天小米汽车已经进入到了高端区间,Ultra这款五六十万的车,能卖这么大的量。我越来越坚信,只要下功夫投入技术研发,就有机会把高端化完全做成。在手机、汽车取得经验以后,我们今天也在推全品类高端化。问:小米高端化进程中,遇到的最大挑战是什么?雷军:回顾过去的五六年时间,小米高端化遇到最大的压力还是2022年。我们受全球经济环境和地缘政治的影响,业绩下滑了15%,2023年业绩又下滑了3%,对我们这么大一家公司而言压力是巨大的。我们第一次做高端化也很紧张,没想到第一年就远超预期。大家觉得高端化很好做,然后就掉到了坑里,再一点点走到今天,所以它是一个曲折前行的过程。问:小米高端化推进过程中,核心受众群体也在发生变化,小米为此做了哪些努力?雷军:五六年前我们是一个偏男性的品牌。但今天小米汽车接近半数的用户都是女性,整个用户结构发生了变化。在过去5年的高端化探索过程中,我们一步步形成了高端化的方法论。我们有三大引领:科技引领、认知引领、审美引领。我们每个季度都会组织研讨,在高端化的过程中有哪些成绩,遇到了哪些困难,或者掉到了哪些坑里去。这个高端化的过程,是一步步走出来的。 谈汽车行业:很多车企都在摸着理想过河 问:你曾讲到在高端汽车市场上,中国汽车全面领先。在其中,小米扮演什么样的角色?雷军:第一,小米在底盘技术、驾控、性能这些方面,向传统豪车学习,比拼保时捷,这100多年来所有高端车都在纽北赛道打拼。小米是第一家把纽北当主场,认真把车的底盘、驾控做好的企业。 小米YU7 来源:受访者 很多人说你的车跑那么快干嘛?这是做车的基本功啊。只有在这么快的极限情况下,才能把车做好。100年来,所有车厂都是这么做的。中国车厂现在才开始做这件事情,所以我相信在小米的引领下,会有越来越多的车重视驾控、底盘、汽车的机械素质。第二,人车家全生态,包括生态互联开放合作,这也是小米给市场带来的新东西。此外,还有高度重视设计,小米现在已经做了几十种车漆,且计划在3年内再做100种。市面上大众车型为什么颜色很少?因为简单、成本低、快。但我们认为,车的颜值也很重要。问:小米也开放了汽车IoT的接口给所有车企,目前小米跟这些车企的合作到了一个什么样的进度?雷军:小米汽车是后来者,我们发自内心感激新能源汽车行业的所有先行者。2023年年底,我们用非常认真的方法致敬了整个行业的先行者,非常真诚地感谢大家所做的贡献。小米作为后来者,还是享受了很多时代红利。所以从第一天起,我们认为小米有责任帮助整个行业进步。我们是受益者,我们也要反馈整个行业。所以我们加入汽车行业以后,一直强调合作共赢。在过去的一年半里,大家应该看到我们还是有效地推动了行业之间的合作。今天国产汽车大家都在进步之中,其实没必要搞得很难看,而且这个市场也很大。基于这一点,我们在推动loT的标准和协议的开放。小米的手机秒充协议全部免费,这可以让更多的车能够更好的支持小米手机,越来越多的车厂跟我们正在结盟和合作。问:明天理想发i6,你和蔚小理创始人关系也很好,造车之后如何评价蔚小理?雷军:顺为和小米很有幸成为蔚来和小鹏的早期投资者。理想虽然早期没有投资,但是理想跟我们都是北京企业,也有很多的合作。我非常钦佩李想为整个新能源汽车作出的伟大贡献,我认为理想开创了大空间增程SUV这条路。大家低估了产品定义的价值,不少的车厂都是摸着理想过河的。 谈组织:高管们吵架是常事 问:在筹备汽车和芯片这两个大项目的过程中,你遭遇了哪些具体的挑战?雷军:我此时此刻面临的问题就是,定制服务到底成不成?我非常庆幸小米内部的决策文化是非常民主的,大家经常吵得死去活来,翻天覆地。我也蛮喜欢这个环境,我觉得只有这样的决策环境,老板才不容易犯错误。如果我一个人拍板,(汽车)定制服务干了再说。但实际上他们反对是有道理的,全世界就没有一个大众品牌能把定制服务做好,因为真的很麻烦。只要有哪一点做得不好,用户肯定从头到脚把你骂个死去活来。小米还有一个很包容的文化,鼓励你去试。只要你说得明白,风险可控,你就先去试。定制化服务就是小米今天在高端化遇到的又一个拦路虎,我今天讲了我们很多内部的争议,有的决定一争争一年,我们内部经常开共创会,一开一整天,从早上到晚上不停地吵。但是这种共创的氛围,使我们决策的准确度大幅度提升。如果5年后我们的定制服务真的成了一个很多高端客户喜欢的服务的话,我们就基本做成了。我都不想要挣钱,不亏钱就算成功了,我们真的为客户做到了体验平权。 谈未来:长期持续投入 问:未来3~5年,小米在销量增长上有没有找到什么新解法?雷军:从全球来看,手机都是竞争特别激烈的市场,它的竞争难度甚至超过了汽车。苹果、三星、华为都是这个星球上的科技巨头,中国市场也是我见过最激烈的市场。6个主要玩家的份额都很平均,都是15%左右的市场份额,各领风骚两三个月,我们的5家同行都是很了不起的公司。在这么强大的同行竞争压力下,我们早就放弃了速胜的可能性。两年前我跟他们提的目标就是每年坚定增长1%的市场份额,看能不能5年时间做到20%的份额。小米是长跑型选手,时间越长我们越强大。过去的5年,小米发生了翻天覆地的变化,你可以再给小米5年时间看一看。我们要向所有的同行学习,但我们也要在各个维度不留死角,做六边形战士。我们会从每一个维度去关注,跟对手差别在哪里。 来源:受访者 问:小米17系列中,采用了很多国产材料创新,小米在供应链自主化方面有哪些布局?雷军:5年前,我们就提出要转型智能制造,转型硬核科技公司,其核心是能力驱动,而不是赌机会。它需要3年5年10年的投入,持续研发,才能真正把事情做成。我对整个中国的工业越来越有信心,我们早期都在应用层的创新,这是我们中国公司的长处。紧接着到零部件级的芯片级创新,材料和核心的零部件创新。今天我们讲的红色发光主材,是中国国产公司第一次做到欧奈尔的材料级别。此外,我们的超级像素、电池技术等等也在突飞猛进地发展。这些都得益于我们在手机业务对核心研发的长期、持续的投入。我们整个手机部的研发人员有1万多人,过去我们讲得少,其实小米下了很大的功夫。 -
苏宁易购官宣开启双11 9月26日消息,苏宁易购宣布,今年双11大促将全面提前至国庆档,自9月30日开启“家电普惠日”,率先打响双11活动“第一枪”。苏宁易购集团副总裁陆耀表示,广大消费者对融合新功能、新场景、新体验的新智家电的需求依然迫切。苏宁易购将依托“国庆抢跑+双11延续”的优惠节奏,整合全渠道供应链、深化场景体验创新,让消费者尽早享受实惠;同时将持续推动行业回归用户价值与行业本质,联合合作伙伴共同定义产品标准与消费趋势,让家电消费在普惠中升级。 据介绍,活动节奏方面,今年苏宁易购双11启动时间提前至国庆,并于9月30日零点起正式开启家电普惠日,全程长达44天,覆盖9天9夜狂欢补贴季、双11嘉年华等阶段。作为双11全程“第一枪”,9月30日至10月1日,苏宁易购将联合品牌开启“闪购48小时”专场,全国万店全程不打烊,加码推出10万套特价家电,为消费提供一步到位的优惠让利。(易智) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 -
Science重磅:下一代协作型AI Agent?UCLA团队揭示AI、小鼠的共同合作逻辑 图源:Stella Levi合作是人类社会的基础,理解合作如何产生并维持,不仅对解决冲突、治疗影响社会行为的疾病具有深远意义,也对设计更优的人工智能(AI)系统至关重要。随着多 AI Agent 系统在自动驾驶、分布式机器人等场景的落地应用,如何让 AI 学会高效合作,已成为突破技术瓶颈的关键。已有研究表明,人工 Agent 和生物 Agent 可以表现出相似的行为策略和神经表征。这为探索人工 Agent 在交互时如何产生合作行为,以及这类交互是否可能由类似生物系统中的神经网络动态驱动,开辟了新的方向。今天,加州大学洛杉矶分校助理教授 Weizhe Hong 团队在这一领域取得了新的突破——通过对比小鼠和人工 Agent 在合作任务中的表现,证明 AI 系能够形成与生物大脑中的观察结果相似的行为策略和神经表征。这项研究首次直接比较了生物大脑和 AI 之间的合作学习,为社会行为中最重要的方面之一提供了新见解,同时也为人类打造出更智能的协作型 AI 提供了全新思路。相关研究论文以“ Neural basis of cooperative behavior in biological and artificial intelligence systems”为题,已发表在 权威科学期刊Science上。 论文链接:https://www.science.org/doi/10.1126/science.adw8151实验验证:小鼠是如何学会协作的? 为探究生物合作的底层逻辑,研究团队设计了一次小鼠合作实验。实验选用 8 周龄的 C57BL/6J 小鼠,将其两两配对,放置在中间有透明带孔分隔板的实验舱内。分隔板的设计很关键,既让两只小鼠能通过视觉、嗅觉和轻微肢体接触感知彼此,又避免了直接肢体干扰。 图|小鼠合作实验中实验舱示意图。实验的核心任务是同步鼻触:每只小鼠所在的舱室都有一个鼻触口和一个饮水口,只有当两只小鼠在规定时间窗口内先后完成鼻触动作,才能同时获得饮水奖励;若仅有一只小鼠鼻触,或超出时间窗口,双方都无法得到奖励。为逐步提升合作难度,研究团队将时间窗口从初始的 3 秒,逐步缩短至 1.5 秒,最终定为 0.75 秒,以此考验小鼠的协调精度。在正式实验前,研究团队先对单只小鼠进行“预训练”,让它们学会将鼻触动作与饮水奖励关联,同时剔除鼻触动机极低的个体,确保实验数据的有效性。训练阶段则分为三个阶段,分别对应 3 秒、1.5 秒和 0.75 秒的时间窗口,三个合作阶段分别包含 5 次、10 次和 15 次每日训练,每次训练持续 30 分钟。经过系统训练,76% 的小鼠的合作表现显著超过随机水平。研究团队进一步通过打乱数据法判断随机水平:将一只小鼠的鼻触时间固定,随机打乱另一只的鼻触序列,计算此时的正确合作概率。对比发现,真实实验中小鼠的正确合作次数远高于随机数据,且错误次数更少,这说明它们是通过主动协调来达成合作。在表现超随机水平的小鼠中,41% 属于“高表现组”。随着训练推进,错误合作次数持续减少,鼻触间隔也不断缩短。 图|对照实验的实验结果。为进一步验证“主动协调”的必要性,研究团队设计了三组对照实验:一是将透明分隔板换成不透明板,阻断视觉信号;二是让小鼠“各自为战”,达成单独鼻触即可获得奖励;三是“单方合作”,仅一只小鼠需依赖同步鼻触获奖励,另一只可单独获奖励。结果显示,这三种情况下,小鼠的合作指数均大幅下降,尤其是不透明板组,等待和互动行为几乎完全消失,充分证明小鼠的合作依赖对同伴信息的感知和互利动机。这些证据共同表明,这种合作行为并非源于独立的基于时间的决策、简单的模仿行为、偶然动作或依赖社会线索的决策。相反,两只动物都正确遵循规则,并根据伙伴的社会信息和互利关系主动协调行动,才能实现成功的合作。关键因素:前扣带回皮层 小鼠的协作行为背后,究竟是哪个脑区在“发号施令”?研究团队将目光锁定在前扣带回皮层(ACC)。ACC 位于大脑额叶中部,此前研究已发现它与情绪处理、社会决策等功能相关,但在合作行为中的具体作用尚不明确。为观察 ACC 的神经活动,研究团队采用了微型内窥镜钙成像技术。他们先向小鼠的 ACC 区域注射表达荧光钙离子指示剂(GCaMP7f),通过实时记录钙信号变化,追踪单个神经元的活动。最终成功记录了 17 对小鼠共 12798 个 ACC 神经元的活动数据。 图|小鼠执行合作任务时 ACC 的神经活动(A);对 17 对小鼠的 12798 个神经元进行神经活动记录(B-D)。分析发现,ACC 神经元对合作事件具有高度特异性响应:一部分神经元仅在正确合作时激活,另一部分则只对错误合作有反应,且响应正确事件的神经元数量明显更多。正确事件响应神经元的占比,与小鼠的合作表现呈正相关:高表现组小鼠的 ACC 中,这类神经元的比例显著高于普通组。说明 ACC 对成功合作的编码能力,直接影响合作效果。 图|在合作条件下对正确或错误试验产生反应的神经元,在不透明分隔板条件下仅表现出微弱的神经活动;相反,另一组基本独立的神经元则对自发触鼻行为产生反应。研究还发现,ACC 不仅能识别合作结果,还能编码合作中的关键决策。通过支持向量机(SVM)解码 ACC 神经信号,研究团队能准确区分这两种决策状态,证明 ACC 是合作决策的“大脑”。通过 SLEAP 姿态追踪技术,研究团队还拆解出小鼠合作的三大核心策略: 接近:小鼠会主动靠近分隔板,在鼻触前 2 秒内,向同伴一侧移动的频率显著增加; 等待:当一只小鼠先到达鼻触端口,会在社交区域停留,直到同伴靠近再行动; 互动:两只小鼠会通过隔板两侧的鼻端接触交流,且互动角度从初始的 180 度逐步优化为 120 度,既能保持对同伴的感知,又能快速切换到鼻触动作,策略精度持续提升。 行为相似:AI 复刻小鼠合作逻辑 在揭示小鼠的合作机制后,研究团队将研究范围拓展至生物系统之外,深入探究合作机制在 AI 系统中的形成及其运作方式。研究团队基于多 Agent 强化学习(MARL)框架,利用循环神经网络(RNN)开发了两个 Agent,并构建了一个模拟小鼠实验的虚拟环境,训练 Agent 在此环境中实现协作。 图|两个 Agent 分别位于两侧,中央设障碍物分隔,每侧均配备“鼻触口”和“饮水口”。训练结果超出了研究团队的预期:AI 成功掌握了合作策略,且其行为模式与小鼠高度趋同。在合作阶段正确合作次数持续增加,鼻触间隔集中在 2 个时间步内,且错误次数远低于非合作阶段。研究团队进一步分析 AI 的神经网络活动,发现 AI 中也存在专门编码自我位置和同伴位置的单元。在合作阶段,编码同伴位置的单元活性显著增强,且其占比与 AI 的合作表现正相关;而在非合作阶段活性则明显减弱。接下来,研究团队深入研究了 Agent 是否会像动物那样展现出促进合作的行为策略。为此,他们分析了每个 Agent 根据其伙伴位置采取的行动。由于 Agent 可直接“看到”彼此,因此最初团队预计其不会出现像小鼠实验中观察到的那种接近或互动行为。然而结果出乎意料,Agent 会表现出“等待”行为:当同伴距离鼻刺位置较远时,它们会暂停或后退移动。如图所示,两者都试图通过最小化彼此与鼻刺位置的距离差异来主动协调行动。这种主动协调行为出现在正确戳探前,但在错误戳探或非合作状态下则不存在。此外,这种等待行为与个体 agent 更优的合作表现呈正相关。由此可见,这种行为能有效促进 AI agent 的合作行为。 图|Agent 的运动流场分析。虽然生物小鼠与人工 Agent 属于两类完全不同的系统,但它们在合作行为中却呈现出惊人的相似性。研究团队认为,这种一致性背后的原因主要有以下三点:首先是信息依赖。无论是小鼠还是 AI,实时感知同伴状态都是合作的前提。小鼠通过透明隔板获取视觉、嗅觉信号,AI 通过传感器观测同伴位置,一旦这些信息被阻断,合作便会迅速崩溃。其次是合作策略。成功的合作依赖可学习、可优化的预备策略。无论是小鼠的“接近-等待-互动”,还是 AI 的“静止-靠近-同步”,本质都是通过预备行为降低协调难度,并且这些策略会随训练优化。最后是专属单元。生物和 AI 都演化出了专门编码合作相关信息的“单元”:小鼠 ACC 中,有神经元特异性响应正确合作、编码决策;AI 的 RNN 中,有单元专门处理同伴位置、调控合作动作。这些单元的活性与合作表现直接挂钩,抑制或消融它们,合作能力就会受损。以上研究结果证明,合作并非生物的专属技能,而是一种可计算、可复制的底层逻辑。随着技术发展,或许将来我们能看到基于这种逻辑的 AI,与人类在多种场景中实现真正意义上的协作。整理:小瑜如需转载或投稿,请直接在公众号内留言 -
谷歌掏出自家最强机器人大脑,一句话完成垃圾分类,关键技术解析来了 智东西 作者 陈骏达 编辑 云鹏 智东西9月26日报道,今天,谷歌DeepMind推出Gemini Robotics 1.5系列机器人模型,通过思维链机制和模型协作,进一步提升机器人的自主性,使其能够感知、计划、思考、使用工具和行动,以更好地解决复杂的多步骤任务。谷歌将其称之为把AI agents带入物理世界的重要一步。谷歌DeepMind本次发布的两款模型分别为Gemini Robotics 1.5和Gemini Robotics-ER 1.5。前者是谷歌目前最强大的VLA(视觉-语言-动作)模型,能将视觉信息和文本指令转化为机器人的控制命令,主要充当机器人的小脑。这一模型在采取行动前会思考,并展示思考过程,还能在不同的机器人本体上进行学习,提升学习效率。Gemini Robotics-ER 1.5则是谷歌迄今为止最强大的VLM模型(视觉语言模型),能对物理世界进行推理,更像是机器人的大脑。它原生具备调用数字工具并创建详细的多步骤计划,进而完成任务的能力。该模型在空间理解基准测试中实现了最先进的性能,具身推理能力远超GPT-5、Gemini 2.5 Flash等模型。 搭载上述两款新模型的机器人,也因此解锁了完成复杂长链路任务的能力。比如,你可以让机器人查询当地垃圾分类要求,将桌面上的物品放到正确的垃圾桶中。模型能准确理解这一复杂需求,并驱动机器人完成任务。 开发者可以通过Google AI Studio中的Gemini API使用Gemini Robotics-ER 1.5模型,而Gemini Robotics 1.5目前可供部分合作伙伴使用。谷歌还发布了Gemini Robotics 1.5系列模型的技术报告。技术报告:https://storage.googleapis.com/deepmind-media/gemini-robotics/Gemini-Robotics-1-5-Tech-Report.pdf模型链接:https://deepmind.google/models/gemini-robotics/gemini-robotics/一、基于Gemini基础模型打造,训练数据来自3款机器人 对机器人而言,大多数日常任务都需要上下文信息和多个步骤才能完成,这对目前的机器人而言颇具挑战。为了帮助机器人完成复杂、多步骤的任务,谷歌DeepMind让Gemini Robotics 1.5和Gemini Robotics-ER 1.5两款模型在同一个Agent框架中协同工作。具身推理模型Gemini Robotics-ER 1.5像大脑一样协调机器人的活动。该模型擅长在物理环境中进行规划和做出逻辑决策,也具有先进的空间理解能力,能以自然语言与用户进行交互,对任务是否成功和任务进展进行评判,并且可以调用谷歌搜索等工具来查找信息,或使用任何第三方用户定义的函数。Gemini Robotics-ER 1.5为每个步骤提供自然语言指令,而Gemini Robotics 1.5利用其视觉和语言理解直接执行特定动作。Gemini Robotics 1.5还帮助机器人思考其行动,以更好地解决语义复杂的任务,甚至可以用自然语言解释其思维过程,使其决策更加透明。 这两个模型都建立在Gemini系列模型之上,这使得它们能够继承Gemini的多模态世界知识、先进推理以及工具使用的通用能力。之后,两款模型使用不同的数据集进行了微调,以专注于各自的角色。当它们结合起来时,可以提高机器人泛化到长任务和多样化的环境的能力。Gemini Robotics 1.5系列模型共同使用的训练数据集由三种模态组成:图像、文本,以及机器人传感器与动作数据。训练所用的机器人数据集是多本体(multi-embodiment)的,涵盖了数千个多样化任务,从抓取与操控,到双臂协作,再到人形机器人执行日常复杂任务。这些数据采集自多个异构机器人平台,包括ALOHA、Bi-arm Franka和Apollo人形机器人。 ▲Gemini Robotics 1.5系列模型能开箱即用地完成跨本体任务除了机器人专属数据集,训练数据中还包括来自互联网的公开文本、图像和视频数据集,使得模型不仅具备机器人相关技能,还能借助大规模世界知识提升泛化能力。为了确保训练的高质量与安全性,所有数据在使用前必须经过严格处理。谷歌DeepMind通过多阶段筛选,确保数据遵循相关政策,去除低质量样本与不符合规范的内容。数据集中每张图像都配备了原始描述与合成描述,这些合成描述由Gemini和FlexCap模型生成,帮助模型捕捉图像中的细节与上下文语义。训练过程中使用了最新一代硬件,包括TPU v4、v5p与v6e,并结合JAX与ML Pathways框架,以实现高效并行训练与跨平台扩展。二、靠动作迁移机制实现跨本体,让机器人学会“三思而后行” 作为一款VLA模型,Gemini Robotics 1.5的使命是“理解指令并将其转化为动作”。为了实现这一目标,研究者在训练中引入了一个关键机制——动作迁移(Motion Transfer, MT)。MT的作用是打破不同机器人之间的“壁垒”。在传统方法中,如果一个机器人学会了某项技能,往往需要额外训练才能迁移到另一个机器人。而在MT的加持下,Gemini Robotics 1.5能够在不同实体之间直接实现零样本迁移(Zero-shot Transfer)。也就是说,即便模型只在ALOHA机器人平台上学过“打开抽屉”,它也能在Apollo人形机器人上完成同样的任务。这一能力来自于MT机制对动作与物理的统一建模,它能对齐不同平台的数据并提取其中的共性。除此之外,Gemini Robotics 1.5还具备了具身思考(Embodied Thinking)的能力。它在执行动作之前,会生成一条以自然语言形式呈现的“思考轨迹”。这条轨迹帮助模型将复杂任务拆解为更细致的步骤。例如,当接到“帮我收拾桌子”的指令时,模型可能会先在思考中分解为“拿起杯子”、“移动到水槽”、“放下杯子”等小步骤。这种方式不仅降低了从语言到动作的直接映射难度,也让模型在执行过程中更具鲁棒性。如果杯子在移动过程中掉落,它会立刻调整思考轨迹,改为“重新拾起杯子”,而不是简单判定任务失败。与Gemini Robotics 1.5不同,Gemini Robotics-ER 1.5并不直接操控机器人执行具体动作,而是专注于具身推理(Embodied Reasoning),负责高层次的任务规划与决策。在训练中,Gemini Robotics-ER 1.5针对机器人任务所需的关键能力进行了特别优化。首先,它能够完成复杂的任务规划,把长远目标拆解成一系列合理的子任务。其次,它具备较强的空间推理能力,可以结合视觉与时间信息,理解物体的相对位置与运动轨迹。最后,它还能够进行任务进度估计,实时判断任务是否成功、完成度如何,并据此调整后续动作。 ▲Gemini Robotics-ER 1.5能完成的部分任务Gemini Robotics-ER 1.5在15个学术具身推理基准测试中实现了最高的综合性能,超过Gemini Robotics-ER 1.0和GPT-5等模型。 它能够将语言描述准确地映射到视觉目标上,比如“指向桌子左下角的蓝色杯子”,或是基于多视角信息实时判断机器人动作是否达成目标,这对长序列任务的稳定执行至关重要。在整个体系中,Gemini Robotics-ER 1.5的定位是编排器(Orchestrator)。它接收人类指令与环境反馈,制定总体计划,再将这些计划转化为Gemini Robotics 1.5能执行的具体动作指令。它还具备调用外部工具(如网络搜索)的能力,确保机器人在面对复杂场景时依旧能够灵活应对。不过,具备更高自主性和执行能力的机器人,也可能带来安全风险。为此,谷歌DeepMind已经开发了新型的安全和对齐方法,包括顶层的安全判断机制和更为底层的安全子系统(如用于避免碰撞的系统)。谷歌DeepMind还发布了机器人安全基准测试ASIMOV的升级版,这是一个用于评估和改进语义安全性的综合数据集,具有更好的边缘场景覆盖率、改进的注释、新的安全问题类型和新的视频模式。在ASIMOV基准测试中,Gemini Robotics-ER 1.5显示出最先进的性能,其思维能力极大地有助于提高对语义安全的理解,更好地遵守物理安全约束。结语:机器人模型跨本体化共识逐渐形成 与传统依赖单一数据和特定平台的训练方式不同,Gemini Robotics 1.5系列模型通过多本体数据、动作迁移机制,以及具身思考与推理范式,让机器人能够跨平台迁移技能,并在复杂环境中展现出类似人类的适应能力,扩展了机器人模型的通用性。而这也成为不少厂商打造机器人模型的目标之一。日前,宇树开源的机器人世界大模型UnifoLM-WMA-0,虽采取了不同的架构,但也同样具备适配多种机器人本体的能力。跨本体化,或许已经逐渐成为行业的共识与新赛道。 -
滴滴AI出行助手“小滴”开启公测 9月26日消息,滴滴开启公测AI出行助手“小滴Beta v0.8版本”,该功能在滴滴派单系统上,通过智能理解用户需求,为用户提供定制化的用车方案。用户更新至最新版滴滴App后,可通过搜索“AI叫车”并输入口令码,即可体验AI出行助手小滴。 据了解,“小滴”支持语音和文字输入,用户只需描述出行需求,例如“明早送家人去机场,要空间大、服务好的新车”,系统便会结合实时路况等信息,智能推荐最多3个匹配的车辆选项供用户选择。该功能打破了传统先选车型再输入目的地的叫车流程,实现“需求优先、系统匹配”的智能化服务。 公测期间,滴滴鼓励用户尽可能详细地表达需求,如对车辆类型、舒适度、价格等方面的偏好,以帮助AI持续优化推荐精准度。除实时叫车外,“小滴”还支持预约用车、订单查询、路线规划及智能客服等功能,覆盖多种出行场景。 据悉,滴滴同步上线MCP服务,开发者通过简单配置即可接入,使自定义智能体具备出行方案规划、实时叫车、订单查询及自动支付等能力,轻松构建专属出行助手。该服务目前已支持特快、特惠、快车、优享、专车和豪华车等多种车型,未来滴滴将在安全可信基础上持续拓展MCP技术应用场景,与开发者共建开放AI生态。(朴灿灿) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 -
京东物流布局具身智能,“超脑大模型2.0”和“异狼”机械臂来了 9月25日消息,JDDiscovery-2025京东全球科技探索者大会在北京举行,京东物流首度发布两大核心技术成果——“超脑大模型2.0”与“异狼具身智能机械臂系统”,全面提升“超脑+狼族”的“人工智能+”物流供应链全场景的科技化、智能化,成为“人工智能+”在物流行业的科技应用新范式。 据了解,“超脑大模型2.0”基于数字孪生技术,将千万级变量求解时间缩短至2小时内,实现物流路径动态优化。该模型支持多设备协同,使员工操作标准化提升15%,人机协作效率提升超20%,一线作业效率提升近20%。同时,该模型支持与“狼族”智能设备互联,构建多机协同的智能物流系统。 “异狼”机械臂则针对物流场景中的非标包裹自动化难题,通过视觉感知与高精度控制技术,实现毫米级抓取与码垛操作,具备“感知-决策-执行-进化”的全流程闭环能力,目前已在北京、天津等多地园区投入常态化运营。 二者协同形成“云脑+端臂”的智能闭环,共同强化京东物流“超脑+狼族”技术体系。该体系已衍生出商业化平台“与图”数智时空,为零售、金融、电力等多行业提供选址、分单、营销等智能支持,地理编码准确率超98%,助力客户实现精准运营降本增效。 据悉,京东物流“狼族”产品群还包括“智狼”货到人系统、“独狼”无人车及“飞狼”无人机等,覆盖仓储、分拣、配送全链路,目前已部署于全球超500个仓库,推动物流行业从“机械化”向“认知化”全面跃迁。 未来,京东物流将继续深化AI与具身智能技术融合,构建开放、高效的智慧供应链生态,为“人工智能+”在物流领域的实践提供可落地的中国方案。(朴灿灿) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 -
纽约时报:中国工厂去年安装近30万台新机器人,使用的机器人数量是美国的五倍 中国正在以远超其他国家的速度制造和安装工业机器人,美国则远远落后,位居第三,这使中国在全球制造业中已经拥有的主导地位进一步得到巩固。据面向工业机器人制造商的非营利行业组织——国际机器人联合会周四发布的报告,去年中国工厂运行的机器人数量超过200万台。报告还称,中国工厂去年新安装了近30万台机器人,超过世界其他地区的总和。美国工厂安装的机器人为3.4万台。在中国工厂加大机器人运用的同时,其机器人制造能力也在提升。政府运用公共资金和政策指令来鼓励中国企业成为机器人以及半导体和人工智能等其他先进技术领域的领军者。 在全球范围内,机器人和人工智能正对制造业产生日益重要且具颠覆性的作用。工业机器人适用范围广泛,从焊接汽车零部件的机械臂到将箱子吊到传送带上的机械爪。随着这种技术帮助工厂提高效率,一些工厂需要的工人数量正在减少,其他员工的角色也发生了变化。过去十年里,中国开始了大规模行动,在工厂推广机器人,成为机器人的制造大国,并把人工智能领域的进步结合到机器人行业中来。科技研究公司Omdia的首席分析师苏连杰表示,中国的企业已从国家层面的大力推动中受益,这与中国的电动汽车和人工智能行业的发展方式完全一样。“这并非偶然,”苏连杰说。“中国的企业在这方面投资已有多年。”中国让自己成为世界制造业强国努力的一个关键部分是大力推动工厂自动化。自2017年以来,中国工厂每年安装的机器人数量超过15万台。与此同时,制造业的产出也在大幅增长。截至今年年初,中国工厂生产的制成品已占全球总量的近三分之一,超过美国、德国、日本、韩国以及英国的总和。中国之后的四个使用工业机器人最多的国家分别是日本、美国、韩国以及德国。与上年相比,这四个国家安装的机器人数量去年都有所下降。其中日本安装了4.4万台机器人。2015年,中国政府把提升本国在机器人领域的全球竞争力作为《中国制造2025》运动的一项首要任务,以减少先进制成品的进口。重点行业几乎可以无限制地从国有银行获得低利率贷款,并在收购外国竞争对手上得到帮助,享有政府的直接注资或其他方式的扶持。2021年,中国政府颁布了一项全国性的详细战略推广使用机器人。“大家能看到这项战略多么有效;缺乏战略的国家始终处于劣势,”机器人联合会秘书长苏珊娜·比勒说。该联合会的数据显示,中国在全球机器人制造业占的份额去年上升到了33%,高于2023年的25%。此前领先的日本在全球市场占比已从2023年的38%下降到了去年的29%。直到去年之前,中国工厂安装的进口机器人数量仍多于国产机器人。但中国去年安装的机器人中有近60%是国产的。总体而言,中国工厂使用的机器人数量是美国的五倍。机器人联合会的数据不包括人形机器人,这种有两条腿的机器人目前大部分仍处于实验阶段。但中国政府的扶持已带动了人形机器人初创企业的蓬勃发展,形成了一个生产机器人专用部件(例如电动关节)的配套产业生态系统。总部设在技术热点城市杭州的人形机器人初创企业宇树科技有限公司曾在本月早些时候表示,有计划在今年年底前上市。宇树科技生产的最新型号人形机器人起价3.99万元,比行业领军者美国波士顿动力公司机器人的售价低得多。尽管如此,中国公司在制造人形机器人的一些关键部件(包括某些传感器和半导体)方面仍落后于外国竞争对手,Omdia的苏连杰说道。许多部件的顶级产品仍在德国和日本等长期在机器人制造业领先的国家生产,他说。“如果你要组装一个真正顶尖的人形机器人的话,它几乎完全不是中国制造的,”苏连杰说。“它也许会用一两个中国部件,但总的来说,整个系统会是很国际化的。”但就工业机器人而言,中国拥有众多优势。它有大量能安装机器人的熟练电工和专业计算机程序员。但就连中国也有机器人安装专家短缺的问题,他们的年薪飙升至近43万元。此外,中国的人工智能行业高度聚焦于运用这项新技术来追踪和优化工厂设备性能的各个环节。中国企业“正在利用人工智能迅速介入,判断哪些机器运行良好,哪些机器略有不足”,在上海从事自动化行业供应链研究的顾问卡梅伦·约翰逊说。他还说,在中国以外的地方,“人们还没有把人工智能视为一个制造业工具,至少目前还没有,不像中国人正在做的那样。” -
“AI的万亿赌注:一场无人知晓如何回本的豪赌” 【文/观察者网 柳白】 “人工智能(AI)投资达到史诗级水平:它真的能回本吗?”在全球人工智能发展热潮下,美国《华尔街日报》9月25日以此为题发表了一篇长文,把目光对准了当前这股投资热潮中潜藏的巨大风险和不确定性。 文章指出,科技公司正以前所未有的规模投资AI基础设施,总投入已超过美国州际公路系统的建设成本,这实际上是一场豪赌。当前AI带来的收入远不能覆盖如此庞大的投入,况且盈利模式尚不清晰,存在巨大的回报不确定性,可能需要全球经济发生巨变才能回本,既有巨大机遇也伴随泡沫破裂的隐忧。 文章写道,科技公司向数据中心投入了数千亿美元,并背负了沉重债务,但目前的收入相对微薄;这让人想起互联网投资泡沫。 在美国北达科他州人口仅1100人的小镇埃伦代尔,有这样一座尚未建成的AI数据工厂,规模加起来比十座建材市场还要大,项目造价超过150亿美元,相当于该州年度经济总量的四分之一。 北达科他州埃伦代尔的全新人工智能数据中心即将竣工 人工智能热潮掀起了人类历史上成本最高的建设浪潮之一。过去三年,美国主要科技公司对AI数据中心、芯片和能源的投入超过了按通胀调整后的州际公路系统四十年的建设成本。AI支持者甚至将其比作又一轮工业革命。 但一个大问题是:没人确定他们何时能收回投资,甚至能否收回。 文章形容,这场建设热潮实际上是一场豪赌,赌的是技术会迅速进步、改造经济并带来稳定利润。 在5月与Meta首席执行官马克·扎克伯格的一次会议上,微软首席执行官萨提亚·纳德拉谈到电力最初应用缓慢时表示:“我希望我们不要花50年时间。” 扎克伯格回答说:“是啊,反正我们都在投资,就好像这不需要50年似的。”他最近在白宫的一次晚宴上推测,该公司到2028年在美国的支出可能达到6000亿美元左右。 硅谷观察人士担心,AI的热情已演变成泡沫,越来越像上世纪90年代末互联网基础设施投资狂潮。 当时,电信公司花费超过1000亿美元在全国铺设光纤电缆,认为互联网增长将极其迅猛,任何投资都合理。结果却是严重过度建设,导致电信业成为互联网泡沫破裂中受创最深的板块。行业巨头如Global Crossing、WorldCom和360Networks接连倒下。 如今,本来枯燥的芯片和数据中心领域,已成为数千亿美元的激烈战场,硅谷巨头们不断加码支出,还给项目起上科幻般的名字。 扎克伯格在社交媒体上晒出了名为“许珀里翁”(Hyperion)的超级数据中心规划图,显示其规模相当于曼哈顿的一大块区域。 OpenAI的萨姆·奥特曼将自己的数据中心计划称为“星际之门”(Stargate),取自1994年的科幻电影。他们本周公布的规划需要至少1万亿美元投资建设数据中心。奥特曼还承诺未来几年每年向甲骨文支付约600亿美元租用数据中心服务器。然而,OpenAI今年预计总收入只有130亿美元。 “许珀里翁”(Hyperion)超级数据中心规划图 “这是个万亿美元的难题” 六年前,承租北达科他设施的CoreWeave还是一家不到20名员工的默默无闻的加密货币矿企。如今,在华尔街和私募资金的助推下,它已蜕变为市值超过通用汽车和Target的计算巨头。 如今的投资规模远超当年的互联网泡沫,这意味着要让这些投资合理,经济必须发生巨大转变。 红杉资本合伙人大卫·卡恩(David Cahn)估算,仅2023和2024年投向AI基础设施的资金,就要求消费者和企业在这些芯片和数据中心的生命周期里购买约8000亿美元的AI产品才能获得合理回报。 但分析师认为,大多数AI处理器的寿命只有三到五年。 本周,贝恩公司咨询师估计,到2030年,AI基础设施投资浪潮需要实现每年2万亿美元的AI收入。相比之下,这比亚马逊、苹果、谷歌、微软、Meta和英伟达2024年合计收入还要高,且是全球整个订阅软件市场规模的五倍以上。 摩根士丹利估计,去年AI产品收入约450亿美元。该行业的盈利模式包括收取ChatGPT等聊天机器人的订阅费,以及按量收费让外部公司使用其数据中心。 “科技行业如何填补这一差距是个‘万亿美元的问题’。”伯恩斯坦分析师马克·摩尔德勒(Mark Moerdler)说。 尽管消费者普及AI的速度很快,但大多数人使用的是免费版本。企业除了为微软Copilot或类似产品每月为每个用户支付约30美元外,一直不愿为AI掏钱。“总得有人从中赚钱,”他说。 预测繁荣何时变成泡沫是出了名的困难。许多泡沫持续多年。有些从未破裂,只是停滞不前。AI支持者坚持认为这次繁荣不同于互联网时代。如今的科技巨头产生的现金远多于1990年代的光纤建设者,而且AI几乎立即可供全球大部分地区使用,不像互联网需要消费者和企业接入高速网络 截至8月,OpenAI统计约有7亿人(占世界人口的9%)为ChatGPT的周度用户,高于3月份的5亿,而其收入预计将在2024年增长两倍。 支持者认为,如果AI继续发展到能够取代大量白领工作的程度,节省的成本将足以回报投资。AI高管预测,未来几年该技术可能使全球GDP增加10%。 甲骨文董事长拉里·埃里森本月告诉投资者,“训练AI模型是一个巨大的数万亿美元市场”,企业和消费者日常使用AI的市场“将大得多得多”。 “债务就是公司的燃料” 不容忽视的是,AI建设背后的融资很复杂,债务几乎存在于每个层面。 Alphabet、微软、亚马逊、Meta等公司打造自己的AI产品,有时还将云计算服务访问权出售给OpenAI等设计AI模型的公司。仅这四家“超大规模”公司明年资本支出预计近4000亿美元,超过阿波罗太空计划按今日美元计算的成本。 有些公司自己建设数据中心,有些则依赖第三方来建造配备冷却设备和电力的巨型仓库。 然后是像CoreWeave这样的中间商公司,其负责人是前大宗商品交易员迈克尔·因特拉托尔(Michael Intrator)。CoreWeave的主要业务是租赁数据中心,用英伟达芯片填满它们,然后将这些服务器出租给科技公司。 CoreWeave的崛起相当迅速。2017年,因特拉托尔与一家能源对冲基金的前同事联合创办了Atlantic Crypto,购买服务器来挖掘加密货币以太币。 2019年,因特拉托尔将公司更名为CoreWeave,并转向为AI提供动力的云计算服务器。2022年ChatGPT的发布点燃了AI狂热后,他全力加速,迅速积累数据中心和芯片,并以惊人的速度与AI公司签署租赁协议。他获得了英伟达的投资,如今英伟达持有其超过6%的股份。 截至本周,CoreWeave已经与科技公司签订了价值超过420亿美元的未来服务器租赁合同,其中包括25日宣布的与OpenAI先前协议的扩展,金额高达 65 亿美元。 这种增长是由大量债务推动的。 因特拉托尔在接受美国消费者新闻与商业频道(CNBC)采访时形容,债务就是“这家公司的燃料”。 为了加快芯片采购,CoreWeave求助于其最大的融资伙伴黑石集团(Blackstone),以及其他渴望进入AI领域的领军者。 CoreWeave与包括微软在内的顶级科技公司交易的融资利率起始于8%以上,对初创公司则更高。总的来说,CoreWeave大约有150亿美元的债务。 它欠房东的钱更多:CoreWeave的证券备案文件显示,它承担着560亿美元的数据中心租赁付款,租期通常约为10年。 然而,根据其IPO文件,CoreWeave与科技公司的合同通常为2至5年。这意味着在与科技公司的合同到期后,它仍需支付数十亿美元。同时,公司还在为许多尚未找到租户的服务器支付租赁费用。 如果建设浪潮远超实际需求,或者科技公司不再依赖第三方供应商,CoreWeave的数据中心最终可能会像本世纪初遍布美国被闲置的光纤电缆一样。 因特拉托尔表示,数据中心繁荣类似于上世纪初债务驱动的美国电网建设,只是规模大得多,更像战时动员。 他认为,未来几年CoreWeave的数据中心会有足够的需求。他表示,公司的债务主要与其与科技公司的合同挂钩,这些合同提供的收入足以偿还贷款和租赁费用。 他说,高融资成本是“你构建新事物时不得不交的学费,我们支付了那笔学费以尽早入场。” “我不会告诉你没有风险,”他补充道,“但我们在如何减轻风险,以及构建债务方面非常深思熟虑。” CoreWeave正竞相在能源丰富的地区租赁正在建设的数据中心,以领先于竞争对手。其业务范围从新泽西州延伸到得克萨斯州和俄勒冈州。 为了在埃伦代尔立足,CoreWeave找到了一个由数据中心建筑商Applied Digital开发的场地。Applied Digital最初是一家加密货币基础设施公司,后来也加入了AI热潮。 2023年,Applied Digital在多风平原上开始建设一处数据中心。北达科他州寒冷的气候是一个优势,为服务器降温的成本更低,因为这些服务器消耗大量电力且经常过热。 Applied Digital的CEO韦斯·卡明斯(Wes Cummins)花了几个月时间,试图让科技巨头直接租赁该数据中心,但没有成功。他一边推进建设,一边从一家日本银行获得贷款,并接受了麦格理集团(Macquarie)的投资。 他说,他一直很焦虑,直到今年早些时候,他的公司与CoreWeave开始认真谈判由CoreWeave租赁该数据中心。5 月,他们签署了三项协议中的第一项。总的来说,CoreWeave在15年内欠卡明斯的公司110亿美元。 “CoreWeave非常灵活,行动非常迅速,”卡明斯说。“他们很激进,并且一直保持激进。” CoreWeave计划在这个仓库式的综合设施中安装价值超过100亿美元的芯片和其他设备,该设施的电力配置为400兆瓦,足以为超过15万户家庭供电。 往昔泡沫的回声 历史上技术泡沫屡见不鲜。乐观情绪引发投资者蜂拥,随后往往是过度建设和巨大亏损,即便新技术最终渗透经济。 英国19世纪的铁路狂热投入占GDP超7%,铁路里程在1840至1852年几乎翻了五倍,却只带来预期四分之一的收入。 研究经济泡沫的数学家安德鲁·奥德利兹科称,这种狂热是一种“集体幻觉”,投资者、社会和媒体被群体思维裹挟,看不到风险。 他本人也经历过90年代光纤热潮。那时,电信公司和初创企业以相当于GDP 1%的规模疯狂铺设光纤,认为互联网流量每100天翻倍。但他发现当时流量实际是每年翻倍。 狂热迫使高管们忽略不利数据,一味加大投资,直到泡沫破裂。 “公司和高管都有强烈的私利,”奥德利兹科说,“警示信号被忽视了。” 光纤公司Level 3联合创始人凯文·奥哈拉回忆说,当时银行和投资者主动送钱,他们坚信需求会持续飙升,尽管已有隐忧,仍专注于流量增长的愿景。 “那是彻底的淘金热,”他说,“我们每周花约1.1亿美元建设网络。” 最终现实打破了泡沫。 Level 3股价暴跌95%,许多巨头破产,大量光纤闲置十多年,直到2010年代在线视频和游戏需求增长,才逐渐消化过剩产能。 “比以往所有科技泡沫加起来都大” 越来越多迹象表明,AI的乐观预期可能落空。 麻省理工学院报告称,95%的受访机构没有从AI产品投资中获得回报。芝加哥大学研究发现,AI聊天机器人对丹麦7000个工作场所的员工收入、工时或工资“没有显著影响”。 OpenAI在8月发布的ChatGPT-5被广泛视为渐进式改进,而非颠覆性突破。鉴于其高昂的开发成本,这次发布加剧了人们对生成式AI模型改进速度慢于预期的担忧。 AI高管表示,每代新模型的训练成本比上一代高三到五倍,意味着回本难度更大。 另一障碍是芯片会迅速贬值,不像光纤可闲置多年,AI芯片像汽车一样很快落后于新技术。 “这比以往所有科技泡沫加起来都大,”银湖资本(Silver Lake)联合创始人罗杰·麦克纳米说,“这个行业即使能像史上最成功的科技产品一样成功,也可能无法证明当前的投资水平是合理的。” 尽管如此,资金仍源源不断涌入。 Applied Digital近期又在北达科他州破土动工建设一座280兆瓦的新数据中心,目前尚未找到租户。 在埃伦代尔,白天人口会翻倍,因为建筑工人午餐时挤满了加油站的三明治柜台。数据中心完工后,预计常住人口将增加300至400人,占比约三分之一。 埃伦代尔市长唐·弗拉赫蒂说,住房短缺日益严重,政府已贷款修建排水、道路等基础设施,为约20套新房做准备。 “我们是在冒险,如果AI热潮破灭,一切可能崩塌,”弗拉赫蒂说,“但如果没有这波热潮,20或30年后埃伦代尔可能成为鬼城。” “我们现在正处于风口浪尖,只能继续冲下去。” 本文系观察者网独家稿件,未经授权,不得转载。 -
马蜂窝宣布携手高通及小米开启智能体AI合作 9月26日消息,近日,2025骁龙峰会·中国上,马蜂窝作为旅游领域移动端智能体AI应用的合作伙伴亮相活动,展示其借助第五代骁龙®8至尊版移动平台的端侧算力,以及小米的系统数据,规模化拓展旅游AI服务能力的前沿成果。 “只需对手机说出一句需求,AI就能像一位懂你的老朋友,为你定制省心、省时且高性价比的行程。"马蜂窝旅游研究院院长孙云蕾为大家现场演示了智能体AI行程规划的功能,针对一位前往成都出差、已有会议安排和往返机票的用户,系统可通过小米日历自动识别空闲时段,结合本地POI数据为其为其智能规划景点游览、餐饮推荐等行程,极大提升了旅行规划的效率和满意度。 合作深度融合马蜂窝和小米技术优势,构建了从数据感知、本地计算到主动个性化服务的完整技术链路。通过在终端实现用户日程、地理位置及偏好数据的实时处理,结合马蜂窝的旅游行业垂直模型、旅游知识图谱、RAG增强检索等多项技术,提供从行前攻略,到行中智能主动推荐、多语言翻译、餐厅预订等一站式服务,为用户带来更加精准、高效且安全的旅行体验。 在孙云蕾看来,此次合作不仅是技术方面的联通,更是让AI从“附加功能”走向“行业基础设施”的关键一步。智能体AI的引入端侧,使旅行服务摆脱云端依赖,在保护用户隐私的同时提升响应速度与数据安全性,使AI旅行助手变得真正可信、可用、可靠。 AI正系统性地重构旅行服务链条,在继续迭代和提升智能工具服务能力的同时,马蜂窝也将通过与高通技术公司等合作伙伴的发展,深化端侧AI与旅游场景的融合,推动智能出行服务的普及与升级,帮助旅行者拥抱真正“说走就走”的超级自由行时代。(崔玉贤) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 -
AI落后信号?Meta考虑采用谷歌Gemini技术进行广告定向投放 财联社9月26日讯(编辑 周子意)Meta公司据称已与Alphabet旗下谷歌的云部门进行了洽谈,探讨利用后者的Gemini大模型来提升Meta的广告业务的可能性。据报道,Meta公司的员工提议对竞争对手谷歌的Gemini模型进行微调,并基于Meta的广告数据对开源的Gemma模型进行优化,以提升其广告投放的精准度。业内人士透露,这些谈判仍处于相对初期的阶段,最终也可能不会达成协议。对谷歌的承认Meta选择谷歌的人工智能技术而非其自身开发模型的这一决定,凸显了该公司在大规模应用人工智能技术方面所面临的问题,尽管该公司在研究、基础设施和人才方面已经投入了巨额资金。上月就有报道称,Meta早前已考虑与谷歌或OpenAI建立合作关系,以改进人工智能功能,包括为其聊天机器人Meta AI提供针对查询的对话式回应,以及为Meta的社交媒体应用提供人工智能功能支持。另一方面,这一消息似乎肯定了谷歌作为主要人工智能参与者的地位。戴维森公司的技术研究主管Gil Luria在接受采访时表示,“尽管Meta对自己的人工智能技术颇为自信,但它们向谷歌寻求在广告销售领域人工智能算法方面的帮助,这其实是一种相当认真的承认(落后)。”目前,Meta和谷歌在在线广告市场中直接展开竞争。在它们最近的季度收益报告中,两家公司均表示,他们在人工智能领域的投入正在推动其核心广告业务的增长。在周四盘后交易时段,谷歌股价上涨近1%,而Meta则横盘整理。 -
xAI诉OpenAI“挖角窃密”,AI界“宫斗”大戏持续上演 来源:环球网【环球网科技综合报道】硅谷的AI大战近日再度升级!据路透社报道,当地时间9月25日,特斯拉CEO埃隆·马斯克旗下的人工智能初创公司xAI向加州联邦法院提起诉讼,将竞争对手OpenAI告上法庭,指控其通过挖走前员工窃取商业机密,以在AI技术开发竞赛中占据不公平优势。 据提交的诉状显示,OpenAI被指存在一种“极其令人不安的模式”,即专门针对那些掌握xAI关键技术和商业计划知识的前员工下手,其中包括xAI的源代码及其在启动数据中心方面的运营优势。xAI在诉状中直言,OpenAI通过非法手段诱导这些员工违反对xAI的保密义务和其他责任。面对指控,OpenAI发言人迅速回应,在最新声明中坚决否认了所有指控,并称这不过是“马斯克先生持续骚扰公司行为的最新篇章”。值得一提的是,这并非xAI与OpenAI之间的唯一法律纠纷。此前,马斯克就OpenAI转型为营利性公司一事对其提起了诉讼,OpenAI也随之发起反诉,指控马斯克骚扰。此外,xAI还单独起诉了苹果公司,指控其与OpenAI合谋打压竞争对手平台,苹果公司同样尚未对此作出回应。(旺旺) -
AGI又进一步了?谷歌AI模型重磅更新 助机器人感知环境完成复杂任务 《科创板日报》9月26日讯(编辑 宋子乔) 当地时间9月25日,谷歌DeepMind专为机器人打造的AI模型系列Gemini Robotics更新,其研发团队推出Gemini Robotics 1.5和Gemini Robotics-ER 1.5,它们协同工作,构成了机器人的“执行和决策系统”。 “我们正在推动物理代理(an era of physical agents)时代的到来——使机器人能够感知、计划、思考、使用工具并采取行动,以更好地解决复杂的多步骤任务,新模型是里程碑式成就,标志着我们在解决物理世界中的通用人工智能(AGI)问题上迈出了重要的一步。”DeepMind表示,新模型加持的机器人可以主动了解周围环境,以通用方式完成复杂的多步骤任务。 据介绍,Gemini Robotics 1.5是谷歌目前性能最强的视觉-语言-动作(VLA)模型,能够将视觉信息和指令转化为机器人执行任务的运动指令。该模型在采取行动之前会进行思考,并展示其思考过程,可帮助机器人更清晰地评估和完成复杂任务。另外,该模型能将从一个机器人学到的动作迁移到另一个机器人,即帮助机器人相互“学习”,从而无需针对每类机器人专门定制模型,可大大提高机器人的泛用性和学习能力;Gemini Robotics-ER 1.5是谷歌性能最强的视觉语言模型(VLM),擅长在物理环境中进行规划和做出逻辑决策,拥有先进的空间理解能力,能够以自然语言进行交互,预估机器人的成功率和进度,并且能够原生调用谷歌搜索等工具、创建详细的多步骤计划来完成任务。具体操作上,机器人首先利用升级后的Gemini Robotics-ER 1.5模型理解其所处环境,并像人类一样使用谷歌搜索查找信息。随后,Gemini Robotics-ER 1.5会将搜索结果转化为自然语言指令,再交给Gemini Robotics 1.5模型,让机器人结合视觉和语言理解能力完成每一步操作。 该图展示了谷歌的具身推理模型Gemini Robotics-ER 1.5和视觉-语言-动作模型 Gemini Robotics 1.5如何在物理世界中执行复杂任务 谷歌近年来积极投身打造“机器人界的Android系统”。与早年自研机器人本体不同,谷歌现在希望通过提供强大的AI模型,让不同的机器人制造商采购,类似于安卓系统在手机行业的模式。据the verge报道,谷歌DeepMind机器人部门负责人卡罗琳娜•帕拉达(Carolina Parada)曾表示,其AI模型研发重点在于,使机器人能够在物理世界中采取行动之前“提前思考多个步骤”。这种聚焦于AI模型的战略出发点与黄仁勋提出的物理AI理念类似。在机器人身上实现物理AI,可以理解为,机器人能够感知、理解现实世界,在此基础上与人进行交互并执行复杂的操作任务。AI模型作为机器人的“脑子”,在此过程中至关重要。8月25日,英伟达推出新一代专为物理AI和机器人开发者设计的计算平台Jetson Thor。英伟达表示,这款全新的机器人计算机将成为科研与工业领域机器人系统的“大脑”。《科创板日报》此前报道过,当前估值第一的机器人初创公司Figure自主研发了端到端机器人AI模型Helix,该模型可让机器人直接将视觉语言模型中捕获的丰富语义知识转化为动作;Dyna Robotics日前接受了英伟达等的投资,该公司目前正研发用于帮助机器人在现实场景中学习和提升能力的AI模型,其CEO Lindon Gao表示,Dyna不会为机器人编写任务指令,而是让它们通过从环境中获取的数据输入逐渐学习,“我们的最终目标是解锁物理AGI”……这些科技巨头、明星初创公司的动作预示着机器人行业发展必然趋势——以自研AI模型打通AGI之路。中金公司日前发布研报称,未来仅有少数具备全栈能力的机器人企业,有望进一步突破至“具身智能”层级。该机构认为机器人大模型是破解传统机器人控制瓶颈、迈向通用具身智能的关键路径。当前行业主要基于大语言模型、自动驾驶大模型及多模态大模型探索的发展方向,产业重心已转向“小脑+大脑”系统研发,而不同企业在研发与商业化路径上存在差异。只有极少部分具备全栈技术能力、资源整合优势与长期主义战略的企业,未来将通过收敛技术路径,最终定义“具身智能”的核心标准,进一步突破至“具身智能”层级。华泰证券也表示,本轮具身智能热潮起于大模型的技术突破,大模型决定了人形机器人泛化能力的天花板,是现阶段商业化的核心壁垒之一。当前众多科技大厂入局赛道,如谷歌、OpenAl、Meta、英伟达等均在布局大脑,国内大厂虽然布局稍晚,但已有成型产品,如华为、百度、科大讯飞等,同时涌现出一批优秀初创公司,试图打造机器人“通用大脑”,以及Figure Al为代表的全球头部人形机器人创企开始自研基础大模型。这会加速行业进入淘汰赛,不具备一定AI能力的本体厂或被挤压生存空间。 -
金山办公将发布骁龙X2 Elite版WPS Office 速度提升20% 9月26日消息,2025骁龙峰会·中国活动上,金山办公宣布将推出骁龙X系列平台赋能的AI PC适配版WPS Office。该版本依托骁龙X系列平台的性能优势和算力,实现启动速度相比其他系统提升20%。 本次合作中,WPS Office通过与AI PC深度适配,充分发挥骁龙X系列平台性能优势。在大型文档打开、复杂表格运算及多任务并行场景下,均展现高速响应能力,实现低功耗表现,为移动办公提供高效解决方案。 金山办公全球战略生态总经理张宁表示,此次合作标志着“硬件算力+软件场景”的融合进入实用阶段。该版本计划于今年12月底正式发布,将重点面向轻薄设备用户,提供兼顾性能和续航的办公体验。 高通技术公司产品管理副总裁Nitin Kumar指出,骁龙X2 Elite平台凭借一流CPU性能、领先终端侧的AI推理能力和长续航,已成为AI PC的标杆级解决方案。目前已有超百款基于骁龙X系列平台的PC设计落地,为适配版WPS Office提供广阔应用空间。 截至2025年6月30日,WPS Office全球月度活跃设备数达6.51亿,创历史新高,其中PC版月活3.05亿,移动版月活3.46亿,为跨设备办公生态奠定用户基础。 未来,金山办公将与高通紧密协作,依托骁龙赋能的AI PC、云服务和AI工具构建“三位一体”生态,探索全场景办公创新。张宁表示:“我们相信,未来的办公体验将是跨设备的无缝、统一体验。金山办公将与高通紧密合作,携手共创面向未来的创新成果。 ” (崔玉贤) -
知乎:开放搜索API 宣布完成Agentic升级 9月26日消息,在云栖大会期间,知乎同时带来了从模型到社区实践的最新进展。据介绍,近期,知乎开源了针对创意写作任务优化的大语言模型Zhi-Create-Qwen-32B,在训练策略调优和数据优化取得突破,在创意写作能力方面实现了显著提升。在应用层面,知乎直答宣布已经积累超过千万用户,本次大会也宣布完成Agentic升级:引入智能思考模式,针对搜索、研究、学习、创作等需求,精准理解用户意图,进行多轮搜索研究直至给出精准优质的回答。结合联网搜索和知识库引用,在思考生成阶段提供溯源可证的内容源头,进一步降低幻觉,提升可信度。 据悉,这意味着知乎直答从AI搜索进化为Agentic助手,加速社区AI应用的Agentic进程。与此同时,知乎也在本次云栖大会上,首次开放了搜索API,希望让更多可信内容开放共享。(定西) -
机器狗巡街,城市治理迎来新搭档 共享单车违规停放、草坪垃圾堆物……面对城市治理中的堵点、痛点,人类迎来最佳搭档——机器狗。循着研究人员划定的步道,电量满格的它们不仅能长时间上岗、多频次巡查,还能实时将捕捉到的异常信息回传至数据后台,提醒保安或执法人员到场处置。 在宝山区南大智慧城,机器狗巡街不再是科幻场景。9月28日,南大即将发布机器狗巡街训练场景。南大智慧城、上大通用智能机器人研究院以宇树机器人本体为依托,聚焦“安全巡查”这一公共服务场景进行二次开发。从机器狗的选型、上装到自主巡检,试验团队进行了数月迭代,“解锁”了违章停车、堆物整治等数个创新应用场景。“这是一次科技创新、城市管理交融的探索,不仅为提升城市治理效率,也为上下游企业开放创新场景。”南大公司董事长张鹏介绍,南大智慧城目前已集聚近十家具身智能机器人产业相关企业,其中部分创新团队聚焦二次开发。在他看来,这是机器人产业生态逐步成熟的体现。以硬件见长的龙头企业专注研发本体,不断提质增效,降低用户门槛。大量与之相伴而生的“二创团队”精耕垂直细分领域,持续做大蛋糕。从跟着跑到独立行走真让机器狗开始巡街时,研发团队遇上了许多意料之外的困难。研发伊始,考虑到轻量、成本等因素,研发团队选择了一款消费级机器狗,并在研究院楼宇内进行日常巡检实验,效果令人满意。然而面对气候复杂多变的室外场景,小型狗并不一定是最优选择。经过反复比选后,研发团队最终选定了具有更强户外作业功能的B型工业级机器狗。选型确定后,更难的是根据现实应用场景“加装”零部件。“机器狗的视觉能力很关键。”上大通用智能机器人研究院副院长华子恺解释,机器狗首先要“看见”这些违章违规行为,才能将其实时记录,并回传给后台。为了给机器狗装上“千里眼”,每台测试设备都加装了3个摄像头,包括红外摄像头、可见光摄像头以及鱼眼摄像头。前两者确保机器狗无论在白天、黑夜,都能保持一定的能见范围。鱼眼摄像头主要查看机器狗四周的环境,确保巡检的安全性。三个月试验至今,“视力”不断增长的机器狗已迈出关键一步——从工程师跟着跑到独立行走。放眼全国,部分城市正探索机器狗巡查这一新场景。比如今年6月,成都春熙路商圈出现了两只与警察共同巡逻的机器狗。看到机器狗现身,好奇的市民游客不免留影合照。客流较多时,还可能堵住机器狗的“去路”,干扰其正常巡查路线。假设遇上这一情况该如何?上大通用智能机器人研究院的研发团队正计划嵌入语音播报模块以及警报功能。一旦机器狗发现自身被热情的市民“围堵”,便会发出友善提醒。此外,他们还考虑未来适时加入互动模块。 在华子恺看来,想让机器狗真正适应巡检场景,不仅需要系统提升,更需要标准磨合。“当机器狗看见了一辆共享单车停放在某个区域,它凭什么标准来界定是否违规停放,以及需要找谁?”他解释,南大智慧城以半开放式空间为主,城市管理、楼宇管理难免有模糊交叉地带。对于这些区域的识别,首先需要向机器狗“投喂”精细化的语料、指令,也让其在后续研判时更精准。从“堆人力”到“新手上路”若论机器人基因,南大智慧城并非佼佼者。可为何偏偏它能先“吃螃蟹”?作为上海“南北转型”的重要承载区域,历经十余年更新改造,南大智慧城眼下正迈入产业载体密集建成投用期。大批设施投用后,公共安全是区域管理中面临的第一道坎儿。6.3平方公里,密布着数十栋建成投用的载体,倘若按照传统的“堆人力”模式,运营方每年需要为此投入数千万元。更难的是,传统治理模式下很难让各片区形成相对统一的服务品质。从违章停车的标准到绿化带内的垃圾清运速度,正是这些看似不起眼的城市角落,关系着一个区域能否留住心仪的创新团队、企业。张鹏将目光投向了今年初进驻南大智慧城的科研机构——上大通用智能机器人研究院。该研究院由宇树科技、上海大学、宝山区三方共建。背靠上海大学机电工程与自动化学院等优势学科资源,在创新应用场景的开发上具备一定容错率。相较于结果导向更鲜明的市场团队,涉及领域更宽的科研机构是更适配场景研发阶段的“创新合伙人”。有别于封闭的产业园区,南大智慧城的开放场域对机器人来说挑战更大。机器人不仅可能面临“人机交互”,还需要识别、避让疾驰而过的汽车。不过,与中心城区相比,华子恺认为,仍在焕新期的南大智慧城整体人流、车流可控,适合机器狗“新手上路”。对于即将上岗的机器狗,南大还有更多期待。南大智慧城目前已开通轨道交通7号线、15号线,未来还规划了18号线、31号线与城际铁路南何支线。这些隧道管廊的巡检既复杂又危险,未来能否也交托给机器狗?目前,南大智慧城已与相关企业达成初步合作意向,计划开展场景测试。这将进一步拓展机器狗的应用边界,从地面走向地下,实现更立体的城市智能巡检体系。