找到
1117
篇与
互联网
相关的结果
- 第 15 页
-
三天两炸!谷歌深夜再甩Nano Banana Pro 三天之内,两度炸场!谷歌再次用“核弹级”更新宣告:AI还是我的主场。 (本图由Nano Banana Pro生成)继Gemini 3惊艳亮相后,谷歌趁热打铁,正式发布了其图像生成领域的终极武器Nano Banana Pro。它一经发布,就让无数设计师和开发者惊掉下巴,有人直呼:“这简直是不给对手留活路!” 以前玩AI生图,大家都有个共识:它能画出足以乱真的科幻大片,却写不对海报上的一句简单标语。 无论画面多么惊艳,一旦涉及到具体的“文字渲染”或“逻辑排版”,AI往往会瞬间“智商掉线”,甩给你一堆鬼画符般的“外星文字”。这种“只懂艺术,不懂设计”的硬伤,曾是AI迈向专业化应用最大的拦路虎。 但现在,这个瓶颈彻底被谷歌炸穿了! 就在Nano Banana Pro(官方名:Gemini 3 Pro Image)正式发布后,开发者社区的惊叹声瞬间引爆社交网络。 免疫学家德里亚·乌努图兹(Derya Unutmaz)贴出了一张一次性生成的完整医学插图,完美描述了CAR-T细胞治疗阶段,配文惊呼:“谷歌,你们做了什么?! ” 曾在多家科技媒体担任产品经理的帕克·奥托拉尼(Parker Ortolani)在测试复杂图表生成后,直接感叹:“强大到离谱!” 工程师迪迪·达斯 (Deedy Das)赞扬了Nano Banana Pro在编辑和品牌修复任务中的表现:“类似Photoshop的编辑功能,它搞定了一切,是我迄今为止见过的最好的图像模型。” 甚至连表情包创作者也参与进来。@cto_junier通过一次提示生成了一个完整风格的“LLM讨论桌”表情包,包含Logo、图表、显示器等所有元素,并称Gemini 3 Pro Image为“新表情包引擎”。 Nikunj Kothari则一键将一篇完整的文章转换成了风格化的黑板讲座板书,称结果“令人无语(赞叹)”。 不过在一片赞誉声中,也不乏冷静的“泼冷水”。 AI研究员Lisan al Gaib对该模型进行了一个重逻辑的数独问题测试,结果模型“幻觉”出了一个无效的谜题和一个毫无意义的解法,他指出该模型“遗憾地还不是AGI”。这提醒我们,虽然视觉推理取得了巨大飞跃,但在规则绝对受限的系统中,逻辑幻觉仍是当前技术难以根除的顽疾。 那么,抛开对AGI的极致苛求,回归到内容生产的现实维度,Nano Banana Pro究竟强在哪里? 答案不在于它“画得更漂亮”,而在于在容忍度相对较高的创意领域,它拥有了前所未有的“深度思考”和“影棚级控制力”。它不再是机械的“看图说话”,而是真正做到了 “理解逻辑,生成结构”。 这次升级,核心冲突点直指专业领域:它将图像生成从一个“创意玩具”,彻底变成了具备高精度、高保真、高一致性的“企业级内容生产引擎”。下面,我们将深入挖掘这款模型的细节,看看它如何用推理内核和物理控制重塑视觉内容生态。 一、深度推理:从“像素堆砌”到“逻辑建模”的跨越 Nano Banana Pro的底层技术,是它与过去所有模型的本质区别。它集成了Gemini 3 Pro独有的“深度思考”(Deep Thinking)推理能力,将逻辑一致性直接应用于视觉物理和内容结构。 1. 结构化多模态推理 Nano Banana Pro不再是单纯地“模仿”风格,而是能理解并生成具有明确结构、意图和事实基础的视觉内容。 · 信息图表生成: 这是其最受赞誉的功能。用户可以提供复杂的段落提示词,一次性生成完整的、零拼写错误的教育图表、医学插图或商业流程图。它能够根据语言提示,准确地构建连贯的排版、布局和主体连续性,这是传统模型无法实现的。 · 设计师特拉维斯·戴维斯(Travis Davids)展示了一个一次性生成的、布局和排版完美的餐厅菜单:“生成长文本的问题正式解决了。” · 实时知识: 借助谷歌搜索的庞大知识库,Nano Banana Pro可以生成基于实时信息的可视化内容。例如,根据当前的天气数据,生成一张波普艺术风格的天气信息图;或者根据最新的食谱步骤,生成分步可视化的烹饪指南。 · 多元素融合与一致性: 模型的合成引擎得到了显著扩展,支持将多达14个不同的输入图像(包括多个角色、产品、背景纹理)混合成一个连贯的场景。更重要的是,它能在复杂的群像镜头或序列叙事中,保持最多5个独立主体的一致性和相似性,彻底解决了AI生成角色“漂移”或“变脸”的历史痛点。 · 2. 高保真文本渲染的极限突破 文本处理能力不再是“附加功能”,而是Nano Banana Pro的核心卖点。 · 准确与清晰度: 该模型被评价为在图像中直接渲染正确、清晰可读多语言文本的业界翘楚。无论是海报中的短标语,还是复杂的图表说明,其文本错误率都显著低于竞争对手。 · 多语言与本地化: 模型能够支持语义本地化和图中文本翻译。例如,在一个饮料罐的广告概念中,它可以将所有英文文本准确翻译并渲染成韩文,同时完美保留罐体原有的光照、曲率和表面纹理,这项任务在传统流程中需要昂贵的手动后期处理。 · 风格化与表现力: 用户可以要求模型创建具有多样纹理、字体和书法风格的文本,如用粗体、堆叠的字体创建复古丝网印刷效果,或将短语融入伐木场景,用木头组成文字,将文本创意提升到新的高度。 二、影棚级控制:将摄影和设计语言融入AI工作流 Nano Banana Pro的另一大亮点是,它将过去只有专业摄影师和设计师才能掌握的“物理控制”,转化为简洁的提示词。 1. 专业的视觉参数操控 模型允许用户对图像的底层物理属性进行精细控制,模拟专业摄影和后期制作。 · 光照与气氛: 用户可以精确操纵光照方向、强度和类型。例如,可以轻松地将白天的场景渲染为夜晚,或引入刺眼的定向光,在人物面部投射出深邃阴影,只照亮眼睛和颧骨,实现特定的戏剧效果。 · 景深与焦点: 模型能够控制景深虚化(Bokeh Effect)。用户可以指定焦点,例如将焦点从人像转移到前景的花朵上,突出构图的细节,实现专业级的画面分层。 · 色彩与角度: 支持应用复杂的色彩分级(Color Grading)和调整相机角度,让用户轻松将想要的视觉外观应用到模型中,确保品牌在每个触点上保持无缝和一致。 2. 高级编辑与分辨率支持 · 非破坏性局部编辑: 引入的“选择、优化、变换”能力,允许创作者修改图像的特定部分(如改变领带颜色、移除背景物体),而无需重新生成整个图像,极大提高了工作效率,更接近传统的编辑软件。 · 高分辨率输出: 模型支持高达2K和4K的输出分辨率,确保了创作成果可用于从社交媒体到高要求的印刷等任何平台。多种宽高比的支持也确保了图像能适应各种目标平台。 三、生态整合:从开发者到企业级的全栈部署 Nano Banana Pro的发布策略,明确了其作为谷歌AI生态系统核心基础设施的定位。 1. 开发者和企业访问 · API与云服务: 模型已开始在全球范围内的Gemini API和Google AI Studio中推出,供开发者访问。企业可以立即通过Vertex AI进行规模化创作,并将很快登陆Gemini Enterprise。 · Antigravity集成: 在谷歌内部的智能体IDE Antigravity中,Gemini 3 Pro Image被用于在界面元素被编码之前,就生成动态的UI原型和视觉素材,大大简化了“从设计到代码”的流程。 · 商业应用升级: Google Ads中的图像生成功能已升级到Nano Banana Pro,直接将尖端的创作和编辑能力交到全球广告主手中。同时,Google Slides和Vids的Workspace客户也能使用它来生成演示文稿视觉素材和故事板。 2. 用户访问与定价分层 · Gemini应用: 消费者和学生可在Gemini应用中,通过选择“思考”模型进行“创建图像”。 · 免费层: 用户将获得有限的免费配额,之后恢复使用原始的Nano Banana模型。 · 付费层: Google AI Plus、Pro和Ultra订阅用户获得更高的配额。 · 定价策略: Nano Banana Pro的定价采用分级制,定位高端市场(例如标准图像约0.134美元,远高于竞品约0.04美元的基准)。但谷歌强调其价值在于:4K高分辨率、企业级治理(付费层图像不用于训练谷歌系统)以及其作为逻辑推理模型的稀缺性。这笔溢价,是为了“专业保真度和数据安全”而支付。 3. 来源追溯与信任构建 · 强制SynthID: Nano Banana Pro生成的每张图像都强制嵌入了谷歌不可感知的SynthID数字水印,确保其AI来源可追溯,这在医疗、教育等高风险领域是运营要求。 · 移除可见水印: 为满足专业工作对“干净”视觉画布的需求,Google AI Ultra订阅用户和Google AI Studio开发者工具内生成图像上的可见“Gemini火花”水印将被移除。 · 用户验证工具: 谷歌将一个强大的验证工具直接交到用户手中,现在可以将图像上传到Gemini应用,直接询问它是否由Google AI生成,这得益于SynthID技术。 Nano Banana Pro的问世,标志着AI图像生成正式从“新奇的艺术工具”转向“可靠的商业基础设施”。它不仅在视觉质量上达到了前所未有的高度,更重要的是,它带来了逻辑、结构和一致性,让AI视觉内容真正做到了“所想即所得,所见即所用”。(小小) -
鸿海与OpenAI合作,将共同设计数据中心的硬件 OpenAI正与苹果公司的主要供应商鸿海合作,共同设计和制造数据中心硬件。两家公司于11月21日宣布达成合作。根据声明,鸿海将与OpenAI共同设计和开发数据中心服务器机架,并致力于确保这些机架能够在美国各地生产。鸿海还计划在美国为AI数据中心设施生产布线、电源系统和其他关键设备。OpenAI首席执行官Sam Altman在一份声明中表示:“此次合作是朝着确保人工智能时代的核心技术在美国本土构建迈出的一步……我们相信这项工作将加强美国的领导地位,并有助于确保人工智能的益处得到广泛分享。”这与在特朗普重返白宫后宣布的一系列旨在加强美国本土AI基础设施的举措相呼应。尽管此举显示了OpenAI扩张其AI版图的雄心,但其持续的巨额支出也加剧了市场对人工智能泡沫的担忧。值得注意的是,两家公司表示,该协议并未包含具体的采购承诺,这为合作的最终规模留下了不确定性。OpenAI的宏大基建蓝图 与鸿海的合作并非孤立事件,而是OpenAI宏大基础设施投资计划的一部分。今年以来,OpenAI已采取一系列行动,以确保获得支持其AI服务所需的庞大算力。据报道,OpenAI正与甲骨文公司和软银集团合作,推进一项雄心勃勃的计划,即在未来几年内向美国数据中心和AI基础设施投资5000亿美元。此外,近几个月,OpenAI已与包括英伟达和超威半导体在内的芯片制造商以及云计算提供商达成了多项价值数十亿美元的交易,旨在显著扩大其数据中心规模。掌控供应链与市场担忧 除了扩大算力规模,OpenAI的系列举措也显示出其试图加强对AI供应链控制的战略意图。今年10月,OpenAI宣布与博通公司达成协议,采购定制芯片和网络组件,这被视为其垂直整合供应链的关键一步。与鸿海在服务器硬件上的合作,进一步将这种控制力延伸到了基础设施层面。然而,OpenAI的“烧钱”速度引发了市场的警惕。有观点认为,这种大规模的支出正在加剧人工智能领域的泡沫风险。Sam Altman此前曾表示,OpenAI承诺在AI基础设施上投入1.4万亿美元,对于任何企业而言,这都是一笔巨款,更不用说对于一家尚未实现盈利的初创公司。这些巨额投资承诺的背后,是其商业模式能否支撑如此庞大资本开支的疑问。 -
微言 | 快递不上门,不必全怪快递小哥 明明备注了“送货上门”,却只收到一条取件短信,包裹被径直放进快递柜或快递服务站。据媒体报道,“双11”快递高峰后,不少消费者开始抱怨,一些包裹的派送停在了“最后一百米”。快递不上门的问题由来已久。无论是身边还是网上,都不乏这样的场景:快递箱堆得满满当当,甚至人们需要蹲在临时堆放地上翻找半天,才能找到自己的包裹。其实,2024年3月1日起施行的修改后《快递市场管理办法》早已明确规定:未经用户同意,快递企业不得代为确认收到快件,不得不经同意擅自将快件投递到智能快件箱、快递服务站等快递末端服务设施。然而,此类服务乱象却屡禁不绝。细究之下,快递送不上门的原由,人力成本不足是主要因素。有业内人士告诉媒体,为控制人力成本,不少快递企业不愿在站点加派人手,一个快递员常常要背负好几个小区的派送,每天单量动辄几百件,不堪负担。目前大部分快递企业,大多靠着加盟制和低价策略拓展市场规模。加盟商需要压缩成本,对于送货上门这类服务质量问题,自然缺乏主动改进的动力。处于快递企业末端的快递员,则面临工作量大、业绩考核等多重压力,更难以保证逐家上门派送。2024年我国快递包裹业务量达1750.8亿件,同比增长21.5%;我国快递包裹市场规模已连续11年保持全球第一。但服务细节不到位,仍让中国快递的高质量发展面临挑战。这一问题,除了要靠快递企业、电商、监管部门的多方协同,快递企业未来还可通过科技破局,或许也会成为一种更为可行的解决方案。据悉,今年已有不少快递企业开始研发专属的无人机配送技术,在智能化背景下,物流末端配送效率与用户体验可能将有优化的空间。对普通人而言,快递不上门显然是带来不便,但也不必苛求快递小哥——因为受限于行业模式与现实条件,整个快递产业链仍亟待优化,解决问题的关键终究在于企业运营模式的升级和行业服务意识的提高。 -
巨头公司避谈的秘密:“活化石”程序仍是今日数字世界的中流砥柱 今年早些时候,科技界迎回了一位代码界的“老朋友”——ELIZA。作为世界上第一个能进行看似有意义对话的人工智能聊天机器人,ELIZA曾令20世纪60年代中期的计算机科学家们惊叹不已。最近几十年,人们都以为ELIZA已经失传,因为其创造者、美国麻省理工学院的约瑟夫·魏岑鲍姆从未公布过他创建ELIZA时所写下的420行代码。然而,美国斯坦福大学的杰弗里·施拉格和同事们对魏岑鲍姆的成就十分着迷,并为此成立了一个ELIZA考古项目。几年前,他们在麻省理工学院魏岑鲍姆的旧文件盒中发现了丢失的代码,为ELIZA的复活铺平了道路。能再次与这位在人工智能历史上占据过重要地位的聊天机器人对话,不仅令人惊叹,也引出了一个令人好奇的话题:在ELIZA代码之外,今天是否还有更古老的代码片段仍在执行着某些重要任务?为此,有人启动了对于最古老代码的追踪,并发现了一些意想不到的情况:大部分古老代码远未得到ELIZA那样的尊重。总体上,企业和组织对旧代码呈现出一种奇怪的矛盾态度:一些人似乎不信任它,另一些人则对其充满信心,而几乎所有人都不愿公开讨论它。很少被提及,从未被遗忘对技术的追根溯源通常不难。你可以在公开资料上很快找到当今最古老却还能飞行的飞机,那是英国的一架修复后的布莱里奥11号,历史超过115年;或是世界上最古老但仍在使用的灯泡,就在美国加利福尼亚州利弗莫尔,点亮至今已有124年。但寻找仍在使用的最古老计算机代码却没这么容易。英国数学家阿达·洛芙莱斯在19世纪40年代设计了世界上最早的计算机程序。但实际上,洛芙莱斯的程序依赖于英国数学家查尔斯·巴贝奇设计的机械计算机,这款设备却从未被制造出来,因此这段代码就从未真正运行过。英国剑桥大学开发的电子延迟存储自动计算器EDSAC或许是世界上最早的通用计算机之一。如今,英国国家计算机博物馆的志愿者们正在制作一台EDSAC的复制品,一旦完成,它就能运行20世纪40年代到50年代发表在科学论文中的EDSAC软件,它们可能是世界上现存的最古老代码之一。在这项工作完成前,要寻找仍在运行的旧代码,或许可在现代软件中获得线索。几乎与EDSAC投入使用同时,计算机科学家开始简化代码编写的方式,“高级”计算机语言由此问世。这些语言的结构与人类语言相似,能使编程变得更直观。多年来,世界上已开发出许多高级计算机语言,包括IBM的Fortran(1957年)、COBOL(1959年)和JavaScript(1995年)。即使某种计算机语言已不再常用,它也不会被完全遗忘,因为如今的程序往往包含着用多种语言编写的代码,这意味着用几十年前的语言编写的旧代码片段,现在仍会隐藏在常见的应用程序中。基于这些信息,一条线索很快浮出水面——根据吉尼斯世界纪录,如今用来预订机票的网站,通常依赖美国航空公司于1960年开发的Sabre全球分销系统。这意味着,当今软件版本中的一些代码,可能比ELIZA更古老。然而,试图联系Sabre的结果是石沉大海,发送给其他机构的联系请求,包括达美航空、美国航空、联合航空、汉莎航空和英国航空,英国银行业的“四大”——汇丰、劳埃德、国民西敏寺和巴克莱,英国伦敦劳合社和贝宝,甚至苹果、微软、惠普、德州仪器等科技公司,都没有给出任何回音。维萨(VISA)和万事达在最初似乎表现出兴趣,但最终表示无法提供帮助。这种拒绝讨论旧代码的态度,着实让外界费解。对此,英国LEO计算机协会受托人文森特·博德斯沃斯说:“企业可能感到紧张,不愿让人注意到他们的产品中存在古老代码,因为他们不知道这些代码如何工作,以及如何维护以确保其继续运行。”LEO计算机协会是一个旨在保存英国一家已停产计算机品牌历史的公益性机构。 淡出不退出,多亏“老江湖” 寻找古老代码的难点还在于,源代码可能丢失,同时理解或修改这些代码所需的专业知识也会失传,后者可能更为常见。LEO计算机协会的博德斯沃斯曾谈起他听到的一个故事。那是1971年英国改用十进制货币时,伦敦一家不知名的银行遭遇问题,它有一个计算机程序主要针对非十进制货币进行金融计算;但由于程序源代码丢失,因此没办法对这个程序进行修改,使其完成向十进制的切换。后来,银行并没有为重写软件而投入重金,而是简单操作,编了一段代码,将十进制的英镑、便士转换为非十进制的英镑、先令和便士,并将数值交给旧程序计算,最后再利用另一段代码,将计算结果从非十进制转换到十进制。博德斯沃斯说,这种补救措施虽然笨拙,但也算是沿用至今的古老代码。在美国得克萨斯州,有家名为“COBOL牛仔”的咨询公司,联合创始人比尔·希恩肖早在1970年就用COBOL语言为银行ATM机写过软件。实际上,整个20世纪中叶,COBOL对企业运行至关重要;即便如今它不再是程序员的首选,但仍在一些软件中扮演着小却重要的角色。希恩肖估计,目前有8000亿行的COBOL代码仍在运行。由于当今大部分程序员不熟悉它,熟悉它的人也大多即将退休,因此遇到问题的企业只能求助于希恩肖团队。实际上,这群“牛仔”最年轻的成员也40岁了,大多数人是六七十岁,希恩肖则是82岁。在他看来,虽然目前使用COBOL不会有问题,但十年后情况可能有变。在理论上,代码虽不会磨损或用坏,但经过软件更新,旧代码也可能与程序其他部分不兼容。2024年7月,网络安全公司CrowdStrike在更新软件时出现故障,导致全球机场、医院和银行的数百万台计算机瘫痪。好在他们很快识别故障,推出新的更新,让大多数计算机在几小时内恢复运行。但是,假如故障涉及一种只有少数程序员才懂的旧代码,修复就会困难得多。鉴于这些担忧,科技公司不愿讨论旧代码也算合乎逻辑。另外,他们偶尔也会从现代软件中删除旧代码,最著名的例子是25年前的“千年虫”——当时为避免千禧之交全球的计算机因为难以区分2000年和1900年而大量崩溃,经过一场紧急行动,旧代码被强行移除。旧代码悖论,关键是有效 在一些极端重要的软件中,旧代码迄今仍很活跃。Perl基金会主席斯图尔特·麦金托什说,2024年发布的最新版本Perl,包含了1987年首个版本的代码片段。由于Perl支持亚马逊网络服务,因此所有亚马逊网络服务的用户,都会用到这段有着近40年历史的代码,其中包括苹果公司,以及美国航空航天局、中央情报局,英国军情五处和军情六处等重要组织。还有一些现代软件,会用到更古老的代码。比如负责发行开源操作系统Linux一个版本的软件公司红帽(Red Hat)。该公司的迈克·麦格拉思表示,许多版本的Linux都包含一条名为“缩进”的命令,该命令所用的代码能追溯到1976年,这也意味着在人工智能和云计算时代,人们仍在使用近50年前的代码。麦金托什说,旧代码能延续下来的原因很简单——有效。尽管人们一直担心旧代码可能与新代码不兼容,但事实上,许多旧代码几十年来运行良好。这甚至在业内催生了一种矛盾的现象:软件工程师越来越怕旧代码出故障,但同时,他们也越来越相信旧代码有能力持续保持可靠和准确。航天业是最好的例证。欧洲航天局计算机系统工程师詹姆斯·埃格尔斯顿表示,太空任务的设计、建造和发射成本极高,有些卫星价值数十亿美元,因此倾向于使用可靠的旧代码,而非冒着风险用可能出问题的新代码,因为一旦搞砸,航天器就会报废。有些仍在使用的古老代码可能不在地球上,甚至不在太阳系——距地球超过200亿公里的“旅行者”号探测器,如今可能仍在运行着与1977年发射时几乎完全相同的软件。一位匿名航天内部人士透露,美国航空航天局偶尔会聘请上年纪的程序员,让他们维护或修改面向旧任务的晦涩代码,这类似于希恩肖为保险公司和银行所做的。但航天业似乎也不愿讨论对旧代码的依赖。美国航空航天局并未回应相关采访请求。埃格尔斯顿也承认,欧洲航天局对他接受采访的想法持谨慎态度,主要是担心航天局使用旧代码,可能误导人们认为其太空任务不值得资助。那么,仍在运行的最古老代码究竟在哪里?目前唯一能做的可能只剩下猜测。博德斯沃斯认为,在某间政府办公室的一台古老计算机上,它可能正悄然运行,年复一年地执行着相同的任务。尽管旧代码在未来某一天终究可能出现故障,但谁也说不准那会是多久以后,而且实际上,每个人都乐见它继续稳定运行。“我们正处于数字革命的最初阶段。展望500年后,我们也许仍会在与今天相同的基础上进行建设。”麦金托什说。 -
AI热潮,哪些企业更受益? 随着第三季度财报季的尘埃落定,高盛发布报告称,市场对AI基础设施的投入并未减速,反而正在加速上修。尽管投资者对于信贷市场能否消化这一投资热潮、以及支出是否超过自由现金流存有疑虑,但数据表明,科技巨头Hyperscalers的资产负债表仍有巨大的举债空间。对于投资者而言,关键信号已经出现:AI交易正在从单纯的基础设施建设,转向回报分化更为明显的阶段。目前的资本支出预估可能仍被低估,潜在上行空间高达2000亿美元。与此同时,投资逻辑正由“卖铲子”的人(基础设施),逐步向AI平台型股票和能够通过AI大幅提高效率的“生产力受益者”转移。资本支出预估大幅上修,回报分化加剧第三季度财报季不仅催化了AI资本支出预估的进一步走高,也重新引发了投资者对于AI投资繁荣背后风险的担忧。高盛投资组合策略团队指出,市场共识对五大AI超大规模计算公司(Hyperscalers:亚马逊AMZN、谷歌GOOGL、Meta、微软MSFT和甲骨文ORCL)的2026年资本支出预估,已从财报季初的4670亿美元(同比增长20%)飙升至如今的5330亿美元(同比增长34%)。虽然“AI交易”目前主要集中在基础设施领域,但该领域内的回报离散度正在增加。这种分化主要受到两个因素驱动:一是投资者对AI投资能否真正产生收入效益的信心程度;二是为这些投资提供资金所使用的杠杆规模。这种分化可能为投资者提供了以更“便宜”的价格获得AI驱动收益的潜在机会。2026年资本支出仍有2000亿美元上行空间尽管目前的支出数字已经令人咋舌,但分析师的预测可能依然过于保守。自下而上的市场共识认为,超大规模计算公司的资本支出年增长率将由近期的76%放缓至2026年底的25%。这就意味着,分析师预计2026年即这几家巨头资本支出的增长将出现大幅减速。然而,高盛回顾过去两年的数据发现,分析师在每一阶段的预估都不仅是保守的,而且是“过于”保守。基于历史技术投资周期的支出规模分析,高盛认为目前对2026年超大规模计算公司的资本支出预估,仍有高达2000亿美元的上行空间。市场普遍担忧现金流和资产负债表能力会限制2026年的支出,但数据证伪了这一观点。绝大多数超大规模计算公司的资本支出迄今为止都是通过现金流提供资金的,但这些公司同时也拥有巨大的债务融资能力。自2021年以来,这些科技巨头的资产负债表上虽然合计增加了2950亿美元的净债务,但由于盈利能力的强劲增长,它们的集体净债务/EBITDA杠杆率仅为+0.2倍。据高盛测算,这五家公司完全可以在其资产负债表上再增加7000亿美元的净债务,而且即便如此,其净杠杆率也不会超过1倍。因此,相比于现金流或资产负债表能力,供应链瓶颈或投资者胃口更有可能成为近期资本支出的制约因素。杠杆压力与反馈回路虽然最大的AI基础设施公司(前述Hyperscalers)拥有强劲的资产负债表,但参与AI基础设施建设的许多其他上市公司和私营企业则面临更严峻的挑战。资产负债表债务和替代性融资的近期增长速度已引发了投资者的焦虑。由于最大的美国上市公司与较小的AI公司之间存在收入和股权关联,这种紧密的联系创造了一种反馈回路。这意味着,AI生态系统中某一部分(尤其是较小的私营公司)的压力,风险极易传导并影响整个AI板块的投资者。实际上,在第三季度财报季中,已有多家超大规模计算公司报告称,私募股权投资价值的变化对其收益产生了巨大影响。下一阶段赢家:平台股与生产力受益者随着企业AI采用率的持续提高,以及市场对纯基础设施板块的担忧日益增加,投资者的焦点正在转移。高盛重点强调了以下两类未来受益者: AI平台股: 随着越来越多的企业实际采用AI技术,这些公司将获得直接的收入顺风。 AI生产力受益者: 高盛筛选了一批具有较高劳动力成本和高工资敞口的公司,这些公司在最近的财报电话会议上明确提到了利用AI自动化来提高效率。 正如报告最后冷峻指出的那样,对于华尔街来说,这些名字可能意味着好消息;但隐含的就业“替代”机会,对于普通大众而言绝对不是好消息。 -
Hugging Face CEO回应“AI泡沫说”:倒不如说现在是“LLM泡沫” IT之家 11 月 19 日消息,据外媒 TechCrunch 今日报道,Hugging Face 联合创始人兼首席执行官 Clem Delangue 在 Axios BFD 活动中提出观点:现在并不存在所谓的 AI 泡沫,而是“大语言模型泡沫”,而且这个泡沫可能不远就会破裂。“泡沫说”是当今“数万亿美元”的问题,但即便泡沫破裂,AI 的未来也不会受到威胁。依照 Clem Delangue 的看法,目前被过度追捧的是驱动 ChatGPT、Gemini 等聊天机器人的大语言模型。不过,这种关注可能不会持续太久。 ▲ 图源 Axios BFD Clem Delangue 说:“我认为我们正处在一个大语言模型泡沫里,而且这个泡沫很可能会在明年破裂。但大语言模型只是 AI 的一部分,在 AI 应用于生物、化学、图像、音频、视频等领域时,我认为眼下只是开端,未来几年会看到更大的发展。”Clem Delangue 认为的问题在于,大语言模型并不能解决所有场景的需求,未来会有更多体量更小、用途更明确的模型被广泛采用。“现在所有目光、所有资源、所有资金,都集中在这样一种想法上 —— 用巨量算力打造一个能解决所有公司、所有人所有需求的模型。但现实是,未来几个月和未来几年,会出现更多不同类型、更定制、更专门化的模型,用来处理各自不同的问题。”为了说明这一点,Clem Delangue 举了银行客服聊天机器人的例子。“这种机器人并不需要回答生命的意义是什么,对吧?完全可以用一个更小、更专用的模型,能更省钱、更快,还能在企业自己的基础设施上运行。我认为这才是 AI 的未来。”Clem Delangue 承认,大语言模型泡沫破裂可能对 Hugging Face 带来一定影响,但他指出 AI 产业本身庞大而多元,即便大语言模型这一部分被高估,也不会对整个行业或 Hugging Face 造成决定性冲击。Clem Delangue 还表示,Hugging Face 目前仍保留着已融资 4 亿美元(IT之家注:现汇率约合 28.44 亿元人民币)中的一半资金,这种克制的资金策略与不少 AI 公司形成鲜明对比。“按 AI 行业的标准,这样子基本可以算是盈利状态,因为其他公司花的不是几亿美元,而是动辄数十亿美元。”与其相比,Hugging Face 采取的是更高效的资本策略。“现在很多人在抢进度,因此做出的都是很短视的决定,甚至有些慌乱。我在 AI 行业已经工作了 15 年,见过多个周期。所以我们从这些经验里吸取教训,努力把 Hugging Face 打造成一家长期、可持续、真正能对世界产生影响的公司。” -
OpenAI痛失独宠?微软英伟达150亿美元扶持对手 等等,这剧本不对劲! 微软不是OpenAI的“头号铁粉”吗?英伟达老黄和Anthropic CEO此前不是还隔空互怼过吗? 就在所有人都以为格局已定时,一则重磅消息引爆了全球AI圈:微软、英伟达和OpenAI的头号竞争对手Anthropic,结成了一个史无前例的“450亿美元AI巨头联盟”! 具体而言,Anthropic承诺在未来十年内向微软Azure豪掷300亿美元购买云算力,而微软和英伟达则回注150亿美元的联合投资,其中仅老黄一家就掏了100亿! 这场“三方联姻”直接动摇了整个AI产业的基石。它不仅是Anthropic冲击王座的“关键一跃”,更是微软祭出的“多模型护城河”神兵利器;当然,对OpenAI来说,这无疑是感受到了来自“自家大哥”的背刺! 网友称赞此次合作让Claude在顶级云平台全面可用,并对Claude在医疗、金融、制造等关键行业推动自动化与智能决策的未来充满期待。 一、300亿与150亿的“共生循环”:谁才是这场游戏的赢家? 试想一下,300亿美元,这几乎是许多国家一年的GDP!Anthropic承诺用这笔钱,在未来十年内购买微软Azure的云算力额度。这个数字背后,折射出训练下一代前沿AI模型所需计算资源的天文数字级成本。现在,AI模型已经变成了彻头彻尾的“算力吞金兽”。 而作为回报,英伟达的100亿美元和微软的50亿美元,共计150亿美元,以股权注入的方式立刻送到了Anthropic手中,为它接下来的“算力大胃王”计划提供了至关重要的资本。 明眼人已经看出了门道:这笔交易是一个精妙的“共生流动性循环”。 微软投资出去的资本,有一大笔会以Anthropic购买算力的形式,“回流”到自家Azure部门。 这简直是玩了一手“左手倒右手”,既加速了数据中心建设,又锁定了长期租户。这种模式与当年微软对OpenAI的合作如出一辙,堪称资本与算力的乾坤大挪移,Azure才是最终极的赢家。 二、算力饥渴与“双云策略”:Anthropic的生存之道 Anthropic为何需要如此不惜血本?答案很简单:下一代模型的算力饥渴症。 若想在与OpenAI的GPT-5和谷歌的Gemini的军备竞赛中不掉队,就必须拥有数万块GPU协同运作的集群超算能力。通过与Azure结盟,Anthropic不仅确保了优先使用微软先进的超级计算架构——包括最新的英伟达Grace Blackwell和Vera Rubin系统,更重要的是,它彻底告别了此前“单吊”亚马逊AWS的旧模式。 虽然Anthropic仍与亚马逊保持关系,但对Azure的300亿美元承诺,标志着其基础设施战略正式转向“双云策略”。这一下,Anthropic不仅降低了“供应商锁定”的风险,还借此成为微软口中“横跨全球三大主要云服务平台的唯一前沿模型家族”,这分布优势简直是降维打击! 有网友评论道,若其他替代方案(如亚马逊Trainium)真具备竞争力,市场绝不会出现如此一边倒的战略抉择。归根结底,在AI算力这场竞赛中,性能决定一切,而英伟达目前已遥遥领先。 三、老黄的100亿“对冲”与“化敌为友”的哲学 此次联盟中角色最耐人寻味的,非英伟达莫属。黄仁勋大手一挥,甩出100亿美元,去资助OpenAI的“头号刺客”。 这看起来像是一出“资敌”戏码,但老黄的算盘是保住市场主导地位。无论Anthropic的Claude还是OpenAI的GPT-5最终在软件层面上谁更胜一筹,只要它们都需要最顶尖的GPU来训练和推理,那么对Blackwell和Rubin GPU的需求就将是永恒的。 这100亿是对抗谷歌、亚马逊自研芯片崛起的“防御性举措”。老黄用真金白银投票,确保英伟达硬件始终是AI时代的行业标准。 更戏剧性的是,仅在数月前,黄仁勋和Anthropic CEO达里奥·阿莫代伊还在公开场合就AI的社会影响、芯片出口等问题“隔空互怼”,几乎是水火不容。现在,金钱和战略需求成功弥合了哲学分歧。阿莫代伊在该联盟下构建的算力集群将全面基于英伟达最新架构,一句“现在你的业务就像坐上了火箭”,将两位曾经的对手拉上了同一艘巨轮。 四、原生集成与“多模型护城河”:微软的终极野心 对微软而言,这场交易不仅仅是锁定收入,更是执行其“多模型护城河”的宏伟战略。 今年9月,Microsoft 365 Copilot开始通过托管在AWS上的标准API提供Claude,数据不得不跨越云端边界。但这次,Anthropic的模型将原生地规模化运行在Azure基础设施上。这意味着,开发者通过Microsoft Foundry和Azure AI Agent Service使用Claude Sonnet 4.5、Opus 4.1和Haiku 4.5时,延迟将显著降低。 企业客户也能更有效地应用Azure的合规性和安全控制。这种深度整合,对于Microsoft 365中的“研究员”等需要复杂多步骤推理的智能体至关重要。 此外,这种整合还利用了双方共同开发的模型上下文协议(MCP)。该协议标准化了AI智能体连接数据的方式,使Claude能够无缝对接微软庞大的企业生态系统。 通过同时在Azure上托管OpenAI和Anthropic的模型,纳德拉将Azure打造成了AI时代的“中立电网”,一个“淘金路上的卖水人”。这不仅保护了微软免受过度依赖单一提供商(如OpenAI去年领导层动荡)的风险,而且能确保用户始终拥有“最趁手的工具”。 无论是企业想用GPT-5的广博知识,还是Claude的专业推理,最终的计算收入都会流向Azure。 五、OpenAI的影响力被“稀释” 对于OpenAI来说,这无疑是被“自家人”削弱了议价权。 多年来,OpenAI作为微软的旗舰AI合作伙伴,享有无可撼动的特殊地位。但Anthropic承诺的300亿美元云服务支出,加上英伟达的100亿美元战略对齐,表明微软正在建立一个平行的创新和部署渠道。OpenAI对微软AI版图的影响力,已不再是“独一份”。 英伟达对Anthropic的深度合作(共同优化Claude在英伟达硬件上的性能),更是OpenAI从未在公开层面获得的整合待遇。这可能意味着,在获取尖端GPU资源和定制化方面,Anthropic获得了“优先通行证”。 但微软AI首席执行官穆斯塔法·苏莱曼在8月表示,"我们的目标是深化合作伙伴关系,确保我们与OpenAI在未来许多年保持良好的合作",这表明了一种多元化而非替代的战略。 写在最后 450亿美元的超级联盟,宣告了AI领域的竞争,正式从“一超多强”迈向了“群雄逐鹿”的新阶段。 旧的秩序正在瓦解,新的王座正在铸造! Anthropic已经靠着这张天价“船票”,获得了与OpenAI、谷歌平起平坐的资源保障。 我们正站在一个技术和资本狂飙突进的十字路口! 面对这种史诗级的格局重塑,你,还坐得住吗?(小小) -
酒店机器人血战:价格从13万打到1.3万 斑马消费 任建新最近几年,各大连锁酒店内几乎随处可见酒店机器人的身影。但这个看似充满科技含量的新兴行业,其实并没有想象的那么美。云迹科技是酒店机器人龙头,2024年全年完成5亿次机器人服务,单日同时在线机器人数量高达3.6万台,覆盖全国300多座城市的3.4万家酒店。未曾想,这些在酒店里看起来“忙忙碌碌”的机器人并不赚钱。哪怕贵为行业龙头,云迹科技过去三年多时间仍然累计亏损了近10亿元。这些资本眼中的科技宠儿,解放了酒店从业人员的双手,却在行业价格战的压力下,仍在苦苦求生。 酒店机器人混战来回穿梭在酒店走廊上的服务机器人,曾让第一次见到此场景的住客惊呼不已,云迹科技就是背后的佼佼者。云迹科技成立于2014年初,专注于商用服务机器人的研发。十年间,其机器人产品已覆盖超3.4万家酒店,华住集团旗下的全季、汉庭,首旅如家集团旗下的亚朵、如家等,都是其客户。据弗若斯特沙利文数据,2024年在国内市场,云迹科技以13.9%的市场份额位于榜首,比第二到第五名的份额总和还要高。在以云迹科技为代表的先行者带动下,整个酒店机器人行业,都受到了资本的追捧。从2021年开始,云迹科技、擎朗智能等企业频繁获得融资,云迹科技先后完成2.65亿元C轮和5.8亿元D轮融资,背后站着腾讯、阿里等多家知名机构,投后估值超过40亿元。在政策和资本的双重加持下,酒店机器人赛道迅速升温。招股书显示,2022-2024年云迹科技的总营收从1.61亿元增长到2.44亿元,2024年增速达68.6%,2025年前5个月公司营收再次增长18.9%。期间,毛利率也逐步从24.3%增长到39.5%。竞争对手们同样没有闲着。优地科技已经完成多轮来自酒店巨头的增资持股。根据官网信息显示,其自有品牌机器人已经遍布全国600多座城市、覆盖10000家商业场所、日均服务量超过30万次。更不用说还有擎朗智能、九号机器人、普渡科技等行业小巨头都在该领域“掘金”,其中擎朗智能早在2023年的出货量就超3万台。可酒店机器人光鲜的外表下,其实并没有看到的那么美。以云迹科技为例,2022~2025年前5个月,公司亏损分别为3.65亿元、2.74亿元、1.84亿元和1.18亿元,不到三年半累计亏损近10亿元,2025年前5个月亏损还出现了同比40.48%的扩大。热度逐渐退潮酒店机器人热度退潮、赚钱难,主要受到两个方面的影响因素。对酒店场景的高度依赖,导致营收结构单一,是最根本的原因。招股书显示,2022~2024年云迹科技酒店场景营收占比分别为70.1%、95.1%和83%,到今年前5个月这一数据又重新回到93.2%。高度依赖单一场景的经营模式,使得自身业绩更容易受到整个酒店行业波动的影响。特殊的三年,推升了无接触服务,放大了酒店行业对服务机器人的需求。2023年,随着连锁酒店对机器人采购逐步收缩,直接导致云迹科技全年营收同比下滑10%。很多人可能并不知道,酒店机器人其实是个小众且拥挤的赛道。据东方证券所发布的数据,2023年我国酒店服务机器人的市场规模只有11亿元,哪怕维持以往20.8%的年复合增长率,到2028年也只能达到36亿元。众多玩家聚集在这一条小赛道,竞争的激烈程度可想而知。行业前五名的合计市场占有率也不足30%,整个行业仍然处在较为分散的局面中。由于产品逐步陷入同质化竞争,为抢夺更多的市场份额,酒店机器人企业无奈选择以价换量。招股书显示,云迹科技主营产品“润”系列机器人的价格从2022年的每台2.32万元下滑到2024年的1.31万元,降幅为43.8%;“UP”系列机器人售价从每台5.42万元下滑到2.23万元,降幅超过60%。有代理商表示,随着越来越多的玩家涌入该市场,价格战日趋激烈,酒店机器人的平均售价从2016年的13.6万元一路下滑至2024年的1.31万元,降幅超过90%。价格战影响下,酒店机器人企业的利润空间被严重压缩,陷入“卖一台,亏一台”的尴尬境地。第二曲线何在?不可否认,机器人对连锁酒店运营成本的下降,起到了立竿见影的作用。据东方证券研报,以单机价格约在2-3万元之间的酒店送物机器人为例,配备两台机器人5年总投入在6万元左右,若要提供同等服务人工成本将会达到75万元。而酒店机器人企业们,解放了酒店服务员的双手,自己却步履维艰。如此一来,打破单一的酒店场景,便成了云迹科技们首先要解决的问题。目前,云迹科技已开始走出酒店,迈向写字楼、医院等场景。据弗若斯特沙利文预计,2024-2029年服务机器人在国内医疗机构市场将会以46.6%的年复合增长率迅速扩张,此外写字楼和工厂等场景也有不错的增长潜力。只是短时间来看,新业务仍然要面临着较大的挑战。一方面,2024年包括商业楼、医疗机构和工厂等领域为云迹科技带来的营收占比较低,不足300万元;另一方面,酒店之外的场景同样竞争者林立,况且商业楼等环境更加复杂,对机器人的智能程度要求也更高。全新场景需要更多的时间深耕,云迹科技也在试图向软件方面转型。此前,该公司已成功推出HDOS行业首批服务智能体应用系统,能够为用户提供礼宾服务、订单管理等多项功能。2024年,其AI数字化系统在总营收中的占比已经达到22.4%,毛利率高达61.8%,显著高于硬件产品;2025年前5个月软件类产品营收为918.8万元,同比增长超10%,毛利率进一步提升至67.2%。随着相应的智能体应用接入更多设备,无疑给云迹科技的第二增长曲线打开了想象空间。出海,成为了酒店机器人企业寻求增长的另一条路径。10月16日,云迹科技正式登陆港交所成为“酒店机器人第一股”,间隔不到半个月便再次迈出了出海的步伐。当月底,在香港财政司的带领下访问沙特阿拉伯。沙特蓬勃的旅游业带动酒店行业快速扩张,再加上当地较高的人力成本和对科技的开放程度,无疑对寻求出海路线的云迹科技产生了极大吸引力。只不过在竞争激烈的服务机器人赛道,对于市场的争夺,无论拓场景、做软件还是出海,竞争对手们之间难有秘密可言。归根结底还是要把重心放在研发端,推出更具有差异化和能解决更多复杂场景的产品。尴尬的是,截至2024年底云迹科技的研发团队已经缩减到66人,研发费用率从2022年的42%几乎腰斩至2024年的23.4%。 -
谷歌最强AI模型Gemini 3登场,号称迄今最智能 IT之家 11 月 19 日消息,北京时间今天凌晨,谷歌正式推出全新的 Gemini 3 系列模型,并将其定位为迄今“最智能”“事实最可靠”的 AI 系统。伴随 GPT-5 上线不顺,这一版本也被视为谷歌重夺领先位置、在面向消费者的 AI 竞争中反超 OpenAI 的关键机会。谷歌所有用户均可在 Gemini 应用里直接使用新的旗舰模型 Gemini 3 Pro,并同步将其引入搜索订阅服务。谷歌 DeepMind 高级总监 Tulsee Doshi 表示,随着搜索形态不断演变,Gemini 3 Pro 将让谷歌更接近“让信息普遍可得并真正有用”的目标。Doshi 说,“真正重要的一步,是摆脱只能给出文本回应的旧模式,提供一种更完整、更丰富的呈现方式。” Gemini 3 Pro 的核心能力是“原生多模态”,能一次性处理文字、图片与音频,而不是分成不同流程。谷歌举例称,模型可以把菜谱照片整理成一本食谱,也能根据多段课程视频自动生成互动抽认卡。该模型带来的升级已渗透到谷歌的一系列产品中。在 Gemini 应用内的 Canvas 工作区,用户能借助新模型构建功能更完整的程序。Gemini Labs 中测试的“生成式界面”功能,也能让 Gemini 3 Pro 根据提示生成杂志式的视觉版面,或创建随需求变化的动态界面。 在谷歌搜索的 AI Mode 中,Gemini 3 Pro 也会以更直观的方式呈现结果,包括图片、表格、网格甚至模拟内容。依托升级的“查询扇出技术”,模型不仅能把问题拆解成可搜索的细项,也更能理解提问意图,进而找到“过去可能遗漏”的内容。据外媒 The Verge 报道,谷歌还顺势讽刺了一下 OpenAI,强调 Gemini 3 Pro 不会像 ChatGPT 那样习惯性奉承。Doshi 表示,新模型的回答会“变化明显”,谷歌称 Gemini 3 Pro 的表达“更聪明、准确、直接,以真正的洞见取代客套和套路 —— 告诉用户该知道的内容,而不是迎合用户想听的话”。谷歌表示,新版在“谄媚”方面的表现已明显收敛,而 ChatGPT 今年早些时候也不得不修正类似问题。据IT之家了解,Gemini 3 Pro 的推理与智能体能力也显著增强,更能应对复杂任务,并具备稳定的长期规划能力。Gemini 应用内正在测试的 Gemini 智能体功能正由这套模型驱动,可代替用户整理邮件,或搜索并预订行程。 目前,Gemini 3 Pro 排在广泛使用的评测平台 LMArena 榜首。其 Deep Think 模式进一步强化推理能力,但暂时只向安全测试人员开放。Gemini 3 Pro 已在 Gemini 应用内向所有用户开放,美国地区的 Google AI Pro 和 Ultra 订阅用户也可在搜索的 AI Mode 中选择“Thinking”使用这一模型。Gemini 智能体则将率先提供给 AI Ultra 订阅用户。 -
“我慌了,发生了什么?”,Cloudflare故障引发全球互联网混乱 美东时间周二早间,互联网基础设施服务商Cloudflare表示,其全球网络正在遭遇异常,导致包括社交媒体平台X在内的大量网站出现“internal server error”等访问故障,用户无法访问许多网站和服务,包括零售、电商、社交媒体、金融服务以及交通相关平台。该公司随后声称,在耗时不到四小时后已修复问题。 宕机期间,X的部分功能中断,多家网站也陷入访问受阻。根据故障跟踪平台Downdetector的数据,除X之外,也有大量站点受到影响,相关报告数量持续攀升。用户在访问X、ChatGPT、DoorDash、IKEA,以及纽约市大都会运输署(MTA)等网站时,都看到与Cloudflare相关的错误信息。 随后,Cloudflare的一位女发言人表示,在美东时间早上6点20分左右,他们的某项服务出现了异常的流量激增,导致经过公司网络的流量出现错误。Cloudflare另一位发言人Jackie Dutton在公告中说,这个问题是由一个用于管理威胁流量、自动生成的配置文件引起的,修复耗时不到四小时。公司表示已经部署了核心修复措施,但谨慎指出系统“仍需时间完全稳定”。Dutton表示: “这个文件的条目数量超过了预期大小,触发了负责处理Cloudflare部分服务流量的软件系统崩溃。” 声明称,没有证据显示此次事件与网络攻击或恶意活动有关。故障的影响范围极为广泛。Downdetector在平台上表示,在Cloudflare宕机期间,“各类受影响服务的报告累计超过210万条”,显示此次事件已成为近年来较为严重的一次基础设施级别中断。 事故发生后,Cloudflare的股价周二开盘一度暴跌7%,随后跌幅收窄。 数字资产行业也出现反应。币安联合创始人、前CEO赵长鹏在X上发文称:“区块链依然正常运行(Blockchain kept working)”,暗示去中心化系统未受此次事件影响。到美东时间12:15,Cloudflare表示系统正在逐步恢复,但全球部分区域仍可能出现访问错误、性能下降或登录问题。公司将在状态页面持续更新修复进度。 对少数公司过于依赖 近年来,多次因为数字基础设施供应商出现问题,导致全球互联网使用陷入瘫痪。亚马逊云服务(AWS)、CrowdStrike Holdings Inc.和微软公司先后出现过类似事故,也突显全球互联网在很大程度上依赖于少数公司提供服务。Cloudflare和AWS的服务对普通用户来说几乎是“隐形”的,但它们的工具支撑着消费者每天使用的大量网站和服务。上个月AWS的宕机让互联网部分区域陷入瘫痪,导致数百万用户的网站和应用无法使用,零售销售受阻,社交媒体和金融服务中断,很多企业也受到影响。去年,网络安全公司CrowdStrike所使用的一项工具中的漏洞更是让全球的电脑系统大面积崩溃,引发数千次航班延误和取消,也让政府机构和大型企业的运营陷入混乱。加州网络安全公司Check Point Software的专家Graeme Stewart表示,这类事故凸显了互联网对少数几家基础设施提供商的过度依赖。他说: “很多机构依然让所有关键服务都依赖同一条路径,而且没有真正有效的备份。一旦这条路径出问题,就没有任何后备方案。这就是我们一直看到的问题。” 萨里大学(University of Surrey)网络安全教授Alan Woodward表示,周二的故障再次说明互联网高度依赖“少数玩家”。他把Cloudflare形容为“你从未听说过的最大公司”。 “人们别无选择,只能依赖这些少数大公司。” 首席技术官道歉Cloudflare首席技术官Dane Knecht为这次事故道歉。他在X上写道: “当Cloudflare网络出现问题,影响到依赖我们的海量流量时,我们辜负了客户,也辜负了整个互联网。这个问题本身、造成的影响、以及解决所花的时间,都是不可接受的。我们已经开始着手确保类似情况不会再次发生,但我知道今天确实给大家带来了麻烦。客户对我们的信任最为重要,我们会尽一切努力赢回这份信任。” Cloudflare在过去几年曾多次经历类似宕机。2019年7月,Cloudflare软件中的一个漏洞导致网络部分模块过度占用计算资源,使全球数千家依赖Cloudflare的网站(包括Discord、Shopify、SoundCloud以及Coinbase)离线长达30分钟。2022年6月,Cloudflare发生故障,影响其19个数据中心的流量,导致多个主要网站和服务瘫痪,持续约一个半小时。Cloudflare的软件被全球数十万家公司使用,作为企业网站与终端用户之间的缓冲层,用于保护网站免受流量攻击或流量突发导致的宕机。去年,网络安全公司CrowdStrike发布的错误软件更新导致运行微软Windows系统的数百万台设备崩溃,给航空、银行、医疗等众多行业造成大范围混乱。CrowdStrike的这次宕机源于其产品中一个在客户电脑最底层运行的错误。而Cloudflare的作用是保护互联网基础设施,如网站和平台,因此当Cloudflare宕机时,许多热门网站会直接无法访问或出现异常。Cloudflare主要负责“让网站始终在线且速度够快”,而CrowdStrike专注于保护电脑和服务器免受攻击。 -
一夜封神,Gemini 3让谷歌找回“碾压感” 305亿重仓谷歌的巴菲特看到了什么?出品 | 网易科技《态度》栏目 作者 | 袁宁 编辑 | 丁广胜 刚刚,谷歌正式推出传闻中“效果炸裂”的Gemini 3。 先说一个判断:行业竞争依旧激烈,但从今天起,牌桌的形状确实发生了变化。 最近几周,Gemini 3其实早已“未发先火”。网易科技了解到,不少投资人和技术从业者,最近常用的模型已经悄悄变成了Gemini。 而社区里,Gemini 3 “提前暴露”的能力案例表现也是一个比一个惊人:一句指令,Gemini 3就能动态构建一个基础版 Windows;一条提示,它能生成交互式 UI;甚至在未提供任何图片的情况下,自动完成一个从零构建的 SVG 动画。 也正因如此,有传言称,“股神”巴菲特亲测 Gemini 3后当场增持了43亿美元谷歌股票。 据谷歌 CEO Sundar Pichai 最新披露:AI Overviews 的月活已达20亿,Gemini 月活超过6.5亿,70% 的云客户在使用谷歌 AI,1300万开发者已在基于生成式模型构建产品。 01用十条最重要的信息,快速理解Gemini3 1、谷歌称Gemini 3是其最智能的模型,能帮助将任何想法变为现实。 2、Gemini 3能自主规划并执行多步骤的复杂任务,比如帮你整理 Gmail 收件箱、规划并预订旅行、处理工作流。 3、可以直接在谷歌搜索的“AI 模式”中直接体验到 Gemini 3 ,这是首次在发布当天就将 Gemini 集成到搜索中。 4、一个很酷的亮点之一是“生成式 UI” 体验。这意味着当你提问时,Gemini 3不再只返回文字,而是能即时为你“编码”生成一个定制的、可视化的交互界面。比如,学习物理问题时,它会生成一个你可以动手操作的模拟器;规划旅行时,它会生成一个图文并茂的交互式行程。 5、Gemini 3能无缝处理文本、图片、视频、音频和代码,有100万 token 的上下文窗口。你可以给它看手写的菜谱、分析你的匹克球比赛录像、或者让它帮你理解复杂的学术论文和视频讲座。 6、对于开发者来说,现在可以用更自然、更模糊的语言(即“氛围 vibe”)来描述一个想法,Gemini 3就能将其转化为功能丰富的应用或精美的用户界面。 7、推出全新的开发平台 Google Antigravity。开发者可以像“指挥官”一样,管理多个 AI 代理同时在编辑器、浏览器和终端里自主工作。 8、Gemini App 全面升级,Gemini App 不仅用上了 Gemini 3内核,还重新设计了界面,并率先在其中尝试了“Gemini 代理”等实验性功能。 9、还有一个更强大的“Deep Think”模式,它在解决顶级难题(如博士级考试)上的表现更为惊人,代表了 AI 智能的更高上限。 10、谷歌称Gemini 3模型将表现出更少的“逢迎”现象,对提示词注入的抵抗力更强,并改进了对网络攻击滥用的防护。 02谷歌重回牌桌中央 在过去一年里,行业内部很多人认为谷歌在应用层落后,尤其在执行能力、产品节奏、终端体验等方面,被竞争者拉开了明显差距。但 Gemini 3的亮相,让谷歌的结构性优势实现了一次完整对齐。 核心变化在于:谷歌把“模型—产品—入口—分发—生态”重新连成了一条线。 具体来看,有几点值得注意。 首先,Gemini 3发布当天就进入了谷歌搜索的“AI 模式”,这是谷歌从未有过的节奏。 以往,大模型从训练完成到真正进入搜索、Android 或 Workspace,往往需要跨越多个链路: 训练 → API → 应用 → 终端整合 → 全球推送。 这次的路径几乎是同步发生。这意味着谷歌第一次让“新模型能力”与“全球最大入口产品”形成即时结合。这种压缩时间差的方式,让谷歌重新获得了可以快速推开用户端体验的能力。 其次,过去谷歌的问题被认为是“太大、太慢、太复杂”。但当 TPU、模型、安卓、搜索、Chrome、Workspace 被拉到一个统一节奏里,这种复杂性开始反向成为优势。 现在来看,Gemini 3正在这个统一技术栈里获得乘数效应:TPU 提供训练与推送能力、搜索承担流量入口、Android 与 Chrome 撑起交互层、Workspace 负责执行任务、Antigravity 解决开发者的多代理协作。相比之下,大多数竞争者只能在链条的一部分取得突破,难以在“入口—交互—执行—生态”四个层面同时推进。 Gemini 3并不意味着谷歌全面逆转战局,但它重新明确了一个判断:谷歌依然是少数能把“顶级模型能力”直接压到全球主流应用体系中的巨头。这份能力既来自技术堆栈,也来自覆盖全球数十亿用户的分发体系。 行业竞争依然继续,但从今天起,牌桌的形状确实发生了变化。 附网易科技等媒体与Gemini团队沟通实录,经不改变原意的编辑: Q:能否分享一下在训练 Gemini 3过程中出现的那些 “Aha moments”? Gemini 团队:这个问题很有趣。我们在使用这个模型时的确经历了不少“顿悟时刻”。 其中一个最直观的体验,是我第一次用它做“氛围编码”(vibe coding)。只用非常模糊和简短的提示,它就能从零生成各种游戏,还能在环境里构建3D 画面并让你直接玩。我当时真的被惊到。 我们有一位工程师甚至一直用它做游戏,这些游戏明天就会在 YouTube 发布。以这样自然的方式创造出丰富、高保真的体验,这是以前没有的。 另一个常被忽略的能力是多语言表现。我尝试让它把一首古吉拉特语诗(我父母使用的语言)不仅翻译,还进一步创作。它展现出的细腻风格、节奏感和创造力,让我再次意识到这模型的智能水平。 真正“神奇”的地方是,当你把多模态输入、复杂推理和要求输出的格式组合在一起时,你能看到 Gemini 3的能力被完全唤醒。 Q:你会如何描述 AntiGravity 在整个生态系统中的定位? Gemini 团队:简而言之,AntiGravity 是基于 Gemini 能力构建的新一代 IDE。 AI 已经在重新塑造我们写代码的方式——工程师可以站在更高的抽象层级,让智能体去处理复杂任务,而你只关注目标。 AntiGravity 基于这一理念,为开发者提供一个以智能体为核心的 IDE。市场上当然有其他 IDE,我们的模型也会继续在各种 IDE 和 API 中使用。但 AntiGravity 会成为我们与开发者更直接的接触点:理解他们真实的工作流、任务场景和痛点,从而反向推动模型进化。 它会带来一种全新的软件开发范式。 Q:面向消费者,你们期待 Gemini 智能体最典型的使用场景是什么? Gemini 团队:我们希望它帮助用户处理生活中更复杂、耗时的任务。 比如,我最近买演唱会门票,不用再手动查一堆网站。告诉智能体我要带两个孩子去、想要什么价格区间,它就会自动筛选选项,把我带到可以直接下单的页面。我只需要点一次继续。 另一个非常实用的场景是清理邮件。我每天早上醒来有几十封邮件,以前要花很多时间逐条判断。现在让智能体接管,它会自动帮我分类:哪些是任务、哪些需要回复、哪些可以归档。节省了大量时间。 我迫不及待希望更多人能体验到这种效率。 Q:Pro 版本已上线,我们能期待 Flash 和 Flashlight 很快推出吗? Gemini 团队:是的,我们正围绕 Gemini 3构建完整的模型家族。 当前重点是观察 Pro 版本的反馈:用户在用它做什么?哪些地方还有潜力? 这些反馈会直接作用于 Flash 和 Flashlight 系列的决策,包括成本、延迟以及最合适的使用场景。 你们很快会看到更多产品。 Q:Gemini App 近期用户增长迅猛,团队有做了哪些事情推动? Gemini 团队:增长来自几个重要因素: 第一是 Nano Banana 的病毒式传播,尤其是在泰国、印尼、印度等市场。那是一款极其成功的产品,很多人愿意分享给朋友。 第二是学生群体的快速扩散。我们与教育合作伙伴合作,为学生提供优惠,我们看到他们在作业和课堂学习上对 Gemini 的强烈需求。 最后是模型质量本身的提升。从2.5 Pro 到现在,我们看到了很明显的用户迁移与粘性反馈。我们同样期待 Gemini 3的表现。 -
大规模宕机!美国多个网站崩了 11月18日,知名网络基础设施公司Cloudflare表示,其全球网络出现问题,导致许多网站和应用程序的服务中断,包括X(原twitter)和ChatGPT在内的多家互联网平台无法访问。据媒体报道,Spotify和亚马逊也出现了服务中断。Cloudflare股价盘前一度下跌超5%。 Cloudflare股价下跌值得注意的是,18日晚,话题“cloudflare崩了”“推特崩了”登上微博热搜榜官网显示,Cloudflare是一个全球性的云平台,为世界各地的各种规模的企业提供广泛的网络服务,同时提高其关键互联网资产的性能和可靠性。Cloudflare还为全球125个国家/地区的330个城市提供数据传送服务。 Cloudflare是一个全球性的云平台2019年9月13日,Cloudflare在纽约证券交易所敲钟上市。北京时间19:17(伦敦时间11:17),Cloudflare官网状态显示其支持的门户提供商目前遇到一些问题,因此客户查看或回复支持案例时可能会遇到错误。 Cloudflare官网截图半小时后,Cloudflare表示目前正经历内部服务故障,部分服务可能会间歇性受到影响。大约20分钟后,该公司发布消息称,中断情况已开始缓解,但仍在继续调查该问题。截至21:13,该公司表示,其部分服务的错误率已“恢复到事件发生前的水平”,并且正在继续努力恢复其他服务。 Cloudflare发布消息 截至发稿,包括X和ChatGPT在内的多家互联网平台依然受到故障影响,X平台的贴子显示“无法载入”。 X平台的贴子显示“无法载入”实际上,这也并非Cloudflare首次大规模宕机,其系统已多次"中招"。2019年7月,Cloudflare软件的一个漏洞导致其部分网络耗尽全公司计算资源,致使全球数千家依赖其服务的网站最长宕机30分钟。当时受到严重影响的网站包括博客平台Medium、游戏聊天服务商Discord、电商平台Shopify、音乐服务SoundCloud、比特币交易平台Coinbase及在线存储服务商Dropbox等一众知名平台。2022年6月,Cloudflare再次发生故障,波及处理其大部分全球流量的19个数据中心,导致多家主流网站和服务陷入瘫痪,此次事故持续约一个半小时。(免责声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。)每日经济新闻综合上海证券报、财联社、公开消息 -
中美机器人爆发了一场论战 一段"无加速、无遥控"的机器人视频,竟然让硅谷大佬坐不住了最近,一段来自中国初创公司的机器人视频在全球范围内引发了轩然大波。更有意思的是,这段视频不仅展示了令人惊艳的技术实力,还意外引发了一场跨越太平洋的"真假之辩"。中美机器人爆发了一场“论战” 就在最近,一个视频在国内外科技圈引爆了。视频的主角,是一个来自中国的人形机器人。它能浇花、扔垃圾、整理玩具、和孩子们玩飞盘,动作流畅得令人惊叹。 更关键的是,发布方——一家名为“灵启万物(MindOn Tech)”的深圳初创公司强调,整个过程“无加速、无遥控”,完全由机器人自主完成。这家成立不久的公司背景也不简单,创始人来自腾讯。他们使用的硬件,是另一家中国公司宇树科技(Unitree)的G1人形机器人。“这是假的!” 美国CEO下场质疑 这个视频如同一块巨石投入平静的湖面,迅速激起千层浪。视频的火爆,很快引来了大洋彼岸的关注。有美国网友直接在社交平台X上@了“美国宇树”Figure的创始人兼CEO——布雷特·爱德考克(Brett Adcock),问他:“这是真的吗?” 这位CEO的回应,给火热的讨论浇上了一盆冷水: 看起来像是一个开环回放的RL控制器(也就是说,它在没有感知的情况下盲目移动,并且运行的是一个开环回放)。 然后在最后,当他们抓住物体时(表明循环中出现了感知),他们移除了视频右下角的“禁止遥控”字样,并进行了人工遥控。 Brett Adcock对中国机器人公司的成果似乎抱有普遍的怀疑态度。此前他公开质疑中国另一家机器人公司——优必选(UBTECH)的帖子,并直言不讳地指出: 优必选展示的量产交付视频是“假的机器人(fake robots)”,很可能是电脑特效(CGI)。 有了优必选的“前车之鉴”,当MindOn的视频再次引发热议时,外界的怀疑情绪似乎被再次点燃。一场围绕“中国机器人视频是真是假”的论战,就此展开。一场“真与假”的论战 面对质疑,支持者们也拿出了证据。有网友迅速放出了一段备份录像,从不同角度证明了视频的真实性。 一位名叫Mike Kalil的美国科技博主更是发表长文,详细论证了为什么他认为灵启万物的视频“没有造假”Kalil表示,视频中机器人展示的端水、爬上床、与孩子互动等行为,虽然看起来惊艳,但在学术界早有相关的研究成果(如ResMimic、HDMI、OmniRetarget等论文)。MindOn所做的,是出色地将这些前沿研究整合并工程化落地。Kalil总结,灵启万物的技术很可能整合了近年来机器人研究的多项前沿成果,例如通过模仿学习(imitation learning)和强化学习(reinforcement learning),让机器人在模拟环境中进行数百万次训练,再将学习到的能力迁移到物理机器人身上。 “论战”背后:路线之争的浮现 这场跨国“论战”的精彩程度,不亚于机器人本身。但对于投资者来说,更重要的问题是:如果这是真的,意味着什么?有分析师一针见血的指出: 如果像灵启万物这样的软件系统,能够在已经量产的、相对经济实惠的硬件(如宇树G1)上实现真正的通用功能,那么它们可能会对Figure AI、1X Technologies和特斯拉等公司构成严重威胁。 目前,以Figure、特斯拉为代表的美国头部玩家,大多走的是“软硬一体”的垂直整合路线。它们不仅要研发驱动机器人的“大脑”(AI软件),还要自己设计和制造机器人的“身体”(硬件本体)。这就像苹果公司,自己设计iOS系统,也自己生产iPhone。这种模式的优势是集成度高、体验好,但研发成本和产品价格也居高不下。而灵启万物的视频则展示了另一种可能性:“安卓模式”。在这个模式中,AI软件(大脑)和机器人硬件(身体)可以解耦。像灵启万物这样的公司专注于开发最强的“大脑”,而硬件则可以交给像宇树科技这样已经实现规模化量生产、且成本更低的公司。一旦这种模式跑通,人形机器人产业的竞争格局将被彻底改写。竞争的关键将从“谁能造出更好的机器人身体”,转移到“谁能开发出更聪明的机器人大脑”。与此同时,美国公司目前所依赖的硬件集成战略将会受到冲击。当便宜的硬件平台也能实现高级的自主智能时,昂贵的定制化硬件壁垒就不再那么牢固。市场可能会向一个更加开放、灵活的生态倾斜,软件可以在任何硬件上运行。这就像智能手机市场,如果安卓系统在第一代iPhone发布之前就已成熟,今天的市场格局可能会完全不同。从这个角度看,这场关于视频真假的“论战”,本质上是两种技术路线、两种商业模式的提前碰撞。美国CEO的焦虑,或许并非空穴来风。他看到的,可能是一个极具颠覆性的“安卓时刻”正在中国悄然酝酿。无论如何,人形机器人的竞争已经进入白热化阶段。而中国公司,正以一种出人意料的速度,从硬件制造到软件智能,全方位地加入了这场全球角逐。 -
产业繁荣推动机器人走进千家万户(专家对话) 本报记者 李 贞 中国机器人产业正加速发展,成为全球制造业自动化的重要引擎。关于当前行业发展情况,本报记者采访了北京航空航天大学机器人研究所教授陈殿生。 记者:过去,我们知道机械臂也就是工业机器人会应用在工厂生产线上。但现在,我们看到很多机械臂走进了日常生活,成为咖啡机器人、按摩机器人等。这种发展变化具有怎样的价值? 陈殿生:这一变化看上去是机械臂的应用场景变了,但实际上,其背后的技术已发生了跨越式发展。 应用在生产线上的传统工业机器人,它需要有围栏,将机械臂与人隔离开,以保证人的安全。但应用在生活服务场景中的机械臂,需要与人密切接触,它们更准确的称呼应该是协作机器人。从“制造”转向“服务”的机械臂,其技术内核,比如精密传动、运动控制等,还是源于工业机器人,但设计理念、安全标准和场景需求都已经发生了变化。 国产协作机器人的快速发展具有重要意义。首先,它带来了技术普惠化,让机器人从只为大型制造业服务的“高端装备”,走进了大众消费领域。这也是技术安全成熟、成本下降、供应链完善的必然结果。其次,它催生了“机器人+”的新商业模式,比如“机器人+咖啡”的无人咖啡厅、“机器人+康养”的新型康养社区等。结合数据大模型和深度学习等技术,机器人还可以记住用户偏好,为人们提供个性化服务。 随着协作机器人技术的进步和产业繁荣,机器人走进千家万户只是时间问题,我们想象中的未来生活正一点点变为现实。 记者:目前中国机器人产业发展情况如何,有哪些发展优势? 陈殿生:产业发展方面,中国已成为全球第一大机器人生产国。技术方面,近年来中国机器人产业实现了一系列科技创新突破。2024年,中国机器人专利申请量占全球机器人专利申请总量的2/3。 特别是中国机器人产业链条日益完整。从上游零部件,到中游本体制造,再到下游系统集成,已形成完整的产业生态。核心零部件自主化取得突破,控制器、伺服电机、精密减速器等核心零部件的国产化率大幅提升。许多国内企业已实现了这些核心部件的自主研发和批量生产,不仅降低了生产成本,也为产品定制化奠定了基础。 在国际市场上,中国机器人也越来越受认可。当前,中国机器人出口的增长已不再仅仅依靠价格优势,而是更多地依靠技术、品牌和完整的解决方案。从东南亚到欧洲、北美市场,充分证明了中国机器人在质量、性能和可靠性上达到了国际先进水平。 记者:面向未来,中国机器人产业在技术发展上将有哪些重点发力方向? 陈殿生:中国机器人产业具有广阔的发展前景。伴随AI技术发展,提升机器人智能化水平是一个重要趋势。 如今AI技术正在重塑机器人的能力边界。利用AI算法与大模型对机器人进行训练,能实时优化和调整机器人的运动轨迹、感知参数、经验判断等,从而获得更优的执行效率。AI技术还可以具备预测性,通过分析机器人运行数据,提前预测零部件可能发生的故障等,实现从“定期维护”到“按需维护”的转变,极大减少非计划性停机。在具身智能领域,AI技术还让机器人拥有了一个能够理解、推理和执行任务的“大脑”,让机器人“心灵”又“手巧”地自主完成任务。 今后,机器人产业的竞逐将是“机器人大脑”的比拼。相信中国机器人产业将在这场竞争中勇攀高峰。 -
田渊栋离职Meta,最后一篇论文? 新智元报道编辑:桃子【新智元导读】离职Meta后,田渊栋团队最新论文放出了。他们提出的「三门理论」发现,RLVR微调只在小权重里发力,性能提升的同时又不破坏模型结构。田渊栋离职Meta之后,最后一篇亲笔?上月末,Meta血裁600人团队,AI大佬田渊栋官宣自己也被裁员。最近,他在Meta期间一篇论文正式发布,已被顶会NeurIPS 2025录用。 最新研究中,他们发现一个反常却稳定的规律——强化学习与可验证奖励(RLVR)虽能提升模型性能,但几乎不碰主方向上的权重。这是一种受模型结构自身约束的优化偏置。这背后的原因究竟是什么,不如打开「黑箱」看一看。 论文地址:https://arxiv.org/pdf/2511.08567论文中,团队提出了「三门理论」,即KL锚点 → 几何结构 → 精度。它能解释并刻画AI独特的优化行为,也为近期一系列来自参数空间的观察现象,提供了可解释性:其中就包括,RL更新稀疏、RL遗忘较少,在线量化秩序一次校准。更重要的是,RLVR的优化方式与监督微调(SFT)完全不同,而且,人们常在SFT中用到的方法,不一定在RL中好使。 总言之,新论文最大的贡献在于,首次绘制出RLVR训练动态的「参数层面全景图」。RL学习,优化偏差从哪来?在研究之前,Meta团队提出了一个关于RL学习动态的核心问题:优化偏差是从哪里产生的?它在训练过程中如何影响参数的变化? 为此,他们专门探索了RLVR方法。它是通过使用确定性的、可验证的奖励函数,去提高LLM在精确任务中的性能。RLVR会在同一个预训练模型的前提下,把更新引导到跨不同运行、数据集和训练方案中的同一类偏好区域。这是一种受模型本身影响的优化偏向。如下所示,在训练过程中,RL会把更新集中在同一模型的相同区域。 每个面板展示的是一个0-1更新掩码(1=已更改,0= 更改)。尽管使用的数据和算法不同,这种条纹状模式仍在不同运行中反复出现1 RL会将更新定位到同一模型的相同区域这里,作者分析了DeepSeek-R1-Distill-Qwen-1.5B的5次微调运行。这些运行分别使用了,包括数学、代码等多样化数据,以及不同的RL变体,如GRPO、DAPO、Reinforcement++。首先计算更新掩码 M_i,通过比较基础模型和微调模型来追踪更新集中在哪些位置。随后,更新一致性比率: 如下所示,在五次RLVR运行中,团队绘制了第13层的投影(Q/K/V/O)以及MLP的下投影。较亮的条带标记了在大多数运行中被更新的坐标,呈现出一种稳定的、类似条纹的路由模式,而不是随机散布。 权重更新的一致性比例2 优化偏向在整个训练过程中持续存在为了研究单次运行内部的动态变化,作者又在DeepSeek-R1-Distill-Qwen-1.5上,跟踪了训练步骤中的按行和按列的更新比率: 下图中,路由偏向在训练初期便开始出现,并在训练推进中不断增强。这表明这是一种随时间保持稳定的现象,而不是短暂的偶发现象。 其峰值与图2中的偏置结构一致。 3 这种偏向可在不同模型族之间泛化不仅如此,作者又在Llama和Mistral上,同样观察到了类似的条纹结构特征。这表明,这种路由偏向是RLVR的普遍现象。 「三门」理论,破解黑盒那么,究竟是什么驱动了RLVR独特的训练动态?论文中,研究人员提出了一个「三门理论」。具体来说,每一步RL更新都会经过三个「门」——它们共同将更新从主方向偏离,并引导进入低曲率、保持谱结构的区域。门一: KL锚点对更新的约束实验显示,同策略(on-policy) 的RL更新,会施加一种隐式的KL「牵引绳」,即锚点效应。这使得每一步策略的偏移都保持很小。巧的是,这一观察与近期MIT、斯坦福等机构研究的观点一致。此前研究表明,最终策略也与初始策略保持KL上的接近。 接下来的重点在于,这条「牵引绳」是如何影响权重更新的动态过程?门二:模型几何结构决定KL约束下更新的落点上面的门一,提供了限制单步偏移的KL「牵引绳」,但并不规定更新会落在哪里。在一个预训练良好、具有结构化几何特性的模型中,小幅更新会局限在其既有几何结构内。根据矩阵扰动理论,如Wedin的sin-Θ定理),小范数扰动只会导致极小的子空间旋转,并保持近乎稳定的谱结构。在KL约束下,RL更新往往会保持模型的原始权重结构,而不是将其破坏。因此,更新会自然偏向优化地形的低曲率方向,从而避免模型行为出现剧烈变化。鉴于直接在长CoT的LRM中量化曲率成本极高,团队又采用一种高效的替代指标——主权重(principal weight)。门三:精度限制正如作者所言,存不下的东西看起来就像「稀疏」的。bf16的有限精度(仅有7位尾数)像一块「透镜」:它会掩盖那些RL想持续施加但幅度过小、无法被有效存储的微更新。基于理论的验证:RLVR优化动态 在参数层面,作者验证了RLVR的学习动态,其与理论框架高度一致。尤其是,门二所描述的「更新偏向非主权重」。RLVR在提升推理能力的同时避开主方向:它保持谱几何结构、避开主权重;而一旦预训练的几何结构被破坏,这种优化偏向也会随之消失。 RLVR保持谱几何结构,而SFT会破坏它如下所示,是SFT与RLVR在Qwen3-8B-Base上的谱几何对比。与SFT相比,RLVR能保持稳定的前k阶谱,并显著减少子空间旋转。 左图:示例层的前k个主角度和奇异值曲线;右图:跨所有层的最大主角度与归一化谱漂移RLVR会避开主权重,而SFT则会直接更新主权重下图中,RL会避免更新主权重。研究人员将RL的更新掩码与主权重掩码M_princ、低幅值掩码M_low,以及二者的组合M_princ ∩ M_low^c进行对比。RL更新与主权重之间的逐层重叠比例始终低于随机水平;而当去除其与M_low的重叠权重(即M_princ ∩ M_low^c)后,这种效应表现得更为明显。 RL算法重新思考作者观察到的训练动态揭示了一个超越机制本身的重要洞见:RL在参数空间中的优化机制,与SFT完全不同。那些诞生于SFT时代的旧PEFT方法,尤其是依赖稀疏或低秩先验、并因此与SFT训练动态高度对齐的方法,在RLVR中的迁移表现并不好。下图中的曲线直接验证了:SFT中偏好的主方向更新,对于RL并不有效。 下图中,是LoRA与PiSSA在DS-Qwen-1.5B(DeepMath-103K)上的表现对比。整体来看,PiSSA(以主方向为目标)相较LoRA并未带来额外收益;并且在较高学习率、被强制推动主方向更新时,它往往会在早期崩溃,而LoRA依然更为稳定。这一结果支持了研究中的几何分析:强行将更新推入SFT所偏好的主方向与RL的优化特性并不匹配,不但无法带来明显收益,还会在放大学习率时导致训练崩溃。 智能体与RLHF任务 此外,作者还分析了额外的智能体与RLHF(基于人类反馈的 RL)检查点,并确认它们在权重空间上的诊断结果与前文一致:(i) 主子空间旋转幅度极小,(ii) 谱漂移轻微,(iii) 更新与主方向存在显著错位。如下是更多关于关于智能体和RLHF的实验结果。 参考资料: https://x.com/tydsh/status/1989049095575728156?s=20 -
阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO | 极客早知道 阿里千问 App 公测,与 ChatGPT 正面交锋 11 月 17 日,阿里巴巴正式官宣「千问」项目,全力进军「AI to C」市场。当天,千问 APP 公测版上线,接入全球性能第一的开源模型 Qwen3 并免费开放,与 ChatGPT 展开全面竞争。此前,有知情人士透露,在未来几个月内,阿里巴巴将在该应用中逐步增加智能体 AI(Agentic-AI)功能,以支持包括主要淘宝市场在内的平台上的购物功能。「阿里巴巴计划最终通过海外版本向全球扩张。」该人士表示,在过去几个月里,阿里巴巴 CEO 吴泳铭已从各部门调集了大量开发人员投入到此项目中。(来源:证券时报) Google 推出全新 AI 气象模型,天气预报效率与准确性大幅提升 Google 于 11 月 17 日宣布全面升级其天气预报服务,采用最新研发的 AI 气象模型「WeatherNext 2」。这一新模型将被整合到 Google 多款热门产品中,包括搜索、Gemini 及 Pixel 手机。据介绍,Google 的 AI 增强型天气预报已经在准确性方面表现优异。此前,AI 气象模型在生成预测的速度和效率上已超越传统基于物理的模型。Google 表示,WeatherNext 2 可在不到一分钟的时间内,用 Google 的 TPU 芯片完成传统超级计算机数小时才能完成的预测工作。(来源:cnBeta)余承东官宣,华为 Mate80 发布会定档 11 月 25 日 11 月 17 日消息,华为常务董事、终端 BG 董事长余承东宣布,华为 Mate80 系列发布会定档 11 月 25 日 14:30。网上爆料称,华为 Mate 80 系列共有四款机型,分别是 Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS 非凡大师。该系列或将首发全新麒麟 9030 处理器,直屏+3D 人脸识别的方案,预计还将支持侧边指纹识别。与 Mate80 同时发布的还有 Mate X7。(来源:网易科技)贝佐斯出任人工智能初创公司「普罗米修斯计划」CEO,旨在提升汽车、航天领域制造水平 11 月 17 日消息,据《纽约时报》报道,亚马逊创始人杰夫・贝佐斯正在将他的金钱与时间投入一家人工智能初创公司,并将以联合 CEO 的身份参与日常管理。三位匿名知情人士透露,这家公司名为「Project Prometheus」(普罗米修斯计划),创立之初便拿下 62 亿美元资金,其中部分源自贝佐斯本人注资,成为全球融资最充足的初创企业之一。值得注意的是,这是贝佐斯自 2021 年 7 月卸任亚马逊 CEO 以来,首次在一家公司中担任运营管理角色,尽管他目前还在深度参与对标马斯克 SpaceX 的蓝色起源公司,但他在该航天公司也仅被冠以「创始人」头衔。据报道,「普罗米修斯计划」公司聚焦的前进方向与贝佐斯的兴趣紧密相关,将专注于开发用在计算机、汽车、制造业、航空航天领域的 AI 技术,旨在提升这些领域的制造水平,该公司迄今为止保持低调,甚至没人清楚其创立时间,也没有人知道它的总部。(来源:IT 之家) 刘强东:京东正式推出京东外卖独立 APP 11 月 17 日京东在三亚举行品酒会,会上京东创始人刘强东宣布推出京东外卖独立 app、京东点评、京东真榜。刘强东称,「早期因为我们把外卖服务归在『秒送』品牌下,集成在主 APP 里,导致很多用户甚至一些老用户,想点外卖时直接在京东主 APP 里搜京东外卖却找不到,这让我们损失了巨大的流量。现在独立 APP 上线,对于经常点外卖的同事来说,应该会更方便、更好找。」对于京东点评,刘强东则表示,「经过将近一年的思考和筹备,现在也正式上线了。我们采用的方法,是利用人工智能,把全网关于餐厅、酒店、景点、行程等所有好吃好玩的信息进行抓取,进行一次大规模的人工智能分析。最后,直接由 AI 生成一份针对这些地方的、全面的点评报告。我也宣布,我们的点评业务永远不会做商业化。作为一个商业企业,大家追求商业利益,我完全可以理解。但我坚定地认为,企业不能什么都以利润为导向,什么都只看钱,什么都要拿来赚钱。该你赚的钱当然可以赚,但如果你给用户提供排名、提供点评,还要从中赚钱,那内容就注定不可能真实。」(来源:蓝鲸新闻)小鹏汽车:第三季度营收 203.8 亿元,同比增长 101.8% 11 月 17 日,小鹏汽车公布 2025 年第三季度财报,交付量、总营收、毛利率、现金储备在内多项核心数据均创历史新高。小鹏汽车第三季度总营收为 203.8 亿元,较 2024 年同期上升 101.8%;总交付量达 116,007 台,同比增长 149.3%,创下单季度交付历史新高;毛利率达 20.1%,同比提升 4.8 个百分点,创下单季度历史新高。截至 2025 年 9 月 30 日,现金及现金等价物、受限制现金、短期投资及定期存款为人民币 483.3 亿元。2025 年第四季度,小鹏汽车预期总交付量达 125,000 台-132,000 台,同比增加 36.6% 至 44.3%;总营收预期达 215 亿元至 230 亿元,按年增加约 33.5% 至 42.8%。小鹏汽车董事长 CEO 何小鹏表示:「2025 年第三季度,小鹏汽车各项关键经营指标,包括销量、收入、毛利率、在手现金,再创新高。净亏损进一步收窄,我们目标在四季度实现公司盈亏平衡。」在公司经营持续改善的背景下,小鹏汽车将更加笃定地投入物理 AI 研发,并加速第二代 VLA 模型、Robotaxi 和人形机器人在 2026 年规模量产。(来源:财联社)大疆官方回应:投资 3D 打印公司消息属实 11 月 17 日晚间消息,今日,大疆官方向新浪科技表示,大疆投资 3D 打印公司消息属实。大疆表示,本次投资是基于我们对消费级 3d 打印技术发展潜力、行业增长潜力的看好,符合大疆对创新科技的一贯理念和前瞻性布局。近日,拓竹科技创始人陶冶发布上千字朋友圈,称「老东家投了一家 3D 打印公司,协议里面还特别安排了拓竹相关的条款」。陶冶曾任大疆消费级无人机事业部负责人。他带领团队于 2020 年创立拓竹科技,专注于将工业级 3D 打印技术下沉至消费级市场。(来源:新浪科技)字节 Seed 研究员被开除原因曝光:多次接受付费访谈泄密 11 月 17 日下午消息,近日,字节 Seed 研究员任赜宇因多次泄密而被开除。据知情人士透露,任赜宇的泄密行为是多次接受咨询机构的付费访谈,泄露商业保密信息,此事与他在知乎上的技术分享没有关系。就在上个季度,字节在「违反信息安全制度」的案例通报中,提到有 10 名违规参与外部付费访谈的员工,因违反公司《员工行为准则》和公司信息安全制度,而受到公司处罚。为避免更多员工再次违反相关制度,通报中提醒,外部咨询公司会以「专家访谈」、「行业研究」等名义,通过脉脉、领英、小红书等平台发起有偿访谈邀约,以获取公司保密信息,「为保护公司信息及数据安全,守护自己的职业生涯,请拒绝此类邀约。」(来源:新浪科技) OPPO Reno15 系列发布:首发「出圈实况拼图」功能,售价 2999 元起 11 月 17 日晚间消息,OPPO 正式发布全新一代 Reno15 系列手机。搭载四主摄超清影像系统与创新性的实况玩法,同时在直播体验、游戏性能及 AI 系统等进行升级,售价 2999 元起。 Reno15 与 Reno15 Pro 均搭载由 2 亿像素超清主摄、5000 万像素潜望长焦、5000 万像素超广角及前置 5000 万超广角摄像头组成的四主摄超清影像系统。Reno15 系列行业首发「出圈实况拼图」,该功能依托 OPPO 自研视觉大模型与视频 AI 记忆算法,实现「一拍二拼三出圈」的便捷操作;同时支持美图秀秀、Wink App 2500 万像素超清实况封面编辑、小红书 4K 超清发布。(来源:新浪科技)全系 8000mAh:荣耀 500 系列手机电池容量确认 11 月 17 日消息,荣耀 500 系列新品发布会官宣定档 11 月 24 日 19:30,官方公布代言人为肖战。 荣耀产品经理 @ 汤达人 TF 近日分享图片,并宣布荣耀 500 系列新机全系采用 8000mAh 大电池。另外,新机的设备名称分别是荣耀 500 超级 Pro 版、荣耀 500 超级标准版。 电影《阿凡达 3:火与烬》正片片段首曝,内地定档 12 月 19 日上映 11 月 18 日消息,电影《阿凡达 3:火与烬》发布了首支正片先行片段,讲述了灰烬族抓捕杰克家人的情节,本片已定档 12 月 19 日在中国内地上映。 据了解,《阿凡达 3:火与烬》还发布了 IMAX、杜比、RealD 3D、Fandango、4DX、ScreenX 等制式海报。这部电影是《阿凡达》系列的第三部作品,片长 195 分钟创系列之最,讲述了杰克·萨利一家在战火中的成长和守护家族情感纽带的故事。新引入的「风之商人」和「灰烬族」两个种族,分别代表和平与掠夺,为潘多拉世界带来新的冲突和挑战。本片将探讨善恶的界限,不再简单地将人类视为入侵者,而是深入探讨内部对抗和角色内心世界。卡梅隆暗示这可能是系列中最好的一部。(来源:IT 之家)*图片来源:视觉中国 播客上新上周,编辑部汽车组的周老师参加小鹏科技日,在公众号上发布的稿件《》反响热烈,本期逐渐离普,编辑部一起聊了聊小鹏科技日的见闻以及内存价格疯涨背后的洞察,欢迎收听~小鹏科技日上,女机器人走出了让人吃惊的「猫步」,国内外火出圈,却被网友质疑是真人扮演,让何小鹏不得不用剪刀剪掉女机器人的裤腿,自证清白。这背后,到底是怎么回事?在现场看到实体机器人的极客公园同事,又有什么感受和观察?内存价格暴涨,一天一个价,明年的手机和电脑,可能会疯狂涨价,那我们还能换新机了吗?长按下方「卡片二维码」即可收听~欢迎关注我们的播客「逐渐离普」(小宇宙 App),一起加入漫谈日常! -
AI榜单“变天”了!马斯克发布Grok 4.1,盲测排名登顶第一 就在OpenAI发布GPT-5.1,大谈“情商”之际,埃隆·马斯克(Elon Musk)也带着他的xAI,火速加入了这场“AI体验”之战。 就在刚刚,xAI宣布推出Grok 4.1,这是对现有Grok 4模型的重大升级,并已在grok.com、X平台以及iOS和Android应用向所有用户全面开放。。官方宣称,新版本在创意表达、情感互动和协同交流方面表现尤为突出,并且出现幻觉的概率仅为此前模型的三分之一。 更引人注目的是,在一个公开的“盲测”竞技场(LMArena)上,Grok 4.1的“思考模式”版本已悄然登顶总榜第一,甚至其“非推理”的快速模式,都击败了所有对手的“完整推理”模式。 这场突如其来的“榜首易主”,无疑为日趋白热化的AI竞赛,又增添了浓重的火药味。 Grok 4.1升级了什么? xAI本次发布了两个Grok 4.1模型:Grok 4.1(非推理模式)和 Grok 4.1 Thinking(思考模式)。这两个模型均可免费使用,但付费用户面临的限制更少。 官方表示,新版本能更细致地理解隐含意图,与之对话引人入胜,也更能保持人设的一致性。 为了优化模型的风格、人格和有用性,xAI利用前沿的代理型推理模型(agentic reasoning models)作为“奖励模型”,在大规模环境中自主评估并迭代模型的回答。 在11月1日至14日的“静默上线”期间,xAI在真实流量上进行了盲测式的成对比较评估,结果显示,在64.78%的情况下,用户更偏好Grok 4.1。 “盲测”登顶,Grok 4.1到底有多强? Grok 4.1在盲测的人类偏好评估中树立了新的行业标准。 LMArena是一个开源工具,用户可以通过并排、盲测的方式,比较不同大语言模型的表现。在这个竞争最激烈的“斗兽场”里,Grok 4.1取得了惊人的成绩: · Grok 4.1的“思考模式”(代号:quasarflux)以1483 Elo的成绩位列总榜第一,领先所有非xAI模型31分。 · Grok 4.1的“非推理模式”(代号:tensor)无需使用“思考词元”(thinking tokens),可立即生成回答,并以1465 Elo的成绩排名第二。 · 更夸张的是,Grok 4.1的“非推理”模式表现,超过了所有其他模型在“完整推理模式”下的公开排行榜成绩。 与之相比, Grok 4此前在该榜单上的综合排名仅为第33位。 “情商”与“文采”,一个都不能少 除了通用能力,xAI还强调了新模型在“软实力”上的提升。 · 情绪智能(Emotional Intelligence) 为评估模型在个性与人际互动方面的进展,xAI对Grok 4.1进行了EQ-Bench3测试。这是一项由LLM作为裁判的测试,用于评估模型在主动情绪智能、理解力、洞察力、共情能力和人际技能方面的表现。· 创意写作能力(Creative Writing) xAI同样测量了Grok 4.1在Creative Writing v3基准测试中的表现。在该测试中,模型需要根据32个不同的写作提示,在3次迭代中生成回答。更少的“幻觉” 快速响应模型在配备搜索工具后,虽然能迅速给出答案,但更容易出现事实性错误。 在Grok 4.1的后训练阶段,xAI重点降低了模型在信息查询类提示中的事实性“幻觉”。 根据xAI的说法,Grok 4.1出现幻觉的概率是此前模型的三分之一,这使其成为xAI迄今为止的最佳版本之一。 为了验证这一点,xAI不仅在真实的生产流量中进行了评估,还使用了FActScore——一个包含500道关于人物传记问题的公开基准测试。 挑战与未来:真正的对手还在路上 尽管Grok 4.1的“盲测”成绩斐然,但AI的王座之争远未结束。 目前,我们尚不清楚它与GPT-5.1相比的真实表现。 更重要的是,谷歌(Google)正在准备发布Gemini 3.0,这可能会成为迄今为止最强大的模型。 Grok 4.1的发布,无疑是马斯克在AI竞赛中投下的一枚重要棋子。但在这场“神仙打架”的牌局中,谁能笑到最后,还远未可知。(易句) (本文由AI翻译,网易编辑负责校对)