找到
847
篇与
互联网
相关的结果
-
自驾与机器人出租车积极进展难敌市场避险情绪升温 特斯拉(TSLA.US)股价连日下跌 智通财经APP获悉,周五,特斯拉(TSLA.US)股价收低,盘中一度上涨的走势未能延续。市场对机器人出租车业务的期待,与近期对AI投资泡沫的担忧形成拉锯,使股价走势承压。在此前一天的科技股抛售中,特斯拉与其他“七巨头”均出现明显下跌,该股周四跌幅超过2%,周五再度走低超1%。近期市场情绪的波动主要源于外界对科技巨头大规模AI投资的疑虑。包括英伟达(NVDA.US)在内的企业持续投入于数据中心和模型训练基础设施,而部分项目尚未产生正向现金流。在此背景下,特斯拉以其在数据中心、AI芯片以及FSD(完全自动驾驶)软件方面的投入,被投资者视为“AI机器人公司”的代表之一,这也使其股价更受情绪影响。尽管市场担忧升温,特斯拉在自动驾驶和机器人出租车布局方面仍取得积极进展。据报道,特斯拉近日完成在内华达州运营机器人出租车的自我认证程序,并获得当地机动车管理局颁发的“运营合规证书”,允许其在公共道路测试无人驾驶车辆,但商业化运营仍需获得内华达州交通管理局批准。同一周内,亚利桑那州交通运输厅也确认,特斯拉已完成当地机器人出租车业务所需的全部流程,首期项目将继续配备安全员,模式与特斯拉在奥斯汀和旧金山湾区的服务类似。目前,美国市场上已有竞争对手如Waymo在部分城市提供无需安全员的L4级自动驾驶服务。华尔街对特斯拉的自动驾驶前景保持关注。Stifel分析师Stephen Gengaro本周上调特斯拉目标价至508美元,并继续给予“买入”评级。他指出,特斯拉管理层预计到2025年底可将机器人出租车服务扩展至约8至10个大都市区域,并强调FSD的快速迭代将成为业务增长的关键驱动力。与此同时,特斯拉在美部分地区面临产品安全诉讼有新情况。据报道,特斯拉在华盛顿州遭遇新的诉讼,涉及2023年初的一起 Model 3事故。一辆车辆据称在失控加速后撞上电线杆并起火,事故导致一人死亡、一人严重受伤。诉状称,事故发生后救援人员因车辆门把手无法正常操作而难以及时进入车内。这起案件是继威斯康星州另一宗涉及Model S的诉讼之后,近期关于电动车门机构争议的最新案例。相关案件仍在法律程序中。 -
“千问恐慌”背后:全球AI价值正在重估 来源:环球时报【环球时报综合报道】编者的话: “DeepSeek时刻如今成为常态了吗?”彭博社18日的一篇评论文章提出这样一个问题。作者提到,投资者已经接受中国人工智能(AI)团队能以更低成本达到前沿能力这一事实,越来越多的美国初创公司也正悄然基于中国AI模型进行开发。今年以来,DeepSeek、豆包、Kimi、千问、文心等中国AI大模型成了国内外媒体上的“常客”,其背后的创新能力和发展应用路径引发学界和产业界关注。“硅谷不愿承认,但情况显而易见:我们正在目睹一场全面的千问恐慌。”有国际分析人士直言,中国AI大模型的实力正在引起硅谷的“恐慌”。中国的AI大模型产业目前格局如何?技术能力和影响有多大?年初“DeepSeek时刻”的指针如今拨向何处?《环球时报》记者对此进行了深入采访调查。 图为中美代表性AI大模型推出时间 国民级AI爆发期预计出现在明后年随着国内人工智能(AI)市场从“百模大战”迈入差异化竞争新阶段,一批覆盖生活、办公、产业的AI应用脱颖而出。根据公开报道,在11月13日举行的2025百度世界大会上,百度发布了原生全模态文心大模型5.0,支持文本、图像、音频、视频等多种信息的输入与输出;截至2025年9月底,豆包大模型日均Tokens(大模型文本单位)调用量已突破30万亿,相比今年5月底增长超80%;科大讯飞的讯飞星火大模型也在教育、医疗、汽车、办公及情感陪伴等多个领域均有探索……11月17日,阿里巴巴正式宣布“千问”(Qwen)项目,进入AI to C(消费端)市场。据介绍,千问已经展现出一定的办事能力。比如,一句指令就能让千问APP几秒钟完成一份研究报告,并制作成几十页的精美PPT。据透露,阿里巴巴正在计划将地图、外卖、办公、学习、购物、健康等各类生活场景接入千问APP,让千问具备更强大的办事能力。 观众在参观通义千问AI大模型。(视觉中国) “这次发布的千问APP是一个初级版本,将用最先进的模型,打造一个‘会聊天能办事的个人AI助手’。”阿里千问团队负责人接受《环球时报》记者采访时称,除了聊天足够聪明外,“能办事”将是千问APP的一个重要发力方向,千问APP的目标是“打造未来的AI生活入口”。该负责人表示,随着AI技术的深入发展,普罗大众能接触到的C端应用正成为AI落地关键领域,AI绝不仅限于会讲几个冷笑话、生成几段娱乐视频,而是将融入到生活、生产的方方面面,成为人类新的生产力工具。国产AI大模型不仅服务本地用户,同时也凭借创新力和成本优势加速“出海”。MiniMax(稀宇科技)的AI视频生成平台“海螺AI”受到全球超200个国家和地区用户的欢迎,迄今已帮助全球用户创作超3.7亿个视频。该公司副总裁严奕骏对《环球时报》记者介绍说,他们的产品都是基于自主研发的多模态通用大模型。在以色列,基因检测技术公司MyHeritage借助MiniMax的视频生成模型,仅凭一张二维照片即可完成人脸3D重建,并智能补全眨眼、微笑等自然微表情,让尘封的老照片重新焕发生命力。再例如,全球知名广告营销公司S4 Capital/Monks(摩课士)借助MiniMax的大模型,让过去需要耗时数日的提案构思与初稿生成,如今在分秒内即可完成,让设计团队真正实现了创意的“光速”孵化。严奕骏说,中国AI企业想要出海,相对于产品而言,需要先“练好基本功”,深耕技术是基本条件。只有技术进步,商业模式找到好的循环,才有可能成为一个长期发展、立足世界的公司。“目前,中国企业在技术上与海外顶尖AI公司的差距正在不断缩小,中国丰富的场景资源与完备的产业体系,是人工智能发展落地的天然试验场。中国企业通过不断持续加大基础研究投入,在底层技术层面攻坚克难,可以推动AI普惠全球。” 观众在观看AI生成的图片和视频。(视觉中国) 近年来,国产大模型越来越好用,高质量的大模型百花齐放。科技巨头乃至初创企业都在追求打造一款普遍适用的“国民级”AI应用。一位人工智能专家告诉《环球时报》记者,国民级AI应用的爆发窗口期预计将在2026年下半年至2027年中期开启。专家说,目前的AI应用虽然月活数据亮眼,但更多呈现出“强工具属性、弱生态黏性”的特征,尚未达到微信或抖音那种嵌入社会运行机理的国民级地位。该专家认为,AI应用需要软硬件协同进化的成熟度,真正的爆发点要等待端侧AI硬件(AI智能手机/个人电脑)的渗透率突破30%,“届时算力成本将大幅下沉至终端,且模型能力足以支撑全天候助理而非仅仅是问答框,达到类似移动互联网时代的‘iPhone 4时刻’。”专家进一步表示,预计未来18个月是各类垂直应用残酷的淘汰赛,之后才会产生具有网络效应的超级平台。专家还表示,许多AI应用的首月用户流失率高达80%甚至90%,根本原因在于产品未能从“好玩”进化为“有用”。“国民级应用不仅要能陪聊,更要能准确无误地执行长链条任务。只有当AI从一个‘能写诗的文科生’进化为‘不仅不出错、还能帮我搞定报销流程的执行官’时,用户黏性才会发生质变。”面对中国AI发展,硅谷究竟在恐慌什么近日,中国科技企业阿里巴巴基于其最先进的大模型发布的一款消费级APP——千问在全球科技界引发轰动。不少科技媒体形容:其性能可对标ChatGPT,不过其应用已超越普通聊天机器人范畴,而是作为一个AI智能体“协助用户在淘宝完成购物决策,通过高德地图规划最优路线,将前沿AI能力与成熟的商业生态深度融合”。这让硅谷的AI科技企业“坐立难安”。从DeepSeek到阿里巴巴,中国科技公司正在迅速发布先进且经济高效的开源AI系统。彭博社报道称,早在千问应用面世前,其开源系统就已吸引大量全球开发者转向,对OpenAI与Anthropic等硅谷公司的付费商业模式构成直接挑战,“千问恐慌”已埋下伏笔。据彭博社报道,硅谷一些知名企业家和开发者已开始用中国产人工智能模型取代美国产模型。风险投资家查马斯·帕里哈皮蒂亚在一档播客节目中透露,其合作企业已转而使用北京月之暗面科技有限公司(Moonshot AI)旗下的Kimi K2模型。爱彼迎首席执行官布莱恩·切斯基指出,其客服助手依赖于十余种人工智能模型,其中阿里巴巴集团的千问系列占据主导地位。此外,由OpenAI前首席技术官米拉·穆拉蒂创立的初创公司Thinking Machines Lab在其技术文档中也承认,阿里巴巴的千问3系列是其灵感来源。亚马逊也承认,正在用千问开发下一代送货机器人的模拟软件。学术界顶尖机构也正在采用中国的千问模型,斯坦福大学的李飞飞研究团队,花费不到50美元,用阿里通义千问的Qwen2.5-32B-Instruct构建了顶级推理模型s1。根据开源社群平台Hugging Face上的数据,2025年,千问的累计下载量达到3.85亿次,超越了Meta的Llama系列(3.46亿次)。此外,近期发布的新语言模型中,超过40%基于千问架构。随着千问等中国开源模型成为实验、原型和早期产品的支柱,科技界对其依赖正不断加深。这一趋势彻底挑战了美国在AI领域长期领先的固有认知,不安情绪开始在硅谷蔓延。“硅谷不愿承认,但情况显而易见:我们正在目睹一场全面的千问恐慌。”印度营销专家图尔西·索尼11月15日在社交媒体上写道。中国科技媒体“pandaily”评论称,“曾经保护美国人工智能领先地位的技术护城河正在出现裂缝。”媒体分析认为,就跟今年初DeepSeek出现带来的影响一样,当全球开发者发现,他们可以用更低的成本,获得性能足够好的AI模型和运算能力时,“技术最先进”的重要性就会被“性价比最高”取代。美国《商业内幕》12日引述谷歌前首席执行官埃里克·施密特的话称,“世界不可避免地将转而采用中国AI模型。”施密特表示,美国最大的模型是闭源的,而中国最大的模型是开源的。因此,绝大多数没有西方国家那样雄厚资金的政府和国家最终可能都会采用中国模式。千问的崛起在美国引发了更广泛的战略反应。最具代表性的举措当数“美国真正开源模型计划”(ATOM)的启动——该联盟汇聚了行业领袖与研究人员,倡议整合政府与民间资金支持以及制定赶超千问与DeepSeek的技术路线图,以推动美国重掌开源人工智能主导权。与此同时,这种恐慌还蔓延到政治领域。英国《金融时报》11月14日引述一份美国白宫备忘录报道称,华盛顿指责中国科技巨头阿里巴巴为中国军方针对美国境内目标的行动提供技术支持。对此,阿里巴巴发表声明说:“有关内容的断言和影射完全不实。我们质疑匿名泄露者的动机。《金融时报》也承认无法核实泄密内容。这显然是一场恶意公关行动,其幕后黑手意图破坏中美近期贸易谈判的成果。”中国驻华盛顿大使馆也驳斥了报道内容,并表示中国依法反对并打击一切形式的网络攻击。当焦点持续关注AI竞赛的输赢时,有分析人士指出,硅谷初创企业对中国AI模型偏好的转变,凸显全球AI领域竞争格局与市场逻辑的演进。台湾《电子时报》称,“尽管地缘政治紧张犹存,但在技术路线选择中,与性能表现、成本效益及开源程度相关的现实考量正显现出日益增强的影响力。”中国AI:从“同质化竞争”到“差异化突围”彭博社近日刊发评论文章讨论了一个问题:“DeepSeek时刻”如今已成为常态了吗?文章认为,中国的AI实验室似乎总能凭空出世,在芯片和预算不占优势的情况下,缩小与硅谷企业大模型的性能差距。那么,中国企业的AI大模型在与美国科技巨头企业的竞争中处于什么位置?美国斯坦福以人为本人工智能研究所发布的《2025年人工智能指数报告》指出,中美顶级AI大模型性能差距大幅缩至0.3%,接近抹平。彭博社援引杰富瑞投资银行分析师的话报道称,虽然中国超大规模AI企业在2023年至2025年间的资本支出总额比美国同行少82%,但多项分析显示,双方最佳模型的性能差距如今已微乎其微。中美AI大模型竞争格局在过去一年中出现显著变化。一位接受《环球时报》采访的大模型专家表示,过去一年最显著的变化在于竞争维度的升维,中国企业不再盲目跟随美国“大力出奇迹”的烧钱模式,而是开辟了基于算法优化的第二战场。中国AI大模型产业出现一种质的变化,即从“同质化竞争”转向“差异化突围”。他表示,以DeepSeek、阿里千问系列为代表的中国大模型,在2025年初通过架构创新,成功证明了可以用美国同行10%的算力成本实现其90%甚至95%的性能。这种变化意味着格局已由“落后的追赶”演变为“高端守正、中端出奇”的态势。虽然美国在探索AGI(通用人工智能)无人区的绝对前沿仍有6到12个月的先发优势,但在模型落地的性价比和工程化速度上,中国已构建起某种程度的“反向护城河”。中国电信首席科学家、美国贝尔实验室院士毕奇在接受《环球时报》采访时表示,目前为止,美国主流企业大都采取闭源策略,而中国主流企业多采取开源策略。阿里千问团队负责人表示,美国AI企业在数据中心、模型能力、闭源产品的全球竞争中领先,但中国AI企业一直坚持打造开放、专业、实用的AI生态。该大模型专家表示,美国科技巨头当前的战略侧重点在于“封顶”,即不计成本地堆叠数千亿美元的算力集群,试图通过穷举算力来验证“缩放定律”(用来描述模型性能如何随着模型大小、数据集大小和计算资源的增加而变化——编者注)的下一个数量级,其目标是AGI。相比之下,中国企业的战略侧重点在于“铺地”,即争夺场景渗透率和推理成本,致力于在应用层通过极致工程化打破商业落地的成本悖论。未来的竞争不再是谁的模型“话说得更漂亮”,而是谁的模型“事情办得更靠谱”。技术焦点将集中在“系统2”(System 2)思维能力的构建上,即让AI具备类似于人类慢思考的逻辑推理、自我反思和纠错能力。他认为,美国的优势在于拥有最先进的GPU(图形处理器)集群和最顶尖的算法科学家,短板在于高昂的能源和监管成本导致商业闭环困难;中国的优势在于拥有全球最丰富的工业与消费场景数据以及极强的工程落地能力,短板则在于底层算力供应链的脆弱性以及原始创新算法的路径依赖。本周二谷歌发布的Gemini 3 Pro模型超越了OpenAI的GPT-5.1,登顶人工智能基准测试公司Artificial Analysis的“智力指数”榜单。而中国企业月之暗面的Kimi K2 Thinking模型排名第三。美国布鲁金斯学会网站刊文分析称,未来数年,中美将齐头并进探索人工智能前沿领域,任何一方都不太可能获得决定性优势。中美顶尖AI大模型性能差距缩小将成为常态。目前,技术创新和成本优势已使中国AI大模型迈出了“走出去”的步伐,在技术竞争和地缘格局日趋复杂的未来,下一步迈向哪儿十分关键。上述大模型专家对记者表示,中国AI大模型“走出去”必须通过差异化的地缘政治经济策略来实现。他分析道,欧美市场目前构筑了极高的数据隐私与价值观监管高墙,直接进入不仅成本高昂且面临地缘政治风险。潜在的黄金场景在于东盟、中东及共建“一带一路”国家。该专家提到,中国企业“走出去”路径打法应当从输出“单一产品”转向输出“生产能力”,即提供“主权AI”解决方案。这包括了“底层算力基础设施+开源模型基座+本地化数据训练工具”的打包服务。【环球时报记者 陈子帅 杨沙沙 环球时报驻美国、新加坡特约记者 冯亚仁 任重】 -
Bill Ackman:加密货币市场动荡正波及“两房”股价 知名对冲基金经理Bill Ackman警告称,加密货币市场的强制平仓和追加保证金正在引发房利美和房地美的股票抛售。11月21日,Bill Ackman在社交媒体平台上表示,他此前低估了房利美和房地美对加密货币的敞口程度。 Ackman指出房利美和房地美与加密货币的关联并非直接体现在财务报表中。这种敞口隐藏在两家公司的股东基础里,部分持有加密货币资产的投资者同时配置了这两家政府支持企业的股票。他认为当比特币等加密货币价格大幅下跌时,持有杠杆头寸的投资者面临强制平仓和追加保证金要求。为满足流动性需求,这些投资者被迫抛售其他资产,房利美和房地美股票成为被波及对象。这一机制导致两家公司股价与比特币价格呈现相关性。这位Pershing Square创始人坦言,尽管其对冲基金并未持有比特币,但短期内他们实际上持有了"比特币的股市代理"。Ackman强调,短期内技术面因素可能压倒基本面,房利美和房地美正是这一现象的典型案例。房地美的财务状况喜忧参半作为一家由政府支持的金融服务企业,房地美通过购买、证券化和担保单户家庭抵押贷款来为市场提供流动性,其大部分收入来源于此。数据显示,公司的财务健康状况喜忧参半。一方面,其净利润率高达46.89%,自由现金流收益率更是达到惊人的297.1%,自由现金流利润率为66.68%,显示出强大的盈利能力和现金生成效率。但另一方面,公司的财务实力评级为“差”,主要原因是其债务权益比高达49.99,显示出极高的杠杆水平。同时,其每股收益为负0.02美元,而过去三年的营收增长率仅为2.9%,增长显得温和。估值指标显示,房地美市值约53.5亿美元,市销率为1.06,远期市盈率为2.31。技术指标RSI-14为44.07,处于中性区间。公司贝塔系数为2.24,显示出相对市场的高波动性特征。高估值与潜在市场风险从估值和风险角度看,投资者同样需要保持谨慎。分析指出,房地美的估值已处于“显著高估”水平。尽管其2.31的远期市盈率相对较低,但1.06的市销率(P/S ratio)处于历史正常范围内,暗示增长潜力有限。此外,公司面临多重风险。其阿尔特曼Z分数(Altman Z-Score)为0,这是一个预示财务困境的指标。作为金融机构,房地美天然暴露于利率波动和监管政策变化的风险之下。更值得注意的是,该股票的Beta值为2.24,表明其价格波动性远高于市场平均水平,属于高风险资产。分析师对该股的综合推荐评级为中性。 -
谷歌对OpenAI见招拆招 出品|虎嗅科技组作者|余杨编辑|苗正卿头图|视觉中国11月19日消息,谷歌家旗舰版Gemini 3 Pro model上线,官宣其编码和推理能力都有所提升,而“谄媚”变少。不难发现,谷歌瞄准了它的对手ChatGPT。这款号称谷歌迄今为止“最智能”、“最准确”的模型首次向所有用户开放,并且发布首日即可体验。谷歌DeepMind高级总监兼产品负责人Tulsee Doshi表示,随着谷歌搜索引擎的不断发展,这款新模型将助力谷歌实现“人人皆可获取且人人皆可使用”的信息目标。“我认为朝着这个方向迈出的一大步,就是跳出仅仅提供文字回复的模式,让你看到更丰富、更完整的实际内容。” 对OpenAI见招拆招 简单来说,Gemini 3 Pro 具有“原生多模态”特性,它可以同时处理文本、图像和音频,传统的文本-文本的单一交互状态得到了提升,编码功能的增强也使其能够生成更好的视觉效果。在谷歌的官方演示中,AI 对RNA进行了加工处理,整体表现得很流畅。 谷歌官方表示,Gemini 3 Pro 还可以翻译菜谱照片,然后将其转换成食谱;除此之外,它还可以根据一系列视频讲座创建交互式学习卡片。 在 Gemini 应用中,用户则可以在内置的 Canvas 中构建功能更全面的程序。升级后的 AI 模型支持“生成式界面”,一方面可以创建类似杂志的视觉格式,其中包含可供浏览的图片,另一方面可以根据用户的提示创建定制的自定义用户界面的动态布局。这款工具目前还在测试中。 在搜索功能上,Gemini 3 Pro可以根据用户的搜索呈现图像、表格、网格和模拟等视觉元素。根据 Google 的公告,这项技术现在不仅能将问题分解成可搜索的部分,还能更好地理解用户的搜索意图,从而“找到之前可能遗漏的新内容”。谷歌对OpenAI见招拆招,几乎毫不掩饰地暗讽,称Gemini 3 Pro不像ChatGPT那样充斥着空洞的奉承。Doshi表示,Gemini 3 Pro的回复会有“显著”的变化,谷歌将其描述为“智能、简洁、直接,摒弃陈词滥调和奉承,提供真正的洞见——告诉你你需要听到的,而不仅仅是你想听到的”。除了这些改进之外,Gemini 3 Pro 还具备更强大的推理和智能代理能力,使其能够完成更复杂的任务,并“可靠地进行长期规划”。谷歌表示,该模型为 Gemini Agent 的一项实验性功能提供支持,该功能可以在 Gemini 应用内帮用户执行任务,例如查看和整理电子邮件,或搜索和预订旅行。也就是说,谷歌此番发行的不仅仅是模型单品,还是一个充满策略的“聪明桶”——覆盖了AIGC、AI应用、AI搜索和AI Agent全范围。 跑分表达 而在官方的跑分21项基准测试中,Gemini 3 Pro 除了OCR和代理编码表现相对较弱,其他指标几乎都遥遥领先,有相当的优势。 不仅如此,而谷歌又单独拎出了人类最终测试、终端工作台2.0和SimpleQA Verified三个指标加以强调,矛头直指Claude Sonnet4.5和GPT-5.1。 谷歌试图表达,Gemini 3 Pro 在标准化知识生成、AI工具使用乃至“人工智能”这几个重要指标方面,具有全方位的优势。 Antigravity:“智能体优先的未来” 在发布Gemini 3 Pro的同时,谷歌还推出了 Antigravity,这是一款基于 Gemini 3 Pro 以及其他第三方模型的开发工具。谷歌表示,Antigravity 支持多个智能体,并允许它们直接访问编辑器、终端和浏览器,其设计理念是面向“智能体优先的未来”。Antigravity 有两个关键组件。其中之一在于它如何报告自身的工作。具体来说,在完成任务的过程中,它会生成 Google 称之为“工件”的文件:任务列表、计划、屏幕截图和浏览器录制,旨在验证它已完成的工作以及即将执行的工作。不仅如此,Antigravity 还会报告其操作和外部工具的使用情况,但 Google 表示,相比模型操作和工具调用的完整列表,“工件”更便于用户验证。另一项重大改进是提供了两种主要使用视图。默认的编辑器视图提供熟悉的集成开发环境 (IDE) 体验,类似于 Cursor 和 GitHub Copilot 等竞争对手,并在侧边栏中显示代理。而全新的管理器视图则旨在同时控制多个代理,使每个代理都能更加自主地工作。谷歌将其比作“任务控制中心”,用于“并行地在多个工作区中生成、协调和观察多个代理”。谷歌推出了更多向人工智能代理提供反馈的方式,用户可以在代理执行特定任务时留下评论,供其参考,而无需中断其工作。谷歌表示,Antigravity 中的代理能够“从过去的工作中学习”,保留特定的代码片段或执行特定任务所需的步骤。在官方演示中,Antigravity 构建了一个基本的航班跟踪应用程序,对其进行了测试,并通过浏览器录制报告了该测试结果。目前,Antigravity 已推出公开预览版,兼容 Windows、macOS 和 Linux 系统。谷歌此次的出击,并不止于发布一个大模型这么简单。智能体开发平台的开放性,展露出谷歌构建从模型、应用到开发者的完整生态闭环的野心。多模态的交互将AI从一位博学的“对话者”,重塑为一个能看、能听、能行动、能规划的“执行者”。当AI 开始理解和操作多媒体世界,未来3D和全景、沉浸式的交互竞赛,也就不远了。本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。本文来自虎嗅,原文链接:https://www.huxiu.com/article/4808031.html?f=wyxwapp -
南京大学副校长、人工智能知名专家周志华当选中国科学院院士 11月21日,中国科学院发布2025年院士增选结果,选举产生中国科学院院士73人。其中,国际人工智能顶级专家、南京大学教授周志华当选信息技术科学部院士。 周志华。图片来源:南京大学官网52岁的周志华现任南京大学副校长,长期从事人工智能核心的机器学习理论、模型与算法研究,并作出了系统性、原创性贡献。他是在人工智能相关的五大主流国际学会(ACM、AAAI、AAAS、IEEE、IAPR)均入选 Fellow(会士)的第一位华人科学家,也是在国际人工智能领域两大综合性顶级会议均担任程序主席的第一位华人学者。据公开资料,周志华生于1973年11月,1992年考入南京大学计算机科学与技术系,求学8年后取得博士学位。2001年1月留校任教,次年被破格聘任为副教授,第三年被聘为教授。2017年当选为欧洲科学院院士 。2018年3月,南京大学成立C9高校中第一个人工智能学院,周志华出任首任院长。在学术领域,周志华成就斐然。他曾以第一完成人获国家自然科学二等奖2项、教育部自然科学一等奖3项、江苏省科学技术一等奖1项,还曾获得IEEE计算机学会Edward J. McCluskey技术成就奖、首届CCF-ACM人工智能奖等。在一流国际学术期刊和顶级国际学术会议发表论文200余篇,被引用9万余次。在国际上,周志华同样享有很高的声誉,他是国际人工智能大会40年来首位来自欧美之外的程序委员会主席,多次受邀在顶级国际学术会议上作主旨报告。同时还是亚洲机器学习大会发起人,国际人工智能领域多项重要奖项的评委会主席、评委。2023年当选国际人工智能联合会理事会主席,是1969年以来首位担任该职位的中国学者,为提升我国学界在国际人工智能领域的地位和影响力起到了重要作用。除了研究,周志华还非常重视人工智能教育工作。他领衔率先发布了我国第一个人工智能本科专业教育培养体系,在我国人工智能本科专业教育领域发挥了引领示范作用。据公开报道,周志华为大一新生讲授“人工智能导引”课程,并带领计算机系与人工智能学院多位教师开设全校通识课《科学之光——走近计算机科学与人工智能》,选课学生爆满。其撰写的《机器学习》成为该领域世界知名、使用广泛的中文教科书,被翻译成多国语言出版,并被海内外500多所院校采用。 -
小米汽车智驾团队成员超1800人,四位核心成员曝光 界面新闻记者 | 宋佳楠 11月21日,界面新闻了解到,小米汽车公布了智驾团队的相关情况。目前该团队成员已超1800人,其中博士达108人。小米汽车分别在北京、上海、武汉设立了研发中心。2025年,小米在AI领域的研发投入超70亿。值得注意的是,小米汽车重点介绍了智驾团队的四位核心成员:叶航军、陈光、陈龙和王乃岩。 图片来源:小米汽车官方微博 叶航军是小米智能驾驶业务负责人,也是小米汽车初始团队17名核心成员之一,先后担任人工智能部总经理、小米集团技术委员会主席。公开资料显示,2003年,他从清华大学计算机系获得博士学位,研究领域为计算机视觉与图像检索。此后,叶航军先后在Google北京、Google美国任职,参与下一代搜索引擎“咖啡因”的开发。2010年,叶航军加入腾讯,担任腾讯搜索Crawl团队技术总监。2012年,他加入小米,在推动小米人工智能及自动驾驶业务发展方面发挥了关键作用。陈光是小米智能驾驶端到端技术负责人。他毕业于美国密苏里大学电子计算机系,在人工智能和计算机视觉研发领域经验丰富,曾在国际顶级学术会议CVPR、NeurIPS等发表多篇论文。加入小米前,陈光曾在百度Apollo美国研发中心担任感知系统技术负责人,后担任一汽南京研究院CTO,全面负责一汽集团自动驾驶业务的技术研发和架构设计,带领团队成功开发了一汽红旗第三代L4级全无人Robotaxi。今年5月,据36氪报道,陈光出任小米汽车智能驾驶感知负责人,向叶航军汇报。小米智能驾驶VLA负责人陈龙此前就职于英国AI独角兽公司Wayve,该公司专注于研发纯视觉的端到端自动驾驶技术。今年4月,雷峰网曾提到,在招揽陈龙回国加入小米团队的过程中,小米创办人、董事长兼CEO雷军展现出了极大诚意,亲自面谈陈龙。加入小米后,陈龙带领VLA(视觉语言模型)团队,致力于探索下一代端到端模型,增强端到端自动驾驶的泛化性、可解释性,以解决自动驾驶的长尾问题。陈龙目前也是向叶航军汇报。王乃岩则是小米智能驾驶L3负责人。公开资料显示,2015年他博士毕业于香港科技大学计算机科学专业,以深度学习应用于目标追踪领域的开创性研究闻名。后加入图森未来后主导北京公司算法团队组建,2019年起担任图森未来中国首席技术官,负责L2辅助驾驶与L4自动驾驶系统研发。2024年3月,王乃岩从图森未来离职后,于同年5月确认加入小米汽车。他曾多次在顶级会议与期刊上发表论文,被引用次数超25000余次。就在昨日,雷军在社交平台发文宣布小米第50万辆整车下线。“从第1台到50万台,小米仅仅用了1年零7个多月的时间。这标志着小米汽车得到了广大消费者的认可,到了一个新的规模化阶段。”根据小米汽车官方最新预估,2025年全年预计交付超过40万辆车。雷军还强调,小米汽车会持续做好三件事:一是抓安全、抓交付,在确保安全和品质的基础上全力以赴加快生产;二是持续加大科技创新力度;三是推进AI和智能制造的深度融合。小米最新公布的2025年三季报显示,小米汽车业务及AI等创新业务飙升至290亿元,同比增长199.2%。该业务首次实现单季度经营盈利,经营收益7亿元。 -
南威尔士将建100亿英镑AI数据中心走廊,2030年规模1GW IT之家 11 月 21 日消息,英国政府当地时间昨日宣布在南威尔士设立该国第四个“人工智能增长区”,这也是威尔士境内划定的第二个同类区域。 这条沿 M4 高速公路连接纽波特与布里真德的 AI 数据中心走廊包含多个站点,由 Vantage Data Centers 与微软等企业参与,总投资规模达 100 亿英镑(IT之家注:现汇率约合 930.91 亿元人民币),目标到 2030 年建成 1GW 规模、创造至少 5000 个就业岗位。英国政府将为该项目提供 500 万英镑的支持,促进“人工智能增长区”中企业对 AI 的导入。此外,英国政府承诺拿出 1 亿欧元成为英国 AI 硬件初创企业的首批客户;向英国研究人员和初创企业提供价值约合 2.5 亿英镑的免费算力资源;将 1.37 亿英镑的资金用于促进 AI 加速医疗开发。 -
对话 | AI 大乱斗,百度何以“上兵伐谋” 在人工智能席卷全球的浪潮中,一个令人困惑的悖论正日益凸显:模型的考试能力突飞猛进,甚至在各种学术榜单上超越人类,但它们对实际经济增长的贡献,却并未出现同等量级的爆发。为何模型能力上去了,真实的生产力却波澜不惊?在这个节点上,百度试图用一款名为“伐谋”的产品,给出自己的探索:将AI的能力从善于答题,引向善于解决高价值、高难度的真实产业问题。11月中旬,百度智能云在北京举行了一场小规模闭门交流会,雪豹财经社受邀参加。百度伐谋产品负责人、百度智能云信控产品负责人,向我们勾勒了一幅不同于消费级AI应用的图景:一个面向企业生产研发环节、能够“自主演化”的超级智能体,正悄然进入物流港口、城市交通、能源调度等传统产业的核心腹地。两天后,百度世界大会2025召开,百度创始人李彦宏在演讲环节正式发布百度伐谋。李彦宏表示,百度伐谋的理念借鉴自“进化算法”,模拟生物界几亿年的进化过程并压缩至几天甚至几小时,从而发现“过去人类从未发现过的全局最优解”。伐谋,语出《孙子兵法·谋攻篇》,“上兵伐谋,其次伐交,其次伐兵,其下攻城”。伟大的军事家孙武在这里阐述了赢得胜利的四个层次,“伐谋”代表着以智取胜、不战而屈人之兵的顶级战略思想。百度借此命名,表明这款产品旨在解决最高层次、最核心的问题——战略性的算法和策略问题,而不仅仅是执行层面的代码辅助(“伐兵”或“攻城”)。伐谋正式发布当日,在数小时内吸引了超1000家企业申请接入测试,覆盖交通、能源、金融、物流等行业。市场对“自我演化”智能体的高期待,源于伐谋对AI产业价值的重新定义。作为全球领先的可商用的自我演化超级智能体,百度伐谋的目标,是在极度复杂的产业研发场景中,跳出人类经验限制,通过自我演化寻找最优解,为企业挖掘生产力红利。一场关乎如何将AI能力转化为实际生产力的探索,正在百度悄悄起步。破解算法创新的悖论“伐谋的核心,是一个Coding Agent,但它与市面上大多数Coding Agent有根本区别。”伐谋产品负责人解释,常见的AI编程助手主要服务于软件开发工程师,解决的是应用构建问题;而伐谋瞄准的是算法工程师的领域,解决的是算法本身的设计与优化。这一选择背后,是基于对AI能力禀赋和产业痛点的洞察。伐谋产品负责人引用行业观点指出,世界上存在两类任务:一类是“写起来简单,评估起来难”,比如讲故事;另一类则是“评估起来简单,写起来难”,这正是算法问题的典型特征。例如,预测下个月某个区域的用电量,评估标准非常清晰——预测准确率越高越好。但要想写出一个能达到高准确率的预测算法,却极其困难。“为什么选算法问题?因为它是高难度、高价值,且以前不那么方便解决的问题。”伐谋产品负责人说。企业,尤其是大型企业,在完成了初步的数字化之后,其研发环节充斥着大量此类算法难题:从机器学习中的分类(如医疗影像病灶识别)与预测(如火山喷发、商品需求预测),到运筹学中的路径规划与资源调度,再到底层的性能优化。这些算法是数字化系统的“大脑”,其性能的微小提升,都可能带来百万甚至千万级别的成本节约或效率增益。然而,传统解决方式成本高昂且周期漫长。企业要么依赖内部稀缺的高级算法专家,要么求助于高校实验室或顶尖研究院所,项目制交付难以持续迭代。伐谋产品负责人将传统算法工程师的工作流程拆解为四步:寻找基础算法、参考外部知识、编写新算法、评估效果并循环优化。“随着大模型分析和编码能力的提升,前两步和第三步完全可以交给AI。而评估标准由人类定义,也使得整个过程可以自动化。”百度伐谋系统所做的,正是将这四个步骤自动化、规模化。它构建了一个“进化环境”,通过采样不同的基础算法、融合外部知识(如学术论文思想),生成新的算法变体,再经由明确的评估器(如准确率、目标函数)进行筛选,优胜劣汰,循环往复。这类似于一种“算法育种”过程,通过大规模并行计算,让智能体在数字世界里进行高速的试错与进化,最终觅得更优解。“这对人来说,不是没事干了。”伐谋产品负责人强调,人的角色将转向更核心的工作:精准定义问题、设定清晰的评估指挥棒,以及对最终生成的算法进行逻辑审计和可解释性判断。这意味着,企业可以将宝贵的专家资源从繁琐的算法试炼中解放出来,聚焦于更具战略性的任务。落地之战:从港口调度到城市红绿灯任何新技术的价值,最终需要在具体的产业场景中验证。伐谋的首批战场,选择了复杂度高、价值感知强的领域。伐谋产品负责人分享了与央企中国数联物流及辽港集团合作的港口调度案例。在港口运营中,一个核心难题是多机调度:如何安排价格动辄千万的桥吊等设备,在数天甚至更长的周期内,高效完成船舶的装卸货计划,同时尽量减少设备闲置和无效移动。这本质上是一个多重约束的运筹学问题,传统上属于“NP-Hard”难题,即难以在合理时间内找到最优解,通常需要专家分阶段、近似求解。伐谋的介入方式显得颇为“简单”。工程师首先将业务需求抽象化:上传描述作业计划、设备约束、工作台系统等信息的文件,并明确评估标准(如最小化桥吊使用数量)。随后,启动“演化”按钮。系统进入“冷启动”和“岛屿进化”阶段,大量智能体并行探索不同解决方案,通过交叉、变异等操作不断生成新算法,并接受评估筛选。经过可能长达数天、上百轮的演化,系统会输出一个性能最优的算法代码及其效果报告。在这个港口案例中,最终结果显示,相较于原有人工设计的调度方案,伐谋演化出的新算法实现了减少2台作业桥吊的目标,并通过优化决策路径,将设备调动次数减少了10次。“但我们很难让一个工程师去试100次,找100种可能性。”伐谋产品负责人说。同样的逻辑被应用在更具动态性的城市交通领域。百度智能云SaaS信控产品,是与伐谋结合的另一典型场景。“信控,就是城市道路交通信号控制,核心目标是安全与效率。”百度智能云信控产品负责人解释,其工作流程也分为感知(通过互联网数据和路侧设备感知交通需求)、优化(算法决策红绿灯配时如何调整)和控制(信号机执行)。其中,最核心的优化环节,就是一个复杂的数学问题。百度强调“全域信控”理念,即从城市整体路网视角而非单个路口进行优化。这包括战略层的“子区划分”(将交通特征相似的路口分组,如单点、协调干线、拥堵子区)和战术层的参数优化(周期、绿信比、相位差)。在没有伐谋之前,信控系统依靠工程师编写的算法,能找到不错的“次优解”,但并非“最优解”。百度智能云信控产品负责人表示:“伐谋的优势是算法自主迭代进化,而我们要解决的交通优化问题,本质上就是一个求大规模路口数信号配时最优解的数学问题。”通过伐谋对信控优化算法的迭代,在相同交通需求下,优化效果(如车均延误)能在原来的水平上再提升数个百分点。“信控和伐谋的结合是很天然的。”目前,基于伐谋升级的SaaS信控轻量化方案已在鄂尔多斯、许昌等40多个城市落地。百度智能云信控产品负责人认为,这种模式的优势在于“快”和“省”——无需深度对接交警的专网设备,两周内即可交付,建设成本只需原来的十分之一,就可以帮助一些信控优化底子弱的城市快速达到及格线以上的缓堵效果。自演化智能体的未来与挑战百度伐谋所代表的自演化路径,为AI在产业界的深入应用提供了一种新的范式:它不再满足于充当人类专家的辅助工具,而是试图在人类设定的明确目标和规则下,自主地进行探索和创新。这种范式的竞争力在于其可扩展性和持续性。伐谋产品负责人提到,系统性能可以通过增加算力进行ScalingUp,难题可以分配给更多智能体并行探索,模拟“十倍速”的进化世界。同时,一旦框架建立,它可以持续运行,不断吸纳新的数据和知识,实现算法的自主演进,而非一次性交付。这对于需要持续优化、应对多变环境的产业场景(如物流、交通、金融风控)具有重要价值。不过,这条道路也充满挑战。首先,高度的专业性壁垒依然存在。无论是港口调度还是交通信控,将模糊的业务需求精准抽象为可计算的数学问题,仍极度依赖既懂业务又懂算法的复合型人才。伐谋产品负责人表示,与客户的共创、对行业Know-How的理解至关重要。目前,百度采取的是与自身行业SaaS产品线(如交通、金融)深度融合,以及与标杆客户共建的策略,以降低规模化复制的难度。其次,关于技术本身的成熟度。伐谋产品负责人坦承,与国际顶尖模型相比,在纯粹的自演进任务上可能还存在差距,但结合框架后,国产模型也能产生优异效果。这表明,框架设计与算法思想本身,与底层模型能力同样关键。同时,如何高效引导进化方向,避免陷入局部最优,仍是技术上的核心难点。从更广阔的产业视角看,“自演化智能体”的出现,预示着企业智能化进程可能进入一个新阶段:即从“流程数字化”到“决策智能化”。其价值不在于替代所有人类专家,而在于成为企业研发体系中的一种新型生产力,能够以更低成本、更高速度处理海量复杂的优化问题,从而释放人类专家去从事更具创造性的工作。百度伐谋及其在港口、交通等领域的初步实践,是一次重要的探路。它证明了一种可能性:AI可以不只停留在对话和生成,而是能够潜入产业运行的底层,进行沉默而持续的进化。这场进化能够在多大程度上推动AI对经济增长做出更实质性的贡献,仍需更多的时间与案例来验证。但可以肯定的是,这场关于智能体自主性的实验,已经拉开了序幕。作者 | 赵文轩 -
早报|第50万辆小米汽车下线,雷军:安全是基础/Nano Banana Pro正式亮相/苹果远程「变砖」泄密M5 iPad Pro Google 推出「Nano Banana 2」,图像生成进入推理时代俞敏洪:南极游费用 20-25 万,鼓励员工吐槽自己小米汽车第 50 万辆下线,刷新全球最快纪录苹果远程「变砖」泄密 M5 iPad ProOpenAI 紧急推出 GPT-5.1 Pro,直击 Gemini 3微信 Mac/Windows 双端更新,支持滚动截图魅族科技大楼挂牌出售,官方回应飞书上线「应用模式」,表格秒变专业系统蚂蚁集团全模态 AI 助手「灵光」三天冲上 App Store 总榜前十马斯克:未来工作将成为「可选项」,货币将「无关紧要」30.98 万元起,新款享界 S9 发布,全新 MPV 曝光 Google 推出「Nano Banana Pro」,图像生成进入推理时代 昨天,Google 在 Vertex AI 平台正式上线 Nano Banana Pro(官方名为 Gemini 3 Pro Image)预览版。这款新一代图像生成模型被定位为「推理模型」,在生成图像前会进行内部推理,从而显著提升图像质量、事实准确性以及多语言长文本的渲染能力。Gemini 3 Pro Image 支持最高 64K 输入 token 与 32K 输出 token,分辨率可达 4K,并具备多轮次对话式编辑、多图像合成(最多 14 张输入图像合成 1 张输出图像)等功能。同时,该模型集成了 Google 搜索能力,为图像生成提供更精确、最新的知识支持。官方介绍指出,Gemini 3 Pro Image 特别适用于复杂的多轮次图像生成与编辑、需要高事实准确性的创意工作、多语言环境下的长文本渲染,以及依赖最新知识的图像创作场景。除在 Vertex AI Studio 中可用外,开发者还能通过 Google 的 Gen AI SDK 在 Python 与 Go 环境下调用该模型,应用场景得到进一步扩展。爱诗科技旗下 PixVerse(拍我 AI)也已正式接入 Nano Banana Pro,进一步丰富了从图像生成到视频创作的工作流体验。用户现可通过 PixVerse.ai 与 pai.video 上传多张图片,体验高清图片生成,并在平台内实现更流畅的创作流程。 俞敏洪:南极游费用 20-25 万,鼓励员工吐槽自己 昨天,新东方创始人俞敏洪再发多条南极视频,并发文回应其南极旅行引发的舆论争议。他强调,自己与摄影师奚志农乘坐的「夏古号」破冰级邮轮为期 12 天,费用在 20-25 万元之间,并非外界传言的 148 万元。俞敏洪表示,允许员工吐槽是新东方的传统,公司若存在问题会及时纠正。他还提到,网络上出现冒充新东方员工的声音,呼吁公众理性辨别。此外,他宣布计划在今年冬天资助约 10 名新东方及东方甄选的基层优秀员工,以及 10 名东方甄选优秀会员前往南极考察,以此作为激励与回馈。此前,俞敏洪在南极考察期间向员工发布内部信,引发部分员工「无法共情」的吐槽,相关话题登上微博热搜。随后,他在社交平台连续发布 10 条南极相关视频,包括冰川、动物与船舶画面,进一步引发讨论。小米汽车第 50 万辆下线,刷新全球最快纪录 昨天,小米汽车在社交平台发文宣布,第 50 万辆整车在北京亦庄超级工厂正式下线,仅用 602 天、不足 20 个月,刷新全球新能源车企最快纪录。小米集团创始人、董事长兼 CEO 雷军表示,这一里程碑标志着小米汽车在研发、制造、销售、交付和服务等方面的体系能力得到验证,并进入规模化新阶段。雷军还就此事在微信公众号发文,强调「安全是基础,安全是前提」,并透露小米汽车预计 2025 年全年交付量将超过 40 万辆。在过去一年中,小米 SU7 成为 20 万以上轿车销量冠军,YU7 系列 SUV 在 10 月份超越 Model Y,登顶中国市场 SUV 销量榜。而日前小米集团公布的 Q3 财报显示,小米汽车三季度交付量超过 10 万辆,创历史新高,智能电动汽车收入达 283 亿元,并首次实现单季度盈利。小米集团合伙人、总裁卢伟冰在业绩电话会上指出,预计本周将提前完成全年 35 万辆交付目标。当天,雷军还在微博宣布,为庆祝第 50 万辆整车下线,小米汽车宣布将赠送共计 6 万个合金车模,其中包括 1:43 比例 1.5 万个和 1:64 比例 4.5 万个,可通过线上互动、广州车展现场及活动门店领取。苹果远程「变砖」泄密 M5 iPad Pro 据 Wccftech 报道,在俄罗斯 YouTuber Wylsacom 提前开箱泄密 M5 iPad Pro 后,苹果已将相关设备远程「变砖」,使其彻底失效,仅能充电,无法激活使用,形同「昂贵的菜板」。报道指出,该俄罗斯 YouTuber 在测试中展示了 M5 芯片相较 M4 芯片约 30% 的 GPU 性能提升。然而,这一结果被部分消费者解读为「迭代有限」,从而选择购买上一代产品。OpenAI 紧急推出 GPT-5.1 Pro,直击 Gemini 3 昨天,OpenAI 在 X 发帖,仅以两句话官宣正式推出 GPT-5.1 Pro,新模型在性能与应用场景上均实现突破,被视为对 Google Gemini 3 的直接回应。GPT-5.1 Pro 在「情商」与「智商」双维度上进一步升级,现已面向所有 Pro 用户开放。官方表示,该版本在复杂任务中展现更清晰、更强大的推理与表达能力,尤其在写作辅助、数据科学与商业任务方面表现突出。微信 Mac/Windows 双端更新,支持滚动截图 微信近日正式发布 Windows、Mac 双端 4.1.5 版本更新,带来多项实用功能升级。 截图工具新增「滚动截图」选项,用户可在截图后向下滚动生成长图,提升操作效率; 聊天文件新增「下载到...」选项,允许用户将接收文件保存至指定目录,而非默认路径; 消息转发界面新增表情入口,用户可在留言框中直接插入表情与文字一并发送。 此外,微信昨天还推出了 iOS 8.0.66 内测版,暂无可见新功能,但在系统兼容性上作出了调整:安装门槛从以往的 iOS 14,提高到了 iOS 15 及以上,或意味着未来的微信版本不再支持 iOS 14 及以下系统。网易 Q3 营收 284 亿元,《燕云十六声》引爆欧美市场 昨天,网易公布 2025 年第三季度财报,营收达 284 亿元,经调整后净利润为 95 亿元,同比保持稳健增长。 游戏及相关增值服务收入为 233 亿元,同比增长 11.8%,成为主要驱动力。其中,《燕云十六声》海外版本上线 24 小时玩家数突破 200 万,并在 20 个欧美地区 Steam 畅销榜跻身前十,英语区好评率达 84%; 有道与云音乐分别录得 16 亿元与 20 亿元收入,其中有道在「AI 原生」战略推动下,前三季度累计经营利润同比增长近 150%; 研发投入达 45 亿元,占营收比重约 16%。 此外,网易董事会已批准第三季度派息,并宣布延长最高 50 亿美元的股票回购计划至 2029 年。魅族科技大楼挂牌出售,官方回应 位于珠海市高新区唐家湾白沙路 2 号的魅族科技大楼已挂牌出售,总价约 2.5 亿元,单价为每平方米 1.05 万元,整体面积达 23848.55 平方米。该大楼曾是魅族在 2017 年手机市场声量巅峰时期的标志性建筑,如今因战略调整而被出售。 对此,有网友询问魅族科技官微:要搬新总部吗?魅族方面则回复称:「魅族科技大楼租期还很长,会一直陪着大家,追求源于热爱。」魅族近年来在手机业务上逐渐失势。2017 年后,随着创始人黄章回归并砍掉魅蓝品牌,线下渠道缩减,市场份额持续下滑。2022 年 7 月,吉利通过星纪时代收购魅族 79.09% 股权,至 2023 年底实现 100% 控股,黄章彻底退出。2023 年 3 月,星纪魅族集团成立,总部设在武汉,珠海仅为四大办公地点之一,地位不再核心。今年 3 月有消息称,星纪魅族启动组织架构调整,市场部整体迁至深圳办公,未随迁员工需选择离职。业内人士指出,此举是因「珠海跟不上大环境,公司需要找个新的根据地,对标大疆、华为等深圳企业」。目前,魅族业务重心已转向 FlymeAuto、智能眼镜等与吉利汽车深度协同的方向,手机业务存在感极低,9 月,魅族 22 在跳票两次之后终于发布,但并未搭载旗舰芯片。飞书上线「应用模式」,表格秒变专业系统 昨天,飞书多维表格新功能「应用模式」全面上线。该功能支持将表格快速转换为逻辑清晰、交互友好的业务系统,并结合前沿 AI 能力,让非 IT 背景的业务人员也能高效搭建专业系统。据介绍,「应用模式」提供丰富的业务组件与企业级权限管控,支持客户管理、库存管理、直播运营等场景。相比传统定制开发或采购方案,企业可在缩短周期与降低成本的同时,灵活应对业务变化。此外,飞书多维表格已将 AI 深度融入业务系统全流程,提供「AI 生成工作流」、智能数据分析与问答等功能,帮助企业在零代码体系下实现智能化升级。其底层架构支持单表千万级数据与千人实时协同,并开放超 1000 个外部系统集成,具备稳定、安全与开放的生态能力。蚂蚁集团全模态 AI 助手「灵光」三天冲上 App Store 总榜前十 昨天,蚂蚁集团披露,该应用在上线首日下载量突破 20 万,两天多累计下载量超过 50 万,并在第三天冲上 App Store 总榜第七,同时位居 App Store 免费工具榜第一。「灵光」于 11 月 18 日发布,定位为全模态通用 AI 助手。「灵光」的核心亮点在于其开创性地实现了移动端「自然语言 30 秒生成小应用」,用户不仅可以快速生成,还能进行编辑、交互与分享,让普通用户也能轻松「手搓应用」。此外,「灵光」是业内首个全代码生成多模态内容的 AI 助手,支持 3D、音视频、图表、动画、地图等全模态信息输出与可视化互动,呈现出极具信息美感的体验。智元远征 A2 人形机器人完成百公里跨省行走,获吉尼斯认证 近日,智元远征 A2 成功完成全球首次人形机器人百公里跨省行走挑战,从苏州金鸡湖至上海外滩,全程 106.286 公里,并获得吉尼斯世界纪录认证,成为「人形机器人行走最远距离」纪录保持者。认证仪式上,吉尼斯世界纪录认证官现场颁发证书,确认该成绩有效。吉尼斯世界纪录认证官胡晓雯指出,此次挑战过程由 GPS 仪器记录轨迹,并由专业见证人及 5 位第三方监督员全程监督。挑战自 11 月 10 日夜间持续至 13 日清晨,最终于 11 月 14 日确认成绩有效。她表示,这一纪录诞生于吉尼斯世界纪录创立 70 周年之际,展现了「中国力量」的前沿科技成果。据介绍,远征 A2 使用量产商用版本机型,未进行定制化改装,实验室已累计超过 3500 小时可靠性测试。挑战过程中,机器人搭载双 GPS 模块、激光雷达及红外深度相机,实现昼夜环境下的精准导航。远征 A2 挑战自苏州地标「东方之门」出发,途经市区、景区、国道、省道等多样路段,面对柏油路、盲道、坡道及夜间照明不足等复杂环境,机器人全程遵守交通规则,最终抵达上海外滩。智元机器人高级副总裁王闯表示,此次跨省行走展示了人形机器人在硬件性能、平衡算法与耐久性方面的成熟度,为大规模商用奠定基础。高通:骁龙 X2 Elite 兼容 90% Windows 游戏 据 VideoCardz 报道,昨天,高通在 Snapdragon Architecture Deep Dive 2025 大会上详细介绍了其 X2 Elite PC 平台所搭载的新一代 GPU Adreno X2。高通表示,超过 90% 的热门 Windows 游戏可在 Arm 架构笔记本上运行,且性能较英特尔酷睿 Ultra 2 系列核显快约 50%。官方测试显示,在 3DMark Time Spy 中,性能较 Adreno X1 提升 70%,能效提升 125%,在 AAA 游戏中帧率最高可达 2.3 倍。在对比测试中,Snapdragon X2 Elite Extreme 平台在 1080p 中等画质下,平均帧率较英特尔 Core Ultra 9 288V 系统高约 50%,并在《赛博朋克 2077》《博德之门 3》《怪物猎人 Wilds》《堡垒之夜》等游戏中保持在 30 FPS 以上。同时,相较 AMD Ryzen AI 9 HX 370,性能优势约为 29%。高通还表示,已有多家游戏反作弊系统开始提供 Arm 原生版本,包括 Epic Games Easy Anti-Cheat、腾讯 ACE、Roblox、Denuvo、BattlEye 等。公司称,正在采取多项措施解决游戏兼容性问题。此外,高通骁龙官方昨天在 X 上发文,宣布「骁龙控制面板」正式推出。据悉,该应用系由原「Adreno 控制面板」更名而来。目前,该软件已上线高通官网,支持 ARM64 架构的 Windows 系统,集成性能管理、驱动更新与系统监控功能,面向开发者、游戏玩家和高级用户,提供定制化的图形设置与系统优化能力。用户可通过配置文件管理器调整超级分辨率、帧率上限、抗锯齿、纹理过滤等参数,功能类似于英伟达显卡的控制面板。机构:今年中国智能腕戴销量将创历史新高 昨天,Runto 洛图科技发表中国智能腕戴市场最新研报。研报认为,中国智能腕戴市场规模将在 2025 年迎来历史新高。研报显示,2025 年前三季度全渠道销量达到 5260 万台,同比增长 23.2%,全年预计突破 7100 万台。市场在经历 2022 年短暂调整后,于 2023、2024 连续保持两位数增长,并在 2024 年恢复至 5000 万台以上,逼近 6000 万台。研报认为,智能腕戴已从「数据记录工具」转型为「主动健康干预设备」。血氧监测、ECG 心电图、高血压管理、房颤提示等功能逐步推广,推动行业进入准医疗级阶段。市场细分已形成三大方向: 心血管慢病管理:代表产品包括华为 WATCH D 系列与 Apple Watch Series 11,面向城市中产与慢病高风险人群; 重点人群安全守护:如小米 H1 与小天才电话手表 Z11,聚焦老人 SOS、跌倒检测与儿童定位; 专业运动与康复训练:如佳明 Fenix 7 与 Keep B5,为运动爱好者提供高精度 GPS 与最大摄氧量数据。 洛图科技分析师指出,未来行业将加速医疗认证与适老化适配,智能腕戴有望从「消费电子配件」升级为「体卫融合核心工具」。企业需推动二类医疗器械认证,提升监测精度,并在产品端优化交互逻辑,强化远程定位与紧急呼救功能,以满足老年群体需求。梅赛德斯-AMG GT XX 概念车中国首秀,刷新 25 项世界纪录 昨天,在广州举办的「2025 梅赛德斯-奔驰 XX 科技创新日」上,AMG GT XX 概念车完成中国首秀。这款车型作为 AMG.EA 平台的前瞻之作,首次将源自 F1® 的驱动科技应用于纯电架构,展示了电动时代高性能的全新可能。GT XX 概念车搭载创新的轴向磁通电机与电芯直冷技术,峰值功率超过 1000 千瓦(约 1360 马力),最高车速突破 360 公里/小时。在意大利纳多测试赛道的极限挑战中,该车以平均 300 公里/小时的速度连续行驶超过 40075 公里,刷新 25 项世界纪录,其中包括电动车 24 小时最长行驶里程纪录。电池系统方面,GT XX 概念车采用全新四元电池、800 伏高压架构与智能直接冷却系统,单根电缆实测峰值充电功率达到 1041 千瓦,约 5 分钟即可增加 400 公里续航。这一成果被视为推动高性能电动车补能体验接近燃油车便利性的关键突破。除动力系统外,GT XX 概念车还引入空气动力学、人车交互与创新材料等前瞻技术。如全球首创的可变叶片空气动力学轮毂、等离子激励器尾流控制,以及集成 AR 功能的竞速头盔,均凸显 AMG 对驾驭乐趣的重新定义。梅赛德斯-奔驰表示,GT XX 概念车的核心电驱技术将于 2026 年率先应用于 AMG.EA 平台的首款量产高性能四门跑车。华为乾崑携手东风汽车发布「奕境」品牌 昨天在广州举行的华为乾崑生态大会上,东风汽车与华为乾崑联合打造的全新品牌「奕境」正式亮相。该品牌由上百用户共同参与命名与票选,成为东风汽车首个深度用户共创的汽车品牌。东风汽车与华为乾崑在 2025 年持续推进合作:1 月签署《智能汽车战略合作协议》、5 月扩展至智能驾驶与鸿蒙座舱等核心领域、9 月揭牌联合创新实验室,奕境项目被视为双方技术集成度的最高体现。安全方面,奕境将搭载华为乾崑智能驾驶系统,提供车位到车位 2.0、巡泊一体等功能,并新增驾驶员失能辅助、侧向负向障碍物检测等安全守护。智慧体验上,奕境将融合华为乾崑智驾与鸿蒙智能座舱,打造沉浸式移动智慧空间。共创机制也将延续,品牌计划通过创新渠道持续倾听用户声音,使产品迭代与用户需求保持同步。马斯克:未来工作将成为「可选项」,货币将「无关紧要」 据《商业内幕》报道,特斯拉 CEO 埃隆 · 马斯克在美沙投资论坛上表示,随着人工智能与机器人技术的发展,货币将在未来「无关紧要」。他指出,AI 与机器人将使工作变成一个「可选项」,社会最终可能进入一个无需依赖传统就业和货币的阶段。马斯克在论坛上与英伟达 CEO 黄仁勋同台,他强调未来的约束将来自电力与物质,而非货币。他引用科幻作家 Iain Banks 的「文化」系列作品,认为这些作品提供了对积极 AI 未来的参考。他进一步表示,工作将像园艺或运动一样,成为一种兴趣选择,而非生存必需。此前,马斯克多次提出 AI 机器人(如特斯拉擎天柱 Optimus)能够消除贫困。他在股东大会上强调,只有通过机器人才能实现全民医疗与消除贫困。他甚至提出「全民高收入」的概念,认为在理想情境下,任何人都能获得所需的产品与服务,但这一过程将伴随「大量的创伤与冲击」。在论坛现场,马斯克还与黄仁勋互动,提及英伟达财报发布,并以「货币已无关紧要」的玩笑收尾,两人举瓶碰杯,场面颇具象征意味。 30.98 万元起,新款享界 S9 发布,全新 MPV 曝光 昨天,新款享界 S9 正式上市。该车型由华为与北汽联合打造,提供增程与纯电两种动力形式,共计 4 款车型。车身尺寸为长 5160 毫米、宽 2005 毫米、高 1492 毫米,轴距 3050 毫米,定位为中大型轿车。新车在智能驾驶与设计方面进行了全面升级: 搭载 36 个高精度传感器,标配 4 激光雷达,其中包括 1 个 192 线激光雷达与 3 个高精度固态激光雷达; 前向新增 3 分布式毫米波雷达矩阵,并配备车外麦克风; 全系基于新一代途灵平台,标配空气悬架与可变阻尼减震器,提升行驶质感; 纯电版基于 800V 高压平台打造,电动机最大功率 227 千瓦,续航超过 800 公里; 增程版搭载华为雪鸮智能增程系统,CLTC 综合续航里程超过 1300 公里; 搭载华为乾崑智驾 ADS 4 系统,辅助驾驶与主动安全能力进一步提升。 外观方面,新款享界 S9 换装全新寰宇之星车标,采用璀璨星河大灯、智能电子外后视镜及星云贯穿式尾灯组设计,整体视觉更具科技感。售价上,新款享界 S9 增程版 Max 车型的起售价为 30.98 万元;纯电版起售价为 32.98 万元。 此外,余承东还在发布会上宣布即将推出的「One More Thing」—— MPV 新车型,预计定位高端市场。相关阅读:新款享界 S9 发布,余承东说鸿蒙智行首款 MPV 马上就来30.98 万元起,小鹏 X9 超级增程发布 昨天,小鹏 X9 超级增程车型已于正式上市,定位豪华七座 SUV,Max 版起售价为 30.98 万元,Ultra 顶配版本价格为 32.98 万元。新款车型主打长续航与智能化配置,官方宣称其 CLTC 综合续航里程可达 1602 km,纯电续航里程为 452 km,增程器介入噪音低至 ≤0.5 dB,能耗表现为 16.5 kWh/100 km。新车在安全与舒适方面同样强调「同级领先」。全车标配 9 个安全气囊,满足中国及欧洲五星安全设计标准,并采用 2000 MPa 热气胀工艺膨胀管提升车身强度。座舱方面,提供 Nappa 真皮座椅、零重力模式、SPA 级按摩功能,以及 27 个 HiFi 级扬声器的 AI 音响系统。在智能化配置上,小鹏 X9 搭载图灵 AI 芯片,算力高达 2250 TOPS,支持全场景自动泊车与紧急避让功能。此外,车辆配备 800V 超快充技术,10 分钟即可补能,最大离地间隙可拓展至 185 mm,以应对复杂路况。在 2025 年 12 月 31 日前支付 5000 元定金的消费者可享限时上市权益,包括 20 英寸星耀悬浮轮毂、座舱升级套装、金融或积分优惠,以及终身免费流量等多项购车礼遇。56300 元,徕卡 Q3 Monochrom 发布,搭载 6000 万像素黑白传感器 昨晚,徕卡正式发布 Q 系统第二代黑白相机「Q3 Monochrom」,该机型以 6000 万像素专用黑白感光元件为核心,主打纯粹黑白影像表现。 搭载 6000 万像素 BSI CMOS 黑白感光元件,支持三倍解析度技术; 感光度范围覆盖 ISO 100 至 ISO 200000; 最高支持 8K 黑白视频录制; 具备 IP52 防尘防泼溅。 外观设计延续 Q 系列极简风格,全黑金属机身与黑色皮革蒙皮,机顶刻字采用黑色或灰色填色。值得注意的是,Q3 Monochrom 在设计上移除了经典的红色徕卡「可乐标」。徕卡还同步推出多款配件,包括覆皮无线充电手柄与红色滤镜等。徕卡 Q3 Monochrom 官方售价为 56300 元,现已在官方商城上架开售。15.98 万元起,广汽丰田新威兰达正式上市 昨天,全新换代威兰达正式上市,官方打出「开启燃油车域控时代」的 slogan,强调智能化体验,定位 20 万元以内的高性价比 SUV。据悉,全新威兰达是丰田首款采用全新电子电气架构的燃油车,搭载域控制器与千兆以太网,配合高通骁龙 8155P 芯片,实现算力集中与 OTA 升级能力,推动燃油车进入「软件定义汽车」时代。其他规格如下: 首发搭载丰田 TSS 4.0 智能驾驶辅助系统,传感器数量增至 24 个,前向摄像头像素提升至 830 万,毫米波雷达探测距离延伸至 280 米,覆盖 200+ 智驾场景; 配备 15.6 英寸中控屏、26.4 英寸 HUD 平视显示系统,并支持 Harmony OS 生态协同,预装 26 款主流应用。自研语言大模型语音系统支持全车四音区免唤醒交互; 搭载第五代智能电混双擎系统,2.0L HEV 百公里油耗低至 4.59L,2.5L HEV 百公里油耗低至 4.91L; E-FOUR 电子四驱系统可实现前后轴驱动力 100:0 至 20:80 智能调节。 此次换代车型新增 2.0L 混动版本,将中型 SUV 混动价格首次拉入 20 万元区间,主打「起步即高配,入门版就是豪华版」。具体售价如下: 2.0L 汽油入门版:15.98 万元 2.0L 混动入门版:16.98 万元 2.5L 混动四驱入门版:20.28 万元 荣耀 500 官宣搭载 8000mAh 电池:可连刷 31 小时抖音 昨天,荣耀确认荣耀 500 系列全系配备 8000mAh 青海湖电池,官方称可实现抖音连刷 31 小时或《王者荣耀》连续游戏 12 小时,续航表现位居同档之最。新机将于 11 月 24 日正式发布。据网传消息,荣耀 500 系列同时全系搭载高通骁龙 8 系旗舰芯片,成为同档位唯一标配骁龙 8 系的机型。其中,荣耀 500 标准版采用骁龙 8s Gen4,Pro 版则搭载骁龙 8 至尊版。跑分数据显示,荣耀 500 安兔兔成绩为 2434862 分,荣耀 500 Pro 达到 3232068 分。在外观设计方面,新机采用横向跑道式后摄 Deco、一体冷雕背板、直边直屏及大 R 角方案,整体风格与 iPhone Air 相似。韩伯啸:vivo S50 系列全系标配 3D 超声波指纹识别 昨天,vivo 产品经理韩伯啸在微博发文称,vivo S50 系列手机将全系标配第二代 3D 超声波指纹识别,在湿手、暗光环境下均可实现快速解锁。据博主「数码闲聊站」爆料,新机预计在 12 月发布。官方此前披露的信息显示,vivo S50 系列还将全系支持 IP69 + IP68 级防水。此外,S50 Pro mini 将搭载高通第五代骁龙 8 移动平台,结合 LPDDR5X 与 UFS4.1,在普通室温下跑分超过 300 万。此外,博主「数码闲聊站」还表示,vivo S50 系列将主打「3S 级旗舰体验」,搭载最新骁龙 8 Gen5 芯片、配备 IMX882 主摄级潜望镜和 3D 超声波指纹 2.0。 餐饮品牌集体摆摊推「惠民菜」 据界面新闻报道,全国多地餐饮品牌近期集体走上街头摆摊售餐,成为餐饮行业探索新生存路径的最新现象。自今年 7 月以来,从武汉湖锦酒楼、广州炳胜品味,到上海耀粤楼、和记小菜,再到长沙好灶头,区域知名餐厅纷纷加入「摆摊大军」,推出「便民菜」「惠民菜」,以平价策略吸引消费者。数据显示,摊位菜品覆盖红烧肉、辣子鸡、梅菜扣肉、糖醋排骨等主菜,以及卤味、小吃和汤品,部分摊位菜品数量多达 70 种。价格方面,摊位菜品定价整体低于堂食,多数炒菜在 10-30 元区间,素菜低于 10 元,荤菜在 15-30 元之间。营业时间集中在午间及下午三点后,精准匹配下班人群与家庭采购需求。部分摊位单日收入最高可达 3 万元,多数稳定在 1 万元左右。然而,报道指出,摆摊热闹背后折射出堂食业务的持续困境。红餐产业研究院数据显示,2024 年餐饮消费支出增加的消费者占比仅为 31.3%,较 2023 年下降近 19 个百分点、上市餐饮企业人均消费亦呈下滑趋势。例如,绿茶餐厅从 62.9 元降至 56.2 元,老乡鸡从 30.6 元降至 28.2 元。堂食客流不足导致单位成本上升,利润空间被压缩。报道认为,摆摊模式虽能带来现金流与曝光,但难以替代堂食的核心盈利能力。部分消费者质疑外摆菜品「像预制菜」,且价格优势并不明显。长期来看,品牌价值可能因「摆摊越火、堂食越冷」的负向循环而受损。ENGINEERED GARMENTS 携手 GU 打造复古军事风单品 近日,美式复古服装品牌 ENGINEERED GARMENTS 与 GU 宣布推出首个联名系列,并将于 12 月 5 日起在 GU 指定门店发售。此次合作以「Manhattanism」为主题,灵感源自 1970 年代纽约的文化与街头景象,融合复古与军事元素,并通过重新拆解与组合呈现出更具趣味性的设计。系列共包含五款单品,兼具 EG 标志性硬朗美学与更高的日常穿搭性,体现双方在设计工艺与细节品质上的共同坚持。爱彼迎携手奥运名将推出冬奥主题体验 近日,爱彼迎宣布携手 26 位奥运名将推出 2026 年米兰-科尔蒂纳冬奥会与冬残奥会主题「爱彼迎体验」项目。据悉,此次合作的运动员横跨 7 个国家、15 个运动项目,共斩获 67 枚奥运奖牌。他们将在赛前、赛中与赛后带领参与者走进博尔米奥雪道、米兰体育场馆以及科尔蒂纳山脉等地,提供包括花样滑冰、短道速滑和自由式滑雪在内的多样体验。参与者可与「花滑四周跳之王」陈巍一同欣赏冰上艺术,或与意大利短道速滑名将阿里安娜·方塔娜驰骋冰面。爱彼迎表示,该系列体验已在平台开放预订,旅行者不仅能参与运动员带来的深度互动,还能通过平台找到靠近赛场的优质房源,进一步提升赛事期间的住宿便利性。 《狂野时代》明日上映,预售票房突破 7500 万 毕赣执导的艺术电影《狂野时代》将于 11 月 22 日在全国上映,目前正在火热预售中,票房已突破 7500 万。影片昨日发布终极预告与群像海报,进一步强化其跨越世纪的叙事风格与沉浸式感官体验。该片由易烊千玺、舒淇领衔主演,赵又廷特邀出演,李庚希特别出演,并在第 78 届戛纳电影节主竞赛单元荣获特别奖。影片叙事以时间倒流为核心,从 1999 年最后一天起始,串联触觉、嗅觉、味觉、听觉、视觉五个篇章,构建出「迷魂者」跨越一个世纪的幻梦旅程。终极预告中,舒淇饰演的「大她者」与易烊千玺饰演的「迷魂者」展开最后一次对话,场景涵盖末日少年、嗅觉骗局、父子回忆以及听觉拷问等多重维度,呈现复杂的感官叙事。《我最特别的朋友》友情版预告发布 昨天,电影《我最特别的朋友》发布友情版预告。此前,影片已官宣将于 2025 年 12 月 5 日在中国全国上映。此次预告以温暖细腻的笔触,聚焦老郑(张颂文饰)与亮亮(曾柯琅饰)的跨代友情,展现两位孤独灵魂彼此靠近的过程,提前释放影片的治愈主题。《我最特别的朋友》以温暖的笔触展现人与人之间的善意。张颂文通过细微神态变化演绎老郑从孤独到接纳的过程,曾柯琅则以克制表演展现亮亮的内心转变。两人默契的互动诠释出「如父如子般另类友情」的重量。《不过是上班》定档 2026 年 1 月 10 日 近日,刘同喜剧新作《不过是上班》官宣定档,将于 2026 年 1 月 10 日在中国全国上映。影片以荒诞喜剧的设定切入职场主题,首次释出的定档海报以「职场进化图鉴」形式呈现,从打工人起床、通勤到加班的全过程,隐喻现代职场的重复与压迫。刘同在创作中延续其「敢想敢做」「真实洞察人心」的风格,影片不仅是喜剧,更意在成为打工人的集体疗愈。故事通过主人公陷入时间循环的设定,展现年轻人对「厌恶职场」的共鸣与反思。 -
三天两炸!谷歌深夜再甩Nano Banana Pro 三天之内,两度炸场!谷歌再次用“核弹级”更新宣告:AI还是我的主场。 (本图由Nano Banana Pro生成)继Gemini 3惊艳亮相后,谷歌趁热打铁,正式发布了其图像生成领域的终极武器Nano Banana Pro。它一经发布,就让无数设计师和开发者惊掉下巴,有人直呼:“这简直是不给对手留活路!” 以前玩AI生图,大家都有个共识:它能画出足以乱真的科幻大片,却写不对海报上的一句简单标语。 无论画面多么惊艳,一旦涉及到具体的“文字渲染”或“逻辑排版”,AI往往会瞬间“智商掉线”,甩给你一堆鬼画符般的“外星文字”。这种“只懂艺术,不懂设计”的硬伤,曾是AI迈向专业化应用最大的拦路虎。 但现在,这个瓶颈彻底被谷歌炸穿了! 就在Nano Banana Pro(官方名:Gemini 3 Pro Image)正式发布后,开发者社区的惊叹声瞬间引爆社交网络。 免疫学家德里亚·乌努图兹(Derya Unutmaz)贴出了一张一次性生成的完整医学插图,完美描述了CAR-T细胞治疗阶段,配文惊呼:“谷歌,你们做了什么?! ” 曾在多家科技媒体担任产品经理的帕克·奥托拉尼(Parker Ortolani)在测试复杂图表生成后,直接感叹:“强大到离谱!” 工程师迪迪·达斯 (Deedy Das)赞扬了Nano Banana Pro在编辑和品牌修复任务中的表现:“类似Photoshop的编辑功能,它搞定了一切,是我迄今为止见过的最好的图像模型。” 甚至连表情包创作者也参与进来。@cto_junier通过一次提示生成了一个完整风格的“LLM讨论桌”表情包,包含Logo、图表、显示器等所有元素,并称Gemini 3 Pro Image为“新表情包引擎”。 Nikunj Kothari则一键将一篇完整的文章转换成了风格化的黑板讲座板书,称结果“令人无语(赞叹)”。 不过在一片赞誉声中,也不乏冷静的“泼冷水”。 AI研究员Lisan al Gaib对该模型进行了一个重逻辑的数独问题测试,结果模型“幻觉”出了一个无效的谜题和一个毫无意义的解法,他指出该模型“遗憾地还不是AGI”。这提醒我们,虽然视觉推理取得了巨大飞跃,但在规则绝对受限的系统中,逻辑幻觉仍是当前技术难以根除的顽疾。 那么,抛开对AGI的极致苛求,回归到内容生产的现实维度,Nano Banana Pro究竟强在哪里? 答案不在于它“画得更漂亮”,而在于在容忍度相对较高的创意领域,它拥有了前所未有的“深度思考”和“影棚级控制力”。它不再是机械的“看图说话”,而是真正做到了 “理解逻辑,生成结构”。 这次升级,核心冲突点直指专业领域:它将图像生成从一个“创意玩具”,彻底变成了具备高精度、高保真、高一致性的“企业级内容生产引擎”。下面,我们将深入挖掘这款模型的细节,看看它如何用推理内核和物理控制重塑视觉内容生态。 一、深度推理:从“像素堆砌”到“逻辑建模”的跨越 Nano Banana Pro的底层技术,是它与过去所有模型的本质区别。它集成了Gemini 3 Pro独有的“深度思考”(Deep Thinking)推理能力,将逻辑一致性直接应用于视觉物理和内容结构。 1. 结构化多模态推理 Nano Banana Pro不再是单纯地“模仿”风格,而是能理解并生成具有明确结构、意图和事实基础的视觉内容。 · 信息图表生成: 这是其最受赞誉的功能。用户可以提供复杂的段落提示词,一次性生成完整的、零拼写错误的教育图表、医学插图或商业流程图。它能够根据语言提示,准确地构建连贯的排版、布局和主体连续性,这是传统模型无法实现的。 · 设计师特拉维斯·戴维斯(Travis Davids)展示了一个一次性生成的、布局和排版完美的餐厅菜单:“生成长文本的问题正式解决了。” · 实时知识: 借助谷歌搜索的庞大知识库,Nano Banana Pro可以生成基于实时信息的可视化内容。例如,根据当前的天气数据,生成一张波普艺术风格的天气信息图;或者根据最新的食谱步骤,生成分步可视化的烹饪指南。 · 多元素融合与一致性: 模型的合成引擎得到了显著扩展,支持将多达14个不同的输入图像(包括多个角色、产品、背景纹理)混合成一个连贯的场景。更重要的是,它能在复杂的群像镜头或序列叙事中,保持最多5个独立主体的一致性和相似性,彻底解决了AI生成角色“漂移”或“变脸”的历史痛点。 · 2. 高保真文本渲染的极限突破 文本处理能力不再是“附加功能”,而是Nano Banana Pro的核心卖点。 · 准确与清晰度: 该模型被评价为在图像中直接渲染正确、清晰可读多语言文本的业界翘楚。无论是海报中的短标语,还是复杂的图表说明,其文本错误率都显著低于竞争对手。 · 多语言与本地化: 模型能够支持语义本地化和图中文本翻译。例如,在一个饮料罐的广告概念中,它可以将所有英文文本准确翻译并渲染成韩文,同时完美保留罐体原有的光照、曲率和表面纹理,这项任务在传统流程中需要昂贵的手动后期处理。 · 风格化与表现力: 用户可以要求模型创建具有多样纹理、字体和书法风格的文本,如用粗体、堆叠的字体创建复古丝网印刷效果,或将短语融入伐木场景,用木头组成文字,将文本创意提升到新的高度。 二、影棚级控制:将摄影和设计语言融入AI工作流 Nano Banana Pro的另一大亮点是,它将过去只有专业摄影师和设计师才能掌握的“物理控制”,转化为简洁的提示词。 1. 专业的视觉参数操控 模型允许用户对图像的底层物理属性进行精细控制,模拟专业摄影和后期制作。 · 光照与气氛: 用户可以精确操纵光照方向、强度和类型。例如,可以轻松地将白天的场景渲染为夜晚,或引入刺眼的定向光,在人物面部投射出深邃阴影,只照亮眼睛和颧骨,实现特定的戏剧效果。 · 景深与焦点: 模型能够控制景深虚化(Bokeh Effect)。用户可以指定焦点,例如将焦点从人像转移到前景的花朵上,突出构图的细节,实现专业级的画面分层。 · 色彩与角度: 支持应用复杂的色彩分级(Color Grading)和调整相机角度,让用户轻松将想要的视觉外观应用到模型中,确保品牌在每个触点上保持无缝和一致。 2. 高级编辑与分辨率支持 · 非破坏性局部编辑: 引入的“选择、优化、变换”能力,允许创作者修改图像的特定部分(如改变领带颜色、移除背景物体),而无需重新生成整个图像,极大提高了工作效率,更接近传统的编辑软件。 · 高分辨率输出: 模型支持高达2K和4K的输出分辨率,确保了创作成果可用于从社交媒体到高要求的印刷等任何平台。多种宽高比的支持也确保了图像能适应各种目标平台。 三、生态整合:从开发者到企业级的全栈部署 Nano Banana Pro的发布策略,明确了其作为谷歌AI生态系统核心基础设施的定位。 1. 开发者和企业访问 · API与云服务: 模型已开始在全球范围内的Gemini API和Google AI Studio中推出,供开发者访问。企业可以立即通过Vertex AI进行规模化创作,并将很快登陆Gemini Enterprise。 · Antigravity集成: 在谷歌内部的智能体IDE Antigravity中,Gemini 3 Pro Image被用于在界面元素被编码之前,就生成动态的UI原型和视觉素材,大大简化了“从设计到代码”的流程。 · 商业应用升级: Google Ads中的图像生成功能已升级到Nano Banana Pro,直接将尖端的创作和编辑能力交到全球广告主手中。同时,Google Slides和Vids的Workspace客户也能使用它来生成演示文稿视觉素材和故事板。 2. 用户访问与定价分层 · Gemini应用: 消费者和学生可在Gemini应用中,通过选择“思考”模型进行“创建图像”。 · 免费层: 用户将获得有限的免费配额,之后恢复使用原始的Nano Banana模型。 · 付费层: Google AI Plus、Pro和Ultra订阅用户获得更高的配额。 · 定价策略: Nano Banana Pro的定价采用分级制,定位高端市场(例如标准图像约0.134美元,远高于竞品约0.04美元的基准)。但谷歌强调其价值在于:4K高分辨率、企业级治理(付费层图像不用于训练谷歌系统)以及其作为逻辑推理模型的稀缺性。这笔溢价,是为了“专业保真度和数据安全”而支付。 3. 来源追溯与信任构建 · 强制SynthID: Nano Banana Pro生成的每张图像都强制嵌入了谷歌不可感知的SynthID数字水印,确保其AI来源可追溯,这在医疗、教育等高风险领域是运营要求。 · 移除可见水印: 为满足专业工作对“干净”视觉画布的需求,Google AI Ultra订阅用户和Google AI Studio开发者工具内生成图像上的可见“Gemini火花”水印将被移除。 · 用户验证工具: 谷歌将一个强大的验证工具直接交到用户手中,现在可以将图像上传到Gemini应用,直接询问它是否由Google AI生成,这得益于SynthID技术。 Nano Banana Pro的问世,标志着AI图像生成正式从“新奇的艺术工具”转向“可靠的商业基础设施”。它不仅在视觉质量上达到了前所未有的高度,更重要的是,它带来了逻辑、结构和一致性,让AI视觉内容真正做到了“所想即所得,所见即所用”。(小小) -
鸿海与OpenAI合作,将共同设计数据中心的硬件 OpenAI正与苹果公司的主要供应商鸿海合作,共同设计和制造数据中心硬件。两家公司于11月21日宣布达成合作。根据声明,鸿海将与OpenAI共同设计和开发数据中心服务器机架,并致力于确保这些机架能够在美国各地生产。鸿海还计划在美国为AI数据中心设施生产布线、电源系统和其他关键设备。OpenAI首席执行官Sam Altman在一份声明中表示:“此次合作是朝着确保人工智能时代的核心技术在美国本土构建迈出的一步……我们相信这项工作将加强美国的领导地位,并有助于确保人工智能的益处得到广泛分享。”这与在特朗普重返白宫后宣布的一系列旨在加强美国本土AI基础设施的举措相呼应。尽管此举显示了OpenAI扩张其AI版图的雄心,但其持续的巨额支出也加剧了市场对人工智能泡沫的担忧。值得注意的是,两家公司表示,该协议并未包含具体的采购承诺,这为合作的最终规模留下了不确定性。OpenAI的宏大基建蓝图 与鸿海的合作并非孤立事件,而是OpenAI宏大基础设施投资计划的一部分。今年以来,OpenAI已采取一系列行动,以确保获得支持其AI服务所需的庞大算力。据报道,OpenAI正与甲骨文公司和软银集团合作,推进一项雄心勃勃的计划,即在未来几年内向美国数据中心和AI基础设施投资5000亿美元。此外,近几个月,OpenAI已与包括英伟达和超威半导体在内的芯片制造商以及云计算提供商达成了多项价值数十亿美元的交易,旨在显著扩大其数据中心规模。掌控供应链与市场担忧 除了扩大算力规模,OpenAI的系列举措也显示出其试图加强对AI供应链控制的战略意图。今年10月,OpenAI宣布与博通公司达成协议,采购定制芯片和网络组件,这被视为其垂直整合供应链的关键一步。与鸿海在服务器硬件上的合作,进一步将这种控制力延伸到了基础设施层面。然而,OpenAI的“烧钱”速度引发了市场的警惕。有观点认为,这种大规模的支出正在加剧人工智能领域的泡沫风险。Sam Altman此前曾表示,OpenAI承诺在AI基础设施上投入1.4万亿美元,对于任何企业而言,这都是一笔巨款,更不用说对于一家尚未实现盈利的初创公司。这些巨额投资承诺的背后,是其商业模式能否支撑如此庞大资本开支的疑问。 -
微言 | 快递不上门,不必全怪快递小哥 明明备注了“送货上门”,却只收到一条取件短信,包裹被径直放进快递柜或快递服务站。据媒体报道,“双11”快递高峰后,不少消费者开始抱怨,一些包裹的派送停在了“最后一百米”。快递不上门的问题由来已久。无论是身边还是网上,都不乏这样的场景:快递箱堆得满满当当,甚至人们需要蹲在临时堆放地上翻找半天,才能找到自己的包裹。其实,2024年3月1日起施行的修改后《快递市场管理办法》早已明确规定:未经用户同意,快递企业不得代为确认收到快件,不得不经同意擅自将快件投递到智能快件箱、快递服务站等快递末端服务设施。然而,此类服务乱象却屡禁不绝。细究之下,快递送不上门的原由,人力成本不足是主要因素。有业内人士告诉媒体,为控制人力成本,不少快递企业不愿在站点加派人手,一个快递员常常要背负好几个小区的派送,每天单量动辄几百件,不堪负担。目前大部分快递企业,大多靠着加盟制和低价策略拓展市场规模。加盟商需要压缩成本,对于送货上门这类服务质量问题,自然缺乏主动改进的动力。处于快递企业末端的快递员,则面临工作量大、业绩考核等多重压力,更难以保证逐家上门派送。2024年我国快递包裹业务量达1750.8亿件,同比增长21.5%;我国快递包裹市场规模已连续11年保持全球第一。但服务细节不到位,仍让中国快递的高质量发展面临挑战。这一问题,除了要靠快递企业、电商、监管部门的多方协同,快递企业未来还可通过科技破局,或许也会成为一种更为可行的解决方案。据悉,今年已有不少快递企业开始研发专属的无人机配送技术,在智能化背景下,物流末端配送效率与用户体验可能将有优化的空间。对普通人而言,快递不上门显然是带来不便,但也不必苛求快递小哥——因为受限于行业模式与现实条件,整个快递产业链仍亟待优化,解决问题的关键终究在于企业运营模式的升级和行业服务意识的提高。 -
巨头公司避谈的秘密:“活化石”程序仍是今日数字世界的中流砥柱 今年早些时候,科技界迎回了一位代码界的“老朋友”——ELIZA。作为世界上第一个能进行看似有意义对话的人工智能聊天机器人,ELIZA曾令20世纪60年代中期的计算机科学家们惊叹不已。最近几十年,人们都以为ELIZA已经失传,因为其创造者、美国麻省理工学院的约瑟夫·魏岑鲍姆从未公布过他创建ELIZA时所写下的420行代码。然而,美国斯坦福大学的杰弗里·施拉格和同事们对魏岑鲍姆的成就十分着迷,并为此成立了一个ELIZA考古项目。几年前,他们在麻省理工学院魏岑鲍姆的旧文件盒中发现了丢失的代码,为ELIZA的复活铺平了道路。能再次与这位在人工智能历史上占据过重要地位的聊天机器人对话,不仅令人惊叹,也引出了一个令人好奇的话题:在ELIZA代码之外,今天是否还有更古老的代码片段仍在执行着某些重要任务?为此,有人启动了对于最古老代码的追踪,并发现了一些意想不到的情况:大部分古老代码远未得到ELIZA那样的尊重。总体上,企业和组织对旧代码呈现出一种奇怪的矛盾态度:一些人似乎不信任它,另一些人则对其充满信心,而几乎所有人都不愿公开讨论它。很少被提及,从未被遗忘对技术的追根溯源通常不难。你可以在公开资料上很快找到当今最古老却还能飞行的飞机,那是英国的一架修复后的布莱里奥11号,历史超过115年;或是世界上最古老但仍在使用的灯泡,就在美国加利福尼亚州利弗莫尔,点亮至今已有124年。但寻找仍在使用的最古老计算机代码却没这么容易。英国数学家阿达·洛芙莱斯在19世纪40年代设计了世界上最早的计算机程序。但实际上,洛芙莱斯的程序依赖于英国数学家查尔斯·巴贝奇设计的机械计算机,这款设备却从未被制造出来,因此这段代码就从未真正运行过。英国剑桥大学开发的电子延迟存储自动计算器EDSAC或许是世界上最早的通用计算机之一。如今,英国国家计算机博物馆的志愿者们正在制作一台EDSAC的复制品,一旦完成,它就能运行20世纪40年代到50年代发表在科学论文中的EDSAC软件,它们可能是世界上现存的最古老代码之一。在这项工作完成前,要寻找仍在运行的旧代码,或许可在现代软件中获得线索。几乎与EDSAC投入使用同时,计算机科学家开始简化代码编写的方式,“高级”计算机语言由此问世。这些语言的结构与人类语言相似,能使编程变得更直观。多年来,世界上已开发出许多高级计算机语言,包括IBM的Fortran(1957年)、COBOL(1959年)和JavaScript(1995年)。即使某种计算机语言已不再常用,它也不会被完全遗忘,因为如今的程序往往包含着用多种语言编写的代码,这意味着用几十年前的语言编写的旧代码片段,现在仍会隐藏在常见的应用程序中。基于这些信息,一条线索很快浮出水面——根据吉尼斯世界纪录,如今用来预订机票的网站,通常依赖美国航空公司于1960年开发的Sabre全球分销系统。这意味着,当今软件版本中的一些代码,可能比ELIZA更古老。然而,试图联系Sabre的结果是石沉大海,发送给其他机构的联系请求,包括达美航空、美国航空、联合航空、汉莎航空和英国航空,英国银行业的“四大”——汇丰、劳埃德、国民西敏寺和巴克莱,英国伦敦劳合社和贝宝,甚至苹果、微软、惠普、德州仪器等科技公司,都没有给出任何回音。维萨(VISA)和万事达在最初似乎表现出兴趣,但最终表示无法提供帮助。这种拒绝讨论旧代码的态度,着实让外界费解。对此,英国LEO计算机协会受托人文森特·博德斯沃斯说:“企业可能感到紧张,不愿让人注意到他们的产品中存在古老代码,因为他们不知道这些代码如何工作,以及如何维护以确保其继续运行。”LEO计算机协会是一个旨在保存英国一家已停产计算机品牌历史的公益性机构。 淡出不退出,多亏“老江湖” 寻找古老代码的难点还在于,源代码可能丢失,同时理解或修改这些代码所需的专业知识也会失传,后者可能更为常见。LEO计算机协会的博德斯沃斯曾谈起他听到的一个故事。那是1971年英国改用十进制货币时,伦敦一家不知名的银行遭遇问题,它有一个计算机程序主要针对非十进制货币进行金融计算;但由于程序源代码丢失,因此没办法对这个程序进行修改,使其完成向十进制的切换。后来,银行并没有为重写软件而投入重金,而是简单操作,编了一段代码,将十进制的英镑、便士转换为非十进制的英镑、先令和便士,并将数值交给旧程序计算,最后再利用另一段代码,将计算结果从非十进制转换到十进制。博德斯沃斯说,这种补救措施虽然笨拙,但也算是沿用至今的古老代码。在美国得克萨斯州,有家名为“COBOL牛仔”的咨询公司,联合创始人比尔·希恩肖早在1970年就用COBOL语言为银行ATM机写过软件。实际上,整个20世纪中叶,COBOL对企业运行至关重要;即便如今它不再是程序员的首选,但仍在一些软件中扮演着小却重要的角色。希恩肖估计,目前有8000亿行的COBOL代码仍在运行。由于当今大部分程序员不熟悉它,熟悉它的人也大多即将退休,因此遇到问题的企业只能求助于希恩肖团队。实际上,这群“牛仔”最年轻的成员也40岁了,大多数人是六七十岁,希恩肖则是82岁。在他看来,虽然目前使用COBOL不会有问题,但十年后情况可能有变。在理论上,代码虽不会磨损或用坏,但经过软件更新,旧代码也可能与程序其他部分不兼容。2024年7月,网络安全公司CrowdStrike在更新软件时出现故障,导致全球机场、医院和银行的数百万台计算机瘫痪。好在他们很快识别故障,推出新的更新,让大多数计算机在几小时内恢复运行。但是,假如故障涉及一种只有少数程序员才懂的旧代码,修复就会困难得多。鉴于这些担忧,科技公司不愿讨论旧代码也算合乎逻辑。另外,他们偶尔也会从现代软件中删除旧代码,最著名的例子是25年前的“千年虫”——当时为避免千禧之交全球的计算机因为难以区分2000年和1900年而大量崩溃,经过一场紧急行动,旧代码被强行移除。旧代码悖论,关键是有效 在一些极端重要的软件中,旧代码迄今仍很活跃。Perl基金会主席斯图尔特·麦金托什说,2024年发布的最新版本Perl,包含了1987年首个版本的代码片段。由于Perl支持亚马逊网络服务,因此所有亚马逊网络服务的用户,都会用到这段有着近40年历史的代码,其中包括苹果公司,以及美国航空航天局、中央情报局,英国军情五处和军情六处等重要组织。还有一些现代软件,会用到更古老的代码。比如负责发行开源操作系统Linux一个版本的软件公司红帽(Red Hat)。该公司的迈克·麦格拉思表示,许多版本的Linux都包含一条名为“缩进”的命令,该命令所用的代码能追溯到1976年,这也意味着在人工智能和云计算时代,人们仍在使用近50年前的代码。麦金托什说,旧代码能延续下来的原因很简单——有效。尽管人们一直担心旧代码可能与新代码不兼容,但事实上,许多旧代码几十年来运行良好。这甚至在业内催生了一种矛盾的现象:软件工程师越来越怕旧代码出故障,但同时,他们也越来越相信旧代码有能力持续保持可靠和准确。航天业是最好的例证。欧洲航天局计算机系统工程师詹姆斯·埃格尔斯顿表示,太空任务的设计、建造和发射成本极高,有些卫星价值数十亿美元,因此倾向于使用可靠的旧代码,而非冒着风险用可能出问题的新代码,因为一旦搞砸,航天器就会报废。有些仍在使用的古老代码可能不在地球上,甚至不在太阳系——距地球超过200亿公里的“旅行者”号探测器,如今可能仍在运行着与1977年发射时几乎完全相同的软件。一位匿名航天内部人士透露,美国航空航天局偶尔会聘请上年纪的程序员,让他们维护或修改面向旧任务的晦涩代码,这类似于希恩肖为保险公司和银行所做的。但航天业似乎也不愿讨论对旧代码的依赖。美国航空航天局并未回应相关采访请求。埃格尔斯顿也承认,欧洲航天局对他接受采访的想法持谨慎态度,主要是担心航天局使用旧代码,可能误导人们认为其太空任务不值得资助。那么,仍在运行的最古老代码究竟在哪里?目前唯一能做的可能只剩下猜测。博德斯沃斯认为,在某间政府办公室的一台古老计算机上,它可能正悄然运行,年复一年地执行着相同的任务。尽管旧代码在未来某一天终究可能出现故障,但谁也说不准那会是多久以后,而且实际上,每个人都乐见它继续稳定运行。“我们正处于数字革命的最初阶段。展望500年后,我们也许仍会在与今天相同的基础上进行建设。”麦金托什说。 -
AI热潮,哪些企业更受益? 随着第三季度财报季的尘埃落定,高盛发布报告称,市场对AI基础设施的投入并未减速,反而正在加速上修。尽管投资者对于信贷市场能否消化这一投资热潮、以及支出是否超过自由现金流存有疑虑,但数据表明,科技巨头Hyperscalers的资产负债表仍有巨大的举债空间。对于投资者而言,关键信号已经出现:AI交易正在从单纯的基础设施建设,转向回报分化更为明显的阶段。目前的资本支出预估可能仍被低估,潜在上行空间高达2000亿美元。与此同时,投资逻辑正由“卖铲子”的人(基础设施),逐步向AI平台型股票和能够通过AI大幅提高效率的“生产力受益者”转移。资本支出预估大幅上修,回报分化加剧第三季度财报季不仅催化了AI资本支出预估的进一步走高,也重新引发了投资者对于AI投资繁荣背后风险的担忧。高盛投资组合策略团队指出,市场共识对五大AI超大规模计算公司(Hyperscalers:亚马逊AMZN、谷歌GOOGL、Meta、微软MSFT和甲骨文ORCL)的2026年资本支出预估,已从财报季初的4670亿美元(同比增长20%)飙升至如今的5330亿美元(同比增长34%)。虽然“AI交易”目前主要集中在基础设施领域,但该领域内的回报离散度正在增加。这种分化主要受到两个因素驱动:一是投资者对AI投资能否真正产生收入效益的信心程度;二是为这些投资提供资金所使用的杠杆规模。这种分化可能为投资者提供了以更“便宜”的价格获得AI驱动收益的潜在机会。2026年资本支出仍有2000亿美元上行空间尽管目前的支出数字已经令人咋舌,但分析师的预测可能依然过于保守。自下而上的市场共识认为,超大规模计算公司的资本支出年增长率将由近期的76%放缓至2026年底的25%。这就意味着,分析师预计2026年即这几家巨头资本支出的增长将出现大幅减速。然而,高盛回顾过去两年的数据发现,分析师在每一阶段的预估都不仅是保守的,而且是“过于”保守。基于历史技术投资周期的支出规模分析,高盛认为目前对2026年超大规模计算公司的资本支出预估,仍有高达2000亿美元的上行空间。市场普遍担忧现金流和资产负债表能力会限制2026年的支出,但数据证伪了这一观点。绝大多数超大规模计算公司的资本支出迄今为止都是通过现金流提供资金的,但这些公司同时也拥有巨大的债务融资能力。自2021年以来,这些科技巨头的资产负债表上虽然合计增加了2950亿美元的净债务,但由于盈利能力的强劲增长,它们的集体净债务/EBITDA杠杆率仅为+0.2倍。据高盛测算,这五家公司完全可以在其资产负债表上再增加7000亿美元的净债务,而且即便如此,其净杠杆率也不会超过1倍。因此,相比于现金流或资产负债表能力,供应链瓶颈或投资者胃口更有可能成为近期资本支出的制约因素。杠杆压力与反馈回路虽然最大的AI基础设施公司(前述Hyperscalers)拥有强劲的资产负债表,但参与AI基础设施建设的许多其他上市公司和私营企业则面临更严峻的挑战。资产负债表债务和替代性融资的近期增长速度已引发了投资者的焦虑。由于最大的美国上市公司与较小的AI公司之间存在收入和股权关联,这种紧密的联系创造了一种反馈回路。这意味着,AI生态系统中某一部分(尤其是较小的私营公司)的压力,风险极易传导并影响整个AI板块的投资者。实际上,在第三季度财报季中,已有多家超大规模计算公司报告称,私募股权投资价值的变化对其收益产生了巨大影响。下一阶段赢家:平台股与生产力受益者随着企业AI采用率的持续提高,以及市场对纯基础设施板块的担忧日益增加,投资者的焦点正在转移。高盛重点强调了以下两类未来受益者: AI平台股: 随着越来越多的企业实际采用AI技术,这些公司将获得直接的收入顺风。 AI生产力受益者: 高盛筛选了一批具有较高劳动力成本和高工资敞口的公司,这些公司在最近的财报电话会议上明确提到了利用AI自动化来提高效率。 正如报告最后冷峻指出的那样,对于华尔街来说,这些名字可能意味着好消息;但隐含的就业“替代”机会,对于普通大众而言绝对不是好消息。 -
Hugging Face CEO回应“AI泡沫说”:倒不如说现在是“LLM泡沫” IT之家 11 月 19 日消息,据外媒 TechCrunch 今日报道,Hugging Face 联合创始人兼首席执行官 Clem Delangue 在 Axios BFD 活动中提出观点:现在并不存在所谓的 AI 泡沫,而是“大语言模型泡沫”,而且这个泡沫可能不远就会破裂。“泡沫说”是当今“数万亿美元”的问题,但即便泡沫破裂,AI 的未来也不会受到威胁。依照 Clem Delangue 的看法,目前被过度追捧的是驱动 ChatGPT、Gemini 等聊天机器人的大语言模型。不过,这种关注可能不会持续太久。 ▲ 图源 Axios BFD Clem Delangue 说:“我认为我们正处在一个大语言模型泡沫里,而且这个泡沫很可能会在明年破裂。但大语言模型只是 AI 的一部分,在 AI 应用于生物、化学、图像、音频、视频等领域时,我认为眼下只是开端,未来几年会看到更大的发展。”Clem Delangue 认为的问题在于,大语言模型并不能解决所有场景的需求,未来会有更多体量更小、用途更明确的模型被广泛采用。“现在所有目光、所有资源、所有资金,都集中在这样一种想法上 —— 用巨量算力打造一个能解决所有公司、所有人所有需求的模型。但现实是,未来几个月和未来几年,会出现更多不同类型、更定制、更专门化的模型,用来处理各自不同的问题。”为了说明这一点,Clem Delangue 举了银行客服聊天机器人的例子。“这种机器人并不需要回答生命的意义是什么,对吧?完全可以用一个更小、更专用的模型,能更省钱、更快,还能在企业自己的基础设施上运行。我认为这才是 AI 的未来。”Clem Delangue 承认,大语言模型泡沫破裂可能对 Hugging Face 带来一定影响,但他指出 AI 产业本身庞大而多元,即便大语言模型这一部分被高估,也不会对整个行业或 Hugging Face 造成决定性冲击。Clem Delangue 还表示,Hugging Face 目前仍保留着已融资 4 亿美元(IT之家注:现汇率约合 28.44 亿元人民币)中的一半资金,这种克制的资金策略与不少 AI 公司形成鲜明对比。“按 AI 行业的标准,这样子基本可以算是盈利状态,因为其他公司花的不是几亿美元,而是动辄数十亿美元。”与其相比,Hugging Face 采取的是更高效的资本策略。“现在很多人在抢进度,因此做出的都是很短视的决定,甚至有些慌乱。我在 AI 行业已经工作了 15 年,见过多个周期。所以我们从这些经验里吸取教训,努力把 Hugging Face 打造成一家长期、可持续、真正能对世界产生影响的公司。” -
OpenAI痛失独宠?微软英伟达150亿美元扶持对手 等等,这剧本不对劲! 微软不是OpenAI的“头号铁粉”吗?英伟达老黄和Anthropic CEO此前不是还隔空互怼过吗? 就在所有人都以为格局已定时,一则重磅消息引爆了全球AI圈:微软、英伟达和OpenAI的头号竞争对手Anthropic,结成了一个史无前例的“450亿美元AI巨头联盟”! 具体而言,Anthropic承诺在未来十年内向微软Azure豪掷300亿美元购买云算力,而微软和英伟达则回注150亿美元的联合投资,其中仅老黄一家就掏了100亿! 这场“三方联姻”直接动摇了整个AI产业的基石。它不仅是Anthropic冲击王座的“关键一跃”,更是微软祭出的“多模型护城河”神兵利器;当然,对OpenAI来说,这无疑是感受到了来自“自家大哥”的背刺! 网友称赞此次合作让Claude在顶级云平台全面可用,并对Claude在医疗、金融、制造等关键行业推动自动化与智能决策的未来充满期待。 一、300亿与150亿的“共生循环”:谁才是这场游戏的赢家? 试想一下,300亿美元,这几乎是许多国家一年的GDP!Anthropic承诺用这笔钱,在未来十年内购买微软Azure的云算力额度。这个数字背后,折射出训练下一代前沿AI模型所需计算资源的天文数字级成本。现在,AI模型已经变成了彻头彻尾的“算力吞金兽”。 而作为回报,英伟达的100亿美元和微软的50亿美元,共计150亿美元,以股权注入的方式立刻送到了Anthropic手中,为它接下来的“算力大胃王”计划提供了至关重要的资本。 明眼人已经看出了门道:这笔交易是一个精妙的“共生流动性循环”。 微软投资出去的资本,有一大笔会以Anthropic购买算力的形式,“回流”到自家Azure部门。 这简直是玩了一手“左手倒右手”,既加速了数据中心建设,又锁定了长期租户。这种模式与当年微软对OpenAI的合作如出一辙,堪称资本与算力的乾坤大挪移,Azure才是最终极的赢家。 二、算力饥渴与“双云策略”:Anthropic的生存之道 Anthropic为何需要如此不惜血本?答案很简单:下一代模型的算力饥渴症。 若想在与OpenAI的GPT-5和谷歌的Gemini的军备竞赛中不掉队,就必须拥有数万块GPU协同运作的集群超算能力。通过与Azure结盟,Anthropic不仅确保了优先使用微软先进的超级计算架构——包括最新的英伟达Grace Blackwell和Vera Rubin系统,更重要的是,它彻底告别了此前“单吊”亚马逊AWS的旧模式。 虽然Anthropic仍与亚马逊保持关系,但对Azure的300亿美元承诺,标志着其基础设施战略正式转向“双云策略”。这一下,Anthropic不仅降低了“供应商锁定”的风险,还借此成为微软口中“横跨全球三大主要云服务平台的唯一前沿模型家族”,这分布优势简直是降维打击! 有网友评论道,若其他替代方案(如亚马逊Trainium)真具备竞争力,市场绝不会出现如此一边倒的战略抉择。归根结底,在AI算力这场竞赛中,性能决定一切,而英伟达目前已遥遥领先。 三、老黄的100亿“对冲”与“化敌为友”的哲学 此次联盟中角色最耐人寻味的,非英伟达莫属。黄仁勋大手一挥,甩出100亿美元,去资助OpenAI的“头号刺客”。 这看起来像是一出“资敌”戏码,但老黄的算盘是保住市场主导地位。无论Anthropic的Claude还是OpenAI的GPT-5最终在软件层面上谁更胜一筹,只要它们都需要最顶尖的GPU来训练和推理,那么对Blackwell和Rubin GPU的需求就将是永恒的。 这100亿是对抗谷歌、亚马逊自研芯片崛起的“防御性举措”。老黄用真金白银投票,确保英伟达硬件始终是AI时代的行业标准。 更戏剧性的是,仅在数月前,黄仁勋和Anthropic CEO达里奥·阿莫代伊还在公开场合就AI的社会影响、芯片出口等问题“隔空互怼”,几乎是水火不容。现在,金钱和战略需求成功弥合了哲学分歧。阿莫代伊在该联盟下构建的算力集群将全面基于英伟达最新架构,一句“现在你的业务就像坐上了火箭”,将两位曾经的对手拉上了同一艘巨轮。 四、原生集成与“多模型护城河”:微软的终极野心 对微软而言,这场交易不仅仅是锁定收入,更是执行其“多模型护城河”的宏伟战略。 今年9月,Microsoft 365 Copilot开始通过托管在AWS上的标准API提供Claude,数据不得不跨越云端边界。但这次,Anthropic的模型将原生地规模化运行在Azure基础设施上。这意味着,开发者通过Microsoft Foundry和Azure AI Agent Service使用Claude Sonnet 4.5、Opus 4.1和Haiku 4.5时,延迟将显著降低。 企业客户也能更有效地应用Azure的合规性和安全控制。这种深度整合,对于Microsoft 365中的“研究员”等需要复杂多步骤推理的智能体至关重要。 此外,这种整合还利用了双方共同开发的模型上下文协议(MCP)。该协议标准化了AI智能体连接数据的方式,使Claude能够无缝对接微软庞大的企业生态系统。 通过同时在Azure上托管OpenAI和Anthropic的模型,纳德拉将Azure打造成了AI时代的“中立电网”,一个“淘金路上的卖水人”。这不仅保护了微软免受过度依赖单一提供商(如OpenAI去年领导层动荡)的风险,而且能确保用户始终拥有“最趁手的工具”。 无论是企业想用GPT-5的广博知识,还是Claude的专业推理,最终的计算收入都会流向Azure。 五、OpenAI的影响力被“稀释” 对于OpenAI来说,这无疑是被“自家人”削弱了议价权。 多年来,OpenAI作为微软的旗舰AI合作伙伴,享有无可撼动的特殊地位。但Anthropic承诺的300亿美元云服务支出,加上英伟达的100亿美元战略对齐,表明微软正在建立一个平行的创新和部署渠道。OpenAI对微软AI版图的影响力,已不再是“独一份”。 英伟达对Anthropic的深度合作(共同优化Claude在英伟达硬件上的性能),更是OpenAI从未在公开层面获得的整合待遇。这可能意味着,在获取尖端GPU资源和定制化方面,Anthropic获得了“优先通行证”。 但微软AI首席执行官穆斯塔法·苏莱曼在8月表示,"我们的目标是深化合作伙伴关系,确保我们与OpenAI在未来许多年保持良好的合作",这表明了一种多元化而非替代的战略。 写在最后 450亿美元的超级联盟,宣告了AI领域的竞争,正式从“一超多强”迈向了“群雄逐鹿”的新阶段。 旧的秩序正在瓦解,新的王座正在铸造! Anthropic已经靠着这张天价“船票”,获得了与OpenAI、谷歌平起平坐的资源保障。 我们正站在一个技术和资本狂飙突进的十字路口! 面对这种史诗级的格局重塑,你,还坐得住吗?(小小)