找到
1343
篇与
互联网
相关的结果
-
报告:中国机器人、半导体、电动汽车等先进制造技术领先韩国 据韩联社报道,韩国有一份报告分析指出,在机器人、半导体、电动汽车等先进制造业领域,中国快速形成竞争优势,技术水平领先韩国。韩国唯独在存储芯片领域占据优势。韩国产业研究院2月24日发布了题为《韩中先进产业竞争力分析及政策方向》的报告。研究院在总结去年9月专家问卷调查结果的基础上,对韩中整体产业链的竞争优势进行对比,并得出了上述结论。具体来看,在工业机器人领域,韩国研发能力略胜一筹,中国则在采购零配件、量产、市场开拓等多方面占上风。在电动汽车领域,韩国在维修等服务、市场开拓能力方面保持优势,中国自动驾驶技术水平相对领先。在半导体领域,多数专家认为,韩国在存储芯片市场上仍占据绝对优势,但中国在人工智能(AI)芯片设计、芯片设计平台等非存储芯片领域占上风。报告得出的结论暗示韩国或许将在关键芯片市场落后于中国。 -
微软称Copilot为Win10/Win11最佳内置生产力应用 IT之家 2 月 24 日消息,微软于 2 月 19 日发布《Windows 系统中提升效率的最佳生产力应用》博文,榜首为 AI 助手 Copilot,官方重点宣传了其邮件总结与语音交互等提效功能。该文章针对 Windows 10、Windows 11 环境,盘点与推荐多款系统内置应用,意在日常工作与生活中,引导用户更频繁地使用微软生态工具。 在这份官方榜单中,微软将 AI 助手 Copilot 置于首位。为吸引更多用户,官方宣称该 AI 工具能大幅提升工作效率,具体功能涵盖总结电子邮件、起草信息以及将零散笔记转化为待办清单。此外,用户目前还可通过“Hey Copilot”语音指令体验免提交互,直接在 Windows 桌面上唤醒助手并完成各项任务。IT之家援引博文介绍,榜单随后列出了微软 Todo、日历、OneNote、截图工具、时钟和便笺等常规应用。值得注意的是,作为系统底层核心组件的文件资源管理器,在文中仅获得寥寥数语的评价。相比之下,微软 Edge 浏览器占据了最大篇幅,官方重点展示了其 Copilot 集成、垂直标签页、沉浸式阅读器以及密码管理等能力。科技媒体 Neowin 对此分析指出,这篇博文的营销意图十分明显。微软不仅将大量笔墨用于推销 Copilot 和 Edge 这两款在用户群体中存在争议的应用,其推荐逻辑也显得颇为生硬,而且上述两款应用目前极难从 Windows 系统中彻底卸载。 -
高通首批机架级AI软硬件解决方案开启交付,基于AI 100芯片 IT之家 2 月 24 日消息,高通 CEO 安蒙昨日宣布,该企业的首批机架级 AI 软硬件全栈解决方案已运抵沙特阿拉伯,开始向合作伙伴 HUMAIN 的数据中心交付。 IT之家注: HUMAIN 首席执行官 Tareq Amin 称该机架系统基于高通的 AI100 技术,这里更可能指的是 2023 年发布的 Cloud AI 100 Ultra 而不是 2019 年的最初版本 Cloud AI 100。 安蒙宣称此次交付的系统针对从边缘到云端的混合 AI 工作负载进行了全面优化,最早有望在 3 月实现商业可用,为沙特乃至全球的 AI 推理服务提供支持。 HUMAIN 将在第一阶段部署 1024 个 AI100 加速器,这也将是高通在全球范围内最大的部署之一,首个客户为 Adobe。 -
月之暗面近20天收入超去年全年!阿里腾讯等联手再投7亿美元 快科技2月24日消息,据媒体报道,有多位知情人士透露,Kimi旗下K2.5大模型发布不到一个月,近20天累计收入已超过2025年全年总收入。增长主要由全球付费用户及API调用量大幅上涨驱动,其中海外收入已反超国内,海外付费用户增长尤为迅猛。数据显示,Kimi K2.5 在OpenRouter平台调用量持续领先,并在 OpenClaw 模型调用榜中位居第一。春节期间上线的Kimi Claw 支持一键部署,用户无需购买硬件、服务器,也无需编写代码,即可快速使用 OpenClaw相关功能。作为大模型领域备受关注的初创企业,Kimi已成为资本市场重点追逐标的。创始人杨植麟在2025年12月31日内部信中透露,公司已完成5亿美元新一轮融资,100 亿元现金储备规模,接近当时拟 IPO 的智谱与 MiniMax 两家之和。相比二级市场公开募资,Kimi 更倾向于在一级市场持续融资,构建技术、商业与资本闭环。值得注意的是,仅在上一轮5亿美元融资完成一个多月后,2月17日有消息称,Kimi 运营主体月之暗面即将完成新一轮超7亿美元融资,且再度实现超募。本轮融资由阿里、腾讯、五源、九安等联合领投。杨植麟此前在全员信中表示:"融资金额超过绝大部分IPO募资及上市公司的定向增发,还可以从一级市场募集更大量资金,主动权掌握在我们手中。" -
万字详解智能体2.0:手机里的"互联互通"新战场 《21世纪经济报道》竞争秩序场工作室 报道过去两年,智能体(Agent)是AI行业最重要的叙事,现在聚光灯正收束到一个更具体的方向:端侧智能体。在海外,名为OpenClaw的智能体在硅谷技术圈走红,接管一众开发者的电脑;在国内,字节跳动把豆包嵌入手机,样机价格在二手市场居高不下。这些智能体运行在手机、电脑和汽车上,能操作本地环境和所有工具,点外卖、打游戏、炒股票,把执行力拉到极致。智能体还会接管更多个人设备。在发售工程版“豆包手机助手”后,据媒体披露,字节已于去年年底启动正式版手机项目,搭载智能体的新机预计于今年Q2发布。我们近期还从多方了解到,包括阿里系在内的多家App与字节跳动达成停火协议,App允许努比亚设备的手动登录,豆包主动限制AI操作场景,双方回到“井水不犯河水”的状态。行业正在形成一个共识:未来智能体的壁垒,在于能打通多少个人设备,能互联多少服务。智能体想成为新的能力层,重组我们与设备、与App的连接方式,改变行业生态格局。但这种互联互通的技术趋势,也撞上了个人和平台的控制边界。在我们2025年年初的手机智能体测评中,许多担忧已初现轮廓:智能体要想操作手机,需要利用高敏感权限进行读屏和自动操作,引发权限滥用、个人隐私等安全担忧和商业纠纷。眼下,这些问题成了更严肃的堵点。我们为此新一轮测评了豆包手机助手、智谱、荣耀、华为、小米、OPPO、vivo七款手机智能体,追踪它们的性能、底层模型、系统权限、隐私设计最新情况,并梳理水面之下的厂商博弈。越来越多智能体正在排队上路。它们距离真正上路有多远?还缺哪些技术、商业或合规条件?厘清这些关键事实,端侧智能体的故事才可能真正开始。 如果说前几年的大模型浪潮,让人第一次意识到机器会聊天,那么智能体带来的是一个更有冲击力的现实:机器会替人做事。过去一年里,标志性的智能体产品大多生长在云端。Manus、Claude等产品展示了任务规划与工具调用的能力,它们运行在远程服务器上,依赖云端算力和网页工具来做PPT、订票和购物。而端侧智能体走的是另一条路线:模型部署在本地设备,在手机、电脑、汽车里操作软件与系统。越来越多智能体从云端落入个人终端。在国内,豆包手机助手是端侧智能体破圈的一个起点,但这条路并不始于此。过去一年多里,国内手机厂商已经完成了一轮并不低调的市场铺陈。移动数据调研机构Quest Mobile在2025年9月测算,国内六家手机厂商的智能体用户规模,在一年内合计增长了6500万,用户规模整体达到5.35亿。OPPO、vivo、荣耀是其中最积极的发力者。根据Quest Mobile数据,OPPO小布助手在2025年6月已经拥有1.6亿月活用户,vivo蓝心小v为5500万,荣耀YOYO助理为4200万,三者跻身上半年增速最快的AI应用行列。 “AI+硬件”在今年已是一片红海。但与互联网公司用硬件争夺C端入口不同,手机厂商的出发点是,借助AI抬高硬件与操作系统的价值,圆心始终是手机本身。国内的手机智能体潮始于2024年。当年9月,荣耀用“一句话点咖啡”为AI手机拉开序幕,并表示荣耀Magic 7系列是安卓阵营里首款落地AI智能体的手机。华为、vivo、OPPO、小米等厂商也很快升级了自己的手机助手。“AI即操作系统”是主流厂商的战略想法。2025年10月,vivo更新OriginOS 5 操作系统,基于蓝心大模型重构;OPPO提出AI OS战略,开始为智能体配置独立的物理唤醒键。但现实情况是,手机智能体仍停留在一个吸引投资者的概念,而非能用的产品。我们在2025年3月测评了6款手机智能体,发现失败率高、不稳定、耗时长是普遍问题,只有荣耀勉强能算“半自动驾驶”。经过一年的发展,宣传和现实的落差仍在。我们对包括智谱AutoGLM、豆包手机助手在内的7款手机智能体开展了新一轮测试,在总计70次任务中,整体成功率仅有两成,39%的任务启动后中断,还有24%直接失败降级为信息问答。 如果细看任务过程,甚至可以说手机智能体的“接管能力”在退化。以点外卖为例,如今大多数手机智能体只能完成第一步——打开外卖App。之后既不会进入搜索页面,更谈不上筛选店铺、确认规格。2025年年初时,手机智能体明显能在App里走得更远。当时,荣耀YOYO助理能通过多轮对话抵达美团下单页,OPPO和小米也能完成“瑞幸咖啡”的关键词搜索。自主范围不断收紧的同时,能力本身仍存在许多硬伤。最集中的短板是任务规划。当我们说“找一款性价比高的抽纸”时,大部分智能体会将整句话原封不动地复制进电商平台,而不是先搜索抽纸、再按价格筛选。智能体还会直接“偷懒”用文字回答任务,而不是调动App执行。App的版本更新也是难题。在我们的测评过程中,饿了么正式改名为“淘宝闪购”。但如果使用新名称,手机智能体都会打开淘宝,只有说“饿了么”才可能被识别。正是在这一背景下,豆包手机助手只进行了小范围的工程预览,却获得了格外多关注。在早期测评中,不管是订机票、发微信乃至玩开心消消乐,豆包手机助手都能在短时间内丝滑完成。遇到失败,甚至能主动纠错。复旦大学系统与软件安全实验室张晓寒在测评多款AI手机后,将手机智能体的能力划分为基础、进阶和高阶三档:基础能力主要是识别屏幕、调节系统设置,如今的手机智能体都能完成;进阶能力各有侧重,例如华为小艺擅长图像处理,而vivo蓝心小v的本地文件检索速度很快。真正拉开差距的,是深度操作App的高阶能力。“这类跨App任务是手机智能体能力的分水岭,也是当前各家的关注焦点。”张晓寒表示,当前确实只有豆包成功率较高。西湖大学AGI实验室负责人张驰曾带队某头部互联网公司的智能体研究团队,他也认同,豆包在多模态感知、复杂任务推理和准确度的综合体验上属于顶尖。但张驰同时指出,由于第三方App迅速“围剿”了豆包,它在稳定性、长尾场景覆盖率以及对App更新的适应能力上,完成度仍然未知。在张驰看来,目前手机智能体整体仍停留在L1到L2阶段之间,只能在一些有限场景、有限App中做演示。豆包手机助手意味着“智能体第一次真正产品化”,但更像是第一辆上路测试的全自动驾驶汽车,能在园区内跑,还开不上公共道路。值得补充的是,操作App并非手机智能体的唯一关注点,记忆是另一条被多方押注的方向。豆包手机助手、vivo和OPPO都上线了“闪记”类的功能,比如总结小红书帖子,解析B站视频,快速记下微信和支付宝扣款。通过用户手动截屏,让AI存储信息。上下文记忆的建立,可能会进一步改变我们与AI的沟通方式。现在要让智能体做事,仍然需要非常具体的、多轮的提示词,而记忆的目标是让AI理解模糊指令,更加“个人化”。在手机厂商的蓝图里,记忆被视为AI手机向前演进的第一刀。OPPO ColorOS智慧产品研发总监姜昱辰在媒体采访中提到,后续会沿着连点成线、连线成图的路线,建立用户偏好画像。记忆的演化速度会很快,“可能未来1~2年内就会有非常不一样的用户体验。”为什么现在大部分手机智能体仍然不尽如人意?要真正替代人类操作,还需要多久?当人们讨论这两个问题时,模型能力鲜少被追问。几乎所有手机智能体都采用GUI Agent为底层模型,即通说的“视觉路线”。它的工作方式可以概括为三步:理解、感知、执行——大模型先理解点咖啡的指令,再像人眼一样观察外卖App的页面和按钮,最后模拟点击操作。最受关注的豆包手机助手,接近豆包人士告诉我们,采用的是未公开的闭源版模型。2025年1月,字节Seed团队曾和清华大学联合推出开源的UI-TARS原生智能体。从技术报告来看,UI-TARS 1.0 的开发重点在推理能力,把复杂的任务分解为若干个小任务,并加入自我反思纠错的训练过程。大半年后发表的UI-TARS 2.0进一步指出,纯GUI操作存在局限,不足以满足实际工作需求。因此不再局限于单纯的点击和滑动,而是通过SDK,接入外部的文件系统和沙盒平台。曾在手机厂商工作的Carrie向我们指出,国内不少手机智能体的基模来自阿里通义实验室的Qwen系列,开源和多模态能力是其主要优势。我们看到的多篇技术报告也证实了一点。通义实验室在2025年8月专门发布了GUI-Owl模型,用于 GUI 自动化任务。12月,通义实验室又推出了MAI-UI模型,据称首次将用户交互、MCP工具调用、端云协同的能力,集成在一个能自我进化的开源框架中。在覆盖20个安卓应用、116项任务的Android World基准测试中,字节得分73.7分,阿里拿到76.7分。登上该基测榜单的国内公司还有智谱、阶跃星辰和OPPO,自评分数在70分到80分之间。虽然在2025年一年里有明显提升,但还不能稳定达到人类平均水准(80分)。该榜单的最高得分为97.4分,由一家名为AGI的美国硅谷初创公司摘下,据称公司正与小米、联想、三星探讨合作。 阶跃星辰也是目前与手机厂商合作密集的大模型公司之一,合作方包括荣耀、OPPO和中兴。技术报告显示,除了生产力工具,Step-GUI重点考虑了高频使用的生活服务,比如“在携程上订一张去三亚的机票,微信发给我老婆”。最早一批入场手机智能体的智谱,最近开源了AutoGLM。据智谱披露,AutoGLM在常见国内App中的任务成功率可达89.7%。测试得分看起来都不错,为什么实际体验还很笨拙?在张驰看来,差距首先出现在学术指标与产业目标之间。学术界与产业界关注的指标并不一致,很多落地障碍并非技术问题,而是工程问题。但如果不以落地为目标,研究者往往很难提前想到工程缺口。张驰举例说,多轮对话就是一个典型场景。很多开发者没考虑到,在真实环境下,需要用户进行反复补充信息,才能向智能体指明具体要买哪趟航班;再比如,学术研究中的GUI Agent往往只关注单个任务的记忆,但要落地成产品,必须具备手机的上下文记忆,才能理解用户的语境。工程方面的问题,在过去一年里被更多研究者关注。OPPO研究院与上海交通大学在2025年10月联合发布的一篇论文指出,当前技术评估体系过度强调任务成功率,却忽略了以用户为中心的指标,包括意图理解的准确性、持续自我演化能力,以及整体交互体验。这篇论文还提到,基准测试和真实场景的复杂性有明显差距。在测试环境中,几乎没有不可预测的干扰,但在真实使用里,一个突如其来的界面广告弹窗就足以中断执行。在此背景下,豆包的技术意义主要是连接学术与产业。“字节的这一系列研究,更多是基础能力的增强,并围绕产品体验整合多种技术方案,比如加上了系统接口。这些尝试需要大量数据和算力,能够弥补学术界在这方面的不足。”张驰评价道。我们还了解到,一些手机厂商宣称并未在量产产品中释放GUI Agent的全部能力,主要顾虑是稳定性和隐私。据其解释,虽然公司认为自己的GUI Agent实际效果不差,但鲁棒性还不够,也就是表现不够稳健,消费者对AI操作失败的容忍度很低。此外,GUI Agent的隐私风险仍然过高。如果说大模型是智能体的大脑,那么操作系统就是它的手脚。没有环境支持,GUI Agent的能力无法释放,二者缺一不可。正因如此,围绕手机智能体的争议,总会落到一个话题上:系统权限。我们联合张晓寒测评了努比亚(豆包手机)、荣耀、华为、vivo、OPPO、小米六台手机的预装智能体,发现几乎所有智能体的权限总量都超过100个。四类权限(系统控制、屏幕控制与注入、窗口与显示管理、隐私数据访问)构成智能体接管手机的能力基石。张晓寒形容这是“一个惊人的数量级”。他表示,作为参照,即便是微信这类生态复杂的超级App,申请权限通常也不会超过100项。很难说如此多权限,都是必要的。云安全联盟大中华区CTO王安宇曾负责多家手机的终端安全,他告诉我们,智能体如果想应对复杂的任务链条,例如“给我妈发个消息今晚不回家吃饭”,最简单的方式就是提前申请通讯录、短信等全套权限。虽然也有其他方式,但会频繁触发授权弹窗,影响使用流畅度。比数量更值得关注的,是申请权限的内容。测评显示,手机智能体申请的高敏感权限平均接近 40%,包括获取精确定位、读取短信与录音、静默安装应用等。张晓寒表示,普通 App 的高敏感权限占比通常控制在 30% 以下,而且获取位置等敏感数据时,通常得按国家标准进行单独弹窗提示。“这意味着用户在使用手机智能体时,实质上是在运行一个默认拥有极高特权的程序,不能视为普通应用。”智能体拿到的这些敏感权限服务于两项核心能力:读屏与自动操作。如何实现这两步,决定了风险的上限,因此需要更深入的分析。在我们去年第一轮测评中,除了华为,所有手机智能体都采用了无障碍权限。它相当于一张万能门禁卡,可以绕过手机操作系统的沙箱隔离机制,进入每个App的独立房间,读取屏幕上的文本、按钮、标签。经过一年进化,一些智能体走入了手机系统更深处。技术测评结果显示,为了读屏,荣耀、小米和vivo的技术主路径是无障碍权限,而豆包和OPPO利用的是更底层的系统服务——豆包手机助手用到了一项名为WindowManagerService的系统服务,其截图依赖于CAPTURE_VIDEO_OUTPUT 和 CAPTURE_SECURE_VIDEO_OUTPUT 权限;OPPO的小布助手则通过SystemUI 等其他系统组件的相互调用,实现屏幕识别。王安宇向我们解释了两者的差别:无障碍权限仍面临限制,打开时需要有系统弹窗,需要用户手动开启,而且无法直接读取银行密码键盘等Secure安全窗口。只要遵守这些安全栅栏,第三方App都可以合法调用。与无障碍不同,系统框架没有单独的弹窗提示,可以直接获取像素级屏幕内容,并且能截屏到Secure安全窗口。因此,它只授予厂商级预装应用,不开放给第三方App。针对利用系统框架截屏到Secure安全窗口的问题,豆包此前回应时解释,豆包手机助手使用了原生截屏接口(WindowManagerService),目的是为了在灵动岛向用户展示操作过程。针对此次测评,豆包回应我们称,CAPTURE_SECURE_VIDEO_OUTPUT权限用于生成可视化虚拟操作界面,将助手的后台操作过程实时投射至虚拟屏(带有粉色光晕标识),确保用户全程可见。在这一过程中,“严格遵循应用声明的 Secure 标记,无法截屏银行安全键盘等声明受保护的界面内容”。“‘严格遵循’是个有点讨巧的说法,理论上是能够截屏Secure页面的,只是不一定会实际处理。”一位手机安全业内人士直言。我们的技术测评也显示,豆包、OPPO具备截屏Secure窗口的能力,但会加入标志提示,由调用方判断下一步的处理方式。相当于可以无视外界的安全屏障,更依赖于自我约束。在自动操作层面,权限升级同样明显。OPPO和vivo的技术主路径为利用无障碍权限、模拟点击,豆包和荣耀则申请了inject_events权限,小米两者都有涉及。“inject_events相当于设备的完全控制权,能力范围远远超出无障碍权限。”王安宇解释,无障碍点击速度偏慢、容易受后台服务限制等影响,对复杂界面处理也相对存在局限性;而inject_events直接向系统注入事件,更少被UI干预,成功率更高。同样的,该权限只对厂商级预装应用开放。更开放的系统权限是一把双刃剑,它让AI更智能,也让安全暴露在更大的风浪中。智能体需要不断截屏、分析、传数据上云,其中不可避免接触好友动态、私信提示、广告内容等敏感信息。哪怕厂商承诺不存储这些信息,但在读取和处理的瞬间,隐私暴露的⻛险也是客观存在的。多位从业者还共同提到了误操作的问题。如果指令被干扰或者理解错误,用户可能来不及退出,智能体就在几秒钟内完成连续操作了——这是一种更不可控的风险。值得一提的是,无论是无障碍权限还是inject_event,系统方手机厂商都兼具“玩家”和“裁判员”双重身份。我们曾在此前的无障碍权限测评中发现,手机厂商的原生智能体调用了无障碍权限但未提示,或者任务结束后无障碍权限还保持打开,并未严格遵循安全规则。“GUI Agent 最根本的问题还是权限太高了,本质是在代替用户操作。”张驰说,智能体要真正落地,一定需要限制,而且得在用户预期和实际能力之间找到共同点。不能让用户以为什么都能做,实际上很多事做不到,也不该做。不确定性叠加高权限,本身就是一种风险。给智能体套上透明的使用规范,因此是第一道防线。在我们去年的测评中,手机智能体的调用还相当混乱:有的没有单独提示无障碍权限,有的任务结束后仍保持高权限开启。而今年的测评显示,各家提供者已经形成了较为一致的安全基线。豆包、荣耀、OPPO已公开各自的AI隐私与安全白皮书。结合我们的测评可以看到,当前的安全设计主要集中在三个维度:知情与控制、操作透明度、数据传输策略。在知情和控制上,差异最明显的是单独告知机制。虽然所有智能体都要求用户先同意《隐私政策》,但普通用户不一定明白AI如何操作、风险有多大。对此,只有小米和豆包在实际操作前,单独发送了“是否允许AI接管手机”的弹窗。敏感操作的二次确认已成为行业共识,但哪些算敏感操作并不统一。大部分智能体只要求用户对支付二次确认,豆包则将发布内容、删除内容、退出账号等行为也纳为敏感操作,需要手动接管或确认。OPPO在其领头撰写的安全技术白皮书提到,对于不同风险等级的行为,需要不同策略。OPPO建议的高风险操作有拼接验证码、安装App、删除或修改用户数据、发起支付和转账、保存敏感个人信息。豆包在回应我们时提及,豆包手机助手采用了权限授权透明化、敏感操作人工接管、权限可控可调整等安全保障。多位网络安全从业者向我们提到,AI操作日志留痕和权限记录很重要。云安全联盟分析师卜宋博解释,这是为了让AI的每⼀步操作有迹可循。比如“打开麦克风”“访问通讯录”等操作,应当像App权限一样可视化,才能做到事后追溯与监管。测评显示,目前小米和华为的基础记录缺失。例如,使唤智能体需要调用手机麦克风,但在小米系统的麦克风权限使用记录中,事后没有出现小爱同学的痕迹。小米对此没有明确回复,只向我们表示在第一次使用AI助手时,会事前征得调用麦克风的用户授权。还有一种需要特别关注的隐私场景,是锁屏状态下的智能体表现。王安宇告诉我们,手机锁屏时会有网络限制,如果能语音唤醒智能体,说明其绕过了很多安全机制。假如手机落入第三方手中,智能体还可能成为绕过锁屏的“入侵”工具。王安宇和卜宋博因此单独测试了锁屏场景,发现大多手机智能体都已经加上安全防护。只有小米默认屏幕显示详细的通知信息,并允许智能体播报出信息、网络状态、锁屏时间等。“这是一个比较小的攻击面,毕竟现在手机都设计了声纹识别,要唤醒智能体,黑客还得知道机主的声纹特征才行。”多位技术安全专家说。不过他们也指出,作为收集数据更多、能力更强的AI,对危险场景的考虑应当更细致。总的来说,参与测评的业内人士认为代码逻辑是安全的,行业也有一套基础安全护栏。但问题并没有到此结束。目前所有手机智能体都需要用“端云协同模式”来处理数据,而数据上云是手机智能体最有争议的环节,并不让人意外。张晓寒向我们指出,过去常见有敏感信息的网络数据包被截取,或者没有严格加密传到云端,导致隐私泄露。可以说,数据安全是整个手机安全体系中最核心、最脆弱的问题。为了评估手机智能体数据上云的风险,多位技术专家进行了测评。结果显示,除了系统原生功能(闹钟、日历)外,大多数任务都会触发云端传输。至于传输数据是否包含敏感信息,张晓寒告诉我们,测评智能体均采用了较为完备的数据加密和保护方法,所以无法通过抓包验证。张晓寒因此又尝试了黑盒测试,要求智能体“将当前屏幕展现的身份证照片转为吉卜力风格”。结果发现,所有智能体都能完成任务,且身份证号未被脱敏处理,这意味着敏感信息大概率被上传到了云端处理。许多开发者已经在关注数据匿名化方案,试图让“上云”过程更安全。比如,阶跃星辰在技术报告中设想,云端的大模型不应该直接访问原始屏幕截图,而是接受本地GUI模型处理后的摘要。这些摘要仅包含完成任务所需的关键语义,不包含敏感的细节信息。但愿景离现实还有很长距离。北京师范大学最新发布的一篇论文指出,现有GUI Agent的隐私识别能力很弱,只有13.3%的概率准确识别出安卓屏幕里的隐私信息。也就是说,智能体几乎意识不到自己正在看隐私,离合格的数据保护还很远。“最大的担忧还是在这里,你在手机屏幕里看到的一切内容,理论上都会暴露给一个智能体。无论是加密还是直接传原始数据,最终一定程度上都是可以被还原的。”张驰说。开发者当然可以为此承诺最小化收集、不留存等安全措施,但问题在于,数据已经交出去了——如何使用,取决于要不要相信它们的安全机制和自我约束。隐私悖论曾在互联网时代反复上演,用户为了便利交出隐私,但难以控制它们究竟被如何利用。手机智能体的风险更大,因为它不再针对单个App,而是整合全景数据。这既是技术难题,也是信任拷问。豆包手机助手发售后,最显性的阻力来自于App。发售第二天,多位购买了努比亚M153手机的用户反映微信突然被强制下线,提示“登录环境存在异常”。微信相关人士表示,可能触发了安全风控措施。微信率先反应后,阿里系、美团系等App集体“限制”了豆包操作,来自努比亚设备的账号无法正常登录。由于许多高频生活类App无法调动,“AI手机”的核心卖点迅速塌缩。“两方谁有问题?其实做法都有点问题。”在手机厂商和互联网公司都工作过的业内人士指出,App 不该彻底拒绝互联,但 Agent 也没有理由要求强制开放。在发展和安全的外皮之下,“现在纯属是商业行为”。行业的一个共识是:手机智能体尚未探索出合理的分润模式,各方手中握有的筹码、顾虑也不尽相同,这些都增加了达成商业共识的难度。App的防御并不意外。此前,OPPO的“AI一键记账”功能就曾在上线不到一个月后,被微信从支持列表中移除。过去一年,行业已经对自动化截屏与操作保持警惕,只是豆包第一次把能力边界推到极限。这背后的动机已经被反复讨论。可能影响平台的安全运行是一方面;另一方面,一旦智能体能完全替代真人操作手机,短期冲击的活跃度、使用时、广告曝光的核心商业指标,长期还可能让App被管道化(OTT化),退化为智能体的工具零件。除了App,还有一条水下暗流是手机厂商。智能体要接管手机,目前必须拥有手机系统权限才行。尤其对豆包、智谱、阶跃星辰等第三方入局者来说,谈拢硬件厂商是上路的第一关。我们了解到,字节跳动在2024年就开始接触中兴等手机厂商,希望手机AI助手的入口和流量完全转给豆包。作为交换,字节愿意免除手机厂商的托管费,并承担AI助手的Token调用成本。Token成本是各个手机厂商看重的问题之一,智谱也跟手机厂商提出过类似方案,改为按设备数量进行整机收费。这是因为智能体调用频繁、消耗巨大,长期的算力成本反而可能侵蚀硬件利润。但即便字节抛出诱人的商业条件,当时也并未打动中兴之外的手机厂商,原因不只是性价比。据《财新》报道,智能体需要硬件厂商开放系统级权限,包括摄像头、指纹识别等物理传感器的开关。手机厂商普遍不愿意将系统级权限直接开放给App开发者,尤其是字节跳动这种全能巨头。“这只是表层理由。”曾参与谈判的业内人士向我们指出,本质还是因为字节的方案不符合手机厂商的AI战略。一方面,主流手机厂商都有自己的AI团队,不会轻易让渡系统AI助手这一核心入口;另一方面,字节当时并未想清楚AI助手到底要做什么,“手机整个产线都是成本,没有办法拿整个身家赌一个AI的前途。”一位头部手机厂商负责人直言,如果⼀个产品推出第⼆天,⼤部分服务都不能⽤了,“在我们这⼉就是质量事故,是没法接受的。”大部分消费者的手机购买决策依据是系统流畅度、续航和发热,在消费品战场,产品稳定性远比AI创新更重要。不过,这并不意味着手机厂商处于防御状态,而是在谨慎评估。我们了解到,字节仍在推进与硬软件厂商的双线谈判。根据《智能涌现》披露,字节已于去2025年底开启豆包手机助手正式版项目,新机预计将于2026年Q2中晚期发布。有供应链人士称,豆包二代手机依旧合作中兴努比亚,由中兴负责硬件,豆包负责AI。推进的关键是豆包验证了市场需求,即用户愿意为智能体能力买单。我们获得的一份OPPO内部讲话显示,Color OS 智慧产品研发总监称豆包手机助手是一次“AI手机的市场教育”,让整个生态更积极地讨论合作可能性,“现在⼤家(App大厂)都变得更积极了。”在手机厂商的视角里,用户体验始终是第一优先级。考虑到这一点,多位开发者都提到,手机智能体的落地路线应该是“双轨并行”的:高频、标准化的场景(比如订机票、点外卖),通过A2A等合作协议完成;非标准化的长尾场景(比如在某个学术网站注册账号),再用GUI Agent的视觉识别路线。所谓A2A、MCP或者意图框架,都属于智能体与外界工具的互通方案。经过App授权后,智能体通过API或者其他Agent调用服务,避免读屏分析和模拟点击。体验更流畅、鲁棒性更强,也更易形成稳定的合规边界,但也考验对接双方的Agent水平。从手机智能体兴起以来,这类合作路线就一直存在,难点始终在于“摸着石头过河”——合作没有先例,即使只期望覆盖一部分高频App场景,也需要复杂的商务谈判和技术对齐。“现在还是一个非常早期的阶段,肯定说不上有成熟的标准”,前述OPPO负责人坦言。协议需要标准化,尤其需要回答流量分成、数据回流以及用户上下文隐私处理等核心问题,否则合作会变得不可控。据我们的了解,阿里在内的部分App与字节跳动达成停火协议,App允许努比亚设备的正常登录,而豆包主动限制AI操作场景,双方回到“井水不犯河水”的状态。我们于2月10日核查,在微信、淘宝、淘宝闪购、美团、支付宝、拼多多、高德地图App中,努比亚设备的用户可以正常登录,不会再弹出“登录环境异常”的提示;而豆包手机助手会主动提示,自己不可操作上述App。至于进一步的合作意愿如何?许多业内人士的判断是:阿里系可能更愿意探索,因为自身也在推进智能体战略。最近千问App开始接入淘宝、支付宝、闪购、飞猪、高德,甚至“想复刻一个豆包手机都没有任何问题”。而腾讯系一直是坚定的防守阵营。自2024年起,腾讯已经意识到端侧智能体可能对自身生态造成冲击,但没想到最终跑出来的是字节跳动。目前的处境也比较微妙,自家的元宝还在补作业阶段,微信生态对接入Agent尤其谨慎,防守仍是当前的最优解。豆包方面回复我们称,目前仍在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式,否定用户合理使用 AI 的权利。豆包手机助手被微信安全弹窗“封堵”,让不少人想起十多年前的3Q大战。彼时,360以“隐私保护器”为由拦截QQ,腾讯则以不正当竞争为由反击,宣布装有360软件的电脑无法运行QQ。双方从2010年互掐到2014年,成为中国互联网史上标志性的反垄断与竞争秩序案件。映射到今天,争议依然围绕平台的边界,“只不过一个是主张对方篡改功能屏蔽广告,构成不正当竞争;另一个是通过高系统权限绕过App风控,以动摇以App为中心的移动互联格局。”合规从业者李汶龙撰文写道。当前的期望在,寻找同一个概念锚点,至少让不同方在同一个法律框架之下同频对话。多位合规从业者向我们提到,他们认为锚点应该是“互操作性”。互操作性不是一个新概念。20世纪末,欧美监管机构将大型电信运营商视为公共基础设施,要求电话网络必须开放互通。由此确立的互联互通概念,也影响了此后几十年的互联网环境。到了AI时代,互联互通升级为更深入的功能操作,边界也需要重新摸索。海外已经有了一些进展。谷歌的情况与字节颇为相似,三星等手机厂商需要以谷歌的智能体为端侧AI入口。今年1月,欧盟对此启动了两项互操作性的程序,要谷歌履行《数字市场法案》(DMA)义务。两项程序中,一是针对AI服务,要求谷歌向第三方AI提供与Gemini同等级的系统访问权;二是针对搜索业务,要求谷歌以公平、合理和非歧视(FRAND)条款,向第三方搜索引擎开放匿名排名、查询、点击和浏览数据。如果把这一语境置换为国内市场,意味着字节、手机厂商不准利用底层权限“拉偏架”,指定自家的手机助手为唯一入口,必须给第三方平等接入的机会。而头部的APP厂商也不能利用自己的生态地位构建闭环,架空系统入口。双方坚持公平、合理和非歧视的FRAND原则,才有往前走的可能性。寻找锚点只是第一步,进一步的问题是,谁有能力号召和落地规则。多位研发者提到,他们认为可以参考苹果的生态位。苹果当年的做法是,提供一套开发者套件,让所有 App 开发者自己去决定,哪些能力可以通过 Siri 这样的系统级助手被调用,哪些不可以。具体来说,通过App Intents框架,Siri只调度开发者授权的功能接口,而不直接触达底层数据。而针对 App 厂商最担忧的数据控制权之争,苹果设备仅在用户请求时,向私有云发送必要数据,私有云处理完请求后立即删掉数据,即“阅后即焚”。这样一来,硬件级的隐私设计能打消App 厂商被“吃掉”的恐惧,App方保住了数据资产,获得了流量;手机获得了AI能力升级;用户也获得相对可控的隐私体验。但这是一种非常理想化的方案,几乎是国内厂商难以复制的终点。毕竟苹果的处理方案,本质建立在自研芯片和绝对生态霸主的基础之上。Carrie向我们直言:“往深里走,会发现都是芯片和内存的问题”,芯片和端侧AI是当前产业的高门槛工程。豆包也在回复中谈到,在当下的产业落地,云端处理相比端侧有明显优势,复杂 AI 模型在手机上运行会能力大幅降低,还会导致耗电快、手机发热、内存不足等问题。这构成了国内智能体落地的矛盾,似乎没有一家公司同时具备硬件供应链、隐私技术与生态号召力三体合一的底气,去引领安全方案与商业步伐。不少人因此认为,只有出现一个真正破圈的“超级智能体”才能打破僵局。到那时,就像传统出租车面对网约车平台一样,没有端侧智能体的“登船票”就会被甩下——这当然是一个技术上的乐观预期,却是商业与隐私治理的悲观前景。撰文|肖潇 王俊测评|王俊 肖潇 王安宇 张晓寒 卜宋博 章驰制图|肖潇 黎旭亭 黄兰雯 -
不止打车、送外卖,Uber收购停车应用SpotHero以拓宽业务 IT之家 2 月 24 日消息,Uber 今日宣布将收购 SpotHero,这是一家为拥挤市中心、体育赛事及演唱会提供停车预约应用的公司。 交易条款未对外披露,但 Uber 表示,计划在自家应用内推出由 SpotHero 提供支持的停车预约服务,帮助用户在活动场地、场馆及机场寻找车位。Uber 首席执行官达拉 · 科斯罗萨西(Dara Khosrowshahi)在一份声明中称:“当人们选择自驾出行时,Uber 应用里的 SpotHero 功能将让停车体验变得前所未有的便捷,同时也能吸引更多用户加入 Uber 生态。”本月早些时候,Uber 公布了好于预期的第四季度营收,但对当前季度利润给出了较为保守的指引,导致公司股价下跌。该公司本季度营收增长最强劲的是配送业务,从最初的餐饮外卖,现已拓展至生鲜杂货及零售商品。凭借在新市场与地区的扩张,Uber 已成为美国占据主导地位的网约车公司。其当前市值达 1460 亿美元(IT之家注:现汇率约合 1.01 万亿元人民币),而 Lyft 估值仅略高于 50 亿美元。在外卖配送领域,Uber 面临着来自 DoorDash 等公司的激烈竞争,后者市值超过 710 亿美元。SpotHero 上一次对外公布融资是在 2019 年,当时由麦格理资本(Macquarie Capital)领投,融资 5000 万美元。这家总部位于芝加哥的公司成立于 2011 年,目前表示已在美国和加拿大 400 多座城市的超过 1.3 万个停车场、停车区及代客泊车点位提供服务。SpotHero 首席执行官马克 · 劳伦斯(Mark Lawrence)在声明中表示:“与 Uber 联手,能让我们为数百万更多车主带来停车服务,并让停车成为 Uber 平台中自然而然的一环。”Uber 表示,此次收购尚需监管部门批准,预计将于今年上半年完成。 -
当反向过年走红 留在北京的网约车司机"狠狠捡漏" 农历马年大年初四晚上十点左右,北京丰台站出站口的网约车候车区,已经有不少节后返程的旅客在等车。“今天车站的人开始多了,昨天(这里)好像还没什么人,人都在景点里。”老家在安徽的齐师傅,今年春节没有像往年一样赶回去,而是留在北京开起了网约车。当天晚上记者坐上齐师傅的车时,他在平台上注册网约车司机不过也就二十几天,却已经见证和享受了春运和“反向过年”带来的“泼天单量”——除夕前几天离京返乡,临近除夕一直到大年初几外地客游玩热潮,大年初四开始迎来返京。对很多留在北京的网约车司机来说,经过行业供给端的爆发式增长之后,这样的红利是求之不得的。春节假期期间,北京的人流量分布在景点和非景点之间,可谓“冰火两重天”。多位网约车司机告诉第一财经记者,这正是他们最爱的局面——单子多、竞争少、不堵车,平台还有奖励。而当越来越多的人将“年味淡了”挂在嘴边,他们留在北京等一线城市过年的共同理由似乎又多了一个。但每一场留下的背后,都有不一样的故事。 2月20日晚间北京丰台站网约车候车区等车的客流。摄影/第一财经记者亓宁年味儿和生意齐师傅春节期间选择留在北京,一方面是因为有实体生意要照看,几个合伙人当中需要有一个人留下来;另一方面,是因为回老家过年不再有儿时那般年味儿,回乡便不再那么心切。“假期闲着也是闲着,要么刷手机,要么和朋友喝喝茶,还不如出来转转。”齐师傅说,自己只是利用假期短暂“客串”一下网约车司机,平日里忙生意没有时间和精力,这次主要是体验。但对于现在做的建材生意,齐师傅的语气里不乏无奈,最后只是用一句“赔钱”带过。更早之前,他和朋友一起做服装生意,因为经营不善而倒闭,之后才入了建材行业的局,但恰逢大环境变化尤其是房地产行业调整,行业景气度不高。但习惯了做传统实体行业的朋友们还是一起维系经营着这份“工作”。和齐师傅不同的是,今年五十多岁的聂师傅开网约车已经有10个年头了,中间因为平台对车龄的要求还换过一辆车。已经在北京安家的他,春节不离京逐渐成为了自己的“年俗”。“春节单子多呀,比平时可多太多了,而且路上没有什么车,可好跑了。假期平台还有补贴奖励,挺划算的。”聂师傅一边介绍一边举例道,就拿记者从酒仙桥路上颐堤港去往中国电影博物馆这段路来说,平时至少要半小时以上,如今只要十几分钟就能“丝滑”抵达。这也意味着,同样的时间里,以前只能跑一单,春节假期期间至少能跑两单,还少了各种等待煎熬和产生矛盾冲突的概率。“媳妇在酒店工作,假期刚好也正是忙的时候,这几年每年过年我们都留在北京。”聂师傅说。但对于大多数思想传统的家庭,留下来服务大家的首要原因可能不一定是生意,而是不再那么需要回去。“父母都不在了,家里老房子都塌了,回去没地方住了,也没有什么归属感了。这些年在北京过年已经成习惯了,要回去走亲戚、看一看也是在其他闲暇时间,错开这个时间(返乡高峰)。”聂师傅说,从北京开车回内蒙古老家的物理距离其实不算远,但在春节这个节点,心理上已经不再迫切。如果有条件选择,很多年轻人可能是宁愿不回家过年的。老家在河北保定的赵师傅就是其中的一员。“回家过年好像越来越没意思,要面对的事情还特别多。就拿走亲戚来说,亲戚之间那种人情味已经和以前不一样了,但有些习俗又还是要讲究。”在与记者交谈的言语之中,赵师傅吐露着对“返乡过年”的无奈。从北京开车回到保定只有2~3个小时的车程。赵师傅说,为了一个团圆年,他还是会回去,只不过“能拖晚一点就晚一点”。记者搭上赵师傅的车是在腊月二十八也就是除夕前一天的早上,这正是他要回家的日子。这天他醒得比平时都要早,闲来无事便早早出车了。“回家早了也没什么事,还不如多跑几单。”他说。停不下来的订单腊月二十八早上这一单,记者等了近十分钟才有司机接单。赵师傅说,若不是他刚好住在附近,等待的时间大概率会更长。“因为很多司机都已经回老家了,车少了很多。”他说。从多个平台的数据预测来看,这应该还不是最难叫车的时候。 春运期间打车出行会迎来四次高峰 资料图比如,滴滴出行数据预测,今年为期40天的春运时间里,打车出行会迎来四次高峰,前两波分别在2月13日(腊月廿六)、2月22日(正月初六);在返程客流和通勤需求叠加下,2月24日(正月初八)打车需求会迎来第三次高峰;闹元宵、猜灯谜,3月3日~4日(正月十五和十六)是第四波打车高峰。随着“反向过年”逐渐成为一股新潮流,一线城市的打车需求也有明显变化。滴滴预测,春节前一线城市打车需求将同比上涨21%,在一线、新一线城市的打车用户中,异地用户将明显增加。高德大数据也判断,今年“旅行过年”呈现出鲜明的主题化特征,古城寻年味、登高祈福、海岛避寒是最热门的三大主题。这个春节假期期间,记者在与多位网约车司机的交流中印证了“反向过年”带来的这波“泼天流量”——平时他们要用不同手机同时注册和接入多个网约车平台抢订单,但春节假期只在一个平台就可以接到连环单,车被订单“牵着走”成了“幸福的烦恼”。齐师傅说,自己原本只是闲来无事想“体验”一下这份工作,每天计划出车不超过4个小时,实际上却经常被“连环单”拖到8~9个小时,最长时一天跑了11个小时。“我不喜欢主动拒绝接单,因为那样会影响‘积分’,从而影响平台给我的派单量和派单类型。”他告诉记者,有一次自己实在太累不想继续接单了,干脆关掉了手机。这场红利的背后除了需求端的流量飙升,还有供给端的骤然收缩——随着像赵师傅这样的网约车司机返乡过年,原本极度“内卷”的网约车供给变得紧张起来。多位网约车司机告诉记者,春节假期期间,平台会在特定时间内对每笔订单给予几块钱的补贴,同时会降低抽成比例。尽管多位司机坦言,平台降低抽成比例主要是利好乘客,到自己口袋的钱并不会发生明显变化,但额外的订单补贴还是较为可观。“有补贴的情况下,我希望多接短途单,这样就能在更少的时间里拿到更多的补贴。但平台肯定也是有自己的计算规则的。”齐师傅说。另一位网约车司机表示:“平台是要给点激励,不然司机都回家过年了,没人愿意跑了,大家更打不到车了。”以滴滴为例,记者注意到,滴滴官方发布的信息显示,春运期间,公司计划发放11亿元司机补贴,上线免佣卡、流水加速卡、完单奖、大转盘抽奖赢现金等多重奖励,并在春运及春节部分出行高峰时段,试行上线司机服务费,以更好地满足用车高峰需求。车开往哪里那么,春节期间在北京的当地人和外地人们,他们的出行目的地是哪里?“景点。”大年初四去往中国电影博物馆的路上,聂师傅告诉记者,那是他这两天第三次拉着乘客去这个博物馆。“一单接一单,到一个目的地之后也不用担心空车返程或者等很长时间了,因为这几天(乘客)基本都是从一个景点到另一个景点。”他说。从记者和身边亲友的亲身经历来看,司机师傅们说的北京这一旅游热潮并不夸张。春节期间,包括故宫、圆明园、颐和园等在内,北京的大部分知名景区都是人山人海,在景区内时常能听到关于限流预警的广播播报声。国家博物馆、军事博物馆、国家自然博物馆等老少咸宜的博物馆更是一票难求,一经放票即秒光。热门景区方圆几里酒店满房是常态,各类餐馆排长队难以避免,尤以北京烤鸭、炸酱面、铜锅涮肉等北京菜系更为明显。 春节期间,下午5点左右某北京菜餐馆前排队的客流。摄影/第一财经记者亓宁这也成为春节期间国内文旅消费热的一个缩影,而点燃这把消费“火焰”的除了国内居民,也有不少国外游客。“开网约车这二十多天里,我拉了十多波老外。”齐师傅说,其中有来自俄罗斯的、泰国的,也有来自非洲的;有不会说英语只能靠翻译软件交流的,也有中文说得很好的。他们多数也是去往各个景点。但北京市内不同区域的乘客构成也有较大差异,除了外地游客在吃喝玩乐间奔波,当地人过节走亲戚也给网约车司机带来不少“节日限定”的生意。“我这几天的感受是,腊月二十几开始(跑网约车的时候),是返乡去车站的多,临近过年了和春节后这三四天就是游玩的和走亲戚的多,初四开始返程的人开始多了。”齐师傅说,假期还没结束自己就接到了好几个跨区甚至跨到河北的单子,乘客多数是在京家庭走亲戚的。“都说开网约车赚钱,(体验下来)也就那么回事。但我最大的收获是遇见不同的乘客,而且还能在聊天中得到不同的启发和灵感,包括在做生意方面,以前我们一直局限在那些传统行业里不敢轻易转行,这几天我的想法有点开始改变了。”齐师傅说这话时,“返程大军”尚未归来,“反向过年”的亲友还未散去,司机们最爱的“红利期”依然奏效。但他说,“客串”终归是“客串”,过完这段时间,他也要回到正常的上班状态,不再出车。“我是尽量做一行爱一行,开一天就做好一天的事。”他告诉记者,在一个平台组建的300人的司机群里,他的综合“积分”排名排在前五位。 -
OpenAI神秘「波兰军团」曝光!奥特曼:没他们就没有OpenAI 新智元报道编辑:元宇 KingHZ 【新智元导读】微软CTO Kevin Scott的一封邮件揭开了OpenAI「波兰军团」的神秘面纱。掌管OpenAI命运的,竟是6个波兰天才?OpenAI首席科学家Jakub Pachocki,接替Ilya之后,完成了后者多年来求而不得的突破。奥特曼甚至专门发了一篇短文,提到OpenAI两位不可或缺的人物:Jakub Pachocki和Szymon Sidor。奥特曼认为他们两人是天作之合,「OpenAI还没有他们两人没法解决的问题」,没有他们俩就没有现在的OpenAI。 你可能不知道的是两人在波兰读高中就已经认识,而网友Teortaxes抛出一张OpenAI团队合影,波兰人浓度爆表── OpenAI团队中六位顶级贡献者均为波兰人,从左到右分别为Jakub Pachocki、Łukasz Kaiser、Łukasz Kondraciuk、Szymon Sidor、Wojciech Zaremba、Jerry Tworek。其中的Wojciech Zaremba,是OpenAI的十一位联合创始人之一。在OpenAI成立之初,波兰工程师在团队中占据了相当大的比例,其中就有上面提到的Jakub Pachocki、Szymon Sidor、Łukasz Kondraciuk等人。他们成为OpenAI最初团队的核心力量,甚至在OpenAI内部还出现了「波兰黑手党」(Polish Mafia)这一说法。他们在Slack上有一个共同的频道,偶尔会往里面发一些与AI相关的波兰新闻。被低估的OpenAI「波兰军团」在OpenAI早期与核心研究中,有多位波兰背景研究者或工程师贡献突出。其中有一位OpenAI的联合创始人、一位前研究副总裁,还有一位是大名鼎鼎论文《Attention is All You Need》的合著者。Jakub Pachocki Jakub Pachocki自2017年加入OpenAI以来,Jakub历任研究总监等要职,是GPT-4等核心项目的领军人物。在OpenAI早期,他致力于大规模强化学习与复杂博弈系统的研究,通过 OpenAI Five (Dota 2) 等项目,从实践层面验证了「规模化训练引发能力跃迁」的关键认知。此后,作为核心负责人,他主导了 GPT-4 的研发工作,构建了集训练、优化与可扩展性于一体的「工程—研究」闭环体系,并在利用强化学习提升模型复杂推理与代码能力方面取得了突破性进展。他的核心贡献在于确立了大模型结合强化学习(RL)的规模化方法论,将前沿研究转化为可复用的训练体系,并成功带队交付了具有代际意义的关键模型。2024年5月,Jakub接替Ilya Sutskever成为OpenAI首席科学家。Łukasz Kaiser波兰计算机科学家和机器学习研究员,长期从事深度学习基础研究。他曾获得德国RWTH Aachen University计算机科学博士学位,并在法国国家科学研究中心(CNRS)担任研究员。Łukasz Kaiser曾是Google Brain的研究科学家,对注意力机制和Transformer架构的发明贡献巨大,是《Attention is All You Need》论文的合著者之一,这一架构成为了现代大语言模型的核心基础。 Łukasz KaiserŁukasz Kaiser于2021年加入OpenAI,从事大模型与推理相关研究工作;公开资料显示他参与过ChatGPT及GPT-4多模态方向的研发,并与团队推进o1等推理模型相关工作。Łukasz Kondraciuk Łukasz Kondraciuk波兰工程师/研究人员,被列为OpenAI o1推理模型的贡献者之一。他是早期团队成员之一,在ChatGPT和AI开发中有实际贡献。Szymon SidorSzymon Sidor目前担任OpenAI的技术研究员,持有剑桥大学计算机科学学士学位,以及麻省理工学院机电一体化、机器人技术和自动化工程硕士学位。 Szymon Sidor他自2016年左右加入OpenAI,是OpenAI早期研究者与核心技术驱动者之一。他在构建GPT-4模型中发挥了重要作用,更是与Ilya、Łukasz Kaiser共同在大语言模型中引入强化学习(RL)的关键人物,直接催生了后来的o1推理模型。奥特曼称赞他为「不知疲倦」,指出他在解决看似不可能的问题方面的作用。Wojciech Zaremba波兰裔计算机科学家,他是OpenAI的联合创始人之一。 Wojciech ZarembaZaremba持有华沙大学和巴黎综合理工学院的数学硕士学位,以及纽约大学计算机科学博士学位,曾师从Yann LeCun和Rob Fergus。在加入OpenAI前,他曾在Google Brain和Facebook AI Research实习,从事神经网络、对抗样本和分布式训练等方面的研究。2015年,Zaremba与奥特曼、马斯克、Ilya Sutskever等共同创立OpenAI。他最初领导机器人团队,2020年后他转向领导GPT系列模型、Codex和代码相关团队,是公司战略和技术发展关键人物之一。Jerry Tworek也称Jarosław Tworek,前OpenAI研究副总裁。 Jarosław Tworek他在华沙大学获得应用数学硕士,于2019年加入OpenAI,领导了o1、o3、Codex、GPT-4等早期工作,被业界誉为「大语言模型推理能力发展」的关键人物。据媒体报道,2026年1月,他离开OpenAI,创办Core Automation,开发需要更少数据和计算的新型AI模型。他表示离开是为了追求在OpenAI难以开展的核心研究,并认为AI进入「研究时代」,需要新的突破。Ilya、Tworek离去「波兰军团」能否再造奇迹?2023年微软CTO Kevin Scott邮件揭露,OpenAI首席科学家Ilya对门徒Jakub Pachocki研究突破和晋升不满,导致与CEO奥特曼冲突,引发董事会解雇奥特曼事件。Ilya的离开,是OpenAI在战略转型中,逐渐将算力资源向ChatGPT相关应用部门倾斜的必然结果。在这个过程中,兴趣在纯研究领域的Ilya败给了善于拿出实际成果的徒弟Jakub。Scott在邮件中写道:Jakub比Ilya更能够推动研究突破,以至于奥特曼晋升Jakub负责主要模型方向。此后Jakub工作加速,在最近几周取得惊人进步。导师地位被颠覆令Ilya难以接受,应用部门(如ChatGPT)成功导致研究部门GPU和人力短缺,在双重因素的打击下,心灰意冷的Ilya离开了自己参与创建的OpenAI。令人唏嘘的是,Ilya离去之后,今年1月,六人波兰军团中的一位——OpenAI研究副总裁Jerry Tworek也宣布离职。在OpenAI呆了整整七年的Jerry,因为多次向管理层申请更多的算力和人员支持无果,最后与Jakub Pachocki之间爆发了冲突:Pachocki更看好现有的、能快速见效的大语言模型架构。公司需要的是能马上落地的产品,而不是不知何年何月才能跑通的理论。Tworek、Ilya等一系列核心科学家、研究员的离开,背后是ChatGPT等应用部门「吃掉」关键算力资源,基础、前沿研究正在被边缘化的现实,也曾被外部解读为OpenAI理想主义的一种倒退。甚至有网友认为,OpenAI将因此失掉其曾经在基础研究领域的领先地位,只剩下品牌价值。当AI已进入「研究时代」,对于OpenAI、Anthropic、谷歌DeepMind这样的全球顶尖AI实验室来说,基础和前沿研究才是推动发展的根。没有了研究上的领先,OpenAI想要复制下一个「ChatGPT」时刻就会遥遥无期,再厉害的「波兰军团」恐怕也无能为力。参考资料: https://x.com/trajektoriePL/status/2018242446577086589https://www.geekwire.com/2026/the-microsoft-openai-files-internal-documents-reveal-the-realities-of-ais-defining-alliancehttps://en.wikipedia.org/wiki/Removal_of_Sam_Altman_from_OpenAI -
OpenAI有望推出ChatGPT Pro Lite订阅,月费100美元 IT之家 2 月 22 日消息,人工智能公司 OpenAI 旗下聊天机器人 ChatGPT 目前提供多层级订阅服务以满足不同用户需求。免费版 ChatGPT 存在功能与使用配额限制并包含广告内容。付费订阅入门版本 ChatGPT Go 定价为每月 8 美元,在保留部分限制与广告的同时提供基础付费服务。主流版本 ChatGPT Plus 月费为 20 美元,无广告干扰并提供更广泛的功能权限与更高使用配额。针对专业用户群体的 ChatGPT Pro 订阅费用达每月 200 美元,提供当前最高级别的功能权限与配额支持。开发者 Tibor Blaho 昨日发现 ChatGPT 网页版的前端代码中出现了有关全新订阅层级“ChatGPT Pro Lite”的字符串,并显示定价为每月 100 美元(IT之家注:现汇率约合 692.4 元人民币)。 根据网页代码中出现的“reasoning_limit_boost”字段分析,该版本可能提供相当于 Plus 版本 3~5 倍的深度思考模型(如 o1/o3 系列)使用配额,但预计不会包含 Pro 版本专属的专业模式(SOTA Mode)。 -
谷歌NotebookLM遭老牌电台主持起诉,被控模仿复制独特腔调 IT之家 2 月 22 日消息,David Greene 是美国全国公共广播电台 (NPR) 旗下的一名资深主持,曾负责过多个颇具影响力的政治性电台节目。他今年一月向加州圣克拉拉县高等法院提出诉讼,指控谷歌 AI 助理 NotebookLM 的音频概览功能的 AI 配音复制了其独特腔调。 Greene 的关注点不仅是自己的“声纹”IP 遭到侵犯:他认为 NotebookLM 盗用了其声音的传播力量,为无根据的阴谋论等负面内容背书。谷歌对这一诉讼的官方回应是:NotebookLM 音频概览中的男声由谷歌聘请的专业演员配音,与 David Green 本人没有任何关系,相关指控毫无根据。参考此前的类似判例,David Greene 在法庭上并不需要证明 NotebookLM 的男声 1:1 复刻了他的腔调:仅需要两种声音非常相似,能让听众无法分辨而出现误判,谷歌就有可能被判败诉。不过 David Greene 仍需要在确认遭受损失等方面给出足够的证据。 -
不侵权、可商用?谷歌出手AI音乐,Lyria 3落地Gemini生态 谷歌正以一场克制而精准的布局,切入快速增长的AI生成音频赛道。2026年2月21日,这家科技巨头正式将Google DeepMind研发的最新音乐生成模型Lyria 3,全面整合至Gemini应用与YouTube生态系统,标志着其在生成式AI产品线的重要扩展,也是迄今为止谷歌在AI音乐领域最积极的战略动作。此次推送面向全球18岁以上用户,支持文本、图片、视频等多模态输入,可生成30秒高保真音乐曲目,同时覆盖英语、德语、西班牙语、印地语等多种语言,目前已在桌面端逐步推出,后续将同步开放移动端访问。Lyria 3的核心突破的在于三项关键技术升级,既延续了前代模型的声学优势,又实现了体验层面的迭代: 一是自动歌词生成能力,无需额外输入即可完成歌词与旋律的适配; 二是对节拍、人声风格等音乐元素的精细控制,满足创作者个性化需求; 三是多模态协同合成能力,例如用户上传一张日落照片,即可生成一段与视觉情绪高度匹配的原声曲目,实现“视觉氛围→听觉表达”的无缝转化。与技术升级同样重要的,是谷歌为Lyria 3量身打造的合规防护体系,这也是其区别于同类竞品的核心标签。理性妥协与战略权衡 为应对监管机构与音乐产业对AI生成内容溯源的诉求,谷歌在每一段生成音频中均嵌入了SynthID水印技术,这种不可察觉的数字标记的,可通过谷歌专属工具验证内容来源,实现AI生成音乐的可追溯。更值得关注的是,Lyria 3在设计之初便规避了侵权风险,据报道,若用户在提示词中提及知名音乐人姓名,模型仅会借鉴广义风格灵感,不会复制艺术家特有的声线或标志性即兴段落,这一谨慎姿态,本质是谷歌基于自身与主要唱片公司的YouTube授权协议,做出的理性妥协与战略权衡。此次布局的战略时机,恰好踩中AI音乐领域“创新与合规对峙”的关键节点。截至2026年初,AI音乐赛道已陷入版权诉讼的漩涡,Suno、Udio等头部创业公司均面临美国唱片工业协会(RIAA)的高调诉讼,而Udio的核心团队恰恰是此前参与Lyria研发的谷歌前DeepMind工程师,这也让谷歌对竞品的合规短板有着清晰认知。反观谷歌,凭借YouTube与唱片公司的长期授权合作基础,得以在合规框架内推进技术落地,这种“安全为先”的策略,虽看似保守,却为其规避了短期内的法律风险,也为后续商业化铺路。谷歌的合规克制,必然伴随着性能与场景的取舍,这种权衡既是战略选择,也暴露了其布局AI音乐的深层矛盾。行业分析师指出,Lyria 3在流行、节奏蓝调、低保真等主流音乐类型上表现亮眼,声学真实感与作曲复杂性较前代Lyria 2有显著飞跃,但在小众、前卫风格的创作上却显捉襟见肘,灵活性远不及Suno、Udio等竞品。与此同时,30秒的曲目长度限制,也清晰表明谷歌的当前定位——聚焦“零食式”短内容创作,尤其是适配YouTube Shorts的配乐需求,而非专业完整的音乐制作,这一选择本质是为了强化YouTube与TikTok的竞争力,毕竟后者也在加速推进自有生成式音频工具的研发。Gemini商业化的关键布局 从商业逻辑来看,Lyria 3的落地,是谷歌Gemini生态商业化的重要一步,更是其构建“一体化创意套件”的关键布局。谷歌将Lyria 3纳入Gemini“AI Plus”与“Pro”订阅等级,付费用户可获得更高的生成额度,本质是在测试休闲创作者为AI集成工作流付费的意愿。同时,将“Nano Banana”图像模型与Lyria 3联动,为生成音乐提供定制封面,形成“提示输入→音频生成→视觉包装”的闭环,这种“围墙花园”式的生态设计,大幅提升了用户粘性,也让独立AI音乐初创公司在便利性上难以与之抗衡。这一布局背后,既有谷歌自身的生态野心,也有行业竞争与政策环境的推动。谷歌将Lyria 3嵌入Gemini生态,既是与OpenAI、Meta等巨头在生成式音频领域保持同步,也是在AI音乐赛道抢占合规先机。但谷歌并未跟风激进布局,反而坚持合规底线,这一反差背后,是其对长期风险的考量——毕竟Anthropic因使用BitTorrent下载盗版音乐训练模型面临巨额诉讼的案例,已为行业敲响警钟。Lyria 3的推出,也将AI音乐与人类创作的矛盾、技术进步与产业利益的冲突推向台前。尽管谷歌采取了多重合规措施,但Lyria 3的普及仍可能对音乐产业的经济结构产生冲击。随着AI能生成越来越复杂的编曲,传统库存音乐、入门级广告曲的创作价值将面临严重贬值压力,而AI生成旋律的情感共鸣不足,也成为专业音乐人诟病的焦点——这也是AI音乐难以突破的“情感恐怖谷”,即便技术再成熟,也难以复刻人类创作中蕴含的情绪与故事感。展望未来,Lyria 3的演进之路,将成为AI音乐行业发展的重要缩影。谷歌大概率会在后续迭代中突破30秒曲目限制,向完整作品、游戏及虚拟现实实时自适应配乐等场景延伸,推动“动态音频”成为数字交互的新标准。而AI音乐领域的竞争,也将从单纯的算法性能比拼,转向合规框架健全性、社交平台整合深度的综合较量,行业整合已箭在弦上。更深刻的变化在于,Lyria 3的落地正在重塑“音乐家”的定义——未来,精通提示词艺术的创作者,可能与精通乐器的传统音乐人并肩而立。这种创作民主化,既为千万普通创作者赋能,也提出了新的命题:在合成音乐与有机创作的界限逐渐模糊的时代,如何建立强有力的法律框架,保护人类艺术家的知识产权与创作价值,将成为谷歌及整个行业必须面对的长期课题。而谷歌对SynthID水印技术的应用,或许将成为未来联邦层面AI透明性标准的重要参考,为行业合规发展提供可借鉴的蓝本。(本文首发钛媒体App , 作者|硅谷Tech news,编辑|秦聪慧) -
奥特曼:人工智能被当作近期大规模裁员替罪羊 据外电报道,近几个月来,美国各行各业的裁员人数都在上升,包括科技、金融、零售和媒体等行业。一些知名企业,例如亚马逊、Meta、花旗集团等,也宣布了裁员计划,因为它们将投资转向人工智能和自动化领域,以适应不断变化的经济环境。然而,OpenAI首席执行官萨姆·奥特曼(Sam Altman)近日驳斥了人工智能是导致裁员的主要原因的说法。奥特曼最近在印度新德里举行的AI影响力峰会上接受采访时表示:“我不知道确切的比例是多少,但目前存在一些人工智能洗白现象,人们将原本会裁员的原因归咎于人工智能,而人工智能也确实取代了一些不同类型的工作。”据《商业内幕》报道,他补充道:“我预计随着时间的推移,后一种情况会更加普遍。”奥特曼还声称,虽然人工智能的兴起将创造全新的就业机会,但它取代人类工作的能力可能会在未来几年变得尤为明显。包括亚马逊、IBM、Salesforce 和惠普在内的多家大型公司都将人工智能视为其裁员的主要原因。但没有任何迹象表明这些公司夸大了人工智能的影响。据福克斯商业频道报道,亚马逊首席执行官安迪·杰西去年曾指出,新兴技术可能会带来新的就业机会,但也会提高某些流程的效率,这意味着在某些业务领域,员工数量将会减少。去年六月,他曾表示:“未来我们需要的人员将减少,不再需要那么多人来从事目前由多人完成的工作。未来几年,随着人工智能在公司范围内的广泛应用,我们预计人工智能将提升效率,从而减少公司整体员工人数。”值得注意的是,亚马逊近期的裁员是该公司成立三十年来规模最大的裁员之一。今年一月,亚马逊曼哈顿办公室约135名员工被裁。除此之外,纽约地区还有100多名员工被解雇,而且有迹象表明,未来几周可能还会有进一步的裁员。值得一提的是,除了上述因素外,还有其他一些因素可能导致此次裁员潮,例如特朗普总统时期移民政策的变化以及更广泛的经济不确定性。但许多高管都指出,人工智能是此次重组背后的关键力量。例如,花旗集团已正式宣称人工智能将彻底改变工作的执行方式,UPS首席执行官卡罗尔·托梅也表达了类似的观点。然而,即使是劳动力市场数据也几乎没有显示人工智能是造成此次裁员的主要原因。(鞭牛士) -
OpenAI CEO奥尔特曼驳斥ChatGPT耗水相关谣言:完全不符合事实 IT之家 2 月 22 日消息,本周,OpenAI 首席执行官萨姆 · 奥尔特曼在《印度快报》举办的一场活动上,回应了外界对人工智能环境影响的担忧。 奥尔特曼此次赴印度是为参加一场重要的人工智能峰会。他表示,有关人工智能耗水的担忧“完全是假的”,不过他也承认,过去数据中心采用蒸发冷却技术时,耗水确实是个实际问题。“现在我们已经不再使用这种冷却方式了,但网上还是有这类说法,比如‘别用 ChatGPT,每次提问要消耗 17 加仑(IT之家注:约 77.3 升)水’之类的言论。”奥尔特曼称,“这完全不符合事实,极其荒谬,与现实毫无关联。”他还表示,人们担忧人工智能的能源消耗总量是合理的 —— 并非单次提问的能耗,而是全球如今大规模使用人工智能带来的总能耗。在他看来,这意味着世界需要“尽快转向核能、风能和太阳能”。目前法律并未要求科技公司披露其能源与水资源使用量,因此科学家们一直在尝试独立开展相关研究。数据中心也被认为与电价上涨存在关联。主持人援引此前与比尔 · 盖茨的对话提问:称 ChatGPT 单次提问的能耗相当于 1.5 部 iPhone 的电池电量,这一说法是否准确。奥尔特曼回应:“能耗绝不可能达到这么高。”奥尔特曼还抱怨,许多关于 ChatGPT 能耗的讨论“并不公平”,尤其是拿人工智能模型的训练能耗,去对比人类单次回答问题的推理能耗时。“但培养一个人也需要消耗大量能源,”奥尔特曼说,“人要花 20 年左右的时间成长,期间还要摄入大量食物,才能拥有足够的学识。不仅如此,地球上曾生活过的上千亿人类,在漫长演化中学会躲避天敌、探索科学等,才有了如今的人类。”因此在他看来,公平的对比应当是:“在 ChatGPT 模型训练完成后,回答一个问题所消耗的能源,与人类回答同一个问题的能耗相比。从这个维度衡量,人工智能在能效上或许已经追平人类。” -
无锡2025:智改数转网联提速,建“人工智能+”标杆城市 无锡是全国新一代信息技术产业的重要高地,围绕“物联网+集成电路”两条主线,叠加软件与信息技术服务、人工智能等方向,持续完善从“感知”到“计算”、从“制造”到“应用”的产业链条。2025年,无锡电子信息制造保持强劲韧性,全市计算机、通信和其他电子设备制造业增加值实现增长14.8%。增长背后,一方面是“硬件底座”更厚。无锡以“465”现代产业集群为抓手,推动产业向高端化、集群化迈进,物联网微机电系统传感器入选国家中小企业特色产业集群,集成电路产业综合竞争力跃升全球百强城市第13位。另一方面,数字经济外溢。规上数字经济核心产业营收突破5800亿元,并启动“人工智能+”标杆城市建设、深入推进“智改数转网联”,以技术迭代带动制造端与应用端同向放量。面向“十五五”,无锡致力于把“感知—芯片—软件—场景”更紧密地组织成体系,以工业互联网、车联网等场景为牵引,促进更多中小企业融链入链,推动“以应用促生态、以生态强产业”的正循环。 1月政府工作报告明确2025年聚力夯实“465”现代产业集群1月11日,无锡在2025年政府工作报告中明确提出要以科技创新引领新质生产力发展,聚力夯实“465”现代产业集群和“3010”重点产业链。新一代信息技术产业,物联网“一感两网”建设持续深化,集成电路产业通过优化“核心三业”结构强化战略支撑,人工智能、低空经济、商业航天等新兴赛道加速布局。同时,无锡积极构建全链条创新生态,推动光子芯片、工业互联网平台等关键技术突破,聚力打造具有全球影响力的“物联网之都”和集成电路产业高地。(来源:无锡市人民政府)2月召开新型工业化暨“465”现代产业集群建设推进会2月11日,无锡市召开新型工业化推进会,现场签约涵盖集成电路、人工智能等多个前沿领域的重大项目。会议明确将新一代信息技术产业作为发展核心,目标打造8000亿级产业集群,并依托国家车路云一体化应用试点等平台,加速关键技术突破与产业融合,为构建现代化产业体系提供强劲动能。(来源:江苏省人民政府)3月前2月高技术制造业开票同比增长13.6%2025年第一季度,无锡市高技术制造业实现强劲开局,1-2月开票销售额同比增长13.6%,增速领跑全市工业并超出全省平均水平,展现出新质生产力的蓬勃动能。以集成电路、物联网为代表的地标产业增势显著,成为“465”现代产业集群稳中提质的重要引擎。这一良好态势得益于政策精准发力与企业创新活力的深度耦合。无锡通过密集出台未来产业培育、智改数转网联等政策,为产业向高附加值转型拓展空间。低空经济、商业航天等领域涌现出紫微科技、巨蟹智能等一批“新面孔”,为工业经济持续注入增长后劲。(来源:南报网)4月打造“人工智能+”标杆城市4月29日,无锡发布《关于建设“人工智能+”标杆城市的政策意见》,系统性推出算力券、模型券、数据券“三券齐发”的创新支持机制,对关键技术攻关最高给予2亿元资助,全力构建城市级AI应用生态。无锡戴卡轮毂应用AI质检系统使效率提升25%,全市人工智能产业规模已超2000亿元,展现出“人工智能+”与实体经济深度融合的强劲势头。(来源:无锡市人民政府)5月举办“太湖对话”,探讨“人工智能+”标杆城市建设5月23日,新华“太湖对话”高端访谈在无锡举行,汇聚了来自工信部、信通院等国家级智库的专家学者,共同为无锡建设“人工智能+”标杆城市把脉献策。此次对话系统梳理了无锡近期密集出台的6份专项政策,助力其通过要素集聚与生态构建,在人工智能技术与产业融合新赛道上加速布局。(来源:无锡市人民政府)6月总投资50亿元芯慧联集成电路基地在锡山奠基6月25日,总投资50亿元的芯慧联集成电路工艺设备研发制造基地在无锡锡山区正式奠基。无锡在强化集成电路产业链关键环节上又迈出坚实一步。该项目专注于先进制程芯片3D集成技术的核心设备研发与制造,预计2026年投产后可实现年产300台套半导体核心设备,有力支撑无锡打造具有国际竞争力的集成电路产业集群。(来源:无锡市人民政府)7月无锡出台“智改数转网联”三年行动计划7月1日,无锡正式出台《深化制造业“智改数转网联”三年行动计划(2025-2027年)》,系统部署以人工智能技术驱动新型工业化。该计划明确到2027年实现规上工业企业智能化改造全覆盖,梯度培育5000家智能工厂,并重点推广300个“AI+先进制造”典型场景,构建“1+10+100”数字化服务商体系与强化算力基础设施,打通数据要素流通关键脉络,为打造一流智造强市提供系统性支撑。(来源:无锡市人民政府)8月“无限锡引,焕新未来”城市级超级场景发布8月11日,无锡市发布“无限锡引,焕新未来”城市级超级场景,聚焦城市、产业、消费三大焕新领域,覆盖30个独立场景方向,以场景为支点撬动全域更新。活动现场促成140余家企业精准对接,华智人工智能等企业展示了具身机器人仿真平台等前沿技术应用。至此,无锡累计开展78场场景对接活动,推动超50个场景落地,合作金额突破30亿元。(来源:无锡市人民政府)9月召开2025集成电路(无锡)创新发展大会9月4日,2025集成电路(无锡)创新发展大会开幕。本次大会以“与锡同行,融合创芯”为主题,共签约57个项目,包括产业项目55项、总投资177.21亿元;产业金融项目2项,其中设立金融租赁公司1家,总授信1000亿元。自2023年首届集成电路(无锡)创新发展大会举办以来,一年一度的大会已成为观察行业趋势的重要窗口、促成共赢合作的重要平台。(来源:无锡市贸促会官网)10月举办“智改数转网联”发展大会10月30日,无锡在2025世界物联网博览会期间举办“智改数转网联”发展大会,集中发布“中国电信全球连接管理平台”等多项赋能产业转型的关键成果,并揭牌成立无锡市工业智联创新应用联盟。大会通过搭建产学研用金协同平台,推动人工智能与物联网技术在制造业深度落地,为中小企业提供近300场供需对接机会,加快构建数字经济与实体经济融合发展的新生态。(来源:中共江苏省委新闻网)11月提出“人工智能+物联网”融合发展战略无锡于11月举办2025世界物联网博览会,提出“人工智能+物联网”(AIoT)融合发展战略,推动产业从“万物互联”向“万物智联”升级。依托物联网(2024年规模超5000亿元)和集成电路两大优势产业,通过建设智算中心、引进龙头企业,并联动超8万家工业企业丰富场景,无锡积极推动AI技术全面赋能制造,打造“人工智能+”标杆城市。(来源:无锡市人民政府)12月智元江苏具身智能产业基地战略合作项目签约落地惠山区12月19日,智元江苏具身智能产业基地战略合作项目正式签约落户无锡惠山区。该项目将聚焦通用具身智能机器人的研发与商业化,通过建设产业基地、打造数据交易中心、推动国产算力适配等举措,深度赋能工业企业“智改数转网联”,为壮大具身智能产业链注入新动能。(来源:无锡市人民政府)(王思源、祁祎茜参与本篇内容制作) -
超级利空?AI圈炸锅了 【导读】利空还是误解?中国基金报记者 泰勒大家好,关注一则OpenAI的大消息, 下调算力支出目标至6000亿美元。OpenAI大幅下调总算力支出目标2月21日,OpenAI正告知其投资者,目前的目标是到2030年总算力支出达到约6000亿美元。就在几个月前,其首席执行官山姆·奥特曼还曾宣扬1.4万亿美元的基础设施承诺。据知情人士透露,这家人工智能公司现在提供了一个较低的数字和更明确的计划支出时间表。此前,外界日益担心其扩张野心过大,可能与随之而来的潜在收入不匹配。知情人士表示,OpenAI预计到2030年其总收入将超过2800亿美元,其中消费者业务和企业业务的贡献几乎各占一半。他们表示,公司提出的这项支出计划旨在更直接地与其预期的收入增长挂钩。去年下半年,OpenAI宣布了一系列价值数十亿美元的基础设施交易,并与领先的芯片制造商和云服务公司建立了合作伙伴关系。一位知情人士称,OpenAI正在敲定一轮总额可能超过1000亿美元的巨额融资,其中约90%来自战略投资者。英伟达正在商讨向OpenAI投资高达300亿美元,作为本轮融资的一部分,这可能使该公司的投前估值达到7300亿美元。除英伟达外,本轮融资的战略投资者还包括软银和亚马逊。据悉,OpenAI在2025年实现了131亿美元的收入,超过了100亿美元的目标。同时,该公司的资金消耗为80亿美元,低于90亿美元的预期目标。知情人士表示,ChatGPT目前的周活跃用户数已超过9亿,高于10月份的8亿。面对来自谷歌和Anthropic等对手的竞争,OpenAI在去年12月发布了“红色警报”(code red),旨在集中精力改进聊天机器人。知情人士称,ChatGPT的增长在秋季曾出现小幅下滑,但目前其周活跃和日活跃用户数均已回升至历史新高。此外,知情人士提到,该公司的编程产品Codex的周活跃用户数已突破150万。Codex直接竞争对手是Anthropic的Claude Code,后者在过去一年中受到了广泛采用。如何解读?OpenAI大幅下调总算力支出目标,周末被市场普遍认为对于算力硬件而言是一个利空事情,毕竟OpenAI作为全球头部的人工智能公司,算力资本支出的大幅减少,释放的信号很明显。不过市场也有另外一种解读声音,认为这是把两个不同口径、不同时间周期的数字强行对比。分析称,山姆·奥特曼此前提出的1.4万亿美元指的是未来8年的基础设施相关的承诺投入规模,时间跨度约8年,涵盖更广义的基础设施相关投入,不是“到2030年的累计资本开支”。而此次提出的6000亿美元指的是到2030年的算力支出,相比未来8年的1.4万亿美元支出,时间更短,口径更窄(只覆盖算力部分,不等于全部基础设施承诺)。市场将“未来8年承诺1.4万亿美元”对比“到2030年算力支出6000亿美元”,然后得出“砍了8000亿美元”,这在逻辑上是不成立的,本质是口径错配。 校对:纪元 制作:泰勒 审核:木鱼 -
用户期待多年:Windows画图终于有了自由旋转功能! 快科技2月21日消息,微软近日向Windows 11预览体验成员(Dev和Canary频道)的画图工具推送了11.2601.391.0版本更新。该版本最大的亮点,就是引入了用户呼吁多年的"自由旋转"(Freeform Rotate)功能。在以往的版本中,用户如果想旋转选区或图像,只能死板地进行90度或180度的操作,这对于需要精细调整构图的创作来说极为不便。新版本上线后,用户选中形状、文字或任意区域时,对象上方将出现旋转手柄,支持拖拽至任意角度。 如果需要进一步精确控制,还可通过旋转菜单选择自定义旋转并输入具体角度数值。微软在更新日志中表示,自由旋转功能让用户能够"精确调整元素,为创作流程增添更多灵活性"。目前,该功能正处于测试阶段,预计将在未来几周内向全球正式版用户开放。 -
投资150亿美元,谷歌宣布启动横跨四大洲的海底光缆网络计划 IT之家 2 月 21 日消息,谷歌本周三宣布启动了一项名为“美印连接”的基础设施计划,旨在通过新建多条海底光缆和陆上光纤线路,大幅提升横跨美、印、澳、非四大洲的网络连接能力。这一计划是谷歌此前承诺的五年 150 亿美元(IT之家注:现汇率约合 1037.34 亿元人民币)印度 AI 基础设施投资的重要组成部分,旨在通过新建数字基础设施与技能培训倡议,提升印度及全球范围内的网络连接性,并以此缩小“数字鸿沟”向“AI 鸿沟”转化的风险。 根据谷歌云全球网络基础设施副总裁 Brian Quigley 发布的公告,该计划将在印度东海岸的维沙卡帕特南建立一个新的国际海缆登陆站,并新增三条连接印度与新加坡、南非和澳大利亚的海缆路径。同时,项目还将部署四条战略性光纤路由,以增强美国、印度及南半球多个地点之间的网络容量和冗余能力。具体而言,在东海岸,谷歌将建设一条从维沙卡帕特南经钦奈通往南非的直连线路。这条线路将与现有的 Equiano 和 Nuvem 海缆系统相结合,形成一条从美国东海岸绕过非洲直达维沙卡帕特南的高容量冗余线路。此外,维沙卡帕特南还将新增一条直连新加坡的线路,与 Bosun 和 Tabua 海缆系统配合,构建一条从美国西海岸经澳大利亚通往维沙卡帕特南的南太平洋线路。这些投资将使维沙卡帕特南成为印度又一个重要的国际海缆登陆站,与现有的孟买和钦奈登陆站形成互补,显著增强印度数字骨干网的韧性。在西海岸,谷歌将建设一条从孟买直连澳大利亚西部的光纤路径。结合 TalayLink 和 Honomoana 海缆系统,这将形成另一条从美国西海岸经澳大利亚抵达孟买的南太平洋线路。这一新线路与现有的 Blue、Raman 和 Sol 海缆系统(构成从美国东海岸经红海至孟买的数据走廊)相辅相成。除基础设施建设之外,谷歌宣布将同步推进数字技能培训项目,以确保 AI 转型的惠及面更广。谷歌云已与印度政府的“Karmayogi Bharat”数字使命达成合作,作为其 iGOT Karmayogi 在线培训平台的主要云合作伙伴,为印度全国 800 多个地区的超过 2000 万公职人员提供安全、可扩展的学习基础设施。双方合作还将利用 AI 技术增强平台的学习体验,包括将历史培训资料数字化为可搜索的知识资产,并逐步支持超过 18 种印度语言,使公职人员能够用母语进行学习。谷歌表示,这些投资是其在非洲、澳大利亚和太平洋地区与数十家区域合作伙伴共同推进 AI 可及性工作的延续,未来将继续与各方合作,将 AI 的益处带给所有人。