找到
472
篇与
互联网
相关的结果
- 第 24 页
-
金鱼损失随机剔除token,让AI不再死记硬背 henry 发自 凹非寺 量子位 | 公众号 QbitAI 训练大模型时,有时让它“记性差一点”,反而更聪明!大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(Goldfish Loss) 顾名思义,金鱼损失就是让模型像金鱼一样,不去死记每一个细节,而是在损失函数计算时随机剔除一小部分token。由此,模型不再逐字记住训练集内容,但仍能学会语言规律。实验显示,LLaMA-2在使用金鱼损失后: 记忆化内容显著减少:模型不再复现训练数据 下游任务性能几乎不受影响:仍然能流畅生成文本 用网友的精辟评论概括就是:dropout,但损失函数! 在梯度计算中随机屏蔽部分token金鱼损失的核心理念非常简单,就是在模型训练过程中随机剔除一部分训练文本中的tokens,使其不参与损失计算。这样一来,当模型在推理阶段遇到这些位置时,就只能“猜测”,而不是逐字逐句复现训练数据的完整序列。此外,为了保证被剔除token的一致性,研究人员设计了一种基于哈希(hashing)的掩码策略。 那么,这和同样是防止模型背会的正则化方法有什么不同呢?Dropout这样的正则化方法为例,它通过在训练时“加噪声”来防止模型过度依赖某些参数,从而提高模型举一反三的能力。但这样做的问题在于:如果只是随机丢token,那么,每次看到同一段落时,丢掉的地方不一样,模型累计几次就能拼凑出完整段落。所以,说到底,模型还是靠死记硬背,记住了答案。相比之下,金鱼损失则用哈希掩码确保每次遇到同一段落,掩盖位置都一样,这就从根本上阻止了模型复现完整训练文本。接下来,我们来看金鱼损失具体是怎么做的。在传统的next-token prediction中,模型以序列中的下一个真实token作为目标,输出预测分布,并基于该分布计算交叉熵损失。 在金鱼损失下,模型虽然也在前向传播中预测序列里下一个 token。但在计算损失时,会以一定的概率将某些位置的token从损失计算里“抹掉”。也就是说,有些真实的下一个token不会作为目标来训练。 在这里,研究人员采用了简单的静态掩码(static mask),剔除每序列中的第4个token。更进一步,为了确保模型不会从其他地方学到被掩码的数据(例如不同的文档会在不同的网页中反复出现),研究团队还提出了一种局部化哈希掩码(localized hashed mask),使得当相同的前h个token出现时,掩盖模式是相同的(可重复)。实验测试与结果为了验证金鱼损失确实能防止记忆化,研究团队设计了两种实验场景:一种是极端场景,通过对少量样本进行多个训练周期(即重复)来强烈促使记忆化;另一种是标准场景,模拟现实模型训练中使用的批次处理方式 。同时,为了评估模型的记忆化程度,研究采用了以下指标: RougeL得分:该指标衡量最长公共(非连续)子序列的长度 。得分为1.0表示完美记忆 。 精确匹配率(Exact Match):该指标衡量正确预测的序列占真实序列的百分比. 实验表明,在极端场景下,标准训练导致模型逐字记忆了100篇文章中的84篇,而金鱼损失没有记忆任何文章 (注:实验让LLaMA-2-7B在《哈利·波特》第一章或100篇维基百科文档上进一步训练了100个epoch)此外,在标准训练场景下,金鱼损失也明显减少了模型逐字复现训练语料库中目标序列的情况。 但这里可能有个直觉式的反应——如果让模型“随机漏学”一些token,它的能力会不会也随之降低呢?对此,研究人员进行了测试:研究表明,金鱼损失模型、标准损失模型和对照模型之间的总体性能没有系统性差异。 需要注意的是,金鱼损失的核心在于忽略部分token的梯度计算。因此,为了学到足够的语言模式,模型必须通过更多数据来补偿这些空缺,这可能导致计算效率的下降。[1]https://arxiv.org/pdf/2406.10209
-
顺丰、京东、美团:多名快递小哥、外卖骑手受邀观礼九三阅兵 IT之家 9 月 3 日消息,2025 年 9 月 3 日上午,纪念中国人民抗日战争暨世界反法西斯战争胜利 80 周年大会在北京天安门广场隆重举行。IT之家从京东、美团、顺丰方面获悉,多名快递小哥、外卖骑手受邀参加观礼。 据京东消息,来自京东物流的臧继全、魏团结、冯玉滨、宋学文、栾玉帅、李豪、闫贺等多位快递行业优秀代表,满怀自豪和喜悦的心情登上九三阅兵观礼台,与社会各界楷模一道亲历这一承载历史厚重感与民族自豪感的光荣时刻。据官方介绍,这些京东小哥来自北京不同片区,在一线岗位上深耕不辍,凭借出色表现斩获多项荣誉。顺丰集团表示,三十余名顺丰人受邀观礼,在现场深刻感受中华民族伟大复兴。其中,快递小哥刘阔曾作为基层工作代表参加过新中国成立 70 周年庆典活动,今年的九三阅兵他也在观礼之列。参加观礼的还有北京顺丰速运基层片区经理、全国劳动模范王俊超,以及北京顺丰党委书记卢萍、全国人大代表及全国道德模范汪勇等。美团表示,数十名美团骑手及员工受邀参加观礼,还有美团员工入选民兵方队光荣受阅,共同参与见证这一光荣时刻。参与现场观礼的 16 名美团骑手来自全国各地。他们之中,既有曾经参与小兴安岭灭火、松花江抗洪的退伍老兵,也有在车祸中救援受困司机的先锋骑手。此外,美团 CEO 王兴也登上了观礼台。
-
“电商”成“市集”,小红书重构生活方式电商 文 /王慧莹编辑 /子夜一个多月前,小红书更改品牌slogan——从“你的生活指南”变成“你的生活兴趣社区”。随着小红书越来越“大”,简单的指南已经不足以满足小红书用户的需求。越来越多用户涌入小红书,用户在社区内呈现出了多种兴趣偏好,从单纯的内容消费者变成了分享者、交流者。这种分享欲、交流欲延续到电商场域,是小红书去年就喊出的“生活方式电商”。所谓生活方式电商,小红书要做的是帮助用户找到匹配自己个性化需求的商品。如今,生活方式电商有了更具象化的体现。8月28日,小红书在上海举办首个线下市集活动,来自全国超100家商家现场展示优质好货。线下市集开幕的同时,小红书也更新了新版本,电商以“市集”之名重回首页一级入口。“市集”页面设置了市集直播、买手橱窗、新品首发等频道。 线上线下的市集联动,融合内容和交易,打通需求和供给,满足用户边逛边买的需求,也为商家提供更稳定的交易场域。经过这几年探索,以电商为代表的小红书商业化进度在预期之中。不过,作为中国最大的生活方式社区,小红书坐拥3.5亿月活,且超过50%是95后,小红书的商业化规模总是赶不上用户规模。如今,以市集为支点,小红书希望撬动“种草”到“拔草”的全链路变革。这其实是更符合社区特性的电商——不追求最大规模,而是聚焦最高黏性;不主打最低价格,而是提供最优发现体验。或许,挑战电商巨头并不是小红书终极目标,小红书要证明的是,自己找到了一条独特的自营电商之路。更重要的是,满足消费者多样化的生活需求,可以是一门好生意。1、从“友好市集”到“一级入口”,小红书生活方式电商持续扩张“祝你逛得开心!”在炎热的上海,熙熙攘攘的小红书市集,这六个大字映入眼帘。8月28日至31日,小红书举办了首个线下市集,这个长达四天的市集汇聚百余位全国商家,从农产品到阳光手作,每一份对生活的热情都能在这里被满足。 与此同时,不少小红书用户发现,底部导航栏的“商城”悄然换成了“市集”。重新开设传统市集,又将其搬到线上,线下“可感知”,线上“有人感”,这种差异化的电商体验的确很符合小红书。尤其在线上,这个看似简单的入口迭代,实则藏着一场生活方式电商的战略突围。从去年提出生活方式电商至今,生活,在小红书的语境中始终是个动词。小红书首席营销官之恒曾透露,小红书每个月提供购买建议的用户数已经达到了1.7 亿。这种用户土壤决定了小红书做电商的独特性——不能像电商商城那样正式,也不像直播间那样商业化。怎么在内容和交易之间找个平衡,市集是个新答案。市集保留更多小红书的气质,也保留了更多内容感和社区氛围。不同于传统货架电商的交易逻辑,市集的核心逻辑是将交易与社区的“逛”融合在一起。用户点开商品卡片,看到的是带有真实感受的笔记或评论。这种自发式的种草,可能来自买手,也可能来自品牌主理人和用户。从逛到买,市集作为载体,将小红书电商的逻辑捋得更顺,也更有确定性。很长一段时间,在小红书种草,去其他平台交易成为小红书做电商的最大阻力,最根本的原因在于用户购买心智不成熟。小红书需要一个入口,既拥有固定的好货源场域,又有便捷的挑选场景。此次的线上市集页面采用双列流设计,像是城市街道,用户在逛笔记时会发现宝藏商家和商品,并彼此分享交流。这种体验感很重要,相当于给用户一个固定的入口,以此更高频便捷地“逛街”。 图源小红书内测市集页面在货的层面,小红书线上市集延续了友好市集的调性,是对小红书站内的商品进行聚合。对商家来说,“市集”作为一个更集中的交易聚合入口,高品质、高复购、高互动的好商品有了更多被购买的机会。值得注意的是,这次市集成为一级入口,年轻人功不可没,小红书交易市场负责人来克表示:“在小红书购物的用户数正在快速上升,尤其是年轻用户。因此小红书新增‘市集’作为一级入口,意在进一步提升用户购买心智。”来克介绍道,小红书购买用户中95后占比高达70%,他们愿意为好品质、好品位、好价格买单,而非单纯追逐品牌或低价。这群年轻用户成为小红书电商差异化的核心支撑。实际上,小红书此前已在线上成功举办多个市集活动。去年双11的“1年1度购物狂欢”线上主题街区,今年6月的“友好市集”,以及今年8月线上线下联动的“当红手串大赏”……准确来说,小红书“市集”是生活方式电商的具象化、产品化体现。推出生活方式电商时,小红书COO柯南曾经提到,用户在小红书买东西就像在线上逛街,每一个直播间都是一个线上橱窗。2、小红书商业化进入加速期市集的出现,是生活方式电商的延续,标志着电商和社区处在同等战略地位。换句话说,小红书商业化进入新的加速周期。告别过去克制的商业化路线,基于社区的原生性,小红书找到一套自己的电商逻辑后,在商业化道路的步伐愈发紧凑。尤其是这两个月,小红书的动作频频。7月,小红书成立“大商业板块”,由COO柯南担任总负责人,与CMO之恒共同组成领导班子。大商业板块保持商业部、交易部的一级部门设置不变。这一调整旨在打破小红书广告和交易之间长期存在的壁垒,促进商业化广告业务与交易业务的深度协同。延续到业务层面,整合大商业板块的意图很明显,即最大程度促进小红书站内交易转化,形成种草-投流-交易的闭环。简单来说,小红书想要让包括电商、广告在内的更多商业行为在站内自然、流畅地发生。 图源小红书官网此前,小红书开放站外平台外链也是这个逻辑。今年5月份,小红书推出的“红猫计划”“红京计划”,允许笔记下方挂外链,实际上就是在吸引有广告预算的商家。彼时,这个动作被看做是小红书放慢站内电商脚步的信号,实则不然。开放外链的同时,小红书还在加紧完善自身的商业生态,打造丰富的商家生态是第一步。8月,小红书推出百万免佣计划,在2025年9月1日至2026年8月31日期间,同一商家前100万支付交易额免除佣金,仅保留0.6%的支付渠道成本。这一计划几乎没有门槛,佣金在服务费结算时自动减免,商家无需额外申请。这极大减轻了商家,尤其是中小商家的运营成本负担。这一部分商家正是小红书自营电商最为关注的,也是小红书繁荣电商生态的重要组成部分。换句话说,小红书自有电商体系与外链合作是并行的。即便小红书开放了广告外链,但这是种有限的开放,小红书开放的广告外链,只会出现在小红书的商业流量中,不会影响其自有电商的流量空间。这给站内商家吃了颗定心丸。毕竟,用户的消费决策逻辑日渐复杂,一句素人的感悟,都会影响小红书的站内转化,如果不用更完善的体系和优惠政策激励,商家生态不丰富,小红书商业化也跑不快。 过去,小红书的商业体系按照商业化广告、交易分别纵向搭建,独立之余两大部门之间有一堵隐形的墙,存在长期壁垒。随着小红书商业化进入深水区,广告与电商最大程度地协同才能助力小红书跑得更快。早在年初,小红书便明确了2025年商业化业务的三大方向,即行业上从聚焦消费品向满足多行业的需求扩展,重点向生活服务等行业突破;商业产品能力上,更多着力在种草投放之中的优化、种草的投后度量以及客户生意线索的直接交付等;生态上走向更大开放,未来将直接与更多平台、不同行业商家品牌、MCN机构等形成连接。小红书正在沿着既定的方向向前。3、独特的小红书,也找了独特的电商解法?小红书上有一批愿意分享生活的人,仅是“求链接”类评论在小红书每月就达到8000万。这种高粘性流量和用户留存,是很多互联网企业羡慕的,但小红书电商的速度不快。据彭博社报道,2024年小红书电商GMV突破了4000亿元,同比增长了45%。尽管也是在增长,但小红书也有焦虑。小红书电商成长在对手建立的高墙之下,生活方式电商也区别于货架电商、兴趣电商、信任电商等各类电商定义。当国内电商行业已经进入下半场,小红书很难与对手正面硬刚。从以董洁章小蕙为代表的直播电商,再到买手电商、生活方式电商,小红书很早就意识到走独特的道路很重要。传统电商“买卖”的指标很容易被看见,但真正理解用户的人不多见。这个“人”,不仅要懂用户,还要懂生活,向用户分享生活经验,帮用户挑选搭配衣服,这也是小红书电商“人、货、场”三要素中最重要的一环。 这些人,可以是买手,也可以是商家,或是主理人。以人为链接,再搭建货和场,是小红书做电商的思路。这种差异化源于小红书本身的独特性——原生社区属性。这些年,小红书依靠黏性用户、社区氛围破圈,成为互联网平台中特别的存在。在小红书社区中,用户之间形成了一种真实、友好、互助的氛围,用户分享的内容源于真实生活体验,这种信任关系使得用户更容易受到他人推荐的影响,形成了小红书的种草属性,每天在小红书直接表达求购的需求内容超过600万。这几年,随着小红书的内容生态愈加丰富,小红书也成为越来越多人的搜索入口。截至2024年底,73%的小红书月活用户有主动搜索行为,42%的新用户来到小红书第一天便会使用搜索功能。对小红书而言,内容和社区始终是放在第一位的,小红书的社区原生性决定了这一切。小红书电商也是从社区里“长”出来的电商,即便是以商业化进展慢为代价,也不能影响小红书积攒多年的社区氛围。当普通人帮助普通人的社区精神,转化成真实有用经验的心智,又形成交易的转化,便成就了小红书电商的独特内核。正是由于这种独特性,小红书在电商探索过程中,其解法也必然与其他平台不同。简单的货架电商模式,虽然能够满足用户快速查找和购买商品的需求,但无法满足小红书用户对于生活方式探索和发现的渴望。小红书做的是一场围绕社区文化和用户需求展开的创新实践,它不追求大规模的市场份额和低价竞争,而是专注于为用户提供优质的购物体验和发现乐趣。不过,怎么将社区调性与交易更自然地融合,是小红书商业化要考虑的长期命题。
-
曝英伟达又拿下一家AI创企,年内4家已入囊中 智东西 编译 王涵 编辑 漠影 智东西9月3日消息,据The Information最新报道,知情人士透露,英伟达已收购美国AI编程自动化初创公司Solver,这是英伟达今年的第四次收购。Solver仅成立3年,曾吸引800万美元(约合人民币5711.6万元)的投资,其开发的API可以通过自然语言指令自动化代码生成。如今Solver归入英伟达麾下,成为英伟达完善开发者工具链的关键一环。一、成立仅3年,主攻AI自动化开发 Solver的前身为Laredo Labs,由Daniel Lord和Mark Gabel于2022年共同创立于美国加利福尼亚州圣何塞。该公司曾从Radical Ventures和Horizons Ventures等投资者处筹集800万美元(约合人民币5711.6万元)资金。Solver的主要产品是一个名为lastic Engineering API的AI编程平台,该平台利用AI来自动化软件开发流程。客户接入其API可以与现有的集成开发环境无缝集成,无需安装新的系统,能够处理复杂的、多步骤的编程任务,并根据自然语言指令进行自动化代码生成和优化。二、已收购4家软件初创公司,英伟达收购热潮继续 除了Solver外,英伟达在今年上半年还收购了3家初创公司:Gretel、Lepton AI和CentML。据外媒Wired报道,英伟达于今年3月19日收购了美国合成数据人工智能初创公司Gretel,交易估值超过3.2亿美元(约合人民币22.9亿元)。这家初创公司已从投资者那里筹集了约6500万美元(约合人民币4.6亿元),并与亚马逊网络服务、谷歌云和微软等公司建立合作。Gretel的平台利用生成模型创建人工数据,这些数据在保留真实数据集统计属性的同时,还能确保数据隐私。据The Information报道,英伟达于次月收购了中国云服务初创公司Lepton AI,该初创公司向各个云提供商的客户出租GPU容量。据报道,英伟达收购Lepton AI是为了整合自身硬件与云端算力市场,为开发者提供更无缝的AI开发体验随后在5月份,英伟达就宣布推出AI平台Nvidia DGX Cloud Lepton,将AI开发人员与“来自全球云提供商网络的数万个GPU”连接起来,英伟达称之为“一个具有计算市场的AI平台”。在6月,据The Logic报道,英伟达收购了加拿大初创公司CentML,CentML开发的软件专注于优化AI模型在芯片上的运行效率。6月的这次收购进一步强化了英伟达软件栈的性能,确保其GPU不仅在训练方面领先,在AI模型推理部署方面也同样具有强大的竞争力。结语:英伟达进一步补全齐软硬件生态链 英伟达收购AI编程初创公司Solver,或许标志其开始将视线转到为开发者构建编程助手。其实不止英伟达,据The Information报道,OpenAI、xAI和Anthropic等潜在收购方已与AI编程软件Cursor的制造商Anysphere展开洽谈,希望达成授权使用或购买关于程序员使用AI编程软件辅助编程的相关数据。2024年,英伟达共收购了6家初创公司,今年其收购热潮并没有停息,截止目前,英伟达已收购4家初创公司。英伟达的软件收购潮既是其巩固AI基础设施龙头地位的关键策略,即通过收购补全软硬件生态链,进而构建更明显的市场竞争优势。来源:The Information、Wired、The Logic
-
世界模型,腾讯混元卷到了榜首 不圆 发自 凹非寺 量子位 | 公众号 QbitAI 腾讯混元世界模型上新,综合能力问鼎WorldScore排行榜。 HunyuanWorld-Voyager(简称混元Voyager),发布即开源。这距离HunyuanWorld 1.0 Lite版发布仅过两周。官方介绍说,这是业界首个支持原生3D重建的超长漫游世界模型,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。无论是真实街景: 还是像素游戏: 效果都相当不错,不说的话还以为是实拍或者录屏。它和之前的模型相比有什么不同呢?一起来看一下。 一句话,一张图,一个场景 仔细看了看混元Voyager的介绍,这次上新的直观表现其实是多了一个「漫游场景」的功能。比360°全景图交互性更强,可以用鼠标和键盘在场景内活动,更好地感受和探索世界。 左边可以调整渲染画质和场视角: 录制gif图会压缩画质,实际体验相当清晰。而且只需要一句话或一张图就可以生成这样的场景。混元官方还给出了Prompt指引: 给出的示例效果也相当不错,体验感很好,甚至想戴个VR眼镜试试。 由于文件大小受限,压缩了很多次,截个屏给大家看看原本的画质: 对了,图生场景对图片的分辨率是有要求的,太大或者太小都会报错。 具体要求也给出来了,写得十分清楚: 除此之外,混元Voyager3D输入-3D输出的特性,与此前已开源的混元世界模型1.0高度适配,可进一步扩展1.0模型的漫游范围,提升复杂场景的生成质量,并可对生成的场景做风格化控制和编辑。 同时混元Voyager还可支持视频场景重建、3D物体纹理生成、视频风格定制化生成、视频深度估计等多种3D理解与生成应用,展现出空间智能的潜力。 将场景深度预测引入视频生成过程 混元Voyager为什么能够做到一键生成沉浸式漫游场景呢?这个问题涉及到它的模型框架。 混元Voyager框架创新性地将场景深度预测引入视频生成过程,首次通过空间与特征结合的方式,支持原生的3D记忆和场景重建,避免了传统后处理带来的延迟和精度损失。同时,在输入端加入3D条件保证画面视角精准,输出端直接生成3D点云,适配多种应用场景。额外的深度信息还能支持视频场景重建、3D物体纹理生成、风格化编辑和深度估计等功能。用比较好理解的话来说,视频生成+3D建模——基于相机可控的视频生成技术,从初始场景视图和用户指定相机轨迹中,合成可自由控制视角、空间连贯的RGB-D视频。 混元Voyager包含两个关键组件: (1)世界一致的视频扩散:提出了一种统一的架构,能够基于现有世界观测,同时生成精确对齐的RGB视频与深度视频序列,并确保全局场景的一致性。 (2)长距离世界探索:提出了一种高效的世界缓存机制,该机制融合了点云剔除与自回归推理能力,可支持迭代式的场景扩展,并通过上下文感知的一致性技术实现平滑的视频采样。为训练混元Voyager模型,腾讯混元团队还构建了一套可扩展的数据构建引擎——该引擎是一个自动化视频重建流水线,能够对任意输入视频自动估计相机位姿以及度量深度,从而无需依赖人工标注,即可实现大规模、多样化训练数据的构建。基于此流水线,混元Voyager整合了真实世界采集与虚幻引擎渲染的视频资源,构建了一个包含超过10万个视频片段的大规模数据集。将基于1.0模型生成的初始3D点云缓存投影到目标相机视图,即可为扩散模型提供指导。此外,生成的视频帧还会实时更新缓存,形成闭环系统,支持任意相机轨迹,同时维持几何一致性。这不仅扩展了漫游范围,还为1.0模型补充新视角内容,提升整体生成质量。 混元Voyager模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位,超越现有开源方法。这一结果表明,与基于3D的方法相比,混元Voyager在相机运动控制和空间一致性方面表现出优异竞争力。 在视频生成质量上,定性定量结果表明混元Voyager具备卓越的视频生成质量,能够生成高度逼真的视频序列。特别在定性比较的最后一组样例中,只有混元Voyager有效保留了输入图像中产品的细节特征。相比之下,其他方法容易产生明显伪影。 场景重建方面,在使用VGGT进行后处理的情况下,混元Voyager的重建结果优于所有基线模型,表明其生成视频在几何一致性方面表现更为出色。同时,若进一步使用生成的深度信息来初始化点云,重建效果更佳,这也进一步证明了所提出深度生成模块对于场景重建任务的有效性。上图中的定性结果同样印证了这一结论。在最后一组样例中,混元Voyager 能够较好地保留吊灯的细节特征,而其他方法难以重建出基本形状。同时,在主观质量评价中,混元Voyager同样获得最高评分,进一步验证了所生成视频具备卓越的视觉真实性。并且混元Voyager完全开源,相关技术报告已公开,源代码在GitHub和Hugging Face上免费开放。模型部署的要求如下: One More Thing 腾讯混元正在不断加速开源进展,除了包括混元Voyager在内的混元世界模型系列,还有MoE架构的代表性模型混元large、混合推理模型Hunyuan-A13B,以及多个面向端侧场景的小尺寸模型,最小仅0.5B参数。最近还开源了翻译模型Hunyuan-MT-7B和翻译集成模型Hunyuan-MT-Chimera-7B(奇美拉),前者在国际机器翻译比赛中拿下了30个第一名。 除腾讯以外的其它国内大厂也在猛猛开源。阿里的Qwen自不用说,除此外,阿里前段时间还开源了视频生成模型Wan2.2-S2V。美团的第一个开源大模型Longcat-Flash-Chat最近也发布了,不知道大家有没有关注。参考链接:https://mp.weixin.qq.com/s/vCkFWwV5vUQhjMRfMQB2XA 项目主页:https://3d-models.hunyuan.tencent.com/world/ 模型:https://3d.hunyuan.tencent.com/sceneTo3D GitHub:https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
-
AI吞噬软件又一案例?谷歌Nano Banana走红,美图股价重挫 谷歌新款AI模型Nano Banana的爆火,引发了市场对“AI是否将吞噬应用软件”的深度忧虑。然而摩根士丹利分析师认为,这一担忧过度。9月2日,摩根士丹利研报指出,美图的增长轨迹并未受到AI模型Nano Banana的影响,其真正的价值在于提供了基础AI模型无法企及的“最后一公里”解决方案报告强调美图凭借其在垂直领域的深厚积累、专有数据以及对核心付费功能的专注,构筑了坚实的护城河。此外,公司对所有AI模型保持开放和中立,并已将Nano Banana等新技术无缝整合进产品中。摩根士丹利重申对美图的“增持”评级,目标价15.70港元,认为其长期价值依然稳固。预计2025年收入将达到40.21亿人民币,2026年增长至51.20亿人民币,2027年进一步增至67.71亿人民币。Nano Banana引发的市场恐慌 近期,由谷歌发布的新型图像AI模型“Nano Banana”在中国社交媒体上迅速走红。该模型于8月26日发布,凭借其能将照片通过提示词转化为3D模型图片的强大功能,在8月30日引爆了舆论。 这一事件立刻触发了投资者担忧——功能日益强大的基础AI模型将跨界“侵蚀”美图等应用软件的核心业务。受此恐慌情绪影响,美图股价在消息发酵的交易日里暴跌14%,而同期的恒生指数则上涨了2%。值得注意的是,这并非孤例。今年以来,每当有类似GPT-4o或谷歌Veo3等重量级AI模型发布更新时,美图的股价都曾出现过类似的波动。 这反映出市场对于AI时代应用层软件生存模式的普遍焦虑。"最后一英里"价值难以替代 摩根士丹利分析师强调,在AI时代,应用软件的价值在于提供"最后一英里"服务以优化结果,而这正是通用AI模型无法完全实现的。视觉行业的"最后一英里"尤为复杂,原因有二: 场景的碎片化和需求的多样性:用户的需求千差万别,从个人照片的美化、广告图的生成到海报设计,每个场景都有独特的标准和工作流。 个人偏好的主观性:美学和视觉偏好高度个人化,这很难完全通过标准化的提示词来精确捕捉,也无法由通用AI模型完美实现。 正是这两大特点,决定了通用AI模型难以提供端到端的完美产品来满足所有用户需求。因此,专注于特定场景、优化用户体验的应用软件,其存在价值不仅没有被削弱,反而愈发凸显。美图的优势:场景、数据与核心付费点 摩根士丹利认为美图凭借其长期积累,在最大化“最后一公里”价值方面已建立起显著优势。首先,公司业务聚焦,积累了深厚的场景认知。美图专注于非专业休闲和非专业生产力场景,并进一步将后者细化到电商设计等领域。这种专注使其能够深入理解用户在特定场景下的痛点,并开发出高度优化的工作流程,提升用户体验。其次,海量垂直数据构筑壁垒。通过与阿里巴巴等伙伴合作以及自身产品的长期运营,美图积累了海量的、高质量的垂直数据,尤其是在人像美化和电商设计方面。美图利用这些私有数据,在第三方基础大模型之上进行“后期训练”,打造出效果远超通用模型的小模型,成果更贴近用户需求。最后,清晰的商业模式:用户为“核心功能”付费。美图的功能可分为“趣味性功能”(如AI表情包生成)和“核心功能”(如AI人脸精修)。前者可能吸引用户尝试产品,但后者才是驱动用户付费订阅的根本原因。通用AI模型可以模仿前者(如Nano Banana的3D模型),但很难渗透到美图提供的高质量“核心功能”领域。此外,美图采取AI模型中立策略,运用AI模型容器技术,能够快速将不同AI模型的能力整合到其产品中在3D模型图片广泛传播之前,美图已经将谷歌Nano Banana整合到其海外产品中,包括美图秀秀、BeautyPlus和RoboNeo。
-
苹果留不住AI大神,机器人首席又被Meta挖走 9月3日消息,苹果负责机器人技术的首席人工智能研究员张健(Jian Zhang)已经从公司离职,加盟竞争对手Meta,成为近期苹果AI人才流失潮中的又一典型案例。 社交媒体巨头Meta当地时间周二证实,张健已经加入Meta的机器人工作室。另据知情人士透露,还有三名研究员也于近期从苹果大语言模型团队离职,加剧了团队内部的人员动荡。 知情人士表示,苹果研究员约翰·皮布尔斯(John Peebles)、杜楠(Nan Du)和孟昭(Zhao Meng,音译)均于过去一周从公司离职,这几人都来自苹果的基础模型团队。该团队作为公司追赶AI浪潮、开发“苹果智能”的核心力量,最近几周已有包括负责人在内的约10名成员相继离职。 此前有报道称,苹果内部正在讨论是否应该更多地依赖外部技术,而不仅仅是靠自研模型。 在新一批离职员工中,皮布尔斯和杜楠将前往OpenAI,而孟昭则加入了Anthropic。此前,他们的许多同事已跳槽至以高薪挖人的Meta。例如,曾负责苹果模型团队的庞若鸣据称是为一份为期多年、总价值2亿美元的薪酬包而离职。 不过Meta也并非一帆风顺。据报道,即便是部分新入职Meta的AI研究员也已迅速离职。 苹果和OpenAI的发言人均拒绝对人事变动发表评论。Anthropic未立即回应置评请求。 受相关报道影响,苹果股价周二一度跌至盘中低点。当日苹果股价下跌1.04%,收于每股229.72美元。 张健此前负责一个专注于自动化技术及AI在相关产品中应用的由学者组成的小型团队。该团队此前已经有人员变动的迹象,其中一位下属马里奥·斯鲁吉(Mario Srouji)已于今年4月份离职加入Archer Aviation公司,出任AI产品负责人一职。 张健所在的机器人研究小组隶属于苹果人工智能和机器学习部门,与今年早些时候被划归硬件工程部门的机器人产品开发组织相互独立。 机器人技术已成为苹果未来产品规划的关键一环。据报道,苹果正计划推出一系列设备,包括带可移动屏幕的桌面机器人,以及用于零售店和制造业的机械臂。 与此同时,Meta也在推进自家的产品研发。今年2月份有报道称,除智能眼镜和AI功能外,Meta正大力投资人形机器人的操作系统和底层硬件组件。 张健将加入Meta Reality Labs部门下的机器人工作室负责产品开发。 据知情人士透露,苹果AI员工的离职潮预计还将持续,目前有几名员工正积极应聘其他公司的职位。他们表示,“苹果智能”的市场反响平淡,加上公司可能转向使用第三方模型,都导致了内部员工士气的持续低落。 苹果AI实验室的“信任危机” 持续的人才流失只是表象,背后是苹果AI部门内部存在的一系列根深蒂固的问题。 据报道,苹果内部一直在讨论未来新版Siri可能使用竞争对手的第三方模型,这种战略上的不确定性导致团队士气暴跌。 技术上的重大挫折又加剧了这种摇摆不定。被寄予厚望的Siri重建项目成了内部人士口中的“烂摊子”,迫使苹果公司进行彻底的“V2”架构改革,这使得Siri的高级功能至少要推迟到2026年才能发布。 正如分析师约翰·格鲁伯(John Gruber)所说,“即使短期内会很尴尬,在新架构上重建Siri是’唯一’的出路。” 引发离职潮的一个关键导火索是管理层否决了开源部分苹果AI模型的计划。 苹果著名的保密文化与AI研究领域的协作精神存在冲突,据称是压垮许多工程师的最后一根稻草。他们感到公司将市场营销置于科学透明度之上,这让他们倍感失望。 根基不稳:Meta“梦之队”的内部动荡 尽管Meta正从苹果的人才动荡中获利,但其自身的AI部门也同样充满不稳定性。 2025年5月份旗舰模型Llama 4“巨兽”的推迟发布,加之对Runway等初创公司的收购要约被拒,促使Meta在自身危机中制定了“要么收购,要么挖人”的激进战略。 在失去了Llama原研究团队的大部分成员后,Meta于7月1日成立Meta超级智能实验室(MSL),并挖来大量业内顶尖人才。然而,新实验室仅成立50天后就被拆解重组,这也是Meta四个月内对AI研究部门的第二次重大改组。 这种混乱导致Meta耗费巨资组建的AI“梦之队”人员流动频繁。 几位近期入职的研究员已经辞职,其中一些人在Meta工作不到一个月就回到了OpenAI。 离职研究员之一的里沙布·阿加瓦尔(Rishabh Agarwal)表示:“决定不继续留在新成立的超级智能实验室是一个艰难的选择,特别是考虑到这里的人才和算力密度。” 当ChatGPT的联合创始人赵晟佳在加入实验室几天后就威胁要辞职时,这场不稳定危机达到了极点,Meta为了留住他,最终任命其为首席科学家。 Meta日益增长的机器人野心 张健的专业知识将直接服务于Meta进军机器人和具身智能领域的战略布局。 公司的目标是为第三方人形机器人提供核心AI平台,复制安卓在智能手机市场的成功策略。这将使其与谷歌DeepMind的Gemini Robotics模型等项目展开竞争。 这一计划有硬件创新方面的支持,例如为赋予机器类似人类触觉而开发的Digit 360触觉传感器。 同时,它也由V-JEPA 2“世界模型”等基础软件提供支持,这是一种旨在通过视频学习物理常识的开源AI。 Meta首席技术官安德鲁·博斯沃思(Andrew Bosworth)强调了公司现有投资与其机器人目标之间的协同效应。他表示:“我们在Reality Labs和AI领域已经投资和开发的核心技术,与推动机器人技术所需的发展进步是相辅相成的。” 对于Meta而言,这场人才争夺战不仅是为了削弱竞争对手,更是为了获取构建未来AI愿景所需的专业知识。 如今,这场人才争夺战中的硬通货是原始计算能力。正如首席执行官马克·扎克伯格(Mark Zuckerberg)所解释的,顶尖研究人员不再关心管理权限。相反,“在这里,人们会说,’我希望向我汇报的人越少越好,拥有的GPU越多越好。’” 这凸显出像Meta这样愿意在人才和基础设施上投入数十亿美元的公司的巨大影响力。(辰辰)
-
OpenAI下月将为ChatGPT添加家长控制功能,可自动干预风险对话 IT之家 9 月 3 日消息,OpenAI 昨天发布新闻稿,宣布将在下月为 ChatGPT 助手添加家长控制功能,可自动监测孩子的敏感性提问并让家长及时获悉相关状态。OpenAI 表示,他们正与专精进食障碍、药物使用障碍和青少年健康的专家合作打造这项功能,功能上线后家长可使用邮件将自己的 ChatGPT 账号与孩子的账号关联,可决定 ChatGPT 如何回复他们孩子的问题,并可禁用记忆、聊天记录功能。 家长控制功能还将可以自动干预风险对话,当孩子尝试与 ChatGPT 聊敏感话题时,系统会自动向父母发出提醒,让家长能及时采取下一步行动,避免出现“完全不知情”的情况。同时 OpenAI 正在研发新的对话逻辑,可将敏感话题自动转由 GPT-5-Thinking 或 o3 模型回答,测试显示配上新对话逻辑的两种模型能更稳定地遵循安全原则,也更能抵御对抗性提示词,未来 ChatGPT 将持续完善相关功能,让所有敏感性话题都能被上述两款模型理性回答。 据《纽约时报》上周(IT之家注:8 月 27 日)报道,一对夫妇起诉了 OpenAI ,指控 ChatGPT 在他们儿子自杀过程中起帮助作用,聊天记录显示他们的儿子生前多次与 ChatGPT 聊自杀话题,虽然 GPT 有时会劝他拨打求助电话或向身边的人倾诉,但在一些关键话题上起到了负面作用。ChatGPT 告诉他们的孩子可以以“写作或设定世界观”为由提供自杀相关技巧,甚至最后给出掩盖颈部伤痕的诀窍,同时还肯定了这名孩子在衣柜里挂绞索的行为。
-
又一个万亿AI独角兽诞生,直逼字节OpenAI 智东西 编译 程茜 编辑 云鹏 智东西9月3日报道,今天凌晨,大模型独角兽Anthropic宣布完成130亿美元(折合人民币约928亿元)F轮融资,投后估值达到1830亿美元(折合人民币约1.3万亿元),约是今年3月615亿美元(折合人民币约4391亿元)估值的近三倍。 这也意味着Anthropic成为全球仅次于OpenAI、字节跳动,估值排名全球第三的AI独角兽企业。目前全球前两大AI独角兽分别是字节跳动(估值3300亿美元,约合人民币2.4万亿元)、OpenAI(估值3000亿美元,约合人民币2.2万亿元)。这家由OpenAI前研究副总裁达里奥·阿莫迪(Dario Amodei)、丹尼拉·阿莫迪(Daniela Amodei)兄妹联合创立的Anthropic,也一度被认为是OpenAI最有力的挑战者之一。Anthropic首席财务官Krishna Rao在博客文章中提到:“我们正在整个客户群中看到需求的指数级增长。”2025年初,Anthropic的年化收入达到10亿美元(折合人民币约71.4亿元),8个月后的今天年化收入已经突破50亿美元(折合人民币约357亿元)。从客户层面看,其博客透露,Anthropic目前服务超过30万企业客户,大客户数量过去一年中增长了近7倍,而每个大客户意味着能为其带来超过10万美元(折合人民币约71.4万元)的年收入。如今其业务增长的主要推动力就是今年爆火的AI编程神器Claude Code。Claude Code今年5月由研究预览转为正式公开版,三个月时间使用量增长超10倍,产生超5亿美元(折合人民币约36亿元)年收入。本轮融资由风投公司ICONIQ、Fidelity Management&Research Company、Lightspeed Venture Partners共同领投,卡塔尔投资局、新加坡政府投资公司(GIC)等主权基金参投。其博客提到新融资将用于扩大企业采用规模、深化安全研究,并支持国际扩张。值得一提的是,Anthropic此前已完成9轮融资,总融资额达到300.4亿美元(折合人民币约2145亿元)。一、3个月营收超5亿刀,AI编程工具成增长主力 2021年,时任OpenAI前研究副总裁的Dario Amodei带着他妹妹丹尼拉·阿莫迪(Daniela Amodei)在内的逾十人研发小组出走成立Anthropic。如今这家创企已成为OpenAI最有力的竞争对手。2023年,Anthropic发布发布了聊天机器人Claude的首个版本,今年8月已经更新至Claude 4.1。在Anthropic的官宣博客中提到,新模型在智能体工具调用与多语言问答能力上超越OpenAI o3,在智能体编程方面的分数为74.5%和43.3%,大幅超越OpenAI o3和Gemini 2.5 Pro,但其在视觉推理和数学能力上与OpenAI o3和Gemini 2.5 Pro还有一定的差距。 此外,今年2月,Anthropic还推出自家AI编程工具Claude Code,今年5月宣布全面开放,从研究预览转为正式产品,Anthropic的博客提到,如今Claude Code已成为开发人员的首选工具。目前,Claude Code已集成其最强模型Claude Opus 4.1,它具备代码库感知能力,并且能够在用户的开发环境中直接编辑文件和运行命令。 自公开发布至今,Claude Code三个月时间使用量增长超10倍,产生超5亿美元(折合人民币约36亿元)年收入。二、9轮融资合计超300亿美元,谷歌亚马逊追着投 自2021年以来,自2021年以来,Anthropic已完成8次融资,共融资170.4亿美元(折合人民币约1216亿元),目前正在完成的是第9次融资,具体融资轮次及金额如下:2021年5月:A轮融资,金额1.24亿美元(折合人民币约8.9亿元),主要投资人为Dustin Moskovitz、Eric Schmidt、Jaan Tallinn。2022年4月:B轮融资,金额5.8亿美元(折合人民币约41.7亿元),主要投资人为FTX。2023年2月:3亿美元(折合人民币约21亿元),谷歌投资,成为战略股东。2023年5月:C轮融资,金额4.5亿美元(折合人民币约32.3亿元),投后估值41亿美元(折合人民币约294.4亿元),Spark Capital领投,谷歌、Salesforce Ventures、Zoom等参投。2023年9月:亚马逊宣布战略合作,初始投资12.5亿美元(折合人民币约89.8亿元),并计划总计投资高达40亿美元(折合人民币约287.2亿元)。随后亚马逊成为其主要云服务提供商。2023年10月:谷歌投资5亿美元(折合人民币约35.9亿元),并承诺未来追加15亿美元(折合人民币约107.7亿元)。2024年2月,完成7.5亿美元(折合人民币约54亿元)D轮融资,由Menlo Ventures领投。2024年3月和5月,连续在二级市场筹集8.84亿美元(折合人民币约63亿元)和4.52亿美元(折合人民币约32亿元)。2024年11月:金额40亿美元(折合人民币约287.2亿元),主要投资人为亚马逊。2025年3月:E轮融资,金额35亿美元(折合人民币约250亿元),光速创投领投,当时估值为615亿美元(折合人民币约4391亿元)。谷歌、亚马逊、Salesforce等知名科技公司均在其投资方之列。三、高运营开支是隐患,投资者更看重营收飙升 据爆料,Anthropic近期告知投资者,其直接向客户销售AI模型和Claude聊天机器人产品的毛利率约为60%,并正朝着70%迈进。该毛利率数据通常指扣除服务器成本和客户支持费用后的利润占比。知情人士解释道,这些毛利率会随公司对计算资源的规划使用效率而波动。知情人士还补充道,今年早些时候,Anthropic通过亚马逊云服务和谷歌云销售Claude模型的毛利率为-30%,猜测原因可能是亚马逊和谷歌在向云客户转售Anthropic模型时抽取了可观分成。但通过云服务商产生的收入可能只占Anthropic总收入的少数,截至2024年底,其约70%收入来自直销。目前尚不清楚直销收入的具体占比,但最新披露信息显示,Anthropic的整体毛利率可能还将维持在50%-55%,与2023年底持平。作为对比,OpenAI今年初预测2025年毛利率为48%,并预计将稳步提升,到2029年达到70%。两家公司的毛利率计算方式是否一致尚不明确。值得注意的是,Anthropic与OpenAI的毛利率均未反映其每年投入AI研发的数十亿美元资金及人力等运营开支,而这些支出都远高于传统软件企业。虽然AI模型研发成本高昂,但因为算法改进和AI芯片使用效率提升,OpenAI与Anthropic展现出的模型运行成本均呈现下降趋势,这令投资者稍感宽慰。不过当前投资者更关注的是两家公司惊人的营收增长,双方均有望大幅超越年初设定的乐观营收目标。结语:资本向AI领域头部创企集中 根据全球咨询公司Crunchbase此前的数据,全球第二季度约有400亿美元(约合人民币2856亿元)的风险投资资金流向AI领域,其中基础模型公司筹集55亿美元(约合人民币393亿元)。Anthropic此次新融资也说明,风险投资正越来越多地集中投向已经获得充足资金的大型初创公司。同时,除了此前的风投机构、知名科技巨头,此次该公司的融资也涌入了诸多国家主权资金,这也表明投资者对这家AI独角兽价值的认可。
-
谷歌搜索反垄断案宣判:Chrome保住了 9月3日消息, 周二,一名联邦法官裁定,谷歌须向竞争对手公开部分搜索结果及数据,但无需按司法部的要求拆分其Chrome浏览器业务。这一判决意味着,法院并未全盘采纳政府提出的旨在限制硅谷科技巨头垄断权力的全面改革方案。 受周二裁决影响,谷歌母公司Alphabet盘后股价大幅攀升逾8%。 哥伦比亚特区联邦法院法官阿米特·梅塔(Amit P. Mehta)在其长达223页的判决书中指出,为解决谷歌在搜索引擎市场的垄断问题,该公司应当与“符合资质的竞争对手”共享部分搜索数据。此前,美国司法部曾主张谷歌应公开更多数据,并称这类数据是其维持垄断地位的关键。 梅塔法官同时限制了谷歌为维持其搜索引擎在浏览器和手机中的默认地位而支付高额费用的行为。不过,他并未完全禁止这类支付行为,也未支持政府提出的强制谷歌出售Chrome浏览器的要求,尽管司法部认为这一措施对制约谷歌的搜索垄断权至关重要。 梅塔法官在周二发布的判决中表示:“尽管谷歌拥有显著的市场权力,但法院在制定救济措施时仍应保持一种健康的谦逊态度。本庭正是如此行事。” 这项针对互联网时代垄断行为的首例救济裁决,被视为自20多年前微软反垄断案以来,最重要的一次重塑科技行业竞争格局的法律行动。谷歌已表示将提起上诉,预计本案后续法律程序可能持续数年。 这一相对保守的判决,对美国政府近年来积极挑战科技巨头市场支配地位的努力构成了打击。自特朗普政府至拜登任内,联邦部门相继对谷歌、苹果、亚马逊及Meta提出反垄断诉讼,指控它们通过反竞争行为非法垄断互联网的关键领域。 梅塔法官的判决出炉之际,恰值生成式人工智能技术正不断冲击传统搜索引擎的地位。OpenAI、Anthropic、Perplexity等初创公司推出的类人聊天机器人,已能够应答查询、整合研究资料甚至提供旅行规划建议。 作为应对,谷歌已将人工智能生成的答案直接嵌入其搜索结果页顶部,并新增了聊天机器人交互标签页,使用户可就查询内容展开对话。 梅塔在判决书中特别指出,生成式人工智能的崛起“已然改变了本案的进程”。 “这无疑是21世纪最具影响力的反垄断案件,”曾在奥巴马政府担任反垄断助理司法部长的比尔·贝尔(Bill Baer)评论道。“当然,这场法律较量远未结束,后续必将经历层层上诉。” 梅塔法官对此案的判决具有里程碑意义,因为这是首例从起诉到补救措施裁定全程走完司法程序的、针对现代科技巨头的垄断诉讼。该判决将为今后法院审理其他大型科技公司滥用市场支配地位的案件确立重要先例。 今年4月,弗吉尼亚州的一名联邦法院法官认定谷歌在部分广告技术领域构成垄断,该类广告技术是营销人员用于在网站投放广告的核心软件系统。政府主张强制要求谷歌拆分部分广告业务,而谷歌则辩称应通过调整内部政策而非拆分来纠正其市场地位。该案将于9月举行为期两周的听证会,以确定最终补救方案。 此外,谷歌在得克萨斯州还面临另一起针对其广告技术的反垄断诉讼。原告指控谷歌通过损害使用其广告服务的新闻出版商的利益,以维持自身市场主导地位。该案由多州总检察长联合于2020年发起,目前审理已推迟,以等待弗吉尼亚州案件的进一步进展。 一名法官最早可能于今年秋季就联邦贸易委员会(FTC)对Meta提起的诉讼做出裁决。FTC指控Meta通过压制新兴竞争对手维持垄断地位。另一方面,FTC针对亚马逊涉嫌排挤中小商家的诉讼定于2027年开庭。司法部也对苹果提起反垄断诉讼,指控其制造用户转换设备的壁垒。 贝尔指出:“这份论证严密、具有开创性的司法意见,作为首例针对科技平台垄断的政府挑战的判决,将为法院如何规制数字市场的垄断行为提供重要的参考。” 梅塔法官的裁决为始于2020年的“美国诉谷歌案”画上了阶段性句号。据司法部称,谷歌搜索引擎年利润高达数十亿美元,占据近90%的搜索市场份额,但谷歌对该数据表示异议。 谷歌每年投入巨额资金维持其在苹果Safari、Mozilla Firefox等浏览器中的默认搜索引擎地位。法庭证据显示,2021年此类协议支出高达263亿美元。 政府在2023年为期十周的庭审中提出,谷歌通过“数据,体验,用户”的循环反馈巩固其垄断地位:默认设置带来更多用户,用户产生更多数据,数据进一步优化搜索质量,从而吸引更多用户,形成难以逾越的市场壁垒。 正如梅塔法官在去年的阶段性裁决中所指出的:“谷歌不仅拥有垄断地位,并且其行为也一直像垄断者一样来维持其垄断地位。” 今年春季,诉讼双方均提交了支持己方补救方案的证词与证据。美国政府主张,应强制谷歌剥离Chrome浏览器、向竞争对手开放数据共享,并禁止其签订任何确保搜索引擎在网络上获得优先展示地位的协议。而谷歌则辩称,应当允许其继续签订本案所涉的核心合作协议,但同时应赋予苹果、三星等合作伙伴更大的自由度,使其能够选择终止合作或推广其他搜索引擎。 梅塔法官在周二发布的判决意见中坦言,自身在搜索引擎和人工智能领域的专业知识有限,并指出:“与通常基于历史事实裁决争议的案件不同,本案要求法院‘透过水晶球预测未来’,而这显然不是法官的所长。” 梅塔法官最终裁定,禁止谷歌签订任何具有“排他性”的默认搜索引擎协议,即禁止其通过合同使谷歌搜索成为浏览器或手机开机界面唯一自动启用的引擎。然而,他允许谷歌继续支付费用以换取优先展示位置,这一行为正是司法部提起本次诉讼的焦点。法官进一步表示,人工智能技术的迅速发展可能削弱谷歌通过财力优势垄断分销渠道的能力。 他特别写道:“这一领域所吸引的资金规模之大、投入速度之快,令人瞩目。这种新的技术生态使法院倾向于认为,一旦出现更优质的搜索引擎产品,谷歌将难以单纯依靠财力压制竞争对手的渠道发展。” 在数据共享问题上,梅塔法官也采取了审慎立场。他要求谷歌向竞争对手开放其“搜索索引库”,即用于生成搜索结果的基础网页与信息集合,但未强制其公开与搜索结果质量相关的衍生数据,例如网页权重和排名指标等。 在法官裁定谷歌可继续支付预装费用后,苹果股价在周二盘后交易中上涨超过3%。尽管苹果并未直接卷入这起搜索引擎垄断案,但此项裁决对其影响巨大。梅塔法官在判决书中明确指出:“若全面禁止谷歌的支付行为,几乎必然会对分销合作伙伴(包括苹果)、相关市场乃至消费者造成显著,甚至在某些情况下是毁灭性的,连锁负面影响。这一后果使我们无法支持完全禁止支付的方案。” 虽然梅塔法官对谷歌通过支付手段获取独占性分销地位的行为施加了限制,但他并未全面禁止这类支付,为两家公司未来达成新的合作协议留下了空间。此前有分析认为,苹果可能会在设备初始设置阶段引入搜索引擎“选择屏”,使用户可主动选择默认搜索引擎。 分析师指出,即便谷歌案判决落地,苹果可能也需多年时间才会实际调整其现有合作模式。谷歌已表示将就判决提出上诉,分析预计仅救济措施阶段的审理就可能持续长达两年。若对二审结果仍不服,谷歌还可继续上诉,最终最高法院有权决定是否受理此案。 除许可费用之外,苹果方面曾表示,选择谷歌作为默认搜索引擎是因其“质量最佳”,并强调公司始终以“为用户提供最优工具”为优先考量。若未来无法继续将谷歌设为默认选项,苹果仍具备替代方案。例如,公司高管曾在今年早些时候透露,苹果也在考虑引入人工智能搜索引擎作为系统级可选功能。(小小)
-
工程师被指盗走xAI整个代码库 马斯克申请职业封杀令 近日,埃隆·马斯克亲口爆料,其旗下人工智能初创公司xAI的整个代码库被盗了。涉案的主角并非外部人员,而是xAI早期的核心工程师之一——Xuechen Li(以下简称“Li”)。8月28日,xAI以窃取商业机密的名义将Li告上加州北区联邦法院。起诉书显示,xAI对Li进行了多项指控,分别是违反《员工保密信息与发明转让协议》《离职证明与授权书》,盗取商业机密,违反《计算机数据与访问欺诈法》和欺诈。 xAI以窃取商业机密的名义将Li告上加州北区联邦法院 图片来源:xAI起诉书截图根据xAI的指控,Li在离职前夕,精心策划并执行了一场“代码库大迁徙”,随后还计划无缝跳槽至马斯克的“死对头”——OpenAI。而在窃密事件发生前,Li刚刚将手中的xAI股权套现,累计获利近700万美元。尽管OpenAI并不是这次案件的被告,但这事儿一出来,马斯克与OpenAI之间本就剑拔弩张的关系,无疑将更紧张了。价值“数十亿美元”的代码库失窃 xAI代码库被盗时间线要讲清楚这起代码盗窃案,还得从xAI和Li的渊源说起。2024年,Li从斯坦福大学毕业,并取得计算机博士学位。他在学术期刊上发表过不少AI相关文章。同年2月,他加入了刚刚起步的xAI,成为公司的首批20名工程师之一,深度参与xAI核心大模型Grok的开发与训练。 Xuechen Li的X账号头像因为岗位关键,xAI给予了Li极大的信任。他不仅被授予了访问公司整个技术栈组件的权限,还能访问部分机密文件和专用信息。作为对核心人才的认可,xAI还为Li提供了期权和股份。今年6月和7月,xAI协助Li出售了他持有的公司股份,累计套现近700万美元。 xAI起诉书截图但没想到的是,7月25日,当第二笔220万美元的收益到手后,Li却将xAI大量的机密信息和商业秘密,从公司配发的笔记本电脑复制到其个人控制的、非xAI的多个物理或在线存储系统中。为了不被发现,Li采取了大量措施来掩盖其行为,例如删除浏览器历史记录和系统日志,对文件进行重命名和压缩等。三天后,即7月28日,Li提出辞职。8月1日,走离职流程时,他签署了一份《离职证明》,声明其已归还所有公司财产,并删除了所有机密信息的副本。此时的他早已找好了下家,已敲定将于8月19日入职OpenAI。但服务器日志不会说谎。根据xAI的起诉书,8月11日,xAI的安全团队在例行日志审查中,发现了数据外泄的迹象。很快,矛头就指向了刚离职没多久的Li。xAI立即向Li发函,指出其非法窃取数据的行为,要求他归还并删除所有相关信息。可Li不仅不配合,反而立即更改了他用于存储盗取数据的关键账户密码,试图阻止xAI的访问和补救。8月14日和15日,在双方律师在场的情况下,Li承认窃取了公司文件,并试图掩盖这些行为,随后还签署了书面文件。更过分的是,Li于8月14日刚承认完,xAI又发现了他尚未交代的其他被盗资料。8月18日,Li还签署了一份授权访问协议,同意xAI的取证专家访问其个人设备和账户。可等专家尝试登录时才发现,Li并未提供关键账户的访问权限,还隐瞒了多个其他可能存储xAI机密信息的账户。当xAI就此当面质问时,Li的律师给出了令人难以置信的答复:Li“不记得”密码。要知道,关键账户的密码是7天前他才改过的。 xAI当面质问时,Li的律师称Li“不记得”密码 起诉书截图这种态度彻底惹毛了马斯克和xAI。8月28日,xAI对Li提起紧急诉讼,以保住被告盗用的机密信息和商业秘密。这场官司的核心,说到底还是失窃代码库的惊人价值。马斯克在X上表示,Li带走的是xAI的整个代码库。在AI模型开发动辄耗资数亿美元的今天,这份代码库的分量可想而知。xAI在起诉书中称,这些被盗的技术都是“功能优于ChatGPT和其他竞品的尖端人工智能技术”。对竞争对手来说,拿到这些机密,就像是在AI竞赛中捡到了“核武器”。起诉书称,被盗用的商业机密可以为OpenAI和其他竞争对手“节省数十亿美元的研发费用和多年的工程努力”,从而获得“潜在的、不可逾越的竞争优势”。OpenAI等公司可以利用xAI的机密信息改进ChatGPT等产品,融入Grok更具创新性和想象力的功能。 起诉书称,被盗用的商业机密可以为OpenAI和其他竞争对手“节省数十亿美元的研发费用和多年的工程努力” 图片来源:xAI起诉书截图马斯克申请“职业封杀令”在起诉书中,除了要求经济赔偿和强制交出所有设备以供法证检查外,xAI还向法庭申请了临时禁令,阻止Li在OpenAI或任何其他竞争对手公司,从事任何与生成式AI相关的角色或职责,直到确认公司追回所有被盗的机密信息。这无异于对Li的一纸“职业封杀令”。截至目前,Li并未对此发表任何评论。他的最新一条X推文停留在7月,当时他发文称,“一小群才华横溢的人在极度专注和高强度的工作中,能够在极短的时间内取得如此大的成就,这总是让我感到惊讶。”而在这条贴文的下方,马斯克于8月31日跟了一条评论,“他下载了整个xAI的代码库,日志证明他确实下载了,而且他自己也承认了!” Li的最新一条X推文停留在7月接下来,加州北区联邦法院将作出怎样的判决,我们还不得而知。但根据《加利福尼亚州刑法典》第499(c)条,在未经授权情况下,盗取、使用或复制属于企业采取合理保密措施的商业机密,属于重罪行为,最高可判处三年监禁。此外,被判犯有此罪的个人可能还需要赔偿因盗窃造成的损失。另外,根据《联邦经济间谍法》,对于个人,若实施商业机密盗窃行为,或在明知商业机密系非法获取的情况下仍予以接收,最高可被判处10年监禁,并处以罚款。对于企业,若参与商业机密窃取,则可被处以最高500万美元或相关商业机密价值三倍的罚款,以较高者为准。马斯克与OpenAI的争斗或再升级尽管OpenAI并非这起案件的被告,但其处境无疑非常微妙。这或许又将成为马斯克与OpenAI长期恩怨的又一个爆发点。8月25日,xAI和马斯克旗下的社媒平台X起诉OpenAI和苹果公司,指控这两家公司联手实施“反竞争”计划,维持在智能手机和生成式人工智能市场的垄断地位。诉讼书指出,苹果与OpenAI的“排他性协议”使ChatGPT成为iPhone唯一内置的生成式人工智能聊天机器人,相关竞争对手难以扩大规模和进行创新。OpenAI一位发言人对此回应称,这一最新诉讼“与马斯克先生持续的骚扰行为模式一致”。今年2月底,马斯克向旧金山高等法院起诉OpenAI及其首席执行官奥尔特曼 (Sam Altman),指控他们将盈利置于造福人类之上,违背了公司的创始使命。记者|兰素英 宋欣悦编辑|何小桃 高涵 易启江校对|陈柯名|每日经济新闻 nbdnews 原创文章|未经许可禁止转载、摘编、复制及镜像等使用
-
人工智能,重磅利好!国务院印发! 新华社北京8月26日电 国务院日前印发《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)。 《意见》坚持以习近平新时代中国特色社会主义思想为指导,完整准确全面贯彻新发展理念,坚持以人民为中心的发展思想,充分发挥我国数据资源丰富、产业体系完备、应用场景广阔等优势,强化前瞻谋划、系统布局、分业施策、开放共享、安全可控,以科技、产业、消费、民生、治理、全球合作等领域为重点,深入实施“人工智能+”行动,涌现一批新基础设施、新技术体系、新产业生态、新就业岗位等,加快培育发展新质生产力,使全体人民共享人工智能发展成果,更好服务中国式现代化建设。 《意见》提出加快实施6大重点行动。一是“人工智能+”科学技术,加速科学发现进程,驱动技术研发模式创新和效能提升,创新哲学社会科学研究方法。二是“人工智能+”产业发展,培育智能原生新模式新业态,推进工业全要素智能化发展,加快农业数智化转型升级,创新服务业发展新模式。三是“人工智能+”消费提质,拓展服务消费新场景,培育产品消费新业态。四是“人工智能+”民生福祉,创造更加智能的工作方式,推行更富成效的学习方式,打造更有品质的美好生活。五是“人工智能+”治理能力,开创社会治理人机共生新图景,打造安全治理多元共治新格局,共绘美丽中国生态治理新画卷。六是“人工智能+”全球合作,推动人工智能普惠共享,共建人工智能全球治理体系。 《意见》提出强化8项基础支撑能力,包括提升模型基础能力、加强数据供给创新、强化智能算力统筹、优化应用发展环境、促进开源生态繁荣、加强人才队伍建设、强化政策法规保障、提升安全能力水平等。 《意见》要求,坚持把党的领导贯彻到“人工智能+”行动全过程,国家发展改革委要加强统筹协调,各地区各部门要结合实际、因地制宜抓好贯彻落实,确保落地见效。要强化示范引领,适时总结推广经验做法,加强宣传引导,广泛凝聚社会共识,营造全社会共同参与的良好氛围。(完)国务院关于深入实施“人工智能+”行动的意见各省、自治区、直辖市人民政府,国务院各部委、各直属机构:为深入实施“人工智能+”行动,推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生活范式,促进生产力革命性跃迁和生产关系深层次变革,加快形成人机协同、跨界融合、共创分享的智能经济和智能社会新形态,现提出如下意见。一、总体要求以习近平新时代中国特色社会主义思想为指导,完整准确全面贯彻新发展理念,坚持以人民为中心的发展思想,充分发挥我国数据资源丰富、产业体系完备、应用场景广阔等优势,强化前瞻谋划、系统布局、分业施策、开放共享、安全可控,以科技、产业、消费、民生、治理、全球合作等领域为重点,深入实施“人工智能+”行动,涌现一批新基础设施、新技术体系、新产业生态、新就业岗位等,加快培育发展新质生产力,使全体人民共享人工智能发展成果,更好服务中国式现代化建设。到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长,人工智能在公共治理中的作用明显增强,人工智能开放合作体系不断完善。到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%,智能经济成为我国经济发展的重要增长极,推动技术普惠和成果共享。到2035年,我国全面步入智能经济和智能社会发展新阶段,为基本实现社会主义现代化提供有力支撑。二、加快实施重点行动(一)“人工智能+”科学技术1.加速科学发现进程。加快探索人工智能驱动的新型科研范式,加速“从0到1”重大科学发现进程。加快科学大模型建设应用,推动基础科研平台和重大科技基础设施智能化升级,打造开放共享的高质量科学数据集,提升跨模态复杂科学数据处理水平。强化人工智能跨学科牵引带动作用,推动多学科融合发展。2.驱动技术研发模式创新和效能提升。推动人工智能驱动的技术研发、工程实现、产品落地一体化协同发展,加速“从1到N”技术落地和迭代突破,促进创新成果高效转化。支持智能化研发工具和平台推广应用,加强人工智能与生物制造、量子科技、第六代移动通信(6G)等领域技术协同创新,以新的科研成果支撑场景应用落地,以新的应用需求牵引科技创新突破。3.创新哲学社会科学研究方法。推动哲学社会科学研究方法向人机协同模式转变,探索建立适应人工智能时代的新型哲学社会科学研究组织形式,拓展研究视野和观察视域。深入研究人工智能对人类认知判断、伦理规范等方面的深层次影响和作用机理,探索形成智能向善理论体系,促进人工智能更好造福人类。(二)“人工智能+”产业发展1.培育智能原生新模式新业态。鼓励有条件的企业将人工智能融入战略规划、组织架构、业务流程等,推动产业全要素智能化发展,助力传统产业改造升级,开辟战略性新兴产业和未来产业发展新赛道。大力发展智能原生技术、产品和服务体系,加快培育一批底层架构和运行逻辑基于人工智能的智能原生企业,探索全新商业模式,催生智能原生新业态。2.推进工业全要素智能化发展。推动工业全要素智能联动,加快人工智能在设计、中试、生产、服务、运营全环节落地应用。着力提升全员人工智能素养与技能,推动各行业形成更多可复用的专家知识。加快工业软件创新突破,大力发展智能制造装备。推进工业供应链智能协同,加强自适应供需匹配。推广人工智能驱动的生产工艺优化方法。深化人工智能与工业互联网融合应用,增强工业系统的智能感知与决策执行能力。3.加快农业数智化转型升级。加快人工智能驱动的育种体系创新,支持种植、养殖等农业领域智能应用。大力发展智能农机、农业无人机、农业机器人等智能装备,提高农业生产和加工工具的智能感知、决策、控制、作业等能力,强化农机农具平台化、智能化管理。加强人工智能在农业生产管理、风险防范等领域应用,帮助农民提升生产经营能力和水平。4.创新服务业发展新模式。加快服务业从数字赋能的互联网服务向智能驱动的新型服务方式演进,拓展经营范围,推动现代服务业向智向新发展。探索无人服务与人工服务相结合的新模式。在软件、信息、金融、商务、法律、交通、物流、商贸等领域,推动新一代智能终端、智能体等广泛应用。(三)“人工智能+”消费提质1.拓展服务消费新场景。培育覆盖更广、内容更丰富的智能服务业态,加快发展提效型、陪伴型等智能原生应用,支持开辟智能助理等服务新入口。加强智能消费基础设施建设,提升文娱、电商、家政、物业、出行、养老、托育等生活服务品质,拓展体验消费、个性消费、认知和情感消费等服务消费新场景。2.培育产品消费新业态。推动智能终端“万物智联”,培育智能产品生态,大力发展智能网联汽车、人工智能手机和电脑、智能机器人、智能家居、智能穿戴等新一代智能终端,打造一体化全场景覆盖的智能交互环境。加快人工智能与元宇宙、低空飞行、增材制造、脑机接口等技术融合和产品创新,探索智能产品新形态。(四)“人工智能+”民生福祉1.创造更加智能的工作方式。积极发挥人工智能在创造新岗位和赋能传统岗位方面的作用,探索人机协同的新型组织架构和管理模式,培育发展智能代理等创新型工作形态,推动在劳动力紧缺、环境高危等岗位应用。大力支持开展人工智能技能培训,激发人工智能创新创业和再就业活力。加强人工智能应用就业风险评估,引导创新资源向创造就业潜力大的方向倾斜,减少对就业的冲击。2.推行更富成效的学习方式。把人工智能融入教育教学全要素、全过程,创新智能学伴、智能教师等人机协同教育教学新模式,推动育人从知识传授为重向能力提升为本转变,加快实现大规模因材施教,提高教育质量,促进教育公平。构建智能化情景交互学习模式,推动开展方式更灵活、资源更丰富的自主学习。鼓励和支持全民积极学习人工智能新知识、新技术。3.打造更有品质的美好生活。探索推广人人可享的高水平居民健康助手,有序推动人工智能在辅助诊疗、健康管理、医保服务等场景的应用,大幅提高基层医疗健康服务能力和效率。推动人工智能在繁荣文化生产、增强文化传播、促进文化交流中展现更大作为,利用人工智能辅助创作更多具有中华文化元素和标识的文化内容,壮大文化产业。充分发挥人工智能对织密人际关系、精神慰藉陪伴、养老托育助残、推进全民健身等方面的重要作用,拓展人工智能在“好房子”全生命周期的应用,积极构建更有温度的智能社会。(五)“人工智能+”治理能力1.开创社会治理人机共生新图景。有序推动市政基础设施智能化改造升级,探索面向新一代智能终端发展的城市规划、建设与治理,提升城市运行智能化水平。加快人工智能产品和服务向乡村延伸,推动城乡智能普惠。深入开展人工智能社会实验。安全稳妥有序推进人工智能在政务领域应用,打造精准识别需求、主动规划服务、全程智能办理的政务服务新模式。加快人工智能在各类公共资源招标投标活动中的应用,提升智能交易服务和监管水平。2.打造安全治理多元共治新格局。推动构建面向自然人、数字人、智能机器人等多元一体的公共安全治理体系,加强人工智能在安全生产监管、防灾减灾救灾、公共安全预警、社会治安管理等方面的应用,提升监测预警、监管执法、指挥决策、现场救援、社会动员等工作水平,增强应用人工智能维护和塑造国家安全的能力。加快推动人工智能赋能网络空间治理,强化信息精准识别、态势主动研判、风险实时处置等能力。3.共绘美丽中国生态治理新画卷。提高空天地海一体化动态感知和国土空间智慧规划水平,强化资源要素优化配置。围绕大气、水、海洋、土壤、生物等多要素生态环境系统和全国碳市场建设等,提升人工智能驱动的监测预测、模拟推演、问题处置等能力,推动构建智能协同的精准治理模式。(六)“人工智能+”全球合作1.推动人工智能普惠共享。把人工智能作为造福人类的国际公共产品,打造平权、互信、多元、共赢的人工智能能力建设开放生态。深化人工智能领域高水平开放,推动人工智能技术开源可及,强化算力、数据、人才等领域国际合作,帮助全球南方国家加强人工智能能力建设,助力各国平等参与智能化发展进程,弥合全球智能鸿沟。2.共建人工智能全球治理体系。支持联合国在人工智能全球治理中发挥主渠道作用,探索形成各国广泛参与的治理框架,共同应对全球性挑战。深化与国际组织、专业机构等交流合作,加强治理规则、技术标准等对接协调。共同研判、积极应对人工智能应用风险,确保人工智能发展安全、可靠、可控。三、强化基础支撑能力(七)提升模型基础能力。加强人工智能基础理论研究,支持多路径技术探索和模型基础架构创新。加快研究更加高效的模型训练和推理方法,积极推动理论创新、技术创新、工程创新协同发展。探索模型应用新形态,提升复杂任务处理能力,优化交互体验。建立健全模型能力评估体系,促进模型能力有效迭代提升。(八)加强数据供给创新。以应用为导向,持续加强人工智能高质量数据集建设。完善适配人工智能发展的数据产权和版权制度,推动公共财政资助项目形成的版权内容依法合规开放。鼓励探索基于价值贡献度的数据成本补偿、收益分成等方式,加强数据供给激励。支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业。(九)强化智能算力统筹。支持人工智能芯片攻坚创新与使能软件生态培育,加快超大规模智算集群技术突破和工程落地。优化国家智算资源布局,完善全国一体化算力网,充分发挥“东数西算”国家枢纽作用,加大数、算、电、网等资源协同。加强智能算力互联互通和供需匹配,创新智能算力基础设施运营模式,鼓励发展标准化、可扩展的算力云服务,推动智能算力供给普惠易用、经济高效、绿色安全。(十)优化应用发展环境。布局建设一批国家人工智能应用中试基地,搭建行业应用共性平台。推动软件信息服务企业智能化转型,重构产品形态和服务模式。培育人工智能应用服务商,发展“模型即服务”、“智能体即服务”等,打造人工智能应用服务链。健全人工智能应用场景建设指引、开放度评价与激励政策,完善应用试错容错管理制度。加强知识产权保护、转化与协同应用。加快重点领域人工智能标准研制,推进跨行业、跨领域、国际化标准联动。(十一)促进开源生态繁荣。支持人工智能开源社区建设,促进模型、工具、数据集等汇聚开放,培育优质开源项目。建立健全人工智能开源贡献评价和激励机制,鼓励高校将开源贡献纳入学生学分认证和教师成果认定。支持企业、高校、科研机构等探索普惠高效的开源应用新模式。加快构建面向全球开放的开源技术体系和社区生态,发展具有国际影响力的开源项目和开发工具等。(十二)加强人才队伍建设。推进人工智能全学段教育和全社会通识教育,完善学科专业布局,加大高层次人才培养力度,超常规构建领军人才培养新模式,强化师资力量建设,推进产教融合、跨学科培养和国际合作。完善符合人工智能人才职业属性和岗位特点的多元化评价体系,更好发挥领军人才作用,给予青年人才更大施展空间,鼓励积极探索人工智能“无人区”。支持企业规范用好股权、期权等中长期激励方式引才留才用才。(十三)强化政策法规保障。健全国有资本投资人工智能领域考核评价和风险监管等制度。加大人工智能领域金融和财政支持力度,发展壮大长期资本、耐心资本、战略资本,完善风险分担和投资退出机制,充分发挥财政资金、政府采购等政策作用。完善人工智能法律法规、伦理准则等,推进人工智能健康发展相关立法工作。优化人工智能相关安全评估和备案管理制度。(十四)提升安全能力水平。推动模型算法、数据资源、基础设施、应用系统等安全能力建设,防范模型的黑箱、幻觉、算法歧视等带来的风险,加强前瞻评估和监测处置,推动人工智能应用合规、透明、可信赖。建立健全人工智能技术监测、风险预警、应急响应体系,强化政府引导、行业自律,坚持包容审慎、分类分级,加快形成动态敏捷、多元协同的人工智能治理格局。四、组织实施坚持把党的领导贯彻到“人工智能+”行动全过程。国家发展改革委要加强统筹协调,推动形成工作合力。各地区各部门要紧密结合实际,因地制宜抓好贯彻落实,确保落地见效。要强化示范引领,适时总结推广经验做法。要加强宣传引导,广泛凝聚社会共识,营造全社会共同参与的良好氛围。国务院2025年8月21日