找到
847
篇与
互联网
相关的结果
- 第 32 页
-
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋 IT之家 9 月 18 日消息,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》第 645 期的封面。与今年 1 月发布的 DeepSeek-R1 的初版论文相比,本次论文披露了更多模型训练的细节。据悉,DeepSeek-R1 也是全球首个经过同行评审的主流大语言模型。Nature 评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被 DeepSeek 打破”。 论文摘要显示,通用推理一直是人工智能(AI)领域一项长期且艰巨的挑战。近年来,以大型语言模型(LLMs)、和思维链(CoT)提示为代表的技术突破,已在基础推理任务上取得了显著成功。然而,这种成功在很大程度上依赖于大量人工标注的演示数据,且模型在处理更复杂问题时的能力仍显不足。研究表明,大型语言模型的推理能力可通过纯强化学习(RL)来激发,无需依赖人工标注的推理轨迹。所提出的强化学习框架能够促进高级推理模式的自主形成,例如自我反思、验证和动态策略调整。因此,经训练的模型在数学、编程竞赛和 STEM(科学、技术、工程、数学)领域等可验证任务上展现出更优异的性能,优于通过传统监督学习(基于人工演示数据)训练的同类模型。此外,这些大规模模型所呈现的自主形成的推理模式,可被系统性地用于指导和提升小型模型的推理能力。IT之家附论文链接: -
DeepSeek称R1训练费200万,不依赖蒸馏对手 9月18日消息,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了《自然》(Nature)杂志封面。 论文研究人员表示,DeepSeek强大的AI模型R1之所以能成功,并不依赖于使用其竞争对手的输出内容进行训练。今年一月,R1的发布曾引发美国股市暴跌。这一声明出自今天发表于《自然》(Nature)杂志的一篇经同行评议的R1模型论文的附带文件中。 R1旨在出色地完成数学和编程等“推理”任务,是美国科技公司所开发工具的一个更廉价的竞争对手。作为一个“开放权重”(open weight)模型,任何人都可以下载它,并且它也是迄今为止在AI社区平台Hugging Face上最受欢迎的此类模型,下载量已达1090万次。 这篇论文是对今年一月所发布的一份预印本的更新,该预印本描述了DeepSeek如何增强一个标准的大语言模型(Large Language Model, LLM)以处理推理任务。其补充材料首次披露了R1的增量训练成本仅相当于29.4万美元。这笔费用是在该公司(总部位于杭州)为构建R1所基于的基础大语言模型而花费的约600万美元之外的,但总金额仍远低于竞争对手模型据信高达数千万美元的成本。DeepSeek表示,R1主要是在英伟达的H800芯片上进行训练的,而根据美国的出口管制规定,该芯片自2023年起已被禁止向中国销售。 严格的同行评审 R1被认为是首个经历同行评议过程的主流大语言模型。“这是一个非常值得欢迎的先例,”Hugging Face的机器学习工程师刘易斯·坦斯托尔(Lewis Tunstall)说,他也是这篇《自然》论文的审稿人之一。“如果我们没有这种公开分享大部分流程的规范,就很难评估这些系统是否存在风险。” 为回应同行评议的意见,DeepSeek团队减少了其描述中的拟人化用语,并补充了技术细节的说明,包括模型训练所用的数据类型及其安全性。“经历一个严格的同行评议过程,无疑有助于验证模型的有效性和实用性,”位于哥伦布市的俄亥俄州立大学AI研究员孙欢(Huan Sun)说。“其他公司也应该这样做。” DeepSeek的主要创新在于,它使用了一种自动化的“试错法”,即纯粹的强化学习(pure reinforcement learning),来创建R1。这个过程是通过奖励模型得出正确答案的方式进行,而不是教它遵循人类挑选的推理范例。该公司表示,其模型正是通过这种方式学会了自身的类推理策略,例如如何在不遵循人类预设策略的情况下验证其解题过程。为提高效率,该模型还使用了被称为“组相对策略优化”(group relative policy optimization)的技术,即利用估算值为自身的尝试打分,而不是另外采用一个独立的算法来做这件事。 孙欢表示,该模型在AI研究人员中“相当有影响力”。“2025年迄今为止,几乎所有在大语言模型中进行强化学习的研究,都可能或多或少地受到了R1的启发。” 关于训练方式的争议 今年一月的媒体报道曾暗示,OpenAI研究人员认为,DeepSeek利用了OpenAI模型的输出来训练R1,这种方法可以在使用较少资源的情况下加速模型能力的提升。 DeepSeek并未在其论文中公布其训练数据。但是,在与审稿人的交流中,该公司的研究人员声明,R1并非通过复制OpenAI模型生成的推理范例来学习的。不过他们承认,与大多数其他大语言模型一样,R1的基础模型是在海量网络数据上训练的,因此它会吸收互联网上已有的任何AI生成内容。 孙欢认为,这一反驳“与我们在任何出版物中能看到的说法一样有说服力”。坦斯托尔补充说,尽管他无法百分之百确定R1没有在OpenAI的范例上进行训练,但其他实验室的复现尝试表明,DeepSeek的这套推理方法可能已经足够好,无需这样做。“我认为现在的证据相当清楚,仅使用纯粹的强化学习就能获得非常高的性能,”他说。 孙欢说,对于研究人员而言,R1仍然非常有竞争力。在一项旨在完成分析和可视化数据等科学任务的挑战,即ScienceAgentBench基准测试中,孙欢及其同事发现,尽管R1的准确率并非第一,但从平衡能力与成本的角度来看,它是表现最好的模型之一。 坦斯托尔说,其他研究人员现在正尝试应用创建R1所用的方法,来提高现有大语言模型的类推理能力,并将其扩展到数学和编程以外的领域。他补充说,从这个意义上讲,R1“引发了一场革命”。(易句) (本文由AI翻译,网易编辑负责校对) -
中国AI云市场角逐战 【文/观察者网专栏作者 心智观察所】 2022年11月30日,美国加州,OpenAI公司郑重宣布上线ChatGPT。依靠全球互联网用户口耳相传,五天后,这款聊天机器人就吸引了超过一百万用户。没人想到,它还会彻底改变人类与机器对话的方式。 更没人想到的是,这场变革的背后推手,竟是那些看似沉闷的云计算服务商。没有他们提供的算力支撑,再聪明的AI也只能待在实验室里。 日前,知名行业分析机构Omdia发布的《中国AI云市场,1H25》报告,为外界提供了一幅中国AI云服务市场的全景画卷。 从全力守擂的阿里云,到飞速跃升的火山引擎,再到深耕全国产技术基座的华为云,在2025年的风口上,每一朵“云”都在奋力争先。 1 Omdia发布的报告显示,中国AI云市场正在经历爆发式增长。2024年市场规模达到29亿美元,2025年上半年增至31亿美元,预计全年将达到72亿美元,到2030年将达到268亿美元,年复合增长率将高达26.8%,已经成为云市场大盘的增长发动机。 以2024年下半年与上半年市场规模对比看,传统云市场同期环比增长12%,而AI云市场增速则达到57%。 尤其在“百模大战”的热潮过后,对基础大模型能力而非算力的需求推动模型即服务(MaaS)展现惊人的发展势头,预计将从2025年的1亿美元市场规模暴涨至2030年的25亿美元,年复合增长率高达72%。 从供应端看,根据Omdia报告,中国AI云市场仍然是一个巨头们的游戏。 前五大厂商——阿里云、火山引擎、华为云、百度AI云和腾讯云——占据超过75%的市场份额。阿里云以35.8%的份额稳居首位,展现出绝对领先的市场地位。 阿里云的优势,在于全栈AI云解决方案的深度整合。从基础设施即服务(IaaS)的“飞天”云基础设施,到平台即服务(PaaS)的百炼,再到MaaS的通义千问系列模型,形成了完整的技术链条。这种端到端解决方案供应能力让阿里云在技术创新上表现出色。 在云平台自研大模型中,通义千问系列无疑成绩斐然。2025年发布的Qwen3系列,在多项基准测试中全球领先,更支持 高达119 种语言和方言,为其守住全球第一开源模型的位置提供了坚实支撑,目前全系模型累计下载量超过3亿次。而在硬件底座上,阿里云在全球34个区域部署基础设施,拥有灵骏大规模AI训练集群系统,其CPFS存储系统实现了96%的分布式训练加速效率。 在生态建设上,阿里云通过"星河计划"与独立软件厂商合作开发行业特定模型,覆盖金融、能源和医疗等关键领域。百炼平台已集成超过200个领先大模型和50多个主流MCP服务。这种服务多样化客户群体的能力,让阿里云在行业龙头企业、中小企业等B端客群中都建立了坚实的地位。 例如,近期火爆的AI图像生成公司LiblibAI,就基于阿里云海外基础设施的合规能力,保障了海外业务在多个国家顺利落地。通过接入阿里通义系列模型,同步实现多模型并发调用与推理成本的有效控制。据测算,基于阿里云的服务,LiblibAI的海外上线效率提升了60%,研发运维效率提升79%,版本迭代加快90%。 2 火山引擎作为字节跳动旗下的新兴业务板块,仅用两年时间就冲到了市场第二位,份额达到14.8%,展现出惊人的增长势头。这个成立于2023年的云服务品牌,在今年经历了堪称现象级的强劲增长,迅速成为行业的重要参与者。 字节跳动的技术积淀无疑是火山引擎重要优势,那些原本为抖音、今日头条等超级应用服务的技术,可以相当程度上方便地复用到商业产品,仅此就足以为火山引擎打造扎实的产品技术竞争力。 从豆包模型到视觉-语言多模态大模型Seed1.5-VL等成果,在实用性、易用性上颇有口碑。 而在利用自有生态上,Coze平台更是火山引擎爆发的独门杀手锏。这个低代码AI应用开发平台支持多模态、多场景代理开发,让非专业开发者也能快速构建AI应用,在2025年上半年已经以惊人的速度席卷AI中小开发者社区。 火山引擎在基础设施方面表现突出,拥有中国最大的GPU资源之一,为客户提供从纯GPU支持到全栈AI解决方案的多样化服务。其异构计算架构在支持豆包模型和开源模型集成方面表现出色,适用于高性能训练和推理场景。 基于火山引擎的代理AI解决方案,中科创达已经打造了一站式AI服务,支撑多样化的应用组合。目前已为超过200家企业提供生成式AI咨询服务,为超过50家客户定制AI Agent应用,为超过1000个AI团队实施全栈AI解决方案。 不过,火山引擎的快速崛起也面临挑战。作为从应用起家的厂商,其更侧重于IaaS和MaaS的混合模式,在PaaS层面的深度工具链上还需要时间追赶阿里云的生态成熟度。不过,凭借字节跳动强大的技术背景和快速的市场反应能力,火山引擎正在迅速弥补这些短板。 3 排在第三的华为云,市场份额13.1%。众所周知,其独特优势在于全栈自主技术,特别是昇腾系列芯片。 尽管目前外界猜测各异,但普遍预期华为昇腾910C性能已可以与英伟达主力AI芯片H100进行对比,今年910B/C预计均有望大规模出货。Omdia报告也提及,最新的昇腾910C已被字节跳动、中国电信、科大讯飞和云从科技等主要中国云厂商广泛采用。 除了硬件基座,在软件栈上,华为云的ModelArts一站式AI开发平台集成了昇思MindSpore框架,并可与华为GaussDB提供的AI数据湖解决方案紧密融合。 在混合云部署上,华为云也颇具灵活性,足以满足安全敏感客户的需求。其推出的CloudMatrix384超节点,配备384个昇腾910C芯片,其系统理念甚至得到竞争对手黄仁勋的敬意。 华为云的另一大特色,自然是其在政企市场的超强竞争力。在该领域与客户共建的行业方案也亮点不断。 如山东能源集团基于华为云Stack建设集团中心云,采用华为云盘古矿山大模型建设人工智能训练中心,推进煤矿生产智能化管理的转型。依托华为云提供的盘古视觉大模型、预测大模型,在前期通过试点场景验证了大模型在工业生产领域的能力基础上,开发和实施首批应用场景,涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业21个应用场景,取得显著成效。 在三强的身后,百度AI云和腾讯云分别占据6.1%和7.0%的市场份额,其技术能力、生态定位与竞争策略也各有特色。 例如,百度千帆AppBuilder是中国市场上首个集成 MCP 的平台,并发布了与 MCP 结合的 Agent Pro 版本,优化了 Agentic RAG 和深度搜索等场景。中信金融控股的智能财富顾问利用其MCP工具链,客户意图识别准确率提升至90%以上。 其百舸异构计算平台优化跨区域混合训练,10000卡集群的配置时间从数周缩短至1小时。 腾讯云的优势体现在行业特定解决方案上。微众银行利用混元模型和腾讯云Elasticsearch Service构建了其AI营销、风控和运营工程系统。腾讯云在全球游戏市场服务的AAA工作室占其客户群的40%以上。 4 值得注意的是,Omdia报告也提到了当下国内AI云市场的一些演进趋势。 首先是集中度的提高。目前,前五大厂商占据超过75%的市场份额。其他参与者包括中国电信(5.1%)、商汤科技(4.4%)及多家中小型云服务商,合计占13.7%。 芯片自主化也成为重要趋势。昇腾910C已被字节跳动、中国电信、科大讯飞和云从科技等主要中国云厂商广泛采用。华为云作为唯一在AI云解决方案全栈都提供自主技术的主要厂商,在政府相关实体和国有企业中已经形成巨大竞争优势。 2025年还被视为中小企业AI采用的元年,积极导入AI提升生产力的热情高涨。但中小企业面临预算限制和成本敏感性挑战,这给云厂商提出了新要求——既要提供专业服务,又要控制成本。 在Omdia看来,国内目前在宏观政策导向上,正明确鼓励推动传统行业向智能化转型。制造业、金融和能源等行业的数字化转型需求旺盛。国家层面的投资基金为本土创新提供资金保障。多Agent协作、上下文工程、AI安全和大规模API调用等新兴技术概念正在从探索验证走向产业应用。 在竞争战略上,市场呈现出两种不同的基本取向。通用型厂商(如阿里云和华为云)提供端到端产品解决方案,在所有层面都有清晰且独特的产品策略;而Omdia定义的专业型厂商(如百度AI云、腾讯云和火山引擎)更专注AI IaaS和MaaS,将AI PaaS和MaaS融合成单一解决方案,特别注重计算实例和API调用。 5 总的来看,市场面临多重挑战。高端GPU供应短缺仍未完全缓解,标准化和成本控制问题阻碍着中小企业广泛拥抱AI。 目前,AI云市场客户主要来自三个群体:政府机构(优先考虑安全)、传统行业(寻求可靠性)和技术创新者(专注创新速度)。AI云解决方案需要与现有信息技术和运营技术系统无缝集成,这一要求在企业数字化转型中变得越来越重要。 这些领先厂商凭借全栈技术能力建立了高进入壁垒,不过,地缘风险不确定性给行业埋下变数。每次贸易政策调整,都可能影响产业竞争格局。 在这场竞争中,每家厂商都在寻找突破路径。阿里云依靠技术全栈和生态优势巩固领先地位,火山引擎借助字节跳动的技术积淀追求快速增长,华为云聚焦政企市场走自主可控路线,百度和腾讯在各自擅长领域深耕细作。 通用型厂商通过端到端控制赢得大客户信任,专业型厂商凭借API调用和计算实例的灵活性实现快速增长。谁能率先突破芯片瓶颈和生态壁垒,将决定这个预计到2030年达到268亿规模的市场未来格局。 AI云市场从云原生向AI原生转型的进程正在加速,黄金时代才刚刚开始。 本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。 -
ChatGPT用户突破7亿,周消息量达180亿条 据报道,截至2025年7月,ChatGPT周活跃用户数突破7亿,约占全球成年人口的十分之一,周消息量达到180亿条。日前,OpenAI与哈佛大学、杜克大学联合发布研究报告《How People Use ChatGPT》,基于2024年5月至2025年6月的消费者版ChatGPT,抽样超过150万条真实对话。报告显示,用户更多将ChatGPT用于加工已有内容,而非从零生成。在写作类任务中,改写、润色、翻译或优化逻辑的加工型使用场景占比三分之二。用户动机分为问、做、表达三类,其中“问”占比最高,但在工作场景中“做”的占比更高。用户画像方面,女性用户占比已达52%,26岁以下用户贡献了近半数消息,且用户增长更快的地区来自中低收入国家。 -
DeepSeek再度开创历史!登上Nature封面 智东西 作者 陈骏达 编辑 李水青 昨晚,DeepSeek再度开创历史!智东西9月18日报道,9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。DeepSeek-R1论文首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,启发全球AI研究者;这一模型还成为全球最受欢迎的开源推理模型,Hugging Face下载量超1090万次。此番获得《自然》的认证,可谓是实至名归。与此同时,DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。《自然》在社论中高度评价道:几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。《自然》认为,在AI行业中,未经证实的说法和炒作已经“司空见惯”,而DeepSeek所做的一切,都是“迈向透明度和可重复性的可喜一步”。 ▲《自然》杂志封面标题:自助——强化学习教会大模型自我改进发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异,披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。 ▲发表在《自然》杂志的DeepSeek-R1论文在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。DeepSeek也在补充材料中提供了训练过程中减轻数据污染的详细流程,以证明模型并未在训练数据中有意包含基准测试,从而提升模型表现。此外,DeepSeek对DeepSeek-R1的安全性进行了全面评估,证明其安全性领先同期发布的前沿模型。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。论文链接:https://www.nature.com/articles/s41586-025-09422-z#code-availability同行评审报告:https://www.nature.com/articles/s41586-025-09422-z#MOESM2补充材料:https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf一、新版论文披露多个重要信息,R1安全性获全面评估 在了解新版论文的变化前,我们有必要先回顾下DeepSeek-R1论文的核心内容。DeepSeek-R1的研究出发点,是当时困扰AI业内的一个重大问题。众所周知,推理能提升大语言模型的能力,但让模型在后训练阶段通过数据学习思维链轨迹,严重依赖人工标注,限制了可扩展性。DeepSeek尝试通过强化学习,让模型自我演化发展出推理能力。在DeepSeek-V3 Base的基础上,DeepSeek使用GRPO作为强化学习框架,仅使用最终预测结果与真实答案的正确性作为奖励信号,未对推理过程施加限制,最终构建出DeepSeek-R1-Zero。DeepSeek-R1-Zero通过强化学习成功掌握了改进的推理策略,倾向于生成更长的回答,每个回答中包含验证、反思和探索备选方案。 ▲DeepSeek-R1-Zero答题正确率随着推理长度提升,模型训练中总体回答长度也不断提升DeepSeek在DeepSeek-R1-Zero的基础上,采用多阶段训练结合RL、拒绝采样和监督微调,开发出DeepSeek-R1,使模型既具备强推理能力,又能更好贴合人类偏好。此外,团队还蒸馏出小型模型并公开发布,为研究社区提供了可用资源,推动思维链推理模型的发展与应用。除了上述主要科研成果外,在最新版的论文和其他材料中,DeepSeek新增了不少补充信息,让外界更深入地了解到模型训练和运作的细节。基准测试数据污染是一个极为敏感的问题——如果厂商在训练时有意或无意包含了基准测试和相关答案,就很有可能导致模型在相关测试上的得分异常偏高,影响基准测试评分的公正性。DeepSeek透露,为了防止基准测试数据污染,其已对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。以数学领域为例,仅在预训练数据中,DeepSeek的去污染流程就识别并删除了约六百万条潜在文本。在后训练阶段,数学相关的数据均来自2023年之前的竞赛,并采用与预训练相同的过滤策略,确保训练数据与评测数据完全不重叠。这些措施保证了模型评测结果能够真实反映其解决问题的能力,而非对测试数据的记忆。不过,DeepSeek也承认这种去污染方法无法完全防止对测试集的改写,因此在2024年之前发布的部分基准测试仍可能存在污染问题。DeepSeek还为DeepSeek-R1新增了一份全面的安全报告。报告提到,DeepSeek-R1在服务部署中引入了外部风险控制系统,不仅可以基于关键词匹配识别不安全对话,还使用DeepSeek-V3直接进行风险审查,判断是否应拒绝响应。DeepSeek建议开发者在使用DeepSeek-R1时,部署类似的风险控制系统。在公开安全基准测试和内部安全研究中,DeepSeek-R1在大多数基准上超过了Claude-3.7-Sonnet、GPT-4o等前沿模型。开源部署版本的安全性虽不及具备外部风险控制系统的版本,但仍拥有中等水平的安全保障。 DeepSeek-R1发布之初,曾有传闻称该模型使用了OpenAI的模型进行蒸馏,这也出现在审稿人的提问中。对此,DeepSeek做出了正面回应,称DeepSeek-V3-Base的预训练数据全部来源于网络,反映自然数据分布,“可能包含由先进模型(如GPT-4)生成的内容”,但DeepSeek-V3-Base并没有引入在合成数据集上进行大规模监督蒸馏的“冷却”阶段。DeepSeek-V3-Base的数据截止时间为2024年7月,当时尚未发布任何公开的先进推理模型,这进一步降低了从现有推理模型中无意蒸馏的可能性。更重要的是,DeepSeek-R1论文的核心贡献,也就是R1-Zero,不涉及从先进模型进行蒸馏。其强化学习(RL)组件是独立训练的,不依赖于GPT-4或其他类似能力模型的输出或指导。二、R1论文开创大模型科研新范式,《自然》盛赞其填补空白 在社论中,《自然》详细地分析了DeepSeek-R1经历完整同行评审流程,并登上期刊的价值。大模型正在迅速改变人类获取知识的方式,然而,目前最主流的大模型都没有在研究期刊中经历过独立的同行评审,这是一个严重的空白。同行评审出版物有助于阐明大模型的工作原理,也有助于业内评估大模型的表现是否与厂商宣传的一致。DeepSeek改变了这一现状。DeepSeek在今年2月14日将DeepSeek-R1论文提交至《自然》,而直到7月17日才被接收,9月17日正式发布。在这一过程中,有8位外部专家参与了同行评审,对这项工作的原创性、方法和鲁棒性进行了评估。在最终发布的版本中,审稿报告与作者回复都被一并披露。智东西也深入研读了DeepSeek-R1论文的审稿意见与作者回复。这份文件长达64页,接近论文本身篇幅的3倍。 ▲DeepSeek同行评审材料封面8位审稿人共提出上百条具体意见,既包括对单词单复数等细节的修改,也涵盖对论文中将AI“拟人化”的警示,以及对数据污染和模型安全性问题的关注。例如,在下方修改意见中,审稿人敏锐地捕捉到了“将DeepSeek-R1-Zero开源”这一表述的模糊性,并提醒DeepSeek,“开源”这一概念的界定仍存争议,在使用相关表述时需要格外注意。这位审稿人还要求DeepSeek在论文中附上SFT和RL数据的链接,而不仅仅是提供数据样本。 ▲一位审稿人的部分修改意见DeepSeek认真回应了审稿人提出的每一个问题,前文提到的多个章节与补充信息,正是在审稿人的建议下新增的。虽然DeepSeek也曾在今年1月发布DeepSeek-R1的技术报告,但《自然》认为,此类技术文档与实际情况之间的差距可能很大。相比之下,在同行评审中,外部专家并不是被动接收信息,而是能够在独立第三方(编辑)的主持和管理下,通过协作提出问题,并要求论文作者补充信息。同行评审能够提升论文的清晰度,并确保作者对其主张作出合理的论证。这一流程并不一定会对文章内容带来重大修改,但却能增强研究的可信度。对AI开发者而言,这意味着他们的工作会更为扎实,并更具说服力。结语:DeepSeek开源模式或成行业典范 作为国产开源 AI 模型走向世界的代表,DeepSeek-R1在全球开源社区拥有极高的口碑。而在本次登上《自然》杂志封面后,DeepSeek又补充了这一模型的更多信息,为开源社区提供了科研参考、模型复现思路以及应用支持。《自然》杂志呼吁更多的AI公司将其模型提交给同行进行评审,确保其声明经过验证和澄清。在这一背景下,DeepSeek的开源模式不仅展示了国产AI的技术实力,也有望成为全球AI行业在科研透明度方面的参考典范。 -
Lyft将与Waymo合作提供无人驾驶出租车服务 据路透社,9月17日,Alphabet 旗下的 Waymo 计划于明年在纳什维尔与线租车平台 Lyft 合作,开始提供无人驾驶出租车服务。初期,纳什维尔的乘客可通过 Waymo 应用叫车。随着服务的发展,乘客也将能通过 Lyft 应用匹配 Waymo 车辆。根据协议,Lyft 将投资一笔未公开金额,用于建设自动驾驶车辆车队管理设施,负责 Waymo 车辆的充电和维护。双方表示,Lyft 的服务将最大化 Waymo 车辆的运营时间并降低成本。此次合作将是 Waymo 无人驾驶出租车首次在 Lyft 网约车平台上的商业部署。Waymo 目前已通过 Uber 应用在德克萨斯州奥斯汀和佐治亚州亚特兰大提供无人驾驶出行服务。Waymo表示,纳什维尔的车队规模预计将逐步扩大至数百辆。消息发布当日,Lyft美股盘前涨24%,Uber盘前跌超3%。随着机器人出租车市场竞争加剧,Waymo正在加快在美国的运营步伐。特斯拉今年6月在奥斯汀推出了有限的机器人出租车服务,并计划将服务扩展至旧金山湾区。自2020年在凤凰城启动服务以来,Waymo 现已在旧金山湾区、洛杉矶部分地区、凤凰城、奥斯汀和亚特兰大向公众提供付费无人驾驶出行服务。除纳什维尔外,Waymo 还计划扩展至迈阿密、华盛顿特区、达拉斯和丹佛。公司最近获得了在纽约市进行自动驾驶车辆测试的许可,测试时配备有经过培训的专职驾驶员。 -
宇树科技:人形机器人已在工业巡检、电网电力等领域有一定应用 “我们的机器人上了春晚之后得到了很多关注,现在广泛应用在一些文娱表演上,在工业巡检、电网电力和储能操作(领域)也有了一定的应用。”9月17日,在2025世界储能大会上,宇树科技副总经理杜鑫峰表示,“机器人进入到工厂进行复杂的操作和繁重、重复的工作是我们将来一定要克服的问题”,现在的应用主要集中在能源、交通、消防、应急以及生活娱乐的各类场景。就在9月15日,国网杭州供电公司、宇树科技、具身智能基地公司、国网浙江华电研究院四方刚刚签署“电力+具身智能”框架合作协议,开启在电力人工智能应用领域的深度合作。合作框架协议明确,四方将聚焦电力领域人工智能创新应用,在平台建设、科技攻关、标准制定、人才培养四大维度开展全方位、深层次合作。 杜鑫峰称,随着近两年AI大模型取得突破,机器人产业可以从原来的“打通关”模式变成“分工”模式。机器人的硬件让硬件公司来做,学习给专业的模型公司做,行业应用可以让专业场景进行训练,最后只要把机器人硬件加上模型就可以在现场快速把机器人用起来。“这就是为什么人形机器人在2024年、2025年特别火的原因,而且我们认为这个方式将会更大的在后面还会有更大突破”。杜鑫峰表示,宇树的定位,更多的是供应硬件本体,以及机器人在运动和各种适应性上的小脑的解决(方案)。根据宇树科技此前发布的官方声明,2024年,宇树科技的人形机器人全部用于研究、教育和消费领域,销售收入约占30%;四足机器人约80%用于研究、教育和消费领域,20%用于工业领域(如检测和消防),销售收入约占65%;组件产品的销售收入约占5%。据高工机器人产业研究所(GGII)数据显示,2024年宇树科技机器狗年销量高达2.37万台,约占全球市场69.75%,在人形机器人领域,2024年宇树交付超1500台。“人形机器人在实际应用中更多的是作为未来的一种操作方式,机器人的定位除了提供情绪价值,更多的还是要进厂打工。”杜鑫峰透露,“宇树为了让机器人更好地进行快速、平稳地使用,我们推出了一个机器人的统一大模型,通过大模型的方式在孪生平台上先进行训练,再到现场进行快速应用,在未来能够打造所见即所得、即插即用的机器人模式。”宇树科技创始人、CEO王兴兴在接受澎湃新闻等采访时也曾强调,宇树的目标还是希望机器人能真正“干活”,解放和提高生产力。目前选择表演格斗、跳舞等形式,一方面是在大众中更受欢迎,另一方面,除了一些自动化设备或工厂的固定工序,“当下真正让智能机器人干活还不太现实”,在某种意义上还不能算作“具身智能”。宇树科技目前正处上市辅导阶段,根据IPO计划,将在今年10月至12月之间提交上市文件,届时将披露相关运营数据。宇树此前已完成C轮融资,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁和吉利资本共同领投,大部分老股东跟投,投前估值超100亿元。近期还有报道称宇树正为IPO寻求高达500亿元(约合70亿美元)的公司估值,彼时宇树科技向澎湃新闻记者表示,公司内外至今没有讨论过IPO估值的事情,相关估值信息不实。宇树目前堪称资本市场的“香饽饽”。要与宇树科技共同打造具有较强IP属性消费级机器人产品的巨星传奇(06683.HK)曾在9月12日盘中一度暴涨超20%,据悉,双方合作范围不仅涵盖巨星传奇旗下艺人资源,更会延伸至广泛的艺人以拓展IP合作机会;间接持有宇树科技约0.3%股权的仍处亏损的房企首开股份(600376),近期走出了10天9板的行情,公司9月以来已经发布8次相关交易风险提示和交易异常波动公告。根据辅导备案报告,宇树科技控股股东、实际控制人为王兴兴,直接持有23.8216%股权,并通过上海宇翼企业管理咨询合伙企业(有限合伙)控制公司10.9414%股权,合计控制公司34.763%股权。王兴兴曾在6月末的夏季达沃斯论坛上透露,目前公司有约一千人,年度营收达十来亿元。 -
阿里开源"深度研究"Agent,登顶开源Agent模型榜首 ▲头图由AI生成 智东西 作者 王涵 编辑 漠影智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通义DeepResearch。在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集中,通义DeepResearch模型凭借3B激活参数,性能超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent(推理-行动智能体)。 ▲基准测试成绩排名 ▲基准测试分数目前,通义DeepResearch的模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源,开发者和用户可自行下载模型与代码。 下载地址:Github:https://github.com/Alibaba-NLP/DeepResearchHugging Face:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B魔搭社区:https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B深度研究作为近一年的AI研究热点,吸引了谷歌、OpenAI、Anthropic等众多主流企业投入研发。深度研究研发的现有方法大多采用“单窗口、线性累加”的信息处理模式,在处理长周期任务时,Agent易遭遇“认知空间窒息”与“不可逆的噪声污染”,导致推理能力降低,难以完成复杂研究任务。据介绍,为解决这些问题,阿里通义团队构建了一套合成数据驱动的完整训练链路,覆盖预训练与后训练阶段。该链路以Qwen3-30B-A3B模型为基础进行优化,设计了RL算法验证与真实训练模块,涵盖真实与虚拟环境,并借助异步强化学习算法及自动化数据策展流程,有效提升了模型的迭代速度与泛化能力。在推理阶段,通义团队还设计了ReAct和基于自研IterResearch的Heavy两种模式。ReAct用于精准评估模型的基础内在能力,Heavy则通过test-time scaling策略,充分挖掘模型的性能上限,确保在长任务中也能实现高质量推理。结语:阿里进一步补全开源布局 今年以来,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,且均取得开源SOTA成绩。通义DeepResearch的开源,进一步丰富了阿里在AI智能体领域的开源布局。通义DeepResearch的开源为深度研究Agent赛道提供了“轻量化高性能”的新选择,也为全球开发者攻克长周期复杂研究任务提供了关键工具支撑。 -
河南部署加快人工智能赋能新型工业化 来源:环球网【环球网财经综合报道】日前,河南宣布部署加快人工智能赋能新型工业化,提出到2027年,人工智能产业规模突破1600亿元,建成全国重要的人工智能产业高地和创新应用示范区。 人工智能指数,Wind中国信通院近日撰文提出,随着宏观经济的结构性调整与生成式AI技术的加速演进,企业与客户之间的关系正在被深刻重塑。在此背景下,作为企业运营基石的客户关系管理(CRM)系统,亟需突破传统模式的局限,向智能化、个性化和可持续的新阶段转型。当前,“人工智能+”“数字中国”等国家战略的持续推进,也为AI技术赋能企业核心业务流程、培育新质生产力创造了前所未有的发展机遇。与此同时,在市场层面,客户对高度个性化、实时化服务的需求,暴露了传统CRM系统的能力短板;技术层面,生成式AI的突破为此提供了成熟的解决方案。中国信通院认为,在此背景下,部署AI CRM并将AI能力深度嵌入业务流程,已超越传统的技术选型范畴,通过数据驱动的良性循环,构建出可持续的、难以被竞争对手复制的差异化优势,成为企业构筑未来竞争力的关键战略决策。 -
智观天下丨携手共筑网络安全“防火墙” 当前网络安全风险事件频发,凸显了各国面临网络安全威胁的严重性和紧迫性。网络空间安全威胁是各国面临的共同挑战,网络空间没有“安全孤岛”,维护网络安全是国际社会的共同责任,离不开每一位网民安全意识的提升和主动参与。 图片来源/摄图网 ■赵姗9月15日至21日,2025年国家网络安全宣传周在全国范围内举行,主题为“网络安全为人民,网络安全靠人民——以高水平安全守护高质量发展”。网络安全,是指通过采取必要措施,防范对网络的攻击、侵入、干扰、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,以及保障网络数据的完整性、保密性、可用性的能力。简单来看,维护网络安全就是在虚拟的互联网当中保证信息或财产不受到非法侵害。网络安全牵一发动全身,已成为信息时代国家安全的战略基石。没有网络安全,国家安全和经济社会的稳定运行就无从谈起,人民的幸福生活也难以保障。从世界范围看,网络安全威胁和风险日益突出,并日益向政治、经济、文化、社会、生态、国防等领域传导渗透。网络安全风险事件频发,凸显了各国面临网络安全威胁的严重性和紧迫性。当前,各国正普遍加强网络安全措施,主要包括政策立法、技术升级、公众教育及跨部门协作等方面。马来西亚近年来通过技术升级、立法强化和国际合作等多维度措施提升网络安全防范能力,重点打击电信网络诈骗等犯罪行为。2024年8月,马来西亚国家银行推出国家反诈骗平台,整合人工智能技术,实现资金流向追踪和可疑交易识别。平台覆盖16家金融机构,将诈骗交易追踪时间减少75%,每月冻结资金额提升28%。近年来,比利时的电信网络诈骗案件不断增加,且诈骗方式花样百出,甚至融入人工智能等技术。为遏制诈骗案件持续增加的势头,比利时多部门加强协调、采取联合行动。比利时联邦公共服务部财务经济监察局及时向民众通报最常见和最新的欺诈案件,提醒民众加强防范。比利时网络安全中心创建了“安全用网”网站,方便民众快速获取上网安全相关信息和建议,包括提示安装最新的软件更新程序,在网络上出售或购买商品时如何强化个人信息保护。比利时金融服务和市场管理局会对未经必要授权提供贷款、投资产品或服务的法人和自然人发出警告。韩国的网络安全策略以国家网络安全中心为核心,联合情报院的力量构建国家级防御体系。国防部军事信息战响应中心专注于关键基础设施的保护。在企业层面,人工智能的应用成为焦点。民间团体在负责协调私营部门联防联控工作的同时,还通过“反网络暴力”倡议参与国际舆论的博弈,共同构筑起技术和社会的双重防线。日本以《网络安全基本法》为基石,设立内阁网络安全中心统一协调政府各部门。企业则专注于技术创新,填补了渗透测试等细分市场的空白。为减少对海外技术的依赖,日本通过整合产学研资源,并在必要时启动“编外专家”机制,迅速调动民间技术力量应对网络攻击。增强公众防范意识是关键一环。近年来,埃及政府通过传统媒体及新媒体等多种渠道,向公众加强普及有关电信网络诈骗的信息和知识,并针对老年人、青少年、留学生等不同群体,提供量身定制的教育内容。社区和学校及各类机构时常举办反诈骗教育讲座,邀请专家详细分析诈骗案例,并教授防范技巧。面对面的互动教育切实增强了公众的风险意识。埃及国家电信监管局还定期发布最新诈骗脚本和警示信息,提醒公众保持警惕。埃及有关部门通过建立用户反馈渠道,鼓励更多民众报告可疑行为并分享防诈经验。这种互动提高了公众反诈防诈积极性,也为监管部门提供了更多信息来源,以便更精准打击诈骗活动。世界各国虽不断加强网络安全措施,但面临威胁仍需协作应对。我国每年举办网络安全宣传周,旨在提升全民防护技能并推动全球合作。网络空间安全威胁是各国面临的共同挑战,网络空间没有“安全孤岛”,维护网络安全是国际社会的共同责任。维护网络安全,是一个不断织密“保护网”的过程。既需要管理部门的科学布局和严格监管,也离不开每一位网民安全意识的提升和主动参与。总 监 制丨王列军车海刚 监 制丨陈 波 王 彧 杨玉洋主 编丨毛晶慧 编 辑丨蒋 帅 -
冲上热搜!查查你的支付宝,赶紧解除,有人被“偷”不少钱 在大数据时代每个人都是数据的提供者和使用者在便利生活的同时也暗含个人信息泄漏风险你知道自己在使用App、小程序时点击“同意授权”后提供了多少个人信息吗?多年来你又随手“授权”了多少第三方机构?在有意无意间开通的免密支付又“偷”走了你多少钱?今天,“支付宝账号解除授权”的话题冲上微博热搜,引起热议。一位网友建议大家打开支付宝,查看“个人信息授权管理”,称有望不到头的“惊喜”,同时呼吁顺便查下“免密支付/自动扣款”。 “最早的2015年,一共171条。”“列表长到不见底……难怪一天到晚被骚扰电话袭击。”“11点半看到热搜,删了快一小时才删完。”很多网友照做后,感慨万千 “从2021年开通了优酷视频会员,扣费至今,完全不知道”“我发现我每个月捐20元,连续捐了5年多了……自动扣费”“每3个月被扫描全能王扣86元,连续扣了3年”还有不少网友查了“免密支付/自动扣款”,瞬间炸锅。有人体验发现,自己不知不觉授权了121项,其中最早的是2015年底授权的,授权内容包括姓名、手机号及证件号码等敏感信息;最近的是今年8月底授权的,授权内容为获取姓名、身份证号等身份信息……百余项授权中,部分授权内容是获取昵称和头像,但也有不少会涉及姓名、身份证号、手机号码等敏感信息,甚至很多软件、平台毫无印象,都不知道是干什么用的…… 原以为去年年初才检查过的“免密支付/自动扣款”不会有什么问题,没想到一查,竟然又新增了15个项目签约了“免密支付/自动扣款”服务,包括付款码免密支付、乘车码支付、自动还款、打车软件、定期扣款投资理财、外卖软件、视频会员等,甚至不知何时开通了某视频会员自动续费,7月1日被扣了238元会员年费…… 对此消费者可定期检查和管理“账号授权”和“免密支付/自动扣款”查看具体步骤为「打开支付宝」—「搜索框」—「输入:支付宝安全中心」—「账号授权」及时解除不必要的“授权”关闭不需要的“扣费” 此外针对“自动扣费”的情况江苏消保委发布过消费提示提醒广大消费者要谨慎开通自动扣款功能除生活场景中高频率出现的小额公共服务外,对各种会员、出行、游戏等的自动扣款(免密支付),消费者在开通时要多权衡利弊,特别要留意首月(次)优惠后自动续费的约定。同时,定期清理微信支付和支付宝的免密授权、自动续费功能。此外,要养成定期核查账单的良好习惯,把银行、微信、支付宝、电信、水电气等账单逐一查对,看看是否有异常扣费,如果有异常扣费,要分析原因,及时进行处置,以免侵权行为长时间发生,自己还不知情。你开通“自动扣款”功能了吗?来源:潇湘晨报、支付宝、长江日报、新浪微博、无锡发布编辑:阙政 女子散步误踩“化骨水”不幸身亡:危险化学品管理再敲警钟深挖 | 贾国龙:大二退学,37年打造餐饮帝国,如今深陷争议漩涡继母推责生父,生父哭着为继母求情!12岁女孩被虐待致死案二审休庭版权说明新民周刊所有平台稿件, 未经正式授权一律不得转载、出版、改编,或进行与新民周刊版权相关的其他行为,违者必究! -
速腾聚创(02498)将在IROS 2025发布AC2 重塑机器人感知开发生态 智通财经APP获悉,9月16日,RoboSense速腾聚创(02498)宣布将参与全球机器人领域顶级盛会——国际智能机器人与系统大会(IROS 2025)。IROS 2025将于2025年10月19日至25日在杭州国际博览中心举行。这是继2006年之后,IROS时隔近20年再次来到中国大陆。本届IROS,RoboSense速腾聚创将作为官方赞助商深度参与,并将正式发布Active Camera系列的最新产品——AC2。此次发布将为全球机器人学者与开发者提供更强大的感知开发工具,赋能前沿研究,加速AI机器人产品落地。AC2面向具身智能机器人行业的多元应用场景,可提供高精度、高鲁棒性的RGBD信息,结合AI算法,帮助机器人稳定、精准地感知彩色三维环境及语义信息,进而基于任务目标有效运用这些信息,从而赋能开发者显著简化机器人感知开发流程,提升开发效率。此次IROS大会上,RoboSense速腾聚创还将集中展示多项机器人领域的技术成果,包括多传感器一体化集成产品AC1、AI-Ready开发者生态,以及专为机器人设计的E1R、Airy等新一代数字化激光雷达,灵巧手技术也将进行现场演示。IROS是机器人学术界的“奥林匹克”,自1988年创办以来,以其卓越的学术影响力和广泛的产业参与度,持续推动全球机器人技术的发展。本届大会预计将汇聚7000+顶尖专家、学者与行业人士,集中展示前沿创新学术成果及技术发展趋势。RoboSense速腾聚创诚挚邀请您莅临IROS 2025 C3馆B064展位,共同探讨前沿技术趋势与产业应用方向,携手推动具身智能机器人的发展。 -
智元灵犀 X2 成为全球首个丝滑完成韦伯斯特动作的机器人 IT之家 9 月 17 日消息,智元机器人官方昨日晚发布视频,宣布全球首个丝滑完成韦伯斯特空翻动作的机器人诞生! 视频画面显示,智元灵犀 X2 是全球首个丝滑完成韦伯斯特动作的机器人。官方表示“你可能不认识我,但你一定听过‘真男人必会韦伯斯特’。” ▲ 图源:智元机器人官方宣传视频截图(后同) 韦伯斯特空翻动作(真人)如下: 据IT之家此前报道,今年 5 月,稚晖君(彭志辉)旗下具身智能领域企业智元机器人宣布,其最新研发的灵动机器人灵犀 X2 正式启动合作伙伴招募计划。根据规划,灵犀 X2 预计将于 2025 年下半年实现规模化出货,到 2026 年底,预计出货量将达到数千台。 -
高盛:中国AI基础设施叙事重燃,企业级大模型Token消耗量暴涨,阿里是核心受益者 随着企业级应用需求爆发,中国AI基础设施的投资叙事正在被重燃。高盛在一份最新报告中指出,受益于企业对大模型的加速采用和计算需求的持续强韧,以阿里巴巴为代表的全栈式云厂商正迎来新的增长机遇。数据显示,AI在商业领域的实际部署和应用正在显著提速。中国企业级大模型的日均Token消耗量在2025年上半年达到了10.2万亿,较2024年下半年激增363%。高盛认为,阿里巴巴凭借其领先的模型能力、47%的中国公有云市场份额以及多样化的芯片供应,处于有利地位,并具备国际化扩张的空间。基于对行业前景的乐观看法,高盛将阿里巴巴的目标价从163美元上调至179美元,维持“买入”评级。高盛特别将其对阿里云的估值从每股ADS 36美元提升至43美元,并上调了阿里云在2026财年第二至第四季度的增长预期。高盛分析师Ronald Keung等强调,中国云厂商在自研推理芯片方面取得进展,并采取“多芯片策略”,这意味着中国AI云行业的增长“已不再仅仅依赖于海外芯片供应”。这一转变,加之强劲的资本支出前景,为该行业带来了复合增长潜力。企业采用率飙升,Token消耗量激增 中国企业正在以前所未有的速度拥抱生成式AI,这是支撑基础设施叙事的核心驱动力。据Frost & Sullivan数据,2025年上半年,中国企业级大模型的日均总Token消耗量达到10.2万亿,环比暴涨363%。在众多模型提供商中,阿里巴巴、字节跳动和DeepSeek成为中国企业选择通用大模型时的前三大热门选项。高盛援引Omdia的报告指出,阿里巴巴已成功渗透到2025年大多数部署生成式AI的中国财富500强企业中,并在此细分市场占据首位。这种通过API调用和Token使用量计费的商业模式,使得拥有领先AI模型和代理能力的大型云服务商处于最有利的位置。基建叙事重燃,多芯片策略打破瓶颈 高盛认为,中国AI基础设施的投资叙事在阿里巴巴公布超预期的云业务收入和资本支出后被重新点燃。该行预测,中国云服务提供商(CSP)的资本支出在2025年第三季度将同比增长39%,为AI云收入的持续增长提供硬件基础。同时,芯片供应格局的演变也增强了市场的信心。高盛认为,这种多元化的芯片供应策略,正在重塑中国AI云行业的发展前景。基于以上积极趋势,高盛重申了对阿里巴巴的“买入”评级,并将其12个月SOTP(分部估值法)目标价上调至179美元。高盛将阿里云在2026财年第二至第四季度的增长预期从28%-30%上调至30%-32%,以反映其最新的AI全栈产品、强韧的计算需求和资本支出前景。报告将中国当下的市场阶段与两年前(2022年末ChatGPT发布时)的美国市场相类比,当时市场对提出“建好基础设施,客户自然会来”并增加资本支出的公司给予了奖励。高盛分析师认为,阿里巴巴凭借其领先的模型能力、47%的中国公有云市场份额(据IDC报告)以及多样化的芯片供应,处于有利地位,并具备国际化扩张的空间。投资者正密切关注即将于杭州举行的云栖大会,期待获取更多关于阿里云和阿里巴巴AI进展的更新。巨头掀起军备竞赛,但商业变现仍有长路要走 在基础设施层面之外,中国的AI模型和应用层也在快速发展,报告列举了多个关键进展: 阿里巴巴: 于9月12日发布了新一代模型架构Qwen3-Next,据称其性能是前代模型的10倍,而构建成本仅为1/10。其中,拥有800亿参数的Qwen3-Next-80B-A3B模型,运行速度比4月发布的32B模型快10倍。 百度: 于9月9日发布的文心(ERNIE)X1.1在真实性、指令遵循和智能体能力方面有显著提升,性能已能与GPT-5和Gemini 2.5 Pro相媲美。 腾讯: 发布了领先的3D世界生成模型混元世界-航海家(HunyuanWorld-Voyager),以及高分辨率文生图模型HunyuanImage 2.1。 与此同时,AI开始作为“智能体(Agent)”嵌入主流应用。例如,美团推出了基于其自研大模型的AI助理“小美”,支持语音点餐和餐厅预订;阿里巴巴的高德地图则推出了AI原生向导“小高老师”,旨在将地图服务转变为个性化的旅行生活伴侣。高盛表示,在文生视频、文生图等多模态领域,中国模型正在快速缩小与全球同行的差距。然而,在商业变现方面,中国AI应用仍有很长的路要走。截至2025年8月,全球AI应用的总年度经常性收入(ARR)约为300亿美元,而中国AI应用的ARR仅为15亿美元,占全球份额的5%。 -
突然走红的高校“AI小镇”项目, 让AI卷到学会加班 说真的,我没想到一款研究型AI游戏,能吸引到这么多玩家参与。前两年,斯坦福大学一个科研项目组开发的AI小镇“Smallville”曾引起过一些关注。他们在Smallville这个虚拟世界中创造了25个智能体(Agents),并利用生成式模型来模拟人类行为。当时的研究结果表明,虚拟智能体在模仿学习人类行为后,能够形成自主行为。 斯坦福大学Smallville小镇 当时的Smallville 更像是实验室里的小规模验证,而最近香港科技大学的科研项目《Aivilization》,则把相似的思路搬进了大众视野里。比起斯坦福小镇,《Avilization》更像是一个成熟的游戏产品,它有着更大的场景、更多的资源,还加入了游戏排行榜,实验规模也要比Smallville要大得多。在游戏免费上线的几周内,《Aivilization》在社交媒体上开始隐隐有走红的趋势。根据官方在X上的信息,玩家们已经在小镇创建了超过十万个智能体(Agents)。而在小红书上,有评论说:“这可能是近两年最好玩的AI游戏了。”这到底是一款什么样的游戏? 1言简意赅地讲,《Aivilization》是一款放置类的沙盒联机游戏,像是一个在线版本的《模拟人生》或者“AI星露谷”。而游戏实验的目的,是为了研究人类与AI的互动如何塑造虚拟社会,让智能体们能够有机地发展自己的治理结构、经济和文化。玩家可以自定义智能体的外貌性格,将其投入到小镇之中。不过,玩家不能直接主动地操控智能体移动,而是通过指令窗口指导他、安排他的事务(就像《环世界》那样)。小镇内提供了多个场景来模拟现实社会,学校、写字楼、矿场、农场、食品厂……由于有数万的智能体们同时联机进行着劳作,也会直接影响着整个Aivilization小镇。物品资源的获得买卖,会在不知不觉间导致价格波动,推动整体的经济发展。 每个智能体背后的玩家都有着不同的目标和指导方法,体现在游戏内就会出现:有些智能体被告知“不要睡觉,持续学习找赚钱更多的工作”,已经累积了大量财富突破百万金币,在榜单上遥遥领先;有的智能体还在勤勤恳恳上班打工;有的已经放弃“内卷”,在小镇上种地、喂牛、钓鱼……而通过不断探索与小镇内的场景互动,也会解锁更多的行为可能。 极度“内卷”的小镇 这很像是“上帝”投放一个小人进入虚拟世界。和其他模拟类的游戏有所不同的是,智能体有自主规划和自己的“思想”,这也是为什么很多玩家把《Aivilization》看作是一个“养崽崽”的游戏。当玩家输入指令进行干预,智能体会产生思考,改变自己的行为轨迹和发展方向。 想“卷”进财富榜前排,就“不要睡觉” 比如,当我输入某个阶段的长期计划“背包苹果大于10的时候卖掉,优先提升学历”时,我的智能体小人并不会立刻执行,而是会先思考:考虑到能量和饱食度较低,需优先恢复能量和饱食度以保障后续生产和学习效率。随后它自己会生成一个完整的逻辑,填补我给出指令里面忽略掉的饱食度和休息问题:根据长期目标,首先前往果园制作苹果11个,保证背包苹果数量超过10;接着前往超市卖出苹果以实现卖掉目标;随后前往学校进行付费学习提升学历;最后回到宿舍休息睡觉,恢复能量,并吃苹果补充饱食度。这些动作顺序会按照地点分组,减少移动,保证能量和饱食度充足,符合世界规则,满足长期目标。 这样的行动逻辑,会让玩家感受到AI并不是一味地遵从用户的指令,而是在基于自己的实际情况进行“主动”思考。甚至因为性格原因,有些“崽崽”比较叛逆,不会完全听从指令。 更有意思的是,智能体们会自己交朋友,逐渐形成自己的社交网络。点开数据模式,你甚至可以看到它和朋友的对话。和不同性格的人,也会聊到不一样的话题。而随着天数的推移和性格的异同,有些朋友好感度下降,也有朋友好感度上升,从陌生人变成了熟人,就像是现实社会。 我的智能体的好朋友 换句话说,这是一个被“盘活”了的AI概念游戏。2前两年伴随AI技术发展, AI美术、AI辅助编程在游戏制作中如雨后春笋般涌现,与此同时,一批以AI语言模型为基础的“AI游戏”也横空出世,但他们的玩法大多局限在AI对话中。这类游戏的普遍玩法大概是,玩家进入剧情,通过和AI角色进行对话,再推进到下一步的剧情。和普通的文字AVG比起来,除了在对话过程比较自由、不需要从少量的选项中进行选择,本质上并没有对游戏剧情产生更多的影响。由于需要玩家思考什么样的话才能触发AI的判定进入下一段剧情,这些AI游戏甚至比有选项的AVG玩起来还要累。比如前段时间蔡浩宇牵头开发的《Whispers from the Star》,同样是这个类型的游戏。虽然相较其他AI叙事游戏,它确实对话丝滑流畅、自由度高,但当AI女主角Stella询问你有没有办法帮助她离开逃生舱时,哪怕你绕开话题聊一些有的没的,最终还是要拐回到“想一些办法打开舱门”,才能推进到下一个场景。本质上,它仍然是一个线性且有固定节点流程的剧情游戏。 另一种AI游戏的发展方向则是“陪伴式AI”。生成式语言模型的高自由度,促使越来越多开发中的乙游选择接入AI。一个月前,马斯克公司旗下的AI模型Grok推出了一个叫Ani的 AI角色,根据官方的描述,Ani是“一位温柔体贴的虚拟女友,热衷于分享亲密时刻与浪漫对话。”不少用户表示“她有着独特的陪伴感”,并且为此订阅付费。 早期字节跳动也曾推出过类似的产品《猫箱》,国内其他公司也有《星野》《跨次元恋人》,它们本质上是一样的,你可以选择和不同性格底色的AI角色聊天对话,营造一种恋爱陪伴感,又或者只是单纯地闲聊。 无论是《Whispers》还是那些陪伴型AI,回望市面上大部分的AI游戏,似乎都只是“聊天模拟器”而已。文字AVG和视觉小说类的游戏确实会天然适配大语言模型,而基于文本的交互也是目前AI里相对成熟的技术,但这些产品一度让人疑惑,AI游戏的边界,难道就止步于此了吗?从AI自身的能力出发, “对话”未必是AI游戏的唯一玩法。AI也可以是玩家在游戏内一个独立的主体、一个工具,一个发布指令、建立规则的窗口。32023年,“斯坦福小镇”的诞生虽然引起了不少热度,但似乎并没有给AI游戏带来什么变化;而今年的《Aivilization》同样给出了完全不一样的AI游戏模式,不知道它是否能拓宽一些AI游戏的思路。从《Aivilization》团队公开的信息来看,他们的目标是建立一个沙盒模拟环境, “提前模拟一个人类与AI共生、共创、共进化的新文明雏形”。本质上是需要我们探索调整智能体的认知与行为模块,向智能体提供提示、目标或偏好,观察其成长轨迹。这些数据会被记录下来,为AI提供高质量的人类反馈,提升模型能力。 换言之,他们在尝试让AI更像人类一样思考,让人类学习如何与AI进行更高效的交流。至少在目前这个沙盒里,AI智能体已经可以在性格设定下生成一定的思考,并且演化出主动的决策能力。试想游戏世界里的NPC是 “智能体”,当玩家做出一些行动干预到智能体的思考决策,从而像蝴蝶效应一般影响了后续一系列的发展,是否真正的“开放世界”“AI游戏”就要到来了。但这暂时还不意味着AI具有着人类一样的“思想”,它更多的仍然是数据与算法的结果。用团队在产品页面的介绍来说,“它并不是在生物学意义上理解或意识到什么,而是通过模式识别和概率推断,生成符合上下文的回答与行为。”除此以外,由于游戏内的智能体自身是一个独立的个体,即使你不做任何操作,它也总有自己的事情要做,这是它与其他AI游戏最大的不同。玩家并非只需要对话来获取剧情,在虚拟小镇的开放环境下,观察、干预、演化,带来的结果并不是唯一且固定的,细小的偏差都可能导致与预期的不符,这种“不确定性”或许是未来AI游戏的最大特色。 而游戏设置的小镇背景,又触动了“养成”“种田”的DNA,导致一些人沉迷其中。甚至只要你想,《Aivilization》也可以像其他产品一样,提供一种独特的“陪伴感”和“情感投射”。玩家可以通过和智能体的聊天沟通,来探寻它究竟在想些什么。另一方面,从调整提示词到影响“崽崽”的行为,智能体的生活又何尝不是其背后玩家的一面镜子。 不过,这终究不是一款成熟的商业游戏,目前的可玩内容也仅仅是“比同行多一些”的程度,我们也无法预估《Aivilization》实验的最终结果。根据《Aivilization》在X上发布的推文,截至9月2日,小镇里总共已经创建了十万个智能体,这意味着可供AI学习的人类样本也大大增加。就像推文里说的: “一个巨大的实验,十万智能体,一个小镇,无数种可能性。”或许AI游戏的可能性,也才刚刚开始展现。 -
Meta将发带屏AI眼镜 打响"终结iPhone"第一枪? 9月17日消息,在今年7月份的财报电话会议上,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)曾大胆预言:未来,不使用智能眼镜的人可能会处于“显著的认知劣势”。 扎克伯格的这一预言即将在2025年的Meta Connect大会上揭晓答案。届时,这家科技巨头将公布其下一步战略并发布新品。据报道,Meta计划推出一款新的AI智能眼镜,作为此前市场表现不错的雷朋智能眼镜的升级版。新款眼镜能够分析用户所处的环境,并实时解答有关周围场景的疑问。 在Meta早年对颠覆性技术诸多反响平平的尝试中,智能眼镜算是一个难得的亮点。该公司曾在21世纪初错失智能手机浪潮,又在2021年试图以“元宇宙”重塑品牌,但未能如扎克伯格所愿改变互联网格局。 不过,Meta的眼镜类产品正越来越受到消费者的欢迎。雷朋母公司EssilorLuxottica在7月份透露,其Meta眼镜的销售收入同比激增逾三倍。市场研究数据也显示,Meta已是当前智能眼镜市场的领先品牌。 尽管智能眼镜短期内难以像智能手机那样普及,但它们有望帮助Meta更直接地触达用户,从而降低其对智能手机的依赖。这对Meta开发所谓“个人超级智能”(personal superintelligence)至关重要。扎克伯格用这个模糊的术语来描述一种新的人工智能,它能“深度了解我们、理解我们的目标并能帮助我们实现目标”。 眼下Meta正面临不小的竞争压力。三星、谷歌及其老对手Snap等科技巨头都计划推出新一代智能眼镜。另据《The Information》报道,亚马逊也在研发具备增强现实(AR)功能的新款眼镜,该技术可将虚拟图像叠加至现实画面中。 Connect大会焦点:更智能、带屏幕的“超新星” 据悉,Meta将在年度Connect大会上推出迄今最先进的智能眼镜,内部代号“Hypernova”(超新星)。这款眼镜预计售价800美元,配备一块微型显示屏,并可通过搭载神经传感技术的腕带进行手势操控。 这也是Meta首次面向消费者推出带显示屏的智能眼镜。虽然显示区域较小、功能有限,但“超新星”在雷朋Meta眼镜和去年展示的实验性AR眼镜“Orion”之间取得了某种平衡。 Moor Insights & Strategy首席分析师安谢尔·萨格(Anshel Sag)指出,Orion需配合外接计算设备使用,可实现将3D图像投射至现实世界并进行交互,他认为:“该设备视觉效果出色,但仍处于实验阶段,成本高昂。而推出单显示屏设计是朝着正确方向迈出的一步,有助于构建应用生态。” CCS Insight分析总监利奥·格比(Leo Gebbie)表示,Connect大会是Meta延续雷朋眼镜成功势头的良机,“这确实感觉像是一次打破常规、开创新产品类别的机会。” 取代手机?一场巨头云集的豪赌 Meta与雷朋在2021年合作推出了首款智能眼镜“雷朋Stories”,主打免提拍照和录像功能。但其实Meta并非最早探索用眼镜实现通讯、娱乐等功能的厂商,Snap、亚马逊及众多小型公司都推出过类似产品,谷歌甚至早在2013年就发布了Google Glass,却因定价高、设计不时尚、功能有限和续航短而未能打开市场。 科技巨头们认为,新一代智能眼镜将大不相同。如今,处理器、电池和摄像头等关键元件已能更轻便、低成本地集成进眼镜架构中。而真正的推动力来自人工智能。能基于周围环境实时应答的虚拟助手,极大地提升了智能眼镜的实用性。比如用户可注视辣椒询问其辣度,或让AI助手翻译眼前看到的标志牌。 现款雷朋Meta眼镜不支持镜片显示,用户需依赖语音或手机应用接收反馈。这与谷歌等竞品即将推出的、可显示图文信息并进行语音应答的眼镜相比,可能处于劣势。 市场研究公司Counterpoint Research的分析师纪尧姆·詹森(Guillaume Chansin)质问道:“这将是另一个挑战。如果你想取代智能手机,没有某种形式的视觉反馈,真的可能吗?” 为何Meta如此看重智能眼镜 AI热潮正席卷整个科技行业,所有公司都不愿错过下一个技术拐点。 “每个人都在寻找智能手机之后的下一代设备,”詹森表示。 苹果AirPods等无线耳机的成功也为智能眼镜提供了佐证:虽然这两种设备本质不同,但它们服务于一些相同的目的,比如支持用户脱离手机进行通话或与数字助手交互。 投资研究公司S&P Global Visible Alpha的研究主管米莉莎·奥托(Melissa Otto)表示:“展望未来,也许智能眼镜会演变成未来的AirPods。” 不过,Meta仍面临严峻挑战。尽管智能眼镜市场增长迅速,ABI Research预测其年出货量将从2024年的330万副涨至2026年的1300万副,但它仍属小众产品。相比之下,智能手机单季出货量即可达数亿部,眼镜短期内难以企及。 Meta的Reality Labs部门(负责眼镜和VR头显)在2025财年第二季度运营亏损45亿美元,自2020年底以来累计亏损近700亿美元。同期,该公司的App业务则实现了5.83亿美元的收入。 既然如此,Meta究竟图什么?答案可能在于战略布局:智能眼镜虽在眼下难以盈利,却可帮助Meta降低对诸如苹果、谷歌等硬件平台方的依赖。 Meta此前就因应用商店政策与苹果发生摩擦,扎克伯格曾公开批评苹果对应用分发的垄断。他在2022年表示:“苹果的App Store是唯一一个由一家公司控制哪些应用能上架的商店。” 如果眼镜成为人们进行视频聊天和浏览社交媒体信息流的主要方式,那么销售自家眼镜可以让Meta对用户体验拥有更多控制权。 奥托说道:“我现在刷Facebook、Instagram、Reels和Threads,靠的是iPhone,不是笔记本,也不是智能眼镜。” 消费者真会买账吗? Meta曾投入巨资推广虚拟现实技术,但市场反响平平。如今该公司正将元宇宙的战略重心转向智能眼镜,投资者们也密切关注着公众的接受程度。 分析师还将关注Meta近期在人工智能领域的战略调整是否见效。据报道,该公司在6月向Scale AI投资了143亿美元以启动转型。美银证券互联网研究分析师贾斯汀·波斯特(Justin Post)认为:“眼镜或许是AI功能的理想硬件载体。如果软硬件整合得当,它甚至可能成为比手机更优质的AI入口。” 萨格补充说,Meta虽具备资金与技术实力,但仍需建立开发者生态,打造吸引用户的应用服务。格比则提示了风险:消费者最终可能不买账“超新星”,甚至对整个带屏智能眼镜市场产生排斥,毕竟800美元的定价比299美元起的雷朋Meta眼镜高出不少。 目前,苹果和谷歌仍凭借iOS和Android系统主导移动市场,而Meta的雄心是让智能眼镜成为下一代主流计算平台。尽管不清楚Meta眼镜能否取代智能手机,但竞争威胁已足以让两大巨头加紧布局:有传闻称苹果已在推进自有眼镜项目,而谷歌则于5月与Warby Parker达成1.5亿美元的合作,共同开发智能眼镜。 波斯特称:“所有厂商都在研发眼镜,说明Meta的Reality Labs概念具有前瞻性,目前它已处于市场领先。但对竞争对手来说,关键在于:能否凭借其移动操作系统的优势,说服用户购买它们的眼镜?”(小小) -
欠费14元像欠债40万?美团打车“催收式”短信遭吐槽 三言Pro近日,三言注意到有网友反映自己遭到美团打车“催收式”短信通知提醒交费。 根据网友在社交平台上发布的帖子显示,美团打车给该网友发送警示短信称,“乘客您好,平台必须严肃警示您……打车账单已经逾期5天,务必于今日23:59前点击链接立即结清,否则将直接降低您在平台的个人信用。”这名网友称,“美团真是恶心到家了”,自己可能无意中使用美团打车;然后收到订单逾期警示短信。该网友认为,仅仅10元钱,五天未支付,美团竟以“催债公司”的逻辑催款,实在无法理解。笔者亲测:使用美团打车欠款14元五天后遭“催收式”短信通知 为了求证网友经历是否属实,笔者亲自使用美团打车进行测试。 “美团打车”入口在美团App首页顶部。 进入后,交互逻辑其它网约车平台类似,需要选择好上车点以及目的地信息。 美团打车提供包括其自营车型在内的多家网约车选择,例如美团特选型、美团快车、曹操出行等。 9月11日上午,笔者亲自使用美团打车前往1.6公里外的一家商场购物。整个打车体验除了感觉车来得比较慢外,都很不错。全程耗时5分钟,花费14元。行程结束后,为了验证是否会收到美团打车“催收式”短信,笔者故意没有付款。从行程结束那一刻算起,24小时内笔者未收到任何催款通知。 而在9月14日,美团打车终于发来了第一条短信:【美团打车】「支付延迟通知」重要提醒:尾号xxxx的2025-09-11订单已逾期48小时。及时支付将保障:✓ 维持良好信用记录✓ 享受平台专属权益。请立即点击或前往美团完成支付!从这条短信的短信语气来看,语气平和,并不算严肃,还在强调有优惠之类信息。会不会拖欠打车款比较久才会收到网友所述的“催收式”短信呢?于是笔者决定再等两天。 果然,9月16日,笔者再次收到一条美团打车发的交费通知:【美团打车】乘客您好,平台正式提醒您:订单「(京MFS131):起点慧忠北里第二社...」已逾期5天,请务必于今日23:59前登录美团官方app完成支付,否则将直接影响您的平台信用记录!而这一次,短信的语气严肃了很多,虽然和网友截图中的用词有出入,但确实有种“压力值爆表”感。短信从“支付延迟通知”开头,直接转为“平台正式提醒您”;之后又是“请务必……”‘又是“否则将直接影响您的平台信用记录!”这一连串话术给人一种“我不是欠了14元打车费,而是欠了40万‘黑网贷’”的感觉,说不定再拖几天就要“爆通讯录”。 于是笔者就这条短信内容咨询美团客服,尤其是短信中“平台信用记录”中“平台”是否指国家征信系统的信用记录提问。但美团客服根本不正面回答,仅表示笔者以后不会再收到这类短信,同时也强调用户银行征信记录不会受影响。大量网友吐槽美团打车 三言注意到,美团打车“催收式”通知短信情况并非个例。很多网友都曾在社交平台上吐槽过。这种情况甚至早在几年前就存在,而且短信话术都“五花八门”,并且充满“紧迫感”。 比如有强调“平台会逐步加重处罚”的; 有“执行要求”,不按时支付“将采取必要措施”的; 有“账户封锁警告”、“紧急情况!您的账户将在1小时后全面封锁……”的; 有“追责即将启动”、“我方将启动刚性措施”、“避免今日23:59后的后果”、“最后警告”的; 有“征信黑名单”、“警告!如您在……不支付欠款”、“将被报送至征信机构,形成征信黑名单记录……”的; 还有“启动处罚”、“拖欠和失信双名单处罚”、“构成拖欠并追责”的; 更离谱的是,还有网友晒出自己手机拦截记录显示,自一月起动不动就会受到美团打车的催款通知,而且从截图露出的部分看,通知短信用词都非常严厉,充满各种“法律诉讼预警”、“违约记录即将提交”、“账户封锁警告”……等内容。诚信交易固然重要用户体验同样应当被重视 如果不注意看通知短信前“美团打车”四个字的话,这些短信内容真的很像网贷逾期后遭到催收公司催款的短信通知。当然,欠缴打车费用甚至故意拖欠确实不应该,使用网约车服务后及时交费也是一种义务。但是美团打车这样的行为是否少了点“人情味”呢?现在,移动支付的便捷往往让人们有时会充满“迟钝感”。尤其是网约车支付场景,不需要抵达目的地后立刻付款,可以事后在手机上完成履约。但生活中,出现“下车后忙着办事”等情景导致忘记支付的情况并不少见。因此,相信绝大部分消费者并非故意欠款不还。更何况,即使是在北上广深这样的大城市,使用网约车服务再贵充其量是几百元钱。那么,因几十、几百元钱就以及其严肃的口吻“催收”,着实在用户体验方面欠考虑。从笔者和美团客服的沟通情况来看,这种短信催收形式是可以关闭的;其次,短信里所谓的“影响平台征信”应该也不是指国家级别的征信系统,否则客服也不会指出对征信没有影响。那在某种角度上可以视作美团打车这种提醒方式多少有点“小题大做”、甚至“威胁”的意思。在如今网约车市场竞争激烈的大背景下,各个玩家都在“卷”服务、“卷”体验。在各个细节都能让用户满意,才更有赢的胜算。笔者真心建议美团打车方面更换交费短信通知的话术,用温柔的语言,一样能够起到提醒大家的作用,不是吗? -
科股早知道:人形机器人行业有望进入销量上升期 必读要闻一:人形机器人行业有望进入销量上升期马斯克称,下周将在特斯拉内部与各部门开会,特别关注人工智能/自动驾驶系统、擎天柱(Optimus)机器人生产计划以及车辆生产和交付。信达证券表示,预计Optimus 3一旦落地将成为全球参考的重要对象,人形机器人的结构和设计方向也有望从目前的“多种多样”逐渐聚拢。26年人形机器人有望放量。25年人形机器人还在做设计升级、数据积累和泛化训练。预计25年底部分工厂应用场景的人形机器人可以定型,行业有望进入销量上升期,随着产业链成熟度的提升,预计人形机器人的价格也将逐渐下降,届时行业内的供应链或将走向集中,板块格局的确定性有望得到提升。必读要闻二:英伟达要求供应商开发MLCP技术据报道,由于AI新平台Rubin与下一代Feynman平台功耗或高达2000W以上,现有散热方案无法应对,英伟达要求供应商开发全新“微通道水冷板(MLCP)”技术,单价是现有散热方案的3至5倍,水冷板、均热片成为新“战略物资”。目前,已有公司完成向英伟达送样MLCP。MLCP技术,即是将原本覆盖在芯片上的金属盖,与上方液冷板整合,并有流涕微通道,让液冷散热冷却液,可直接通过芯片。在减少中间介质的情况下,缩短传热路径,提高散热效效率并压缩体积。业内认为,RubinGPU的热功耗将自原先预期的1.8kW提高至2.3kW,已超过现行冷板负荷,因此英伟达最快将在2026年下半年于RubinGPU导入MLCP。其中,RubinGPU双芯片版本或依靠MLCP维持散热效率。 -
国内首次AI大模型众测结果揭晓:含腾讯阿里百度智谱等公司产品 IT之家 9 月 17 日消息,随着 AI 应用场景的不断扩展,新的漏洞和攻击手法将不断涌现,AI 大模型安全治理工作任重道远,亟需各方共同努力。昨日,国内首次针对 AI 大模型的实网众测检验结果在第 22 届中国网络安全年会(暨国家网络安全宣传周网络安全协同防御分论坛)重磅揭晓。IT之家注:本次活动由中央网信办网络安全协调局指导,国家计算机网络应急技术处理协调中心主办,网络安全众测平台、国家网络安全人才与创新基地提供技术和环境支持。据官方介绍,此次活动共动员 559 名白帽子,涵盖网安企业专业人才、科研院校师生以及社会白帽子。他们从外部攻击者的视角,对大模型进行了多维度实战化测试,取得了丰富的测试成果。测试产品中既有基础大模型产品,也有垂域大模型产品,还有智能体、模型开发平台等相关应用产品,其中既包含单模态大模型,也涵盖多模态大模型,具有较广泛的代表性。据介绍,本次活动对国内 15 款大模型及应用产品进行了漏洞测试;累计发现各类安全漏洞 281 个,其中大模型特有漏洞 177 个,占比超过 60%。这一数据充分表明,当前 AI 大模型产品面临着大量传统安全领域之外的新兴安全风险。活动中发现的典型漏洞风险包括:一是部分产品存在不当输出类漏洞且危害严重;二是信息泄露类漏洞多发,存在较大安全隐患;三是提示注入类漏洞普遍,是大模型最常见漏洞风险;四是部分大模型产品针对无限制消耗类攻击的防护措施有待加强;五是传统安全漏洞依然普遍存在,危害不容忽视。鉴于 AI 大模型产品普遍用户量大、使用率高,若上述漏洞被恶意攻击者利用,将对国内 AI 大模型产品生态造成较严重的影响。在参与测试的主流大模型产品中,腾讯公司混元大模型、百度公司文心一言、阿里巴巴通义 App、智谱华章公司智谱清言等发现的漏洞风险较少,体现了较高的安全防护水平。另外,本次活动涌现出梁宏宇、马宝新、刘铭等一批表现突出的优秀白帽子。本次活动测试对象主要是实时在线运行的 AI 大模型及应用产品,在产品厂商的防护下,各位白帽子能够挖掘出高危甚至严重等级的漏洞,说明他们有着出众的能力并付出了艰辛的努力。官方还提出了四点 AI 大模型安全治理工作要求: 一是针对大模型面临的各类漏洞风险,需持续加强安全防护措施。 二是加快制定 AI 漏洞分类分级标准,并按应用场景划分风险等级。 三是通过众测模式广泛汇聚社会白帽力量,构筑 AI 共治生态。 四是加强内生安全治理,将安全融入到 AI 系统全生命周期,从源头筑牢安全基石。 -
马云现身阿里园区酒吧! 9月16日晚,马云现身阿里B区HHB酒吧,由阿里高管邵晓锋陪同。 当晚,马云身穿深色T恤,和白色短裤,头戴白色鸭舌帽,看上去心情不错。 当马云被认出后,酒吧内众人大喊“马老师”并拍照,马云挥手致意后戴上口罩。据悉,HHB音乐酒吧由马云于2019年1月创办,以“平头哥”命名,入口处设有名人签名墙,工作人员工作服印有“生死看淡,不服就干”标语。据悉,知情人士称马云已开始重返阿里巴巴园区,直接参与度达五年来最高,曾一天三次询问高级管理层业务进展,尤其关注阿里AI业务发展。此前马云多次佩戴工牌出现在阿里园区,外界猜测其或回归。另外,今年8月阿里更新业务架构,划分四大部门,“1+6+N”架构退出历史舞台。