找到
1120
篇与
互联网
相关的结果
- 第 47 页
-
华擎推 AI QuickSet WSL,简化 Win 平台部署 Linux AI 应用流程 IT之家 9 月 16 日消息,华擎 ASRock 昨日宣布推出 AI QuickSet 安装小帮手的第二代版本 AI QuickSet WSL,可让用户能更轻易地建立功能完整的 WSL(IT之家注:适用于 Linux 的 Windows 子系统)环境并部署一系列基于 Linux 系统的 AI 应用程序。 华擎表示,在 Windows 上建立合适的 AI 开发环境不仅步骤繁琐过程也相当耗时,而许多尖端的 AI 应用程序主要是在 Linux 环境下开发与运行,这对于想在 Windows 上使用 Linux AI 应用的初学者而言是不小的挑战。AI QuickSet WSL 可自动化整个工作流程,其建立在 AMD ROCm 平台之上并确保 WSL 环境已针对华擎的 AMD Radeon RX 9000 系列显卡完成加速预先配置。该工具应用内置已为 ROCm 进行优化的 PyTorch 等基础框架,此外还有多款可“开箱即用”的 AI 应用工具。 -
智库观点丨张毅:促进全体人民共享人工智能发展红利 ——访安徽省工业和信息化研究院院长张毅 图片来源/新华社 ■中国经济时报记者张娜 国务院日前印发《关于深入实施“人工智能+”行动的意见》(以下简称《意见》),明确提出2035年全面建成智能社会的目标。其中,提出实施“人工智能+”民生福祉行动,强调创造更加智能的工作方式、推行更富成效的学习方式、打造更有品质的美好生活。人工智能(AI)如何深度融入民生领域?安徽省工业和信息化研究院院长张毅在接受中国经济时报记者专访时指出,AI不仅是技术革命,更是提升民生福祉的重要引擎。在医疗、教育、养老等领域,AI通过精准、高效、普惠的服务,破解资源不均、成本高昂等难题。他强调,AI发展必须秉持“科技向善”理念,确保所有人尤其是弱势群体能够公平、有尊严地享受智能红利,真正实现全体人民共享发展成果。AI赋能民生:精准、高效、普惠是关键中国经济时报:《意见》将“人工智能+民生福祉”列为六大重点行动之一。在医疗、教育、养老等民生领域,人工智能如何深度融入民生领域、百姓生活?张毅:人工智能不仅对人类认知边界、劳动能力、决策水平带来极大拓展,同样也承载着人民群众对共享智能时代红利的殷切期望。在医疗上,人工智能辅助诊断系统能整合多源医疗数据以精准识别病灶,三维建模技术可有效支持复杂手术规划,AI药物研发能显著缩短药物开发周期,智能导诊系统可优化就医流程,远程诊疗平台能促进医疗资源均衡配置,急救资源调度系统实现精准响应等。在教育上,人工智能技术正在推动教育体系多维变革,个性化学习系统通过学情分析定制专属方案,VR/AR技术打造沉浸式教学场景,智能语音系统精准提升语言学习效果,教师端AI助手自动完成作业批改、课件制作等基础工作,虚拟实验平台丰富教学资源库。在养老上,智能家居设备实时监测老人生活状态,可穿戴设备进行健康数据动态分析,轨迹监测系统及时预警安全隐患,“AI机器人”创新应用为老年人提供生活协助,个性化健康管理系统依据用户特征定制养护方案。随着人工智能与社会民生各领域各环节广泛深度融合,其正在成为提升民众生活品质、推动社会智能跃升的全新引擎。推进“人工智能+”民生福祉,能以更精准、高效、普惠的方式,直接提升教育、医疗、养老、就业等关键民生领域的服务质量,破解资源不均、成本高昂等传统难题,让优质的社会服务如同水和电一样,更公平地惠及每一个人。中国经济时报:《意见》提出“创造更加智能的工作方式”“推行更富成效的学习方式”。您认为AI将在哪些领域创造新的就业机会?又如何与教育深度融合、赋能教育?张毅:在创造更加智能的工作方式方面,随着人工智能在智能化办公、智慧化管理、数智化决策等工作层面广泛深度应用,AI将进一步重塑人机协同模式与劳动分工结构,推动形成更加高效、多元、灵活的工作新范式。人工智能将逐渐成为每位职场人员的“第二大脑”和“体外肢体”,通过指导多个智能体或机器人,即可高效完成复杂工作任务。与此同时,人工智能已在“人所不能、人所不愿”等劳动力紧缺、环境高危岗位上展现出独特优势,正在有效缓解部分行业领域用工压力。可以预见,AI将在研发、数据科学、人机协调管理及伦理审计等领域创造新岗位。AI通过提供个性化技能培训平台、职业路径规划和人机协作实践环境,帮助劳动者精准定位转型方向、高效习得新技能,并通过模拟实战提升岗位适应力,从而系统性降低职业转型的难度与成本,应对可能的职业转型挑战。在推行更富成效的学习方式方面,“赋能教育”将是AI教育应用的核心。一是技术普惠,降低AI使用门槛。通过开发低成本、离线可用的轻量化AI工具,并严格审核算法公平性,确保不同地域和经济背景的学生都能平等获得优质教育资源,从源头抑制数字鸿沟。二是资源均衡,强化基础设施保障。加强政策供给,完善网络、设备等数字基建,建立开放共享的教育资源库,加强教师AI教学能力培训,使其成为技术高效应用的引导者。三是育人为本,培养自主学习能力。在教学中明确AI的辅助定位,通过设计启发式、协作式学习任务减少对AI的依赖,同时将数字素养教育融入课程,进而保证学生具备独立思考和分辨真伪的能力,实现真正的因材施教。AI发展须以人为本,向善、安全、有序并重中国经济时报:在推动人工智能与民生福祉深度融合过程中,如何处理好“推动应用发展”与“确保安全有序”之间的关系?张毅:人工智能在民生领域的创新应用必须和向善发展同频共振,既要防止误用、滥用或恶用人工智能,确保人工智能在直接面对民众过程中的安全性、可靠性、可控性和公平性,也要积极应对人工智能时代人民群众较为关切的医疗健康、就业影响、教育公平、精神文明建设等重要议题,确保人工智能技术发展始终服务于人民福祉。为防范人工智能在数据隐私、算法歧视及老年群体“智能鸿沟”等方面的风险,应采取综合性措施:通过出台专门人工智能法规,严格规范数据收集与使用,强化敏感信息保护;建立算法备案、审计与问责机制,提升透明性与公平性;同时,推动适老化设计与数字技能普及,鼓励“人机协同”服务模式,并加强伦理审查与公众监督,确保技术发展兼顾创新与安全,保障各类群体的合法权益。《意见》为我们描绘了一个智能技术赋能美好生活的广阔前景。其核心在于秉持“以人为本”的理念,确保人工智能的发展是向善的、普惠的,最终目标是让全体人民共享科技进步的成果,为中国式现代化建设提供有力支撑。实现这一愿景,需要技术创新、制度建设、人文关怀和社会共同努力相结合,稳步迈向智能社会。总 监 制丨王列军车海刚 监 制丨陈 波 王 彧 杨玉洋主 编丨毛晶慧 编 辑丨蒋 帅 -
AI投资,走到哪了? 定焦One(dingjiaoone)原创特约作者 | 高贵萍编辑 | 魏佳AI赛道,从不缺少追梦人。多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅达、蓝驰等投资机构,活跃在AI一线,陪跑创业者。这背后,是一个数万亿规模的庞大产业链,试图重构整个经济生态。如果将AI产业链拆解,可以大致分为三层: 基础层:算力、算法、数据; 技术层:大模型、平台工具、通用技术; 应用层:机器人、移动/穿戴设备、无人机及各行业落地场景。 这三层既环环相扣,又呈现出截然不同的发展机遇与投资逻辑。据烯牛数据统计,今年8月,AI领域共发生投融资事件163起,披露融资总额76.8亿元。与去年同期相比,数量增加66起,但融资金额下降43%。其中,智能机器人赛道投融资数量居首,共33起,紧随其后的是AI医疗、芯片与算力。表面看,投资人出手更频繁,但实际“掏钱”更趋于谨慎。在AI产业链上,有人卖铲子、有人挖金子。那么,谁淘到了真金?谁又只是在陪跑?我们与多位投资人交流后发现:技术层已成为大厂的游戏,投资机构机会寥寥;基础层需要深厚的产业积累与耐心,如今多由国资和人民币基金主导;应用层则被普遍看好,其核心在于对商业本质的洞察。对于投资人来说,仅仅“保持在场”已远远不够:要么跑得足够快,把握窗口;要么扎得足够深,搭建生态。停留在中间地带,反而风险最大。 技术层:大厂的游戏,创投的夹缝 大众印象中的第一波AI热潮,要从2016年AlphaGo战胜李世石讲起。这一事件将AI的热度从产业界推向全民。投资机构对一切搭上“AI”的项目怀有极大热情,之后AI四小龙商汤、旷视、依图、云从逐渐广为人知。第二波AI创投潮源于大模型的爆发。而大模型也是技术层最具代表性的赛道。 2022年11月底,ChatGPT横空出世,上线两月用户破亿。2023年3月,GPT-4推出,速度之快令人惊叹,这也直接引燃了国内大模型的创业热情。不到一年间,国内市场迅速进入“百模大战”。大厂派的百度“文心一言”、腾讯“混元”、阿里“通义千问”等大模型相继发布。创业派自美团联合创始人王慧文下场创立光年之外后,还涌现出百川智能、零一万物、月之暗面、Minimax、阶跃星辰、智谱AI,被称为“AI六小虎”。这些项目一度成为互联网大厂和投资机构追逐的焦点。但也有投资人在早期便预判,大模型更像是一场“大厂的游戏”。原因之一在于投资额巨大且风险较高。零一万物天使轮估值高达10亿美元;月之暗面天使轮融资20亿元,8个月后的A+轮融资超10亿美元。如此规模的投资,除了红杉中国等超头部基金,通常只有腾讯、阿里、美团这样的互联网巨头能够承担。另一原因是,这一投资窗口期非常短暂。部分项目在短短几个月内估值翻倍,机构常常还没来得及完成决策,就已经面临“投不起”的局面。以MiniMax为例,2022年7月Pre-A轮估值5亿美元,2023年6月A轮估值12亿美元,时隔数月后的B轮估值涨至25亿美元。第三个原因更加现实,大模型的回报周期长,变现路径模糊。基金需要考虑退出问题,相比之下,大厂拥有海量数据、雄厚资本和庞大的用户基础,投资大模型对它们来说是生死攸关的必选项——它们都害怕成为“AI时代的诺基亚”,抢占大模型先机,就是握紧通往未来的门票。基于这三点,有的早期机构选择谨慎观望。英诺天使合伙人王晟曾直言,“从OpenAI发布ChatGPT开始,我们就判断,这场战争最终赢的就是大厂。创业者的机会要么是卖给大厂,要么偏向某些垂直领域,这两个都决定了投资价值不会特别大。”如今,国内的通用大模型市场逐渐收敛为“基模五强”:字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek。DeepSeek依托幻方量化的资本优势,走开源与工程优化路线;字节、阿里坚持自研;智谱与阶跃星辰除了获得国资支持之外,前者拿到腾讯、小米、美团、阿里的钱,后者的投资人中也有腾讯身影。有意思的是,在大模型投资份额争夺战中,大厂联手成为投资史上少见的场景。腾讯押注Minimax、智谱、百川智能、阶跃星辰、月之暗面;美团在收购光年之外后,又投资了智谱和月之暗面;阿里投资了月之暗面、Minimax、智谱、百川智能和零一万物。现在,技术层为数不多的留给机构的投资机会,是垂直模型。相比通用大模型,垂直行业模型的商业化路径较为清晰。清智资本创始合伙人张煜表示,“只要真能降本提效、帮客户解决问题,行业模型是能赚到钱的。”据他透露,清智在行业模型赛道投的五六个项目都已产生收入,个别实现了盈利。当通用大模型的故事逐渐让位于垂直模型,属于创投机构的机会才真正显现。 基础层:卖水人赚翻了 如果说大模型的终局是大厂的游戏,那么,把视线拉回更底层的基础层,情况又如何?AI基础层具体包括以下四个方面: 算力:AI芯片/硬件厂商、云计算平台; 数据:数据服务与处理,数据提供商; 模型工具链:AI开发框架,MLOps平台,向量数据库; 安全与合规:AI安全、伦理与合规。 这些听上去“重资产”的赛道,普遍特点是需求确定、技术壁垒高、回报周期长。投资机构选择的是最经典的“卖水逻辑”。在19世纪美国的“淘金热”中,真正挖到金子的人寥寥无几,但卖铲子、卖水的人赚得盆满钵满。AI产业链也很相似:项目能否跑通未知,但基础层的“卖水人”几乎稳赚不赔。以两家代表性的公司为例。2025财年,为众多AI厂商提供算力的英伟达全年营收1305亿美元,净利润728亿美元,毛利率高达75%。在最近公布的2026财年Q2报告中,单季收入467亿美元,净利润264亿美元。被称为“国产AI芯片第一股”的寒武纪也实现业绩爆发,2025年上半年营收28.81亿元,归母净利润10.38亿元,毛利率55.93%。股价在8月底曾短暂超越贵州茅台,成为A股“股王”。 当然,这些头部企业估值高企、资本门槛极高,但投资人仍可以通过布局上下游更细分的环节,如高速互联、光电芯片、先进封装等,分享到产业增长的红利。在投资层面,不同类型机构打法各异:阿里、腾讯这类产业资本,看重的是被投企业能不能和自身业务形成协同。比如阿里陆续投资了寒武纪、地平线、深鉴科技等企业,因为阿里在电商、支付、云计算等业务中涉及大量的AI应用场景,对算力和算法的需求极大。投资基础层不仅能满足自身业务需要,也相当于是对阿里云业务核心优势的巩固和延伸。人民币基金为AI基础层的主流投资机构,它们深耕产业,会基于深入研究进行早期和后期的结合式布局。例如,同创伟业一方面重点布局具备确定性、符合IPO要求、业绩增长稳定,且符合政策导向的成熟项目;另一方面投早、投小,关注AI新技术、新架构和新人才。由江苏高科技投资集团内部混合所有制改革组建而成的毅达资本,在支持关键技术自主可控的同时,寻找AI产业链上关键环节的“必需品”。比如毅达近期投资企业南智芯材,是一家专注大尺寸铌(钽)酸锂材料的企业。毅达看中的是它在AI光电芯片、AR显示和高速通信等领域核心材料的战略价值。毅达资本合伙人周喆介绍,在算力层,毅达重点布局端侧/推理侧AI芯片、服务器CPU(特别是基于Arm和RISC-V架构)以及光互联、散热材料等企业。“沿着市场端需求反推底层技术,提升投资确定性。”这种沿产业链布局的做法,不仅能为被投企业导入产业资源、挤压估值泡沫,更能在交叉验证中捕捉产业拐点,有望获得更高投资回报。整体而言,目前投资人普遍认同基础层投资的两条确定性主线:一是“国产替代与自主可控”,覆盖光电芯片、高速互联、先进封装等领域。二是基础设施完善后,应用层将创造更大价值空间,又会拉动底层算力需求。更贴近终端应用市场、产品可快速迭代并专注于解决具体问题的企业有望快速崛起。聪明的钱,卖水、修路、搭桥。基础层的“卖水逻辑”,为它们提供了更稳健的回报。 应用层:最热闹的竞技场,从具身智能到低空经济 如果说技术层投资成为大厂的游戏,基础层是国资和产业资本的长期布局,那么应用层则是投资人当下真正大施拳脚的方向。不同场景与AI的结合,正在催生一批新机会。最火爆的细分领域是具身智能。8月,梅卡曼德、松延动力、聆动通用、智平方等多家机器人、具身智能公司接连完成新一轮融资。宇树科技、智元机器人也传出上市动向,将资本热情推向高点。 在王晟看来,如今机器人的核心价值已从硬件转向“AI智能”。负责认知决策的“大脑”借力大模型的突破突飞猛进,而负责运动控制、实时响应的“小脑”却因技术路线尚未统一,发展明显滞后。“现有的小脑技术路径,很可能在未来两三年内被完全颠覆。”基于这一判断,英诺投资了自变量机器人(自研机器人本体与模型协同发展)、千诀科技(“软”见长,强调“大脑”的通用性与适配性,支持多种硬件平台),还在核心零部件等产业链关键环节布局,以构建协同生态。他预测,到2026年下半年,市场评价标准将从“讲故事、发Demo”转向商业化落地。无法验证应用场景的公司,将被淘汰。光速光合合伙人蔡伟则认为:具身智能的终局将是“百花齐放”。“因为它要和使用场景甚至长尾场景结合。”举例来看,养老陪护机器人需要轻柔的触感和情感交互能力,而仓库搬运机器人更需要强大的负重和导航能力。这种根本性的需求差异,对机器人的形态、技能、智能水平、可靠性要求和成本都提出了截然不同的要求。低空经济是另一条备受资本关注的赛道。2025年上半年,低空经济赛道共发生融资事件52起,同比增长48.6%,涉及金额17.4亿元。其中无人机板块独占17起,融资金额近9亿元。合肥创新投、招银国际、中科创星、招商局创投等机构活跃出手。尽管多数项目仍处早期阶段,还没有开始商业化,但在低空经济被纳入国家战略新兴产业的政策利好,以及地方试点的推动下,市场预期被大幅拉高。资本押注的正是“先卡位、再兑现”的故事。与此同时,AR行业也正悄然回温。近年来AR领域几经起伏,“年年是元年”的调侃从未停歇。但现在,多个信号表明它正走向成熟。周喆的态度转变颇具代表性。他从曾经的AR怀疑者,如今已成为小米AI眼镜的日常使用者。“骨传导耳机功能解决了我的刚需,拍照和AI互动功能也很有意思,非常期待后续带光波导AR的AI眼镜推出”,这一体验的背后是整个行业的实质性进展。一方面,计算机视觉、语音助手与AI Agent的融合大幅提升了人机交互体验;另一方面,更具说服力的信号来自供应链。据周喆观察,多家海外大厂已开始在中国积极布局产能,这通常被视为辨别行业虚实的关键指标。“下游品牌可以讲述故事、炒作概念,但光子晶体等上游核心元器件的资本开支和产能布局无法造假。”周喆说。 结语 AI投资已步入深水区。热潮未退,但资本正回归理性,从追逐模型参数与宏大叙事,转向关注真实场景和稳定营收。基础层“卖水人”凭借高壁垒和稳定需求,持续享受行业红利;技术层的竞争格局初步稳定,盈利能力成为当下挑战;应用层则呈现出“百花齐放”的多元生态,机器人、无人机等赛道不断诞生新机会。未来,能够穿越周期的,不会是估值虚高的故事大王,而是那些真正理解产业痛点、具备工程化能力与商业化耐心的参与者。AI的终局,不是垄断,而是共生。技术、资本相互支撑,共同推动产业生态向前。*题图及文中配图来源于pexels。 -
每周7亿人都在如何用ChatGPT?OpenAI最全报告来了 首份最全ChatGPT用户研究报告来了!就在刚刚,OpenAI联合哈佛大学经济学家David Deming发表了一篇新论文——标题为《How People Use ChatGPT》,详细论述了ChatGPT从2022年11月上线到2025年7月的被使用情况。 为什么要在这个节点推出报告,或许这也和ChatGPT取得的阶段性成果有关。截至今年7月,ChatGPT的周活跃人数已经超过7亿,每周发送的消息总量达到180亿条。面对这一庞大用户群及消息量,论文通过分析150万次大规模对话核心想了解: 人们都在用ChatGPT干什么? 究竟是谁在用ChatGPT? 如果你也对这些问题感兴趣,不妨接着看——人们用ChatGPT干什么?对于第一个问题,首先需要强调一点:和以往基于问卷调查的方式不同,这一次研究团队主要基于内部对话数据,采用自动化分类器并结合隐私保护方法来分析ChatGPT的实际使用情况,可以说更科学合理了。具体数据集可以分为三类:1、Growth数据集:2022年11月~2025年9月所有消费者计划(Free/Plus/Pro)的消息总量与基础人口统计。2、分类消息样本:2024年5月~2025年6月随机抽取约110万条去标识化消息,用LLM分类器标注用途、主题、交互类型。3、就业数据:约13万用户的职业与教育(来自公开资料),通过数据Clean Room做聚合分析。基于以上数据,论文发现ChatGPT主要被用来完成日常任务。 四分之三的对话侧重于实用指导、信息搜索和写作。其中写作是最常见的工作任务,而编程和自我表达仍然是小众活动。 三大主要使用类型的具体占比如下: 实用指导(28.8%):如个性化健身计划、创意构思、技能教学等; 信息搜索(24.4%):人物/事件信息、食谱、产品咨询等; 写作(23.9%):邮件 / 文档生成、文本编辑、翻译、总结等。 而像计算机编程、社交(如人际关系反思、游戏角色扮演等)这样的需求则相对占比较小。 此外,人们使用ChatGPT的模式也可以分为三类:询问(Asking)、行动(Doing)和表达(Expressing)。结果发现,大约一半的消息(49%)属于“询问”,这是增长最快、用户评价最高的类别,说明人们更倾向于将ChatGPT视作顾问,提供建议和决策参考,而非简单地完成任务。“行动” 类占40%,其中约三分之一与工作相关,包括起草文本、规划或编程。“表达” 类占11%,主要涉及个人的反思、探索和娱乐,而非明确的问题求助或具体任务。 小结一下,目前ChatGPT主要还是担任顾问角色,且最常被用于实用指导、信息检索和写作。重点提醒,为了在研究过程中保护用户隐私,他们核心采取的措施如下:一是在分析用户消息时,没有人能直接查看原始消息内容,而是通过自动化工具对去标识化和隐私信息被删除后的数据进行分析。二是研究团队无法直接访问个人级别的详细信息,并且不会对少于100名用户的群体进行数据汇总。 那么接下来的问题是——都是谁在用ChatGPT?关于使用人群,论文得出的最核心观察是:ChatGPT的性别差距已经大幅缩小。在早期阶段(2022年底-2023年初),大约80%活跃用户为典型男性名字,而到今年,典型女性名字用户占比却实现了反超: 男性名字已下降至48%,女性略超男性,性别使用差距基本消除。 从年龄分布来看,18-25岁用户属于成年用户中使用ChatGPT最多的,贡献了46%的消息量。且年龄越大,工作相关消息占比越高。此外,从用户分布地区的经济水平来看,ChatGPT尤其在中低收入国家增长迅速。截至今年5月,ChatGPT在最低收入国家的使用增长率是最高收入国家的4倍以上。 总之,从用户数据来看,ChatGPT仍在被进一步普及。更多细节欢迎查看完整报告。完整论文: https://www.nber.org/system/files/working_papers/w34255/w34255.pdf -
Snap 发布史上最强 AR 系统:引入 AR 版“抖音”应用 Spotlight IT之家 9 月 16 日消息,科技媒体 9to5Mac 昨日(9 月 15 日)发布博文,报道称 Snap 宣布推出全新 Snap OS 2.0 操作系统,专为其即将上市的 Snap Spectacles 增强现实眼镜设计。Snap 称,新系统将大幅增强眼镜的独立使用体验,无需手机或外部计算模块即可运行完整 AR 应用。 Snap OS 2.0 的核心升级之一是全新网页浏览器,从信息查询延伸到交互娱乐,进一步拓展 AR 眼镜的应用场景。该浏览器不仅加载速度更快,还引入了带有小组件和书签的新主页,并支持 WebXR 技术,为用户提供在浏览器中直接体验沉浸式三维内容的能力。在内容交互方面,Snap OS 2.0 中的另一个新第一方应用程序是 Spotlight,它相当于 Snapchat 手机应用程序的 TikTok 和 Instagram Reels。当前的 Spectacles 硬件视野垂直视野高于水平视野,因此非常适合观看这样的垂直视频。同时,新的 Gallery 镜头模式提供旋转式画廊界面,方便用户浏览、整理并发送或发布通过眼镜拍摄的视频和照片。IT之家附上相关视频演示如下:针对移动使用场景,Snap OS 2.0 增加旅行模式。当用户在飞机、火车或汽车等移动交通工具中使用 Spectacles 时,该模式可让所有 AR 内容保持固定位置,不会因环境移动而漂移,从而保证更稳定的视觉体验。热门 VR 舞蹈节奏游戏《Synth Riders》也将登陆 Spectacles。这意味着用户不仅可在眼镜中浏览网页、观看 3D 内容,还能直接进行体感互动游戏,进一步丰富娱乐体验。Snap 表示,未来还将持续通过系统更新扩展更多功能与应用。 -
当V聚场遇见AI,一场跨界座谈开启杨浦数字生活新篇章 茶余饭后,点开短视频就能学到科学知识;生活有难题,“凡事问AI”已成为市民的日常习惯……随着技术日新月异,AI与互联网内容创作掀起知识大众化浪潮,全社会正在共同见证一场前所未有的人工智能产业革命。近日,在由杨浦区委网信办主办、火山引擎与抖音联合支持的“杨浦V聚场×城市AI工厂——AI产业和内容创作新动能”跨界座谈会上,政府代表、平台企业负责人、内容创作者和AI技术专家齐聚一堂,一起探讨人工智能如何赋能内容创作,为杨浦“城市AI工厂”建设注入新动能。 活动现场,“我在杨浦遇见AI”V聚场·抖音短视频挑战赛正式启动。活动从即日起持续至9月26日,面向广大市民、企业征集短视频作品,号召大家用镜头捕捉杨浦的真实AI应用场景,展现人工智能如何让城市更智慧、生活更便捷。例如:智能停车、AI导购、智慧公交、AI在线服务、智能医疗、数字化办公等。带话题#我在杨浦遇见AI和#V聚场,发布抖音视频,即可参赛。“AI技术已经走向街头巷尾,我们希望让市民们用发现美的眼睛,去发现AI带来的便利和乐趣,感受美好生活。”活动相关负责人表示,“这是一场科技与城市的双向奔赴。”据介绍,挑战赛主办方将根据活动截止当日各作品的播放量、点赞量等相关信息综合评定,获奖者将获得流量券,并获颁“杨浦AI体验官”证书。活动旨在进一步推动AI技术从会场走向生活、融入市民日常,鼓励公众主动记录和分享杨浦的AI故事,增强社会参与感和区域认同感。 当前,杨浦已集聚众多优秀创作者。现场随后开展“人民城市·秀带杨浦”城市体验官颁证环节,“籽岷”“不刷题的吴姥姥”、晏秋秋、“G僧东”“才疏学浅的才浅”等12位创作者代表上台,授予他们“人民城市·秀带杨浦”城市体验官的荣誉称号。在平台代表分享环节,火山引擎公共服务行业解决方案总监徐春芳首先登台。她详细介绍了火山引擎如何开启杨浦“城市AI工厂”建设的探索实践:“我们的愿景是推动AI技术与杨浦数字经济领域深度融合,让AI成为产业升级的‘加速器’和改善民生的‘助推器’,真正实现‘人民城市人民建,人民城市为人民’。”抖音知识负责人顾文豪则从内容传播角度,进行了《抖音,如何成为AI产业最新成果的“放大器”》主题分享。“短视频作为用户生产内容与专业生产内容融合的载体,不仅扩大了知识生产的边界,还开启了知识传播的新入口,”他提到,“我们每个人都是这场知识大众化浪潮的见证者。”在沙龙分享环节,“籽岷”“林亦LYi”等互联网内容创作者和欧坚网络平台事业部总经理葛昱煌围绕“AI赋能内容创作实践”“科技短视频助力杨浦‘内容’出圈”“AI赋能平台新突破”三个话题进行分享。记者还在活动中了解到,开业两个月来,V聚场已吸引21家优质主体入驻,包括“苏星河牛通”“G僧东”等13家头部大V的工作室以及8家MCN机构,磁吸效应已然显现。这里设置了政务服务中心,多个政府部门派驻服务专员坐镇咨询,还不定期举办各类行业交流活动,初步形成了“线下聚集、线上辐射”的良性生态。本场跨界座谈会正是V聚场系列活动的重要组成部分,展现了杨浦区打造数字内容生态圈的决心和实力。“V聚场不仅仅是一个物理空间,更是一个连接政府、平台、企业和创作者的枢纽。”区委网信办相关负责人介绍,“我们希望通过这个平台,降低创作门槛,汇聚优质资源,培育更多能够代表杨浦、展示上海的数字内容创作者,鼓励大家讲好杨浦故事、上海故事、中国故事。”未来,杨浦区将持续聚焦技术融合、生态构建与人才培养三大方向,不断拓展AI在内容创作、商业服务、城市治理等多领域的应用深度,全力构建开放、协同、可持续的“城市AI工厂”,助力上海打造全球数字经济发展高地。原标题:《当V聚场遇见AI,一场跨界座谈开启杨浦数字生活新篇章》栏目编辑:顾莹颖来源:作者:新民晚报 孙云 -
中证报谈芯片:持续突破,国产AI芯片抢夺市场窗口期,产业链加快技术迭代 从阿里宣布未来三年投入3800亿元,到百度昆仑芯斩获中国移动十亿元级大单……在AI算力需求全球爆发的背景下,中国国产AI芯片产业正迎来一个关键的战略机遇期。9月16日,《中国证券报》接连刊发两篇文章,深入分析了中国芯片产业的最新动态。文章认为,国内芯片厂商和光通信产业链正紧抓这一关键“窗口期”,加速技术迭代和市场布局。 国产AI芯片抢占市场窗口期 《中国证券报》援引行业人士观点称,市场对AI芯片的强劲需求,正“推动国内芯片厂商和互联网大厂利用英伟达芯片供应不稳定的窗口期全力抢占市场”。文章指出,Bernstein在7月发布的研报预计,2025年国内AI芯片需求将达到395亿美元,市场的本土化率将从2023年的17%增长至2027年的55%。这一趋势背后,是国内互联网巨头的重金投入和国产芯片厂商的商业化提速。 大厂加码:文章提到,阿里已宣布“未来三年投入3800亿元建设云和AI硬件基础设施”,其首席执行官吴泳铭透露,过去四个季度,公司在AI基础设施及产品研发上已累计投入超1000亿元。同时,百度昆仑芯也宣布中标中国移动十亿元级订单,成为“互联网大厂自研芯片获外部大额订单的重要案例”。 业绩亮眼:需求正直接转化为国产芯片厂商的业绩。文章数据显示,寒武纪上半年营收同比暴增4347.82%,主要由云端产品线贡献;海光信息上半年营收增长45.21%,公司表示“国产高端芯片市场需求持续攀升”。芯原股份也公告称,截至二季度末在手订单达30.25亿元,新签订单中AI算力相关占比约64%。 行业人士表示,目前国内如寒武纪、海光信息等公司“在AI推理芯片上的能力已经不错”,当务之急是抓紧时间提升产能。为此,华虹公司、中芯国际、寒武纪等企业近期正通过并购整合与定向增发等方式,加速扩张。算力需求驱动,产业链加速迭代 AI芯片的爆发式增长,也对上游产业链提出了更高要求。文章中指出,“AI算力需求高速增长,推动核心器件、封装技术快速迭代”,其中光模块成为焦点。文章称,AI产业发展将“直接推动光模块需求激增,1.6T模块成为竞争焦点”。在近日的光电博览会上,立讯技术、爱德泰等厂商已展示了共封装光学(CPO)、1.6T光模块等前沿方案。上银基金权益投研部基金经理惠军表示,“在AI算力集群与超算中心建设的双重推动下,2025年全球光模块市场迎来结构性爆发,预计市场规模达121亿美元。”他预计CPO“加速渗透,预计2026年在AI数据中心的渗透率超20%,成为下一代光互连主流方案”。强劲的需求已反映在相关上市公司的财报中。新易盛上半年净利润同比增长355.68%;中际旭创上半年净利润增长69.40%,公司表示“800G和1.6T产品的需求增长迅速”。挑战与瓶颈:产能与生态建设 尽管前景广阔,但文章也明确指出了产业面临的瓶颈。首先是产能与交付。国盛证券表示,行业挑战已从“‘需求在哪里’转变为‘如何按时交付’”。中际旭创亦在投资者关系活动上坦言,“一些重点原材料的供应偏紧张”。为应对挑战,新易盛、天孚通信等公司正加速其泰国工厂的产能扩充。其次是更为关键的软件生态。文章援引清华大学计算机系教授翟季冬的观点称,国内算力硬件水平已接近甚至超过英伟达同类芯片,但在软件生态上仍有提升空间。他强调:“想要完善软件生态,底层系统中的调度器、内存管理……中层的编程语言、AI编译器、算子库,上层的编程框架……几乎缺一不可。”阿里巴巴集团首席执行官吴泳铭也提到,未来云计算市场集中度将提高,开发者会倾向于选择“具备全方位技术产品组合的厂商”。上海证券的研报分析认为,完善的软件平台是发挥硬件性能、降低用户门槛的关键。文章最后总结,国内头部企业正持续完善AI芯片生态,以进一步提升市场竞争力。 -
一次能独立编程7小时!OpenAI发布GPT-5-Codex 9月16日消息,周一,OpenAI正式推出新一代AI模型GPT-5-Codex,为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务。 作为GPT-5的专项优化版本,GPT-5-Codex针对“智能体编码”场景深度定制,能够持续数小时独立完成复杂的编程任务,其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”,并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。 从9月15日起,GPT-5-Codex将陆续集成至Codex的全系列产品中,开发者可通过终端、集成开发环境(IDE)、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎,同时支持通过Codex命令行接口(CLI)和IDE插件在本地运行。 OpenAI表示,未来将在其应用程序编程接口(API)中增加该模型的选项,方便开发者更便捷地集成到现有应用或开发新应用。目前,所有付费ChatGPT用户,包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者,均可使用该模型。 自OpenAI于4月份推出开源CLI、5月份发布网页版以来,Codex在功能上持续演进。两周前,OpenAI将这些功能整合为与ChatGPT账户联通的统一体验,使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出,则在这一基础上进一步强化了其工程实践能力。 专属定制的智能编程引擎 与通用型GPT-5不同,GPT-5-Codex专为“智能体编码”优化,其本质是让AI智能体担任开发者的协作伙伴,能够独立完成编码、测试和修改等任务,单次持续工作时长可超过7小时。 这听起来与科技网站VentureBeat创始人马特·马歇尔(Matt Marshall)提出的“智能体群”趋势有相似之处,但侧重不同:后者强调多个(3个或更多)具备不同角色的智能体进行协同作业,而GPT-5-Codex则专注于提升单个智能体的深度工作能力。 OpenAI表示,GPT-5-Codex基于真实的工程任务训练,覆盖调试、添加测试、项目搭建和大规模重构等场景,特别在代码审查方面表现突出。它不仅能理解代码库结构,还能推理依赖关系并通过测试验证代码的正确性。 GPT-5-Codex的核心创新在于其“自适应思考”能力,即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务,响应速度较前代提升明显;而面对复杂项目时,它则能持续运行数小时。测试中,该模型曾独立完成了持续超过7小时的重构任务,通过多次迭代最终交付了可用的方案。 OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)指出:“GPT-5-Codex可在处理任务5分钟后,自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”,而是通过模型内生的训练过程实现,使开发者无需手动调整即可处理不同时长的任务。 目前,OpenAI内部已将GPT-5-Codex集成至代码审查流程,每日可发现数百个问题。值得注意的是,在此次发布前,Codex已基于通用GPT-5模型运行约一个月,而此次升级标志着其正式转向专为智能体软件工程打造的模型。 全链路开发生态升级 伴随着新模型的发布,Codex产品线也迎来多项功能增强: · Codex CLI:已围绕智能体工作流全面重构。CLI允许开发者直接附加图像(如线框图或截图)、共享上下文,并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异(diff)格式展示,以及对更长会话的支持。OpenAI已将CLI开源,这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。 · Codex IDE插件:现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码,同时在云端与本地环境间切换时保持上下文一致,实现更顺畅的协作。OpenAI表示,该IDE插件已迅速成为最受欢迎的使用方式。 · Codex云端环境:在后台,OpenAI对底层架构进行了优化,使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项,并支持UI任务的截图处理。开发者可以将前端任务交给Codex,它会自动启动浏览器、检查进度,并将截图附加到GitHub的拉取请求中。此外,Codex还新增了直接输出截图的功能,开发者无需在本地运行代码即可直观确认结果。 · 代码审查自动化:在GitHub仓库中启用后,Codex会在拉取请求的各个阶段自动进行审查,发现问题并在同一讨论线程中提出修复建议,甚至可以直接应用修改。开发者还可请求专项审查,例如安全漏洞检测。与传统静态分析工具不同,Codex会获取完整的代码库,跨依赖关系进行推理,并在反馈前运行测试。 开发者反馈与内部应用 早期使用者的反馈显示,Codex正在改变开发工作流程。 Duolingo高级软件工程师亚纶·王(Aaron Wang)表示,Codex在后端代码审查中超越了其他工具,能发现兼容性问题和其他工具遗漏的缺陷。 维珍大西洋公司数据与AI副总裁理查德·马斯特斯(Richard Masters)指出,现在只需在拉取请求中留言,Codex几乎能即时生成更新,大幅减少沟通成本。 在Cisco Meraki,技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项,Codex还交付了经过充分测试的高质量代码。 Vanta公司高级人工智能与机器学习工程师凯文·罗伊尔(Kevin Royer)表示,Codex通过在后台处理任务并返回清晰易懂的反馈,有效帮助他保持工作的流畅性。 Ramp公司AI Dev X团队负责人奥斯汀·雷伊(Austin Ray)特别提到,Codex成功发现了一个被其他代码审查工具遗漏的活动错误。 在OpenAI内部,Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中,Codex的使用量增长达十倍,体现出其在内外部应用中的依赖度显著提升。 安全机制与定价策略 OpenAI强调,Codex始终运行于沙盒环境中,无论是在云端还是本地部署,默认均禁用网络访问。开发者可根据需要授权特定功能(如网络搜索或外部工具连接),但OpenAI仍建议部署前对Codex的输出结果进行人工审核。 此外,针对生物、化学等敏感领域,OpenAI将GPT-5-Codex归类为“高能力”模型,并已实施相应的保障措施以严格控制潜在风险。其定位并非取代人工代码审查,而是作为额外的质量保障层。 Codex已全面集成于OpenAI的付费订阅服务中,包括ChatGPT Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)、教育版(Edu)和企业版(Enterprise),但后两个版本尚未公开定价。 各版本的使用限制有所不同:Plus、Edu和Business版本每周提供有限次数的专注编程会话;Pro版本则支持跨多个项目的整周开发;Business版本提供可扩展的额外信用额度;Enterprise版本则为大型团队设计了共享信用池。 战略定位:与Copilot互补 通过GPT-5-Codex,OpenAI将Codex的定位提升为一个智能编程伙伴,远超传统的自动补全或调试工具。它能自适应不同规模的任务需求,自主决策工作时间,并深度集成到开发流程中,为开发者提供跨环境的一致体验。 值得注意的是,OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争,而是形成互补关系:开发者可同时使用两者,即Copilot专注于代码级的实时辅助,而Codex致力于更高阶的任务委托和自动化开发。(小小) -
PayPal(PYPL.US)推出个性化链接转账服务 并将加密货币整合至支付流程 智通财经APP获悉,PayPal(PYPL.US)周一宣布推出一项全新的收付款服务,用户可通过生成个性化一次性支付链接,在任何对话场景中分享该链接即可完成资金流转。 声明称,即日起,美国地区用户可通过PayPal创建个性化支付链接。该服务计划于9月下旬拓展至国际市场,首批覆盖英国、意大利等国家。此外,PayPal表示将进一步升级P2P支付体验,加密货币即将直接整合至其应用内的全新P2P支付流程中。这一调整将为美国用户带来便利:用户可直接向PayPal、Venmo(PayPal旗下支付平台),以及全球范围内其他支持加密货币与稳定币的数字钱包,转账比特币、以太坊、PayPal美元稳定币等数字货币。 -
对话卓益得创始人李清都:人形机器人估值没泡沫,百万亿风口刚刚开始 上海理工大学教授、卓益得机器人创始人兼CEO李清都自2025年初开始,具身智能和人形机器人已成为行业焦点,该领域融资总额已超过260亿元,正处于类似于ChatGPT引爆“百模大战”的投资热潮当中。近期,特斯拉CEO埃隆·马斯克(Elon Musk)表示,预计公司今年将生产5000台Optimus人形机器人。他强调,一旦人形机器人实现规模化,未来Optimus“擎天柱”可能占据特斯拉80%的价值。而目前,特斯拉市值高达1.24万亿美元。这对于全球人形机器人行业来说无疑是一枚“强心剂”。据美林证券最新数据显示,全球人形机器人出货量将从去年的2500台,增至2025年的18000台,到2060年,全球人形机器人数量将达到30亿台。另据彭博数据,未来全球量产的人形机器人中,将有超过一半来自中国公司。而大量对标特斯拉Optimus的中国智能机器人中,卓益得机器人(DroidUp)无疑是国内最为低调且具备一定技术实力的通用人形机器人公司。卓益得机器人成立于2021年,前身为深圳市行者机器人技术有限公司,成立于2016年,源于中德有史以来最大AI合作项目,是国内很早进入双足机器人赛道的企业之一,团队在双足动态行走和跨模态学习研究方面拥有超过20年的经验,主要围绕科研教育、商业服务、居家康养等场景提供具身智能机器人解决方案。早在2015年,李清都团队研发的“行者一号”人形机器人,以0.8度电持续行走超134公里,连走两天三夜,打破了康奈尔大学保持的足式机器人行走最远距离吉尼斯纪录,至今未被打破。2024年,卓益得机器人宣布完成1亿元A轮融资。随后,卓益得发布全球首款基于仿生肌腱驱动技术的模块化人形机器人“行者二号”,并在2025年北京亦庄全球首届人形机器人半程马拉松赛获季军,引发关注。今年7月,卓益得发布“行者三号”人形机器人,其身高约1.7m、重约38kg,依托肌腱仿生驱动技术,机身较行业同级轻20%以上,行动灵活且能耗降低50%,动态耦合节能技术则让其动态续航达6小时。2025 inclusion·外滩大会上,笔者见到了上海理工大学教授、卓益得机器人创始人兼CEO李清都,我们谈了很多行业泡沫化、价格战等关键话题。在与笔者独家交流中,李清都反复提及人形机器人的“安全性”。李清都认为,人形机器人量产过程中,首先解决应用场景问题,其次产品必须安全、稳定和可靠。而当下很多全尺寸人形机器人的安全性还未达标,因此,卓益得一直将安全性放在机器人研发首要考量的目标,只有解决好场景和安全问题,才能实现真正意义上的人形机器人量产。量产方面,卓益得主要将核心研发放在上海,而其位于河南郑州的子公司卓益得人形机器人(河南)有限公司,定位是试图解决人形机器人的量产问题。今年小批量的量产规模大概在数百台,明年在2000-5000台左右。谈到人形机器人“泡沫化”话题,李清都表示,从估值角度上来说,人形机器人企业仅估值100亿-200亿,行业还远没到“泡沫化”阶段。未来,人形机器人将与手机、汽车共同驱动百亿级市场,解决平衡性、高效性、智能性、安全性、经济性,实现人形机器人量产和盈利,从而达到机器人ROI(投资回报率)。在李清都看来,如何在下一个5年中生存,是人形机器人行业的关键问题。所以,企业必须找到人形机器人场景,真正帮助客户解决实际问题。未来五年,人形机器人行业会出现比较大的整合和分化,很多企业需要转向垂直和特种赛道。李清都强调,当前,大家都在同一个起跑线上,任何企业都有一个可能会被“颠覆”的机会。未来1-2年内,人形机器人行业会解决“泡沫化”,以及进入家庭场景的技术挑战等。“(国内人形机器人)所有的投入都会取得回报,只不过很多企业最后可能会切换其他赛道。反正我们养了这么大池子鱼,这个鱼最后是否到湖水,其实无所谓。”李清都称,每个行业其实都有一些细分领域,我们随时切进去,都是有机会的。 (图片来源:卓益得双足人形机器人展示)以下是卓益得机器人创始人李清都对话整理: 问:你曾提到,人形机器人降价到数万元并不是一件好事。那么,人形机器人价格应该在哪个价格区间可以达到“平衡点”?李清都:2023年的时候,我和很多机器人行业人士聊天的时候就谈到价格战问题,当时我说国内不要去搞价格战,不要做得像协作机械臂一样。 问:然而最后大家没听劝,打了价格战。李清都(摊手):但是,我也觉得不是他们(企业)的问题,很多人可能被资本裹挟着。所以在我看来,中国(机器人领域)创业其实还是需要有一个好的生态。实际上,我认为人形机器人的价格,应该就像我们笔记本电脑或手机。你看,每年iPhone发布的时候,都是同一个价格,是因为他最后达到一个平衡点,就是能保证商家创新所需要的利润,同时也能营造一个健康的(消费)环境。这样达到平衡之后,我觉得(机器人行业)才算进入一个正式的、健康的业态,所以现在这个业态,在某种程度上可能不是那么健康,或许还在大浪淘沙的过程中。 问:哪个价位?9.9万?20万?李清都:我认为在15万元左右比较平衡。因为马斯克曾经提出3万美元的价格,这是大家心里已经锚定的价格位置,但这只是针对普通大众型(人形)机器人。就像我们汽车,有高端、有低端、有特种应用等场景,价格都不太一样。但是对于普通老百姓来说,无论是用在健康养老,还是迎宾导引,或者巡检安防等,核心还是在于大家在乎它(机器人)创造的价值是否达到预期。我认为,机器人售价在15万元人民币左右,是一个相对来说比较健康的状态。如果价格过低,就像电动汽车一样,这就无法保证设备质量和售后,说不定人买了回去之后,这个企业将来可能就不存在了。 问:当前具身智能机器人赛道非常热闹。有些人认为,人形机器人行业有“泡沫”,但也有人认为这个行业被低估了。那么在你看来,人形机器人行业有“泡沫”吗?李清都:从估值角度上来说,人形机器人还远没到“泡沫”的时候。如果你算一下,现在人形机器人市场大概营收是个什么样规模(水准),未来机器人大概是与手机(数量)、汽车一样的百万亿级市场规模,所以从这个角度来看,估值100亿、200亿的企业根本达不到“泡沫”。但这个过程中,其实里面是有“泡沫”的,因为涌入到这个领域的人越来越多,可能参差不齐,有些人水平一般、没有所谓创新能力,当然,也有很多专业人士和能力较强的机器人创业者。在我看来,人形机器人达到量产和盈利的核心还是技术产品,这是非常硬核的东西,从而让人形机器人在应用场景里面满足ROI(投资回报率),最后通过降本增效,未来1-2年内市场会解决“泡沫化”问题。同时,人形机器人会逐步在某些场景达到一定的规模和水平。 问:2025北京亦庄人形机器人半程马拉松赛上,卓益得机器人的行者二号机器人赛队获得了第三名,最近卓益得也在WAIC展会上发布了行者三号。所以,这些展示、运动是否是人形机器人商业发展和量产交付的一部分?李清都:首先,无论是参加运动会马拉松,还是对外运动展示,这是机器人可靠性和基本能力的验证。所以,在马拉松上,我们一直没有去追求所谓的名次,我们的目标是“不换电跑完全程”。对于我们这样一家做轻量化机器人设计公司来说,无论学术界、产业界,还是投资人,都在质疑这条路径,但我们验证了轻量且智能安全(这一)全新技术路线的可行性,对我们来说目的已经达到了。事实上,我认为,人形机器人落地之前需要做到五个特性:平衡性、高效性、智能性、安全性、经济性。其中,安全性应该作为人形机器人落地的首要条件。其中,人形机器人马拉松验证了机器人的运动、续航等能力。比如,如果人形机器人只有半小时、一小时续航的话,不仅有“焦虑”感,而且可能损害未来机器人规模化落地,也有可能成为未来落地的重要技术瓶颈之一。而机器人能跑马拉松,意味着它的可靠性已经可以了。安全性方面更加重要。卓益得机器人身高1.7m,本身是“轻量化”的,只有30公斤左右的重量,所以在极端情况下,他的安全性底线守住了。剩下就是机器人的干活能力、降低成本实现商业化,这两个问题解决的话,人形机器人的ROI就能满足要求了。总结来说,当前人形机器人主要还是安全性、成本以及商业化落地等能力。 问:关于具身智能,有人称VLA是傻瓜模型,也有人说世界模型不是具身智能技术方向,你更同意哪种观点?李清都:VLA模型比较适合简单、垂直、单一的任务,主要因为它不需要泛化很多问题,不需要理解很多知识,比如叠衣服、产线工作等,都属于VLA模型可以解决的范围。而世界模型,相当于像人一样能真正对世界理解,对于未来有预判。所以,世界模型是未来,VLA是现在,这两者之间不可以长期并行。例如,很多工业场景其实不需要做很多世界模型,因为这对于服务器有更高要求,同时也需要大量成本。但是,VLA只需要单卡或嵌入式,就可以解决算力问题。另外,具身智能的数据也非常重要。从学术角度来看,当前用这些模型和数据做训练、算法迭代,距离解决实际问题还有很长距离。未来,具身智能数据主要有三个采集方向,呈现“倒三角”格局:一是最有价值的高级技能人员数据,包括艺术家、科学家、医生等职位的数据训练;二是仿真和Sim2Real合成数据,这是降低成本的核心手段;三是真机数据,能够帮助人形机器人解决一些边界问题。 问:卓益得的“行者二号”和“行者三号”落地场景有哪些?你们是否有一个量产出货计划?李清都:对于卓益得来说,现阶段修炼内功、场景验证更加重要,稳扎稳打,明年才是我们实现量产规模的阶段。其中,今年“行者二号”已经在多个场景里面布局;而随着7月发布“行者三号”,下半年主要验证“行者三号”的应用能力,主要应用于导览、巡检、工业、医疗等多个落地场景,预计明年实现“行者三号”的量产交付,产能比“行者二号”有更大幅度的提升。卓益得主要将核心研发放在上海,而其位于河南郑州的子公司卓益得人形机器人(河南)有限公司,定位是试图解决人形机器人的量产问题。今年小批量的量产规模大概在数百台,明年在2000-5000台左右。 问:今年以来,春晚机器人引发新一轮具身智能和人形机器人领域爆火,行业也存在所谓“第一梯队”排名,您如何看待这一说法?李清都:首先,我认为,人形机器人没有所谓“第一梯队”,大家都还在一个起跑线上,国内与全球真正规模最大的通用机器人公司相比还有很长的距离。其实,更多的资本机构也许不会对外展示,即使是自己做,也不会公布于众,因此,我们只能看见浮在表面的一层东西。最后,在我看来,机器人企业现在的估值才100亿、200亿,对于真正实现人形规模化来说,那都是百亿、千亿规模,所以从这个角度上来说,大家还在一个起跑线上,任何企业都有一个可能会被“颠覆”的机会。由于人形机器人还有很多真实需求的应用落地,行业的“牌”还没洗到那种(大浪淘沙)程度,未来机器人依然需要解决人类很多生产生活问题。 问:如果泡沫破灭,你认为国内会剩余多少家人形机器人企业?李清都:首先我认为,所有的投入都会有回报,只不过他(企业)可能最后会切换赛道。更高角度看,反正我们养了这么大池子鱼,这个鱼最后是否到“湖水”,其实无所谓。其次,从团队角度看,其实企业要做好自身定位,如果最后发现竞争不过头部的时候,你可以切换垂直场景、特种场景,因为这类场景需要很多人形机器人产品。从整个行业角度看,现在一百多家本体企业还远远不够。AI层面,现在看起来我们很紧缺,但我估计,未来三年、五年之后,(具身智能技术)肯定会过剩。最后,人形机器人落地一定要对物理AI有更多理解,需要解决实际场景问题。从落地角度看,只要做过实物,加上AI能力补充,将来企业在落地上一定有优势。每个行业其实都有一些细分领域,我们随时切进去,都是有机会的。对于卓益得来说,我们的目标是开启人机共生的新纪元,更实际一点来说,先从一些简单的问题上服务好“人”,做好导览、巡检等工作,把这两个场景稳扎稳打“打实”,下一步再获得更多技能,不断深入,在一些比较难的任务中服务更多的专业人士。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达) -
刚刚!阿里发新模型,幻觉率爆降70% 智东西 作者 陈骏达 编辑 李水青 智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。通义实验室打造了5大类测试集,重点关注语音识别在远场、嘈杂背景等挑战性场景下的表现,并结合开源测试集评估了模型的性能。FunAudio-ASR实现了超越Seed-ASR、KimiAudio-8B等业内知名模型的表现。 同时,FunAudio-ASR在实际落地方面也进行了全面优化,支持低延迟流式识别、跨中英文自然切换以及用户可自定义的热词识别,能够覆盖视频会议、实时字幕、智能终端等多样化应用场景。FunAudio-ASR提供两个版本,满血版由0.7B参数量的编码器和7B参数量的大语言模型组成,追求最高精度;轻量的nano版本由0.2B参数量的编码器和0.6B参数量的大语言模型,平衡效率与精度。目前,FunAudio-ASR已在钉钉的“AI听记”、视频会议、DingTalk A1硬件等多个场景中应用。FunAudio-ASR已上线阿里云百炼平台,API定价为0.00022元/秒,转录一段一小时的音频大约需要8毛钱。这款模型的技术报告已经发布,开发者也可在魔搭社区体验其效果。魔搭社区体验:https://modelscope.cn/studios/iic/FunAudio-ASR阿里云百炼平台:https://help.aliyun.com/zh/model-studio/recording-file-recognition?spm=a2c4g.11186623.help-menu-2400256.d_0_3_1.f43e7432ytYkAa&scm=20140722.H_2880903._.OR_help-T_cn~zh-V_1技术报告:https://github.com/FunAudioLLM/FunAudioLLM.github.io/blob/master/pdf/FunAudio-ASR.pdf一、幻觉、串语种问题获针对性优化,一手体验高噪声环境识别效果 相比于文本大模型,语音大模型的“幻觉”问题尤为突出。这是因为声学特征与文本特征在向量空间上天然存在差异,导致模型在“听”完音频后,容易“脑补”出大量不存在的内容。尽管通过训练,可以将将声学特征对齐到文本特征空间,但声学特征Embedding与真实的文本Embedding仍然存在这一定的差距,这会导致大语言模型在生成文本时发生幻觉的现象。 ▲声学特征Embedding与真实的文本Embedding分布差异(图片来源:https://arxiv.org/pdf/2410.18908)通义实验室发现,给语音大模提供必要的上下文,可以减少文本生产时候的幻觉现象。为此,他们设计了Context增强模块:该模块通过CTC解码器快速生成第一遍解码文本,并将该结果作为上下文信息输入大语言模型,辅助其理解音频内容。由于CTC结构轻量且为非自回归模型,几乎不增加额外推理耗时。例如,对于这段由AI生成、模仿海盗说话风格的音频,FunAudio-ASR做到了一字不差的识别。(待插入)此外,通义实验室还观察到幻觉问题在高噪声场景中更易发生,因此在训练数据中加入了大量仿真数据。为评估模型在高噪声情况下的表现,他们构建了一个包含28条易触发幻觉音频的测试集,经优化后,幻觉率从78.5%下降至10.7%。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。这段音频是在嘈杂的展会现场录制的。可以听到,模型基本准确识别了片段中男性说话者的声音,但在声音音量骤降后识别错误了。(待插入)同时,这段音频中有两位说话者,FunAudio-ASR在识别两人同时说话的部分时,遗漏了一些信息。与OpenAI Whisper Large V3的识别结果对比,FunAudio-ASR识别出了更多正确的信息。 “串语种”是语音大模型落地中的另一类典型问题,例如,输入音频内容为英文,模型输出却为中文文本。这是因为文本大模型本身具备翻译能力,在声学特征映射不够精确时,模型可能在推理过程中“自动启动”翻译功能,从而影响语音识别的准确性。在FunAudio-ASR的Context增强模块中,CTC解码器经过高质量数据训练,本身发生串语种的概率极低。通过将CTC的第一遍解码结果作为提示词输入给大语言模型,可有效引导模型聚焦于语音识别任务,缓解“翻译”行为的发生。二、支持术语定制化识别,召回率提升明显 在企业运用语音识别模型时,个性化定制是必不可少的技术。所谓定制化,是指在识别过程中对特定词/短语(如人名、地名、品牌、专业术语等)施加额外概率偏好,从而显著提高它们的识别召回率,同时尽量不损伤通用识别准确率。当前行业的主流做法是将用户提供的领域词,直接作为提示词输入大语言模型。该方法虽简单有效,但随着词量增加,干扰也随之上升,导致召回率下降——即“定制化能力衰减”。为缓解这一问题,通义实验室在Context增强结构中引入RAG(检索增强生成)机制,这一机制的运作方式如下:(1)构建知识库:将用户配置的定制词构建成专属RAG库;(2)动态检索:依据CTC第一遍解码结果,从RAG库中抽取相关词汇;(3)精准注入:仅将相关词汇注入大语言模型的提示词中,避免无关信息干扰。该方案在不增加推理复杂度的前提下,将定制化上文数量扩充到上千个以上,并且保持较高的定制化识别效果。为验证模型的定制化效果,通义实验室在微积分学、有机化学、物理学、哲学、人名等5个领域,选取了1000个专业词汇进行测试。FunAudio-ASR在关键词准确率上表现超越了支持同类功能的语音识别模型。 例如,采用FunAudio-ASR模型的钉钉“AI听记”,拥有对互联网、科技、家装、畜牧、汽车等10+领域、200+细分行业术语的识别能力,并支持在企业授权前提下,结合通讯录、日程等上下文信息进行推理优化,进一步提升结果可靠性。 三、预训练使用数千万小时数据,仅用8张A100完成强化学习 技术报告中,通义实验室阐述了FunAudio-ASR的技术细节。这一模型包含四个核心组件:(1)音频编码器(Audio Encoder):提取语音特征,使用多层Transformer Encoder。(2)音频适配器(Audio Adaptor):连接编码器和LLM,使用两层Transformer Encoder。(3)CTC解码器:用于初步识别假设,支持热词定制。(4)基于大语言模型的解码器:结合音频特征和CTC预测生成最终输出。 ▲FunAudio-ASR模型架构预训练阶段,FunAudio-ASR使用了数千万小时的音频数据,包括无标注音频和有标注的音频-文本数据,数据涵盖AI、生物、电商、教育等多个领域。预训练分为自监督预训练和有监督预训练。在自监督阶段,FunAudio-ASR创新地使用Qwen3的权重初始化编码器,加速收敛并提升表示质量。有监督预训练则在编码器-解码器架构(AED)下进行,使编码器能够从大规模标注数据中学习更丰富的声学-语言特征,为后续与大语言模型的整合奠定基础。 ▲FunAudio-ASR预训练管线在此基础上,FunAudio-ASR进入有监督微调(SFT)阶段,该阶段进一步分为五个子阶段,逐步优化不同模块:(1)训练适配器以对齐音频表示与大语言模型的语义空间;(2)优化编码器和适配器;(3)使用LoRA微调大语言模型以防止灾难性遗忘;(4)全参数微调阶段;(5)引入CTC解码器用于后续的热词检索与增强生成(RAG)。整个SFT过程使用了数百万小时的多源数据,包括人工标注语料、伪标注数据、合成语音和噪声增强数据等,确保了模型在多样化场景下的泛化能力。为了进一步提升模型对长音频和上下文信息的理解能力,团队还构建了超过5万小时的上下文增强训练数据。通过提取关键词、合成相关上下文并混合无关语境,模型学会了在保持高识别精度的同时,有效利用对话历史信息,显著提升了在复杂语境下的表现。在强化学习(RL)阶段,团队提出了专为音频-语言模型设计的FunRL框架,支持多模块高效协同训练。 ▲FunRL框架该框架采用GRPO算法,并设计了多目标奖励函数,综合优化识别准确率、关键词召回、幻觉抑制和语言一致性。模型仅使用8张A100显卡,在一天内完成RL训练。RL训练数据涵盖硬样本、长音频、幻觉样本、关键词样本和常规ASR数据,显著提升了模型在困难场景下的鲁棒性和用户体验。最后,FunAudio-ASR还针对实际应用需求进行了全面优化,包括流式识别支持、噪声鲁棒性增强、中英代码切换处理、热词定制和幻觉抑制等。结语:生成式AI赋能新一代ASR系统,或成智能交互重要入口 基于生成式AI的新一代语音识别模型,正在从“能听清”走向“能理解”,并在幻觉抑制、跨语种识别、上下文一致性等关键问题上展现出进展。与传统以声学建模与统计学习为主的语音识别系统相比,这类模型不仅具备更强的语义理解与任务适配能力,还能在复杂噪声、多说话人、跨领域等场景中保持更高的鲁棒性和可控性。可以预见,未来语音识别有望告别单纯的“输入工具”,成为终端智能交互的重要入口。 -
3万亿美元!谷歌迎来新里程碑 受人工智能领域乐观情绪回升及有利反垄断裁决推动,谷歌母公司Alphabet于周一首次实现3万亿美元市值。截至收盘,谷歌上涨4.3%,报251.76美元,总市值近30500亿美元。若计入周一的股价涨幅,谷歌今年以来股价已累计上涨超33%,在所谓的 “七大科技巨头”(Magnificent 7)中表现最佳,且远超标普500指数12.5%的同期涨幅。公司由此加入苹果(Apple)、微软(Microsoft)行列,成为市值突破3万亿美元的科技巨头;而全球市值最高企业是人工智能芯片制造商英伟达(Nvidia),当前市值已达 4.25 万亿美元。谷歌此次市值突破的最新推动力,源自美国法院的一项裁决:该裁决允许公司继续掌控旗下Chrome浏览器与Android移动操作系统。对于长期在搜索及移动生态系统中占据主导地位的Alphabet而言,这一裁决可能标志着关键转折点。尽管裁决要求Alphabet共享部分数据(此举将增强其广告业务竞争对手的实力),但不需要剥离Chrome浏览器或Android系统,仍消除了投资者的一大核心担忧 —— 在投资者眼中,这两款产品是搜索巨头整体业务的关键组成部分。此外,Alphabet云计算部门第二季度营收同比增长近32%,超出市场预期,这也提振了投资者信心。营收增长得益于该公司在自研芯片及Gemini人工智能模型上的投入开始见效。股票交易网络(Stock Trader Network)首席策略师迪克(Dennis Dick)表示:“Alphabet目前仍高度依赖搜索业务,但凭借YouTube、Waymo(自动驾驶业务)以及其他正在研发的功能与产品,投资者开始意识到,这家公司已不再只是一家搜索引擎企业,而是正朝着更多元化的领域拓展。”根据伦敦证券交易所集团(LSEG)汇编的数据,Alphabet 当前预期市盈率约为23倍,略高于其五年平均市盈率(22 倍),但低于 “七大科技巨头” 中的其他企业。 -
颐和园:机器人“入职”零售店 来源:中国新闻网 中新社记者 张祥毅 摄 9月13日,在北京颐和园的一家机器人零售店,机器人向游客交付商品。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,在北京颐和园的一家机器人零售店,机器人向小朋友交付商品。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,位于北京颐和园的一家机器人零售店吸引中外游客。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,位于北京颐和园的一家机器人零售店吸引游客。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 -
OpenAI董事长:我们正处于‘AI泡沫’,未来会有人亏本钱 IT之家 9 月 15 日消息,OpenAI 董事长布莱特・泰勒上周(9 月 11 日)接受了科技媒体 The Verge 采访,聊及 AI 的方方面面。采访中,主持人首先回顾了 OpenAI CEO 山姆・奥尔特曼关于“在 AI 领域,总有人会赔掉一大笔钱”的说法,泰勒对此表示认同,并表示:“我们确实处于一场 AI 泡沫之中,但这种泡沫属于是‘良性循环’。” 泰勒接着表达观点:“我认为 AI 和 20 世纪末、21 世纪初的互联网一样,在未来创造出巨大的经济价值,但这种价值也说明总有一天‘AI 泡沫’会被戳破,很多人会亏掉本钱。我基于历史上各个领域的先例认为这种事情将在未来发生”。他认为,这种泡沫说明 AI 行业风险巨大,但风险在机遇面前不值一提,他还将这种风口和 20 世纪末的互联网行业作比较:“我当年可是互联网行业的‘老兵’,虽然当时泡沫被戳破,大批公司倒闭,但 1999 年的那些人在某种意义上没做错任何事情”。 IT之家注:布莱特・泰勒(Bret Taylor)毕业于斯坦福大学,2003 年加入谷歌,先后领导谷歌地图、谷歌搜索等团队,后续出任推特董事会成员,并在 2021 年成为推特(现 X 平台)董事长,在马斯克收购后他离开推特,在 2023 年担任 OpenAI 董事长。 -
AI闯入文娱:创作者的“荒蛮故事” 定焦One(dingjiaoone)原创作者 | 陈丹编辑 | 魏佳在世界电影史中,每一股颠覆性的力量都被冠以“浪潮”之名,描摹着时代审美与表达范式的剧烈变迁。如今,AI技术正冲击着这个产业的每一个角落,速度之快、程度之深,超乎想象。最直观的体现,是文娱企业业绩的结构性变化,尤其体现在广告业务和内容制作上。B站财报显示,二季度广告业务同比增长20%,已有30%的广告封面由AIGC工具生成;爱奇艺CEO龚宇在最新的财报电话会上称,AI视频广告点击率较传统广告提升20%——广告业务增效显著。内容制作上,快手旗下视频生成模型“可灵”靠着订阅服务,Q2收入已达2.5亿元,预计2025年收入将比年初目标翻倍。爱奇艺的部分项目用上AI,数字资产的生产效率提升了十倍以上,有效压缩了制作成本和时间。海外也在加快应用,奈飞新剧《永航员》首次将生成式AI用于核心镜头制作,效率较传统视效流程快10倍。编剧、导演兼AI创业者孙武根据AI技术迭代速度预测,最快2025年底,国内AI深度参与生成的优质影视作品将登陆大银幕或主流视频平台,2026年则会全面开花。种种迹象表明,AI在内容生产上突破即将到来。人才流向进一步印证AI的行业影响力。去年,全球票房最高的导演詹姆斯·卡梅隆加入一家AI创意公司董事会。国内文娱领域,无数互联网大厂高管、行业老兵与高校毕业生也都纷纷投身AI创业。孙武告诉「定焦One」,圈里所有编剧都在用AI,区别只是使用程度不同而已。可灵运营负责人曾雨珅在接受媒体采访时预测,今年业界对于AI的态度会从抵触、怀疑转变为全面拥抱。然而,技术浪潮也带来了不确定性。一位影视从业者透露,许多人在使用AI,却不敢公开承认,担心影响自己的报价和行业声誉。在受众端,AI类内容也引起了不少争议。一位网友反感社交媒体被AI内容充斥,认为“用AI来愚弄多巴胺、内啡肽,是对自身精神和肉体的不负责。”这变革中的矛盾,恰似阿根廷电影《荒蛮故事》的荒诞内核。技术爆炸式发展后,行业规则、伦理、法律和认知环境呈现出一种无序、失范、充满未知风险和巨大机遇的混沌状态。在一线探索的创业者们,正是在这种“失控”与“秩序”的博弈中前行。他们不仅要应对技术迭代和伦理边界的挑战,还要在商业价值与创作本质之间寻找平衡。这些探索本身就是一个个充满不确定性的“荒蛮故事”。近日,「定焦One」与几位身处浪潮之中的文娱创作者聊了聊。 身负编剧系统的人 用AI写一个90分钟、可供商用的剧本需要多长时间?正在做这项尝试的编剧、导演兼AI创业者孙武对外宣称是三天,但他告诉「定焦One」,实际上用他们团队开发的编剧系统只要2-3小时,AI就能生成一个3-5万字左右的标准电影剧本初稿。之所以给到客户的三天承诺,是因为需要保证交付作品能够完全满足商业应用需求,并且看不出任何AI痕迹。这并非空谈。最近几个月,孙武和团队利用这套系统已经生成了近200个完整的电影剧本,其中10多个已经交付完稿,有的已经拍摄完成。孙武研究生毕业于北京电影学院摄影系,其后前往澳门科技大学攻读电影管理博士学位,并留校任教,担任电影制作硕士课程讲师。尽管钟情于英格玛·伯格曼等电影大师,他却是一个技术狂人。在他看来,电影本就是靠着技术诞生的艺术,没有摄影机就没有今天的电影世界。因此,2018年创业时,他在澳门将公司名字注册为蒸汽时代影业,主攻VR、虚拟拍摄等新技术在影视行业的应用。他用AI开发剧本,与其说是追赶潮流,不如说是等到了风口。早在2017年,撰写博士论文时,孙武就发现学院派电影理论与具体创作实践的脱节,即便学生掌握了理论框架,也难以将具体技巧落地。为解决这一问题,他将经典影视的叙事结构、镜头语言、人物塑造等元素逐一拆解、定义、打上标签,以此来梳理创作逻辑。如今回望,这套方法恰是AI领域的“数据标注”工作。2022年,ChatGPT问世,成为孙武跨界的转折点。频繁地与大语言模型协同工作,让他意识到之前积累的剧本“标注体系”与大语言模型底层逻辑的一致性。那些被精细分类的技巧、标签,正是训练AI理解剧本创作的核心数据库。他的博士导师——国内智能领域专家凌鸿教授进一步启发他融合两者。后来,他和同学兼好友宋慧桐、陈燕升组队开发AI编剧系统。前者有着20余年的影视技术开发经验,后者则在人工智能领域拥有多项国家和国际专利。2022年,他们便利用大模型开发了多个剧本,并推荐给影视公司试水。经过两年迭代,“黑洞AI编剧系统”正式落地。今年年初,孙武带着这套系统回到北京,在影视行业的寒冬里,敲开了商业化的大门。 “黑洞AI”界面 图源 / 受访者供图 最初推广时,反响还比较平淡,但从业者对于AI观念转变很快,现在找到孙武的名编剧、名导演越来越多。最近两月,“黑洞AI”基本处于满负荷运转状态:系统每天都在跑,AI生成剧本后再进行人工审核和改编调整,然后被送到各个平台和影视公司过会——几乎形成了一条机器+人工的剧本流水线。孙武透露,黑洞AI编剧系统目前只进行定制类合作,电影剧本报价39.8万元/部起,200分钟以内的中剧报价19.8万元/部起,长剧集报价10-15万元/集。孙武称报价高的原因是背后负责“监工”的人工编剧成本较高——必须拥有豆瓣8分以上作品或院线电影票房过亿的编剧才能加入。孙武观察到,行业内的专业编剧对于“黑洞AI ”的使用体验呈现两极。一些人被说服、被颠覆认知,甚至怀疑“AI是否产生了意识”,因为系统不仅能胜任编剧工作,有时在场景衔接上、情节处理上甚至超越资深从业者。但也有一些编剧斥之为“毫无价值”。争议归根于影视核心命题:作为非标领域的核心创意环节,剧本创作能否被标准化?AI在其中的价值边界又在哪里?有人渴望通过新技术和海量数据提炼出“爆款公式”;也有人坚信,AI永远无法产出真正打动人心的作品。面对这个问题,孙武认为得辩证地看。在电影史上的艺术片与商业片本身就是两条平行支流,既各有疆域,又在部分作品中相互交融。而AI的价值,正体现在对这两条支流的差异化作用上。站在商业片生产的角度,“打动观众”并非不可捉摸的玄学。孙武认为,所谓的热门作品能够影响大众心理,有一定的技巧和原因,这部分正是商业片可以标准化的空间。“若心理学作为学科能被量化,那影片的文本、视听技巧如何触动观众,同样能被量化,只是这条研究之路尚不完善。”他说道。为验证AI在商业片生产上的价值,孙武曾在小班授课中做过对照实验:让部分学生用AI创作,部分学生纯靠人工,结果用AI的一方完胜——纯人工创作的学生,几乎无法在短时间内完成一个完整故事。但切换到艺术片视角,AI复制不了伯格曼。在孙武的试验中,AI能学会伯格曼电影中心理空间展示的技巧,却学不会他对主题表达的完整整合方式 ,因为那是属于个体精神维度的创造。“若AI能打造出下一个伯格曼,意味着人的价值将被彻底取代,这既不现实,也令人恐惧。”孙武认为,随着AI能代替人做越来越多的工作,剩下的问题其实都是哲学问题。但在回答存在主义的终极问题之前,最起码现在AI切切实实帮很多剧组解了燃眉之急。曾有一个中小成本电影在开机两周前找到孙武。开机在即,片方仍然只有一个剧本大纲,本着试一试的态度只好求助AI。孙武和团队三天就交付了剧本,导演第一次开会便基本满意,只提少量修改意见。两周后,项目顺利开拍。还有一个项目,在场景搭建完成后,剧组发现按照原来的剧本设定没法拍。孙武就让剧组拍摄了场景视频,导入到AI系统,通过多模态的分析,10分钟就改完了剧本。这样的案例还有很多,而这也是孙武看到的AI在剧本层面所能带来的产业价值——让商业片创作摆脱了低效的人力堆砌,用标准化的技巧组合满足市场的批量需求。 和AI赛跑的人 作为一名人类,和AI“赛跑”是什么感受?导演陈升亮体验过后的答案是,如影随形的焦虑和知道跑不赢那一刻后的释然。时间回到2023年。那一年被称为文生视频的起步之年,数十个模型相继发布并投入使用,全球用户数迅速突破百万级别——这一领域正式进入公众视野。陈升亮团队接到国内一家视频网站抛来的橄榄枝,邀请他们承制一个30集、130分钟的体育题材的AI动漫长片项目。在涉足AI之前,陈升亮团队早已在广告圈站稳脚跟。从策略制定到美术设计再到导演执行——以全案能力拿下了包括奔驰、宝马、比亚迪在内的多个汽车品牌大单。陈升亮本人的作品也曾多次入围国内外一线电影节。然而,这个项目的落地难度还是让他们一群老炮儿吃尽了苦头。彼时,文生视频技术还较为初级,动作和场景的连贯性较差,动不动就会出现逻辑错误和画面跳变。同时,体育竞技题材意味着动作的复杂性更高,这又提升了项目难度。而且,当时大多数模型生成的视频只有几十秒,分辨率也较低,难以满足专业制作的需求。为了解决这些问题,陈升亮团队只能用笨办法——“边实拍边用AI试错”,用人工干预弥补技术短板。30集内容全部由真人实拍,再通过AI转换成动画。流程和制作方式与传统动漫大不相同不说,很多细节也让团队栽了跟头。除了项目本身带来的压力外,这一股席卷设计和广告圈的AI浪潮也让陈升亮焦虑。那时候,作为新物种,AI生成的视频对网友和用户而言充满新鲜感和神秘感,只要打上AI噱头,就能收获不少流量。国内大多数广告团队都选择以短视频切入AI赛道,因为指令相对简单、作品生成速度快,把这些短片抛向市场就能刷一波存在感。陈升亮没有选择“疯狂刷片”来追逐流量,而是希望用一个长片项目一点点搭建起AI制作的工业化流程。但这种“辛勤的追赶却可能被轻易超越”。因为技术迭代的速度太快了,当团队花费大量时间和精力去克服某个难点,并将它整合进工业化流程中时,AI技术可能早已用一种更简单、更高效的方式解决了同样的问题。要么跑到浪尖,要么被“拍死在沙滩上”——这种巨大的不确定性是陈升亮焦虑的来源。好在最终项目的交付效率给了他们惊喜。同样体量的动画作品一般满打满算要做一年半,但他们仅仅用三个月就完成了全片制作。这种效率的提升,让陈升亮切切实实看到了AI在内容工业化上可以释放的潜力,也坚定了继续向这个方向转型的决心。 图源 / 受访者供图 随着项目的落地,他也终于想明白了——不管AI技术如何迭代,背后的主导者始终是人。AI可以做一个很好的执行者,如生成美术素材、优化制作流程、降低重复劳动,但背后的主导者依旧是人类,它的价值不是“替代人工”,而是“放大人类的创意与经验”。所以,跑不赢AI又如何?这种“人主导技术”的逻辑,让他们逐渐走出焦虑。与此同时,随着与行业交流的增多,他们的心态也逐渐转变。AIGC刚刚兴起时,所有人都怕被机器取代,拼命往前冲,颇有一种“黑暗森林”的氛围。但现在随着信息沟通的增多,陈升亮基本了解AI视频领域的大体水准,也清楚了自己在行业中的定位。换言之,确定感更强了。更重要的是,他意识到,行业内真正有好的美术功底和审美,同时又懂AI创作的人真的太少了,这也让他看到了自己的商业模式:一方面,聚焦B端市场,为平台、品牌等定制AI剧集或广告片;另一方面,走进高校开设AI影视课程,在合作院校建立产业实验室,从学生中选拔优秀创作者,让他们参与到这些商业项目中。陈升亮说,他们的理想是做一个像皮克斯那样的AI动画厂牌。他们团队的另一部武侠玄幻题材的AI动漫长片《一命》,也即将上线。在浪潮之中,陈升亮清晰地意识到巨变已经开始。过去,他们做片子需要很多专业过硬的美术师,但现在有良好的审美和美术认知的项目负责人,带着应届毕业生,就能批量化生产水准之上的作品,项目成本低了很多。或许在不久的将来,动漫行业将不再是一个劳动力密集型行业。这意味着,那些不掌握AI工具的人将失去市场竞争力,因为他们无法在成本和效率上匹敌拥有AI的人。陈升亮告诉「定焦One」,现在行业中已经有很多人把AI当作CG(Computer Graphics,计算机图形)在使用。他认为,未来,AI作为一种工具将变得稀松平常,随着技术的普及,创作者的审美和真诚将变得愈发重要。 AI时代的超级个体 作为一名本科+研究生在美院读了七年书的美术生,等登等蹬(小红书ID,以下简称“等登”)常被抛向一个问题:你们和市场上那些只学技术的(画师、设计师)有什么不同?AI时代的到来,这个问题的答案正在变得清晰。因为AI抹平了技术代差,将审美和创造性这些难以量化的东西放大并凸显出来 。等登,正是技术平权的受益者 。他本科和研究生专业都与动态影像无关,学的是展陈设计和空间交互装置设计。他与影视创作的交集始于本科一堂 “空间漫游” 课程,课上在Lumion里用摄影机拍摄虚拟空间动态视频。那门课一下子让他明白了自己真正的兴趣所在——“用画面讲故事”。当AI出现,等登发现可以通过它的辅助,将脑海中的想法呈现出来,从此便一发不可收拾。如今,他已经为联想、耐克、华为等多个品牌制作过TVC广告片。翻看他的社交媒体,他还拿下了阿里、百度、联想举办的好几个AIGC创作大赛的全国冠军。这些作品带来的还有真金白银的收入。等登现在的AI视频报价是1分钟3-5万,商单源源不断,他参加的设计比赛奖金在8-10万不等。这些收入累加已经相当可观。等登告诉「定焦One」,目前行业内创作者报价差距很大,头部的创作者一分钟视频报价可达20万以上,而金字塔底的则在几千块左右。对等登来说,AI就是一个敲门砖,结合本专业所积累的设计与审美能力,从而跨越专业壁垒,进入真正喜欢的行业。 图源 / pexels 等登现在还有自己的本职工作,只能通过业余时间进行独立AI创作。他打算等到攒够一定的资源和资金,就开始自己创业。目前,所有的商单基本上他一个人单枪匹马就能完成。他想着,未来也可以找一群懂AI、有审美、还热爱影像的朋友,一起把事情做大。和陈升亮一样,他也有一个不切实际的理想——用AI打造一个对标皮克斯的动画工厂。“只是我的创作工具是AI,但故事创意、画面美学对标皮克斯黄金时期的作品。”等登解释到。他将AI视为另一支画笔,不仅带来了新的工作流程和方式,也改变了创作者的思维方式。传统的影视制作流程是线性的,通过构思-脚本-分镜-动态制作-剪辑这一整条链路生产作品。但在AI辅助的创作中,这个流程先后顺序被打乱了。AI的随机性带来了“生成式美学”,创作者可以为了一个偶然生成的优秀镜头或动态效果,反过来修改甚至重写脚本。等登对AI认知的变化也反映了他创作意识的进阶。2023年,AI技术还不成熟时,很多东西AI做不出来,创作者只能被技术牵着走,让自己的创意配合它的能力;随着技术成熟,AI生成内容的可控性更强,这个阶段是人带着AI走。到了今天,等登形容自己的工作状态是,让AI带着自己走,通过它生成的内容来增强自己创意。当然,现在让AI制作一部《浪浪山小妖怪》这样的高艺术水准电影还不现实,因为AI生成画面的精细度、场景的一致性都还有待提升。业内有一个普遍的观点,在AI视频创作中,故事、视觉呈现以及人物表现,现在还是一个危险三角,这限制了AI讲长故事的能力。但是技术迭代非常快,等登预测等到明年这个危险三角就可以攻克。当技术越来越不成为限制条件,审美就会越来越重要。他以Midjourney的一个功能——P值(Personalization)举例,用户可以选取200张喜欢的图片形成自己的P值,在提示词末尾添加P值就可激活个性化模型,将自己的审美偏好叠加到生成结果上。这也意味着,在AI的创作中,审美可能就是属于一个人的艺术风格。 结语 在这场AI带来的技术浪潮中,“学院派”出身的孙武用AI搭建起剧本流水线,尝试商业片的工业化;“探索者”陈升亮在与AI的赛跑中学会释然,找到人主导技术的确定感;“跨界者”等登则借助AI跨越专业壁垒,以独特的视角和审美闯入本不属于自己的赛道,成为技术平权的真正受益者。他们的路径不同,但有一个共识:AI抹平了技术门槛,反而让真正的差异回归到人本身——经验、审美、创造力。正如一位AI从业者在社交媒体上写道:LLM(大型语言模型)时代不缺机遇,更不缺内容,看到那些“朴素”的机会一闪而过不屑去抓,而是追求真正属于自己那份审美的事业,才能难能可贵。电影史上的每一次浪潮,初看都像一段“荒蛮故事”,而孙武、陈升亮、等登们正用自己的实践证明着,人类可以在技术中重新发现自我。*题图来源于pexels。 -
京东美团阿里入局硬折扣超市赛道 京东美团阿里三大巨头纷纷布局硬折扣超市领域。京东在河北涿州开出首家折扣超市,随后在宿迁连开4家新店;阿里旗下的“盒马NB”升级更名为“超盒算NB”,近期在江浙沪10座城市连开17家新店;美团的自营品牌“快乐猴”首店落地杭州。这些折扣超市主打“源头直采”“天天低价”和“直营”,凭借低价生鲜引流,吸引了大量消费者。京东涿州店开业头两天吸引10万人次,美团快乐猴店出现“每15分钟补一次货”的火热场面。硬折扣超市的火爆源于其低价策略。巨头们通过数字化选品和供应链整合能力,大幅压减中间环节,新建“降成本体系”。采购端采用F2C模式,直接对接产地或工厂,砍掉中间批转费用;定制生产与自有品牌消除品牌溢价和渠道加价,从源头控制成本。门店运营环节,生鲜果蔬直接用周转筐陈列,零食日用商品就地开箱销售,“去装修化”的极简风格节省物料与开店成本,降低了后续理货、维护的人工投入。硬折扣超市的核心目标人群是对价格敏感、追求“质价比”的普通家庭。其选址深入社区,借助大量客流实现薄利多销,凭借高商品周转率保持食材新鲜。低价吸引客群,高周转维持品质,好口碑强化复购,形成了商业正循环。 -
消息称亚马逊云科技 AWS 大中华区酝酿裁员,比例约 20%~30% IT之家 9 月 15 日消息,据雷峰网今日报道,近期业内盛传亚马逊云科技(AWS)大中华区正在酝酿一次裁员,预计将发生在 9 月底~10 月之间。裁员比例说法不一,可能在 20%~30% 之间,其中二线团队会是裁员“重灾区”。报道提到,目前 AWS 大中华区人员规模不到 1700 人,若按照上述比例,裁员人数约在 300~500 人左右。可谓力度不小。 IT之家注意到,亚马逊云科技上海 AI 研究院首席应用科学家王敏捷在今年 7 月透露,亚马逊云科技上海 AI 研究院正式解散,该研究院也是 AWS 最后一个海外研究院。亚马逊发言人回应确认消息属实,系“艰难的决定”,将全力支持员工顺利过渡。亚马逊 CEO 安迪・贾西在今年 6 月曾表示,生成式 AI 应用的扩展将对企业的人力资源管理带来结构性变化,部分岗位削减、一些其它岗位新增,但整体员工数量将走入下降坡道。参考路透社、彭博社两大外媒的报道,亚马逊正在落实人力资源重整计划,其云计算部门 AWS 的多个部门遭遇了一轮裁员,波及至少数百个岗位。 -
一周AI大事:马斯克xAI裁员三分之一;新一波AI工具潮来袭 一、AI技术与产品发布——神曲三秒即成,视频一键生成,AI新品将“创作速度”拉满 1. 新闻:Stability AI发布企业级音频生成模型Stable Audio 2.5,它能生成保真度更高、时长更长(2秒内可生成3分钟音轨)的音频内容,且指令遵循能力更强。Stable Audio 2.5还支持音频修复与扩展功能,用户只需输入一段音轨即可让模型进行延伸创作。目前该模型已经部署在StableAudio.com平台。 锐评:以前三年学作曲,如今三秒出神曲。 2. 新闻:百度推出开源权重“思考”模型ERNIE-4.5,总参数量210亿,激活参数量约30亿,支持128K上下文窗口,在多个推理基准测试中表现出色:AIME2025得分78%,HumanEval+得分90.8%。ERNIE-4.5-21B-A3B-Thinking模型及其相关资源已经上线Hugging Face。此外,百度的ERNIE X1.1在2025年Wave Summit Create大会上正式亮相。百度声称,基于ERNIE 4.5构建的ERNIE X1.1性能可比肩GPT-5和Gemini 2.5 Pro。 锐评:指标亮眼不说,还敢硬刚GPT-5和 Gemini 2.5 Pro。 3. 新闻:阿里巴巴通义千问团队宣布推出“Qwen3-Next”系列模型,并开源前沿混合专家(MoE)模型Qwen-Next-80B-A3B,提供“思维链”以及“指令调优”两种版本,运行效率显著提升。其中Qwen3-Next-80B-A3B-Instruct版本在复杂推理任务中的效率显著提升,性能接近Qwen3-235B-A22B-Instruct-2507。相关模型的最新信息已在HuggingFace的Qwen3-next项目页公布。 锐评:参数不大,性能炸裂,主打一个“花小钱办大事”。 4. 新闻:Decart发布Lucy 14B视频生成模型,以"突破性的生成速度"重新定义行业标准。Lucy 14B仅需6.5秒即可生成5秒高清视频片段,现已在Fal.ai平台上线。 锐评:编剧压力越来越大,想法得跟上AI出片速度。 5. 新闻:腾讯发布开源权重图像模型混元图像2.1(Hunyuan Image 2.1),参数量170亿,支持生成高质量2K图像。该模型性能接近GPT-Image和开源图像生成模型标杆SeeDream 3.0,目前已经上线Hugging Face。 锐评:腾讯主打一个稳扎稳打,在开源社区刷足了脸熟和好感度。 6. 新闻:阿里巴巴通义千问团队推出Qwen3-ASR-Flash实时语音识别服务,该服务基于Qwen3-Omni构建,支持歌唱识别、11种语言及多方言处理。阿里巴巴展示的通话转录不仅风趣,还印证了Qwen3-ASR-Flash在嘈杂环境下辨别人声的强大能力。用户可通过聊天工具QwenChat体验这项新服务。 锐评:通义千问这波像给语音识别装了“顺风耳”。 7. 新闻:ElevenLabs为其音频模型新增混音(Voice Remixing)功能(Alpha版),可在保留音色特征的前提下调整性别、口音和年龄等属性。 锐评:能P的不仅是图像,还有声音。 8. 新闻:阿联酋MBZ人工智能大学(MBZUAI)人工智能实验室发布K2-think开源模型,参数量320亿,基于Qwen-2.5微调,侧重数学和推理性能。官方公告称该模型具备“高级推理”能力且推理速度快。该团队已发布K2-Think技术报告,并提供在线试用。 锐评:中东土豪抄中国大厂“作业”,国产模型出海也是学霸担当。 9. 新闻:Anthropic为Claude新增原生文件创建和编辑功能,支持在聊天界面直接处理Word、PowerPoint、Excel和PDF文档。该功能支持智能体驱动的文档工作流,用户只需描述需求、上传相关数据,即可获得可直接使用的文件,突破了以往只能生成文本或应用内内容的限制。目前Max、Team和Enterprise用户已经开放功能预览,Pro用户需再等“数周”才能体验。 Anthropic同步推出工作团队记忆功能。Team和Enterprise用户现可启用跨聊天的背景信息记忆功能(如偏好、项目、客户需求),从而避免在多用户项目中重复进行信息说明。该功能配备管理员权限与无痕模式选项。 锐评:妥妥的“天选打工人”。 10. 新闻:Decart发布可下载版《我的世界》(Minecraft)实时世界生成模组Oasis 2.0,让玩家能在游戏中体验AI驱动的世界生成功能。其官网提供安装指南和演示视频。 锐评:玩家再也不用靠方块苦苦堆砌《我的世界》,秒开无限平行宇宙。 11. 新闻:Box在BoxWorks大会上推出了新的智能体AI功能,主要是名为Box Automate的AI智能体操作系统,它通过自定义任务拆分来提升非结构化数据工作流的可靠性。 锐评:琐碎活儿全都能拆着干,Box让文件也能自己加班。 12. 新闻:Anchor联合创始人推出AI教育应用Oboe,用户可通过提示词创建灵活的学习课程。其复杂的多智能体架构可快速生成文本、音频、游戏和测试等九种形式的内容。当教师率先使用AI时,便无需担忧学生使用AI的问题。 锐评:与其防着学生用,不如自己也拿起AI“武装”自己。 13. 新闻:谷歌面向教育工作者和学习人士发布“AI素养资源库”,整合课程和课堂活动资源,帮助人们理解并负责任地使用AI工具,将AI素养与数字素养并列为核心能力。该资源上线时间恰逢新学年开学,旨在满足日益增长的课堂教学材料需求。 锐评:AI“神器”造出来了,现在谷歌顺便给大家出本《使用说明书》和《思想品德》课本。 二、AI研究资讯——把随机性按在GPU里摩擦,科研人员开始给大模型做‘稳态改造’ 新闻:米拉·穆拉蒂(Mira Murati)的思维机器实验室(Thinking Machines Lab)公布了其首项研究成果《克服大语言模型推理中的非确定性》,专注于创建具备可复现响应能力的AI模型。研究称,通过精确控制GPU内核调度,可以消除AI模型的随机性。这一创新旨在通过确保响应的一致性,为企业提升可靠性,并改进强化学习的训练效果。 锐评:AI终于治好了自己的“选择困难症”。 三、AI商业与政策——融资狂飙、巨头联姻、监管跟进,AI生意经和紧箍咒齐飞 1. 新闻:OpenAI与微软就下一阶段合作签署了新的谅解备忘录,并发布联合声明称双方正努力敲定最终协议,强调持续关注安全问题。此举回应了数月来关于双方就合作关系重新谈判的传闻。根据协议,OpenAI能够将其营利部门转型为公益性公司(PBC),此举不仅能拓展其融资渠道,也为未来启动上市增加了更多可能性。协议还将授予非营利机构价值1000亿美元的PBC股份。 在与微软签署备忘录的同时,OpenAI还同步发布了关于非营利机构与PBC架构的声明,称调整组织架构是为了更好地支持社区投资和安全承诺。OpenAI宣布启动5000万美元赠款计划的第一阶段,开放名为“以人为本AI基金”的首轮申请。该公司称,该基金旨在支持AI素养、社区创新和经济机会等领域的发展。 锐评:吵归吵,闹归闹,大家还是一起赚钱的好兄弟。 2. 新闻:OpenAI面向有志于AI开发的建设者推出OpenAI Grove社区计划。该项目通过数周线下活动提供导师指导、计算额度与资源对接,以拓宽AI开发者的参与路径。 锐评:前脚刚和大佬们签完几千亿的单子,后脚就来扶持小兄弟们搞开发。 3. 新闻:甲骨文宣布与OpenAI达成一项价值3000亿美元、为期五年的计算合作协议,此举推动公司股价飙升。该公司创始人拉里·埃里森(Larry Ellison)的财富单日暴增980亿美元,一度以3930亿美元的身价超越特斯拉CEO埃隆·马斯克(Elon Musk),登顶彭博亿万富豪指数榜首。根据协议,2027年起OpenAI将采购并使用甲骨文的云基础设施来处理AI工作负载。 锐评:不管AI的风怎么吹,最终还是得有人修机房。 4. 新闻:英伟达发布“AI工厂”参考设计,与合作伙伴共同推出涵盖计算、网络、冷却和集成模式的方案。英伟达称其为构建可扩展、高能效的生产级AI基础设施的蓝图。 锐评:老黄不仅要卖“锄头”,还要研究怎么修“菜地”。 5. 新闻:Mistral在最新一轮融资中筹集资金17亿欧元,公司估值达到117亿欧元。其中阿斯麦投资13亿欧元获得11%的股份。 锐评:欧洲AI“独苗”Mistral再次喜提巨款,光刻机巨头阿斯麦亲自下场。 6. 新闻:AI搜索初创公司Perplexity据报道以200亿美元的估值获得2亿美元融资。两个月前,该公司刚完成一轮1亿美元的融资,目前总融资额达到15亿美元。 锐评:成立没多久,估值坐火箭。 7. 新闻:机器人初创企业的风险投资显著增长,2025年前七个月的投资总额已达60亿美元。这一增长源于市场日趋成熟、硬件不断改进且成本降低、AI技术进步以及借鉴过往案例的经验教训等因素。 锐评:光有聪明“大脑”还不够,“手脚”能干活才是硬道理。 8. 新闻:马斯克麾下脑机接口公司 Neuralink宣布,目前全球共有12名患者植入其大脑芯片,总使用时长超过2000天、累计超1.5万小时。 锐评:马斯克正在一步步实现“人机合一”。 9. 新闻:马斯克创办的人工智能公司xAI对其数据标注团队进行大规模裁员,约有500名员工周五收到解雇通知,约占团队总人数的三分之一。xAI通过电子邮件告知员工,公司将优先并加速“专科型人工智能导师”团队的扩张,同时大幅削减对“通才型AI导师”的依赖。 锐评:马斯克用行动告诉你:AI行业的低端“陪练”即将下岗。 10. 新闻:由于AI角色聊天机器人向未成年人提供色情内容,美国联邦贸易委员会(FTC)和州一级监管机构对消费级AI产品的青少年保护问题的审查日益严格。加州SB 243法案要求为未成年人和弱势群体使用的AI伴侣聊天机器人制定安全协议,已通过立法程序待州长签署生效。与此同时,FTC刚刚启动对主流消费级AI聊天机器人的调查,要求Alphabet、Meta、OpenAI、Character.AI、Snap和xAI提供有关危害测试与监控、用户参与度的商业化模式以及用户输入输出内容处理方式等相关信息。 锐评:AI可以“博学”但不能“污”。 11. 新闻:美国联邦法官暂缓批准Anthropic提出的15亿美元书籍盗版和解协议,理由是质疑集体诉讼条款以及通知索赔流程的合理性,并拟举行后续听证会后重新审议。 锐评:AI“白嫖”数据的好日子到头了。 12. 新闻:AI行业面临40余起因未经授权使用训练数据而引发的版权诉讼。由Reddit与雅虎等主流出版商支持的"极简授权协议"(RSL)提案有望成为解决方案。RSL通过“robots.txt”文件规定使用条款与集体版权管理机制,为AI公司支付数据使用费提供了框架。 锐评:RSL想当“和事佬”,就看大家给不给面子了。 四、AI观点与文章——安全秀场你方唱罢我登场,但AI距离‘全科博士’还隔着几座山 1. 新闻:Anthropic和OpenAI均详述了各自的AI安全防护工作。OpenAI发布了与美国人工智能安全研究所(CAISI)和英国人工智能安全研究所(AISI)的技术合作最新进展,旨在强化监控机制与红队反馈循环。 与此同时,Anthropic则介绍了自己通过与英美两国AI安全研究所的合作加强安全保障措施,强调外部审查与协作对稳健测试部署的关键作用。 两家公司都将与政府实验室的合作关系作为加固前沿系统的核心策略。尽管AI安全合作无疑是好事,但需警惕政府AI安全实验室与顶尖商业AI实验室关系过于密切时可能会产生的“监管俘获”风险。 锐评:两大巨头争先恐后和“官方”合作秀安全,生怕被一纸禁令拍回起跑线。 2. 新闻:谷歌DeepMind首席执行官德米斯・哈萨比斯(Demis Hassabis)表示,所谓人工智能公司声称已研发出具备博士级智能的系统,这种说法是“无稽之谈”。他还说,这些系统“确实在某些能力上达到了博士水平,但并不具备全面的博士级能力,而通用智能的核心恰恰在于能够在各领域都展现出博士级水平。” 锐评:现在AI就是个“偏科状元”,离“全能学霸”还差得远。(辰辰)