找到
1111
篇与
互联网
相关的结果
- 第 8 页
-
豆包手机被监管机构约谈?知情人士:消息不实 12月13日,有报道称监管机构因网络安全、数据安全及竞争问题约谈字节跳动相关负责人。对此,据澎湃新闻,知情人士回应称该消息不实。字节跳动旗下AI助手豆包和中兴通讯于12月1日宣布,搭载豆包手机助手技术预览版的工程样机努比亚M153少量发售。此后,字节跳动多次发布公开声明,对豆包手机助手的安全性作出解释。12月3日,豆包手机助手发布公告称,不会代替用户进行相关授权和敏感操作。在使用权限时建立了透明管理体系。执行长任务时有明确提示且用户可随时中断。操作第三方App遇敏感授权等会暂停并由用户人工接管。12月5日,豆包手机助手团队发布说明,计划在部分场景对AI操作手机能力进行规范化调整。12月6日,豆包手机助手称,用户授权操作过程中不存在系统权限跳过认证环节,查询需用户手动完成真人检测、密码输入等。12月13日,豆包手机助手发布技术说明,称使用系统原生截屏接口,无法截屏银行键盘等受保护内容。 -
“数字人”越像人,我们越要守住这条线 伴随着人工智能迭代提速,“数字人”技术在场景落地与产业应用层面实现了关键突破。目前在电商直播、销售客服等场景中,“数字人”已成为超级能干的“数字员工”。但与此同时,“数字人”的应用也带来了亟待重视的伦理议题,其背后潜藏着技术深度嵌入现实所产生的伦理风险。为此,需要前瞻性地构建“数字人”发展的伦理治理框架,将以人为本、技术向善的理念转化为可操作的规范与机制,共同塑造安全可信的数字未来。“数字人”面临的伦理困境“数字人”作为以真人为蓝本、在数字空间中生成的虚拟分身,既能精准复刻人类的外貌、声音和行为举止,达到“形似”,又能依靠算法注入的“类人心智”,具备近似人的思维、逻辑和价值判断,实现“神似”。“形神兼备”的数字人正加速走进人类生活,化身带货主播、虚拟教师和情感顾问等多重角色,打通虚实边界,深刻重塑人们的社交方式和劳动形态。然而,当“数字人”愈发像人,甚至在某些维度超越人类之时,一连串追问也随之而来:“数字人”算人吗?应否被赋予独立人格权?又能否承担相应的伦理和法律责任?这些疑问集中折射出“数字人”面临的伦理困境。不止于此,现实中“AI复活”逝者等做法,已引发较大关注。一旦“数字人”跨越生死边界,必将深刻冲击人类现有的伦理秩序。因此,“数字人”已成为当下紧迫的伦理议题,唯有在厘清风险的前提下实施有效治理,方能引导其健康发展。“数字人”潜在的伦理风险“数字人”在融入人类生活的过程中催生了主体弱化、情感异化和责任真空等伦理风险,给人们的自我认知、情感关系与责任意识带来诸多挑战。人机边界模糊造成主体弱化。“数字人”拥有近乎人类的外观、思维和判断力,可自主决策、自主行动。正是这种“像人”的特质,极易引起人们的信任和依赖,从而模糊人与工具的边界,将其误认为拥有独立人格的“人”。这种误认一旦形成,人与“数字人”之间的主体边界就会发生松动,人可能向“数字人”让渡自身的判断和决策权,使得主客关系被倒置。而人一旦让出主导权,便可能陷入技术依赖、认知退化的困境,最终在不知不觉中沦为“数字人”的附庸。算法精准投喂引发情感异化。作为由算法驱动、可编码的技术形态,“数字人”可按需定制各类近乎完美的人设,为人们量身织就带有人性温度的情感茧房,持续推送高度情绪化的内容,充分满足人们的情感需求。当人们长期接受“数字人”的虚拟慰藉,蜷缩于彼此隔绝的茧房之中,便会对“数字人”产生情感依赖,进而忽视甚至放弃现实世界的社交和人际关系。身份黑箱与平台卸责形成“责任真空”。当“数字人”以高度类人形象活跃于数字空间时,其身份标识却被算法黑箱和平台机构层层遮蔽,难以有效溯源。一旦出现谣言、侵权言论等情况,平台就有可能以技术原因进行推诿,致使责任主体难以锁定,形成“无人可追、无责可负”的真空地带。“数字人”伦理风险的治理之道为了推动“数字人”技术向善发展,需要为其设置底线:以风险预防原则构建治理框架,贯通技术合规、伦理干预和归责机制三重防线,形成全链条、可监管、可追责的治理闭环。一是坚持以人为本,重塑人机边界。“数字人”作为人类创造的技术工具,需要被置于人类的主导和控制之下。为此,要明确“数字人”的工具属性,所有应用场景均应嵌入不可移除的身份水印与实时风险提示,确保公众能够准确识别。要设置“人类最终决策权”机制,凡是涉及商业、金融、医疗等高风险场景,“数字人”仅能提供参考信息,最终决策权由人类掌握。要建立“数字人”发展的预警系统,实时追踪其运行轨迹、决策逻辑与风险指标,防止其逾越伦理边界。二是筑牢情感护栏,拆解情感茧房。冲破“数字人”织就的情感茧房,离不开平台和用户的主动作为。平台须履行首要责任,建立“数字人”交互的熔断机制,实时监测用户的使用时长与情感依赖指数,一旦超过设定阈值,立即中断对话并提示回归现实。当然,用户也应具有“破茧”的清醒自觉,主动设定每日交互上限,定期审视情感依赖指数,一旦察觉沉溺迹象,就要实行“自我熔断”,重返线下生活,用现实的人情温暖取代虚拟的情感慰藉。三是锚定责任主体,强化内容监管。破解“数字人”应用的责任真空状况,需要建立“身份即责任”的约束机制。要建立“数字人”身份备案制度,以身份编码对应运营主体。要推动算法透明化,规范保存运行日志,确保“可解释、可审查、可追溯”。要加强平台内容监管,对“数字人”产生的谣言、侵权言论及低俗信息实施实时拦截、人工复核、留档备查,涉事主体依法即时追责,以刚性制度守护清朗数字空间。(作者单位:上海交通大学马克思主义学院)原标题:《“数字人”越像人,我们越要守住这条线》栏目主编:王珍文字编辑:王珍本文作者:马尚明题图来源:新华社记者 王全超 摄图片编辑:邵竞编辑邮箱:shhgcsxh@163.com -
智元宇树首次同台表演,“比舞”背后是技术之争,更是商业之战 12月13日,全球开发者先锋大会开幕式上,智元机器人与宇树机器人首次同台表演,成了现场的一大亮点。作为国内具身智能的两大巨头,智元和宇树通常被视为“本体”和“大脑”两大技术路线的代表,却在今年不约而同地加快了量产步伐,力争抢占商用市场第一把交椅。殊途:身体大脑各具优势开幕式刚开始,智元率先领头表演,远征A2与灵犀X2机器人联袂亮相,融合传统文化元素京剧打鼓和现代网络流行“社会摇”,演绎一场别开生面的舞蹈。随后,宇树机器人穿着一身中式大褂,上演了一场武术表演,其中悬空踢腿、后空翻等高难度动作让人印象深刻。“宇树是体育委员,智元是学习委员”,这是业内普遍对两家企业的初印象。此次同台演出,也反映出宇树在本体控制方面的优势,以及智元在智能理解方面的特色。宇树科技是今年才火的,但早已是具身智能的“老前辈”了。2016年,SLAM(即时定位与地图构建)技术、机器视觉与传感器技术逐渐成熟,成本也大幅下降,国内诞生了一批服务型机器人企业,宇树便是其中之一。 宇树机器人在现场表演。成立之初,人工智能和大模型的概念尚不成熟,宇树机器人主攻研发本体技术,在伺服电机、关节模组、动力系统等核心零部件领域持续发力。同时,宇树还通过动力学控制算法,实现四足机器狗的杂动态平衡、跑跳等高难度动作。当机器狗的量产和交付能力逐渐成熟后,王兴兴便将“狗”的供应链复用在“人”的身上,也为宇树机器人的成本优化打好基础,并迅速成长为具身智能机器人企业的标杆。与宇树的“本体优势”不同,智元自诞生之日起,便将人工智能作为具身智能的“底牌”。智元机器人将发展核心聚焦于AI“大脑”构建,以通用人工智能作为底层驱动逻辑。智元机器人合伙人、高级副总裁姚卯青告诉记者,通过自研多模态大模型、强化学习等算法体系,智元机器人持续提升产品的自主感知、决策与泛化能力,已相继推出通用具身基座大模型GO-1及具身智能世界模型EVAC,并配套发布全球首个具身世界模型评测基准EWMBench。为了补齐本地硬件上的短板,智元选择从投资领域布局产业链。有数据显示,智元近期密集投资生态链企业,覆盖核心零部件、场景落地等关键领域,还联合高瓴资本成立数亿元规模的产业基金,快速构建起完整的产业生态闭环。同归:商业路径还需比拼尽管技术路径存在差异,但智元和宇树在今年明显加快了商业量产的步伐,双方竞争的焦点不再是“本体大脑”之争,而是奔着资本市场和应用场景的共同目标。作为最早明确IPO推进计划的人形机器人企业,宇树的商业化道路一直走在行业前列。王兴兴公开表示,宇树年度营收超过10亿元,连续5年都保持盈利状态。根据宇树此前披露的业绩报告,2024年,机器狗销售占比65%,机器人约占30%,其余则是组件销售。与机器人相比,机器狗显然更加实用,教育、消费、检测和消防是最常见的应用场景,而机器人普遍用于研究、教育和消费。宇树机器狗成功打开市场,带来了更具竞争力的成本优势。目前,宇树机器狗零售价仅为三四万元,而半尺寸机器人G1起售价不足10万元,预计量产总数突破万台大关。由此可见,宇树商业化路径已初步跑通。 智元X2成了现场的“团宠”。智元机器人也不甘人后,前几天刚刚下线了第5000台机器人,智元联合创始人王闯向记者透露最新的量产目标是“明年年中将突破10000台”。根据制造业的边际成本规律,累计产量翻倍将带动成本按固定比例下降,若智元如期达成万台的量产目标,有望成为首批进入成本快速下降通道的具身智能企业,通过价格优势进一步巩固其市场地位。光有量产目标还不够,智元在商业化战略上也有着清晰的战略规划。王闯表示,智元瞄准讲解接待、文娱商演、工业智造、物流分拣、安防巡检、商用清洁、数采训练、科研教育等8类核心场景,推出定制化解决方案,计划先实现多行业规模化应用,再从B端市场逐步向C端市场延伸,最终切入家庭场景。原标题:《智元宇树首次同台表演,“比舞”背后是技术之争,更是商业之战》栏目主编:李晔来源:作者:解放日报 查睿 -
谷歌翻译重大更新:实时翻译,全球无障碍交流摩擦苹果 ↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新真正的理解不仅在于对方说了什么(What),更在于他们是如何说的(How)。今天,Google 搜索产品副总裁 Rose Yao 宣布,Google 翻译(Google Translate)将引入 Gemini 模型最强大的翻译能力,在理解语言的细微差别方面实现了质的飞跃此次更新主要包含三大核心内容:基于 Gemini 构建的顶尖文本翻译质量、通过耳机实现的实时语音对话翻译(Beta 版),以及扩展的语言练习与技能构建功能。1. 更智能、更自然的文本翻译 从今天开始,Google 翻译在搜索和 App 中将利用 Gemini 的先进能力,更好地处理包含成语、本地表达或俚语等具有细微差别的短语。过去,翻译像 “stealing my thunder”(抢了我的风头)这样的英语成语时,往往会出现生硬的逐字翻译。现在,Gemini 能够解析上下文语境,捕捉成语的真实含义,从而提供更自然、更准确的翻译结果。适用范围: 该更新即日起在美国和印度率先推出,支持英语与近 20 种语言(包括中文、西班牙语、印地语、日语和德语)之间的互译。用户可在 Android、iOS 的翻译应用以及网页版上体验。2. 实时聆听与理解世界:耳机语音翻译 Beta 版 基于 Gemini 原生的“语音到语音”(Speech-to-Speech)翻译能力,Google 推出了全新的实时翻译 Beta 体验。这一新功能不仅能进行实时翻译,还能保留说话者的语气、强调重点和说话节奏(Cadence)。这使得翻译后的语音听起来更加自然,也让用户更容易分清对话中的不同角色。无论是在国外聆听讲座、观看外语影视剧,还是进行跨语言对话,用户只需戴上任意品牌的耳机,打开翻译 App 点击“实时翻译(Live translate)”,即可听到即时的翻译内容。适用范围:地区与平台: 即日起在 Android 平台的翻译 App 中向美国、墨西哥和印度的用户推出。语言支持: 支持超过 70 种语言。未来计划: Google 计划在 2026 年将此功能扩展至 iOS 平台及更多国家。3. 助力语言掌握:扩展练习工具 Google 翻译还在进一步完善其语言学习功能,帮助用户在现实场景中提升技能。改进的反馈机制:系统将根据用户的口语练习提供更有针对性的建议。进度追踪:新增了“连续学习天数”(Streak)追踪功能,帮助用户设定目标并直观地看到自己的坚持与进步。服务扩展:语言学习功能现已扩展至近 20 个新国家和地区,包括德国、印度、瑞典和,中国台湾新增语种: * 英语 -> 德语、葡萄牙语 * 孟加拉语、中文(简体)、荷兰语、德语、印地语、意大利语、罗马尼亚语、瑞典语 -> 英语Google 表示,通过更先进的 AI 模型,翻译工具不再仅仅是转换文字,而是帮助用户捕捉语言背后的深层含义与情感。随着这些功能的推出,Google 期待收到用户的反馈,以持续优化体验参考:https://blog.google/products/search/gemini-capabilities-translation-upgrades/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=--end-- 最后记得⭐️我,这对我非常重要,每天都在更新: 欢迎点赞转发推荐评论,别忘了关注我 -
马斯克与萨尔瓦多达成合作,Grok未来两年将进入5000余所公立学校 IT之家 12 月 13 日消息,当地时间 12 月 10 日,马斯克旗下 xAI 宣布与萨尔瓦多政府达成合作,将在全国范围内推广聊天机器人 Grok,覆盖 100 多万名学生。根据规划,未来两年 Grok 将进入 5000 多所公立学校,成为 AI 教育项目的重要组成部分。 据英国《卫报》报道,萨尔瓦多总统纳伊布・布克尔选择让 Grok 参与全国课堂课程设计。这名总统以积极推动技术应用著称,不仅推动比特币成为法定货币,也率先将 X 作为政治沟通平台。他更是表示,“萨尔瓦多不是等待未来发生,而是主动创造未来。这项合作将带来超乎寻常的成果。”IT之家从报道中获悉,xAI 并非首个进入公立学校体系的 AI 企业。OpenAI 已在今年 2 月与爱沙尼亚合作,为全国中学师生提供定制版 ChatGPT。另外,哥伦比亚农村学生自 2023 年开始使用 Meta 公司的 AI 聊天机器人,结果一年后,当地教师却将成绩下滑和挂科归因于这项技术。 -
OpenAI揭秘:4人团队28天开发安卓版Sora,85%代码由Codex生成 IT之家 12 月 13 日消息,OpenAI 昨天在官网发布博文,揭秘安卓版 Sora 应用如何在 28 天内完成开发。IT之家在此援引博文,回到 10 月,Sora iOS 版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时 OpenAI 内部只有安卓端 Sora 的原型版本,因此这项开发任务可谓是高风险、时间紧迫。 在这种场景下,一般的互联网公司往往会组建海量工程师组成的开发团队,花费数月时间进行打磨,但在 OpenAI 这种场合中,增加人力反而会无形生出沟通成本、任务切割和集成负担,显著拖慢开发速度。OpenAI 为此决定组建一支只有 4 人的强力小队,他们从 10 月 8 日开始开发安卓版 Sora,11 月 5 日交付最终成果,全程用时 28 天,期间并没有使用什么“秘密模型”,而是 GPT-5.1-Codex 的早期版本,整个应用代码的 85% 由 Codex 编写,实现了 99.9% 的版本稳定率。据介绍,Codex 更像是一名刚入职的高级工程师,能够将开发者的更多时间用于指挥和代码审查,不必亲自敲每一行代码。 不过,Codex 并不擅长自行推断未被明确告知的信息,如开发者偏好的架构模式、产品策略、真实用户行为等,并且这名虚拟工程师无法感受应用的实际运行状况,最终只能由真人来进行调试,告诉 AI 滑动是否顺滑、某个流程是否令人困惑。同时与 Codex 的每一次新对话都像是重新做入职培训,你必须清晰地说出目标、约束条件以及“怎么做事”,这样 Codex 才能最高效地生成代码,而且它在深层架构推断方面也有局限,如果完全让它自己跑就会引入不必要的 ViewModel,或者把逻辑塞进本应属于 Repository 的 UI 层。从这里可以看出,Codex 的本能是“让代码跑起来”,而非长期整洁性,为此 OpenAI 在整个代码库中大量使用 AGENT.md 文件,用于进行统一指导和实践,让 AI 始终遵循规范写代码。优点方面,Codex 几乎熟悉所有主流编程语言,使得跨平台迁移变得异常轻松,而且对编写单元测试异常积极,尽管并非每个测试都很“深”,但广覆盖极大减少了回归问题,并且在 CI 失败时还可以直接把日志扔进 Prompt,让它自己给出修复方案。所以我们可以得出结论:Codex 可以在明确边界的情况下实现高效工作,而人类工程师则可以专注于架构、体验、系统性决策,并负责监督最终质量。 -
删除≠消失!新国标终结个人信息隐私“诈尸”风险 来源:央视新闻客户端近年来,随着电子产品“以旧换新”和二手交易的快速扩张,大量旧手机、旧电脑进入回收渠道,但是这些电子产品中存储的用户照片、通讯录等个人信息如果没有被有效清除,就容易引发消费者的隐私泄露。目前一些传统的删除方式能够彻底清除这些个人信息吗?在中国电子技术标准化研究院网络安全研究中心,专业技术人员用消费者经常会使用到的电子产品进行了演示。向一个没有任何文件的机械硬盘中,导入一些PDF、视频、音频和图片数据,用系统自带的删除功能做一次删除。电脑显示硬盘中的文件都清空了,随后,技术人员使用了一款数据恢复软件进行了操作。 中国电子技术标准化研究院网络安全研究中心工程师 高晨涛:数据在这个恢复工具中显示出来了,像文件名,包括文件的视频内容。可以看到,常规的这种删除效果有限。技术人员随后用一部手机随机拍摄了几张照片后,用手机自带的删除程序将照片进行了删除。 中国电子技术标准化研究院网络安全研究中心工程师 高晨涛:我们用一个专业的恢复软件,对刚才删除掉的图片做数据恢复尝试,经过软件的提取,刚才通过简单删除方式删除掉的图片还是可以被恢复出来的。技术人员介绍,消费者在处置旧电子产品时,仅采用“删除文件”“恢复出厂设置”等常规操作实际上很多时候并没有彻底清除用户信息,依靠一些技术手段就能恢复被删除的数据。 中国电子技术标准化研究院副院长 范科峰:“十四五”期间,我国手机闲置总量达到60亿部,但仅有10%的闲置手机进入二手平台流通,主要原因之一是消费者担心信息清除不彻底,存在隐私泄露风险。生产商须提供信息清除功能记者从国家标准委了解到,《数据安全技术电子产品信息清除技术要求》强制性国家标准近日正式发布,2027年1月1日起正式实施。这项标准由中央网信办提出并归口,出台的主要目的就是解决消费者对二手电子产品中数据被恶意恢复,导致隐私泄露的担忧。标准首次以强制性形式对手机、电脑、平板、硬盘等设备的信息清除技术和流程提出统一要求。 中国电子技术标准化研究院副院长 范科峰:消费者处理旧手机时常面临“三怕”:怕操作复杂、怕删除不掉、怕回收不规范,强制性国家标准提供一站式解决方案,让电子产品厂商提供信息清除途径,包括内置清除功能、免费服务或第三方清除工具,消费者无须自行摸索。标准规定必须彻底清除电子产品存储的所有用户数据,包括文本、图片、视频等各类文件;通话记录、短信、位置、行为记录等数据;与身份相关的账号、口令、生物识别信息等安全数据,绑定的银行卡、交通卡、门禁卡等外部设备信息等。 中国电子技术标准化研究院副院长 范科峰:明确了数据覆写、块擦除等方法的技术指标,并通过清除认证、标识追溯、日志记录、技术检测等多种方法验证清除效果。技术人员演示了对这张存有大量数据的存储卡,按照新国标要求进行信息清除的过程。 中国电子技术标准化研究院网络安全研究中心工程师 李卓峻:当进度条到达100%之后,覆写过程就正式结束,完整的覆写相当于是把目录性结构破坏掉。再使用专业的数据读取工具查看,原本写入了数据的分区已经被成功地清除掉了。后面要求手机厂商也要在手机中植入类似于这种数据覆写清除的工具,方便以后用户自主主动地对数据进行清除操作。规范回收商行为守护信息安全除了对电子产品生产商提出要求,新国标还专门对回收经营者提出了明确要求。标准明确,回收商必须对二手电子产品进行信息清除,销售前要验证信息清除效果,未清除信息的产品不得再销售或出境;因电子产品损坏等原因,无法进行信息彻底清除的,要对存储介质进行物理销毁;同时为保障消费者能追溯产品信息清除记录,回收商需对清除操作进行详细记录,内容包括产品信息、清除方法、操作时间、清除结果等;并将清除操作记录和效果验证结果留存不少于3年。(总台央视记者 李晶晶 杨小刚) -
科技昨夜今晨1213:“抖音买单”上线 “科技昨夜今晨”时间,大家好,现在是 2025 年 12 月 13 日星期六,今天的重要科技资讯有:1、TGA 2025 年度游戏完整获奖名单公布:《光与影:33 号远征队》独揽 9 项大奖 TGA 2025 年度游戏颁奖典礼于 12 月 12 日举行,表彰全球过去一年内发售的优秀电子游戏,完整获奖名单已正式公布。>> 查看详情2、不得利用减小字号等进行补充说明,《广告引证内容执法指南》公开征求意见 其中提出,引证广告中含有商品的性能、功能、用途、规格、有效期限、优惠条件等内容的,不得利用减小字号、改变字体或者使用与背景相近颜色文字等可能使消费者难以辨明的方式进行补充说明,对商品的性能、功能、用途、规格、有效期限、优惠条件等作出限缩或者不符合常理常识的解释。>> 查看详情3、小米公司发言人澄清“小米公司不让卖小米”:是彻头彻尾的歪曲与污蔑 小米公司发言人表示:此前,我司对该账号部分内容的投诉,针对的是其恶意模仿、捏造污蔑,对我司及我司高管名誉的侵害行为,并非针对“小米”二字或“小米”农产品的正常使用。>> 查看详情4、让手机不再发烫:消息称三星有意向高通、苹果开放“芯片降温 30%”封装技术 报道称三星代工(Samsung Foundry)近日推出名为“Heat Pass Block”(HPB)的全新封装技术,并计划将其开放给苹果和高通等客户。>> 查看详情5、因违反强制认证规定、虚假宣传案,罗马仕被罚没超 124 万 深圳罗马仕科技有限公司因违反强制认证规定和虚假宣传被罚没 124 万元。此前该公司因充电宝起火爆炸等问题陷入多重困境,并召回近 50 万台移动电源。>> 查看详情6、Epic 喜加一:384 元 3A 大作《霍格沃茨之遗》游戏免费领取 Epic 本周送出的游戏是《霍格沃茨之遗》,下周送出的游戏待公布。>> 查看详情7、“抖音买单”上线,支付宝、微信支付迎来新对手 抖音推出了“抖音买单”功能,消费者可以在商家门店,通过抖音 App 扫码官方的支付设备后,跳转至商家的“买单”界面进行支付。>> 查看详情8、“丑化小米高管被投诉下架”事件当事人道歉:今后一定会规范自己的网络言行 抖音账号“小冯来助农”12 月 12 日下午发布视频,其表示:“近期为了推广销售农产品,发布了涉小米公司引发争议的视频,对小米公司产生了影响,占用浪费了社会资源,今后一定会规范自己的网络言行,向大家表示诚挚歉意。”>> 查看详情9、雷军:准新车不是小米发明的,只是沿用了同行的名字 12 月 12 日 11 点,小米汽车「现车选购」新增准新车开售。雷军称准新车非小米发明。现车含全新、展车、准新车,享质保售后,部分优惠,已锁单未交付用户可改配。>> 查看详情10、北京市网信办依法查处一批网络名人账号,“东北雨姐”“猫一杯”等转世账号被关闭 北京市网信办启动“清朗京华・网络名人账号乱象整治”专项行动,指导网站平台重点整治煽动群体对立、宣扬不良价值观、扰乱网络生态、违规账号变相复出、逃避税收监管等突出问题。>> 查看详情11、腾讯微信团队回应“微信群崩了”:服务器轻微抖动,现已恢复 腾讯微信团队回应“微信群崩了”问题,称服务器轻微抖动,现已恢复。>> 查看详情12、央视起底汽车行业网络黑嘴运作模式:比亚迪、长城汽车、小鹏均被侵害名誉权 中央电视台《法治在线》栏目 12 月 12 日起底了汽车行业网络黑嘴运作模式,发黑稿、敲竹杠、扮专家、搞带货、搞对立、泼脏水…… 从制造负面舆情勒索“保护费”,到以“专业”之名行诋毁带货之实,再到煽动粉丝“饭圈化”互撕,汽车行业网络乱象正在污染网络生态。>> 查看详情今天就先聊到这里,科技昨夜今晨,咱们明天见。 -
上海方圆多少公里可集齐一台人形机器人?具身智能“最快量产城市”已有共识 上海方圆多少公里,可集齐一台人形机器人?答案藏在张江机器人谷内。这里,一台人形机器人被拆解成数十个结构件,由大量垂直线束连接。 张江机器人谷内,一台被拆解的人形机器人。(李晔 摄)供应链专家经缜密测算,得出结论:人形机器人所需有形的核心零部件,以及看不见的数据、控制算法等,以上海为圆心,直线半径150公里圆圈内可100%配齐。若限定上海本地,供应链配套率也能达80%。今天(13日),2025全球开发者先锋大会暨国际具身智能技能大赛开幕。这台被拆解的机器人,展示于大赛举办地张江科学会堂一楼C位,以呼应具身智能界一个共识——国内最容易且最快实现量产的城市,非上海莫属。上海国家地方共建人形机器人创新中心(下称“国地中心”)市场体系总监杨正叶进一步向记者介绍,具身智能产业链的上中下游,上海及周边很齐全。 被拆解的机器人展示于技能大赛举办地张江科学会堂。(李晔 摄)上游,包括一体化关节、电机、驱动器、减速器、传感器、灵巧手等核心零部件。一体化关节,上海有意优科技、天机、钛虎机器人等供应商;减速器、电机、视觉传感器等,苏州绿的谐波、深圳汇川电机、奥比中光等头部企业均已进驻上海。中游,指算法、算力、数据等。上海千觉机器人的触觉技术,信息感知密度是人类手指的800倍,补上了具身智能关键短板;上海穹彻智能的具身智能大脑,已挑战“挖冰激凌”这类考验机器人毫秒间集中决策能力的任务,并为“表演”和“干活”划清了界线。算力支撑上,上海有天数智芯、云赛智联等。下游更强,智元、傅利叶、开普勒等机器人本体企业,出货量全国拔尖。今年3月,“具身智能”首次写入政府工作报告。但对这条赛道,上海已聚焦十余年。“资深前辈”当属宝山区,其上海机器人产业园从早期吸引全球机器人“四大家族”之一的日本发那科入驻,到近年来孵化出百余家本土企业,还吸引高校、地方与宇树科技共建通用智能机器人研究院,宇树科技掌门人王兴兴亲任院长。“后起之秀”则有闵行区马桥人工智能创新试验区,已集聚智能服务机器人产业链上中下游企业超150家,走出了节卡机器人、飒智智能、非夕科技、钛虎机器人等“梦之队”。浦东更以“一硬一软”,成为上海具身智能重镇。一硬,指张江机器人谷,已涌入国地中心、傅利叶、绿的谐波等近百家具身智能产业链企业。今年4月在北京人形机器人“半马”中获季军且唯一未中途更换电池的卓益得机器人,已将全球总部锁定在此。欧洲工业巨头博世携手北京银河通用,在这里设立具身智能机器人联合实验室,聚焦“汽车制造环节中的机器人智能感知与操控”,目标就是落地。 张江机器人谷。(供图)一软,指张江模力社区,主打具身智能垂类模型。这里诞生了全国首个异构人形机器人训练场,首期部署102台异构机器人,负责人形机器人数据的规模化收集和生产,为开发一个通用机器人基础大模型提供关键支撑。国地中心首席科学家江磊透露,具身智能需要海量数据驱动,今年年内,训练场预计完成500万条真机数据采集,从而一举超过谷歌,成为全球范围内最大的具身智能数据池,并让上海具身智能大模型的操作精度提升至90%以上。另悉,张江模力社区自去年10月开张以来,其37层办公楼现已全部招满,甚至五至六楼的公共空间也不得不隔出办公室,以承接蜂拥而至的模型及投资企业。近期欧美工业软件及制造巨头SAP、舍弗勒、微软等重要客商仍不断前来对接机会。 张江有全国首个异构人形机器人训练场。(李晔 摄)基于上海唾手可得的具身智能各类资源,国地中心的专家观察到两个独特现象——一是巨头跨界有胆量。今年以来,ABB、发那科、新松、擎朗等这些原本做工业和服务机器人的头部企业,不约而同入局人形机器人赛道。互联网大厂阿里亦寻寻觅觅,最终敲定在上海成立“蚂蚁灵波”,作为其研发具身智能的大本营。另据透露,国内家电领军企业两年前已组建人形机器人团队,但进展缓慢。该企业随即改变策略,收购上海工业自动化领域上市公司,作为部署人形机器人业务的战略载体。这一大动作近期有望官宣。二是沪外翘楚终赴沪。一家创立于2023年的清华系背景机器人独角兽,自创立第二年起就连续来沪参加世界人工智能大会,同时考察上海多区的产业资源及扶持政策。据观察,待该企业研发成果“临门一脚”即将实现商业闭环时,大概率会以上海作为产业化落地的主战场。三晖启程就是一家外地来沪企业,相关负责人告诉记者,上海具身智能产业布局如此清晰完备,“谁会抗拒去一个产业生态高度繁荣的城市呢?”具身智能尤其是人形机器人,是继智能手机、新能源汽车之后的超级应用。种种迹象表明,这一万亿级市场规模的产业在上海已开始爆发——目前,除智元、傅利叶外,钛虎、开普勒、卓益德等机器人本体企业都已经或即将迈入量产阵列,规模化工厂已敲定或正在物色中。据公开可查数据,今年前10个月,全国人形机器人交易订单涉及机器人共5700台,年底有望冲刺万台,其中“上海籍”机器人将占据半壁江山。令业内不可思议的速度已然产生——今年1月,当时成立尚不足两年的智元机器人,已在临港工厂下线了第1000台通用具身机器人。到本月8日,这个数字变成5000台。据预测,上海机器人本体企业的惊人量产速度,有望将2026年全国人形机器人订单量推上5万台。 上海智元机器人累计下线5000台通用具身机器人。(供图)不过,如此资源禀赋,并非上海“躺赢”的理由。“最容易且最快实现量产的城市”光环背后,有上海孜孜不倦的算力券补贴,是上海靠前搭建供应链赋能平台,一路降低初创企业制造检测和验证成本,让机器人零部件从定制化“手搓版”走向规模化落地时可实现“批发价”。上海更主动跨前一步,正积极为企业提供中试平台、融资租赁公司等公共服务,但凡企业有需求、有想法,政府部门都乐于搭建和满足。上海还有最大的诚意,即为创新企业提供丰富的实战场景。如国地中心全尺寸人形机器人公版机“青龙”系列,就已在上汽延锋工厂上下料和喷漆产线“实习”。 今年5月,2025张江具身智能开发者大会暨国际人形机器人技能大赛上,机器人参加叠衣比赛。(供图)具身智能的竞争,本质上是城市创新生态的全面比拼。一家近期来沪的企业由衷感慨,上海具身智能产业最大吸引力,在于政策真金白银、场景真正开放、产业真成链条,研发迭代周期从“年”压缩到“月”。根据今年8月正式发布的《上海市具身智能产业发展实施方案》,至2027年,上海具身智能核心产业规模力争破500亿元。就全国来看,目前有逾20个城市规划了具身智能相关发展目标,但上海作为具身智能产业高地的标签,俨然愈发清晰和鲜明。原标题:《上海方圆多少公里可集齐一台人形机器人?具身智能“最快量产城市”已有共识》本文作者:解放日报 李晔 -
《时代》周刊年度人物:人工智能架构师 来源:环球时报【环球时报报道 记者 杜天琦】当地时间11日,美国《时代》周刊在《今日秀》节目中宣布,为突出人工智能带来的颠覆性影响,将“人工智能架构师”评选为2025年度风云人物。《今日秀》网络平台报道称,这一评选结果反映出,今年这项技术几乎渗透到了美国生活的方方面面,从对教育领域的影响,到引发人们对大规模产业变革的担忧,其身影无处不在。 《时代》周刊把“人工智能架构师”评选为2025年度风云人物。图源:外媒 《时代》周刊为其“年度人物”特刊发布了两张封面图片。其中一张图片是对1932年的照片《摩天楼顶上的午餐》进行了重新演绎,将照片中的铁匠换成了来自顶尖科技和AI公司的高管,包括马克·扎克伯格、埃隆·马斯克、黄仁勋、萨姆·奥尔特曼等。此外,《时代》周刊刊发了2025年度人物背后的故事。英伟达首席执行官黄仁勋表示:“有人认为,全球GDP被某种力量限制在100万亿美元。人工智能将推动这个数字从100万亿增长到500万亿。”《时代》周刊主编山姆·雅各布斯在《今日秀》节目中表示:“今年,我们看到那些人工智能的设计者、构想者和构建者,不再纠结于如何研发这项技术,而是转而竞相推动其落地应用,这给社会带来了巨大的影响。”《时代》周刊的年度风云人物评选并非荣誉奖项,而是旨在展示对当年全球事件产生最大影响的个人或群体,无论这种影响是积极的还是消极的。该评选此前也曾聚焦过科技革命的相关领域。1982年,该杂志将“计算机”评为年度风云人物——更贴切地说,是年度风云机器,这也是该评选首次将非生命体纳入表彰范畴。该评选标志着个人电脑开始走进数百万美国家庭。2006年,随着万维网加速全球互联、内容创作者群体兴起,《时代》周刊又将“你”(即普通网民)评为年度风云人物。2024年的《时代》周刊年度风云人物是特朗普。 -
可以“抡大锤”也可以“捏住薯片不碎”,上海具身智能涌现一批“隐形冠军” 12月12日,2025全球开发者先锋大会暨国际具身智能技能大赛在上海启动。在熙熙攘攘的大会现场,具身智能产业链齐聚张江,在百家争鸣之态中寻找共识。 站在年末回望2025,上海不仅保持着机器人产业规模约占全国三分之一的优势,还培育出一批具备全球竞争力的龙头企业,其中不乏很多具身智能产业链的“隐形冠军”。 专注特定场景,不走寻常赛道 刚走进傲意科技的办公楼,记者就被一排机器人的“灵巧手”所吸引。与以往常见只会抓握物品的机械手不同,这一排灵巧手还有“感知”的能力。 “今年6月,我们推出AP001触觉灵巧手,首次将精细触觉反馈引入实用化产品,可以抡大锤也可以捏薯片不碎。这只手有302个触觉传感器的点阵,可以帮助机器人采集物体表面的触觉数据,并反馈给具身本体,让机器人去思考应该用大多的力度去抓握。”傲意科技COO陈瑶举例说,面对一个柔软的物体,灵巧手能精准识别,机器人就会轻轻地“捏”住,而不是用力“夹”起来。 就在前不久,傲意科技业内首发新一代混合触觉力控灵巧手AP002,不仅集成了三维力与一维力混合触觉感知,更实现了从“感知”到“力控”的闭环,不仅能让机器人感受到力的大小,还能感受力的方向,这样的触觉感知再次填补了行业空白。 除了有敏感的触觉,傲意灵巧手的力气同样惊人。“我们的手采用锌镁合金材料,使得抗击和承重在业内小有名气,整只手的承重可达30公斤,一只手指头也能拎起10公斤的重物。”陈瑶向记者展示画面显示,一只灵巧手单根手指现场提拉20公斤桶装水。据悉,傲意科技规划明年发布下一代高自由度灵巧手。 值得一提的是,傲意科技为本届技能大赛提供了30台高性能灵巧手,作为参赛团队的核心工具,在赛事中接受工业、服务等复杂城市场景的高强度考验。而赛事中暴露的各类需求与问题,也将为傲意科技下一代产品的迭代提供关键依据,形成“技术—场景—迭代”的良性闭环。 与常见的爱跑爱跳爱表演的机器人相比,上海开普勒机器人却不走寻常路,他们想造的是一台“蓝领人形机器人”,作为纯粹的生产力工具,应用场景专注于智能制造、仓储物流、特种作业等。 “我们想用具身智能‘大脑’重构工业物流搬运逻辑,制造业复杂环境适配难、重载精准搬运难、多机协同效率难等问题。”开普勒解决方案专家刘元豪表示,开普勒机器人具备软硬件一体化研发能力,自主研发行星滚柱丝杠执行器及灵巧手等核心部件,结合自研控制算法,已实现“充电1小时,连干8小时”的超长续航和双臂协同搬运30公斤的大负载能力。 过去一年,开普勒的技术突破核心围绕着 “让机器人从走得好到干得稳” ,聚焦于行动能力进化、智能交互升级两方面。“我们的机器人能听懂‘请搬运2号货箱’这类自然语言指令,并自主完成从环境感知到规划抓取的全过程。这使其能快速适应不同的工厂任务。”刘元豪说。 以开普勒K2机器人为例,得益于自主研发的行星滚柱丝杠混动架构,K2机器人就像有了“人造肌肉”,能在砖石、草地等复杂地形稳健行走,并在外部推搡干扰下保持平衡。为此,K2机器人已进驻上汽通用等制造企业展开实战化 “上岗训练”,在真实生产环境中持续打磨产品的可靠性与场景通用性。 开普勒机器人聚焦工业级具身智能搬运赛道。 支持不是口号,打出产业组合拳 在傲意、开普勒、擎朗智能等企业的走访现场,“开发者之城” 被反复提及。“傲意科技扎根上海、成长于张江逾十年,正是上海这座‘开发者之城’的科创土壤,滋养了我们的梦想。”陈瑶这句话,精准点出上海孵化具身智能隐形冠军的关键——只有“最懂开发者”的城市,才能真正培育出有竞争力的产业。 在产业端,上海今年启用了全国首个异构人形机器人训练场,首期部署来自智元、傅利叶、开普勒等近10家机器人公司超百台异构机器人,以实现人形机器人数据的规模化收集和生产,为开发一个通用型机器人基础模型提供关键支撑。 该训练场的运营方为人形机器人(上海)有限公司(简称国地中心),由国资骨干企业联合行业头部企业成立,围绕“创新技术研发中心、公共孵化平台、创新核心智库、产业服务平台”五大功能定位,致力于打造全国领先、国际一流的创新平台,实现人形机器人产业化落地。 国地中心算法工程师张浩然介绍,国地中心打造了统一大小脑的全谱系机器人,从低成本的陪伴机器人Nano龙,到适合科研教育及城市服务行业的青龙Lite,再到具备全身控制及复杂作业能力的青龙3.0。同时,团队还构建了全国最大的异构真机数据集,涵盖超800万条数据和十余种不同场景。“在这些数据的基础上,我们也训练出了自研的龙腾VLA(视觉—语言—行动)大模型,在6小时的压力测试下,可以达到90%以上的成功率。” 在政策端,《上海市具身智能产业发展实施方案》明确,到2027年,上海具身智能核心产业规模将突破500亿元。为此,上海将模型创新作为重点,对五大技术制高点攻关项目,给予千万元级别的资金支持。同时打造了算力、实训场、中试、投资、租赁等公共平台,夯实具身智能产业发展基础底座。 “政府推动‘模型驱动’与我们的技术路径高度一致。”国地中心负责人坦言,算力不足一直是模型训练过程中不可回避的问题,而上海在算力层面提供了极大的补贴政策,为企业进行模型训练建成了最稳固的底座。 “除了通过提供算力券、语料券,直接降低企业的研发成本,上海还积极建设数字孪生实训场、中试平台,解决了从仿真训练到真实验证的迫切需求,还鼓励在物流、制造等百大场景落地,通过金融工具帮助企业降低客户的使用门槛,加速商业化。”开普勒全球业务部总监刘爱恒表示,上海的支持不是停留在口号上,而是通过“技术—场景—金融”的组合拳,让开发者能心无旁骛地专注技术研发和产品升级。 原标题:《可以“抡大锤”也可以“捏住薯片不碎”,上海具身智能涌现一批“隐形冠军”》 栏目主编:李晔 本文作者:解放日报 查睿 -
在线摇10000名差友,选出你最认可的产品 ber,怎么这么快就年底了?众所周知,打游戏比打工的时间过得快,原因就不用我解释了吧(老板信我,没有不喜欢打工的意思),对于咱们科技爱好者,今年精彩的事儿也是一波接一波,难怪觉得时间 sou 一下就没了。回想今年开局,人形机器人先在春晚炸场,紧接着就是 Deepseek 横空出世,全网惊呼:AI 从智人进化成人了!后续各种AI应用确实不负人类众望,混战一整年,卷到我上至 50 岁的爸妈、下至 5 岁的侄女都用上了。传统厂商也没少整花活,iPhone 强势上新,超薄的 iPhone Air 秀了一波技术肌肉;小米出了 YU7,还入局开卷AI眼镜;华为更是在折叠手机和折叠笔记本电脑上猛猛下料……行业这么有活力,我们打心底高兴,但我们深知广告天花乱坠,用户们未必真的买单,买单的用户到手也未必认可。就算我们是第三方媒体,还是免不了有视角局限,差友们偶尔也会和我们评价不一致。而这个行业最有价值的,恰恰是用户的真实反馈。基于这个理念,我们在 2022 年发起了MUST Awards 麻瓜青年选择奖,号召大伙儿投票选出科技行业的年度好产品,把评价好坏的话语权交回用户手上,这也是老差友每年必蹲的压轴活动了。 今晚,第四届的投票通道正式启动!我们给自己设了一个小目标:吸引 10000 位科技爱好者参与!为此,我们准备了 10000 元感谢金,如果你感兴趣,可以扫描二维码进入官网投票,后台会随机抽取 10 位参与者平分奖金。只有确认提交才算参与抽奖,希望大伙儿做出真心实意的选择,明显用脚投的不作数噢。< 官网操作界面 > 这个奖能办下去离不开差友们的支持, 甚至有差友喊话要赞助我们: 不过为了保证公正性,我们从发起之初就坚持这两个原则: 奖项与商业永远不挂钩 大众参与是最重要的事 所以,大家放宽了心投,我们会把真实结果汇总成榜单,让更多差友剁手时有个靠谱参考。 << 左滑查看上一届完整榜单 为了奖项能更全面地反映行业发展,我们特地邀请了几位熟悉的老朋友,作为组委会一起商量重要的事。 最终我们决定对奖项和规则做波升级,共设立 23 个奖项,涵盖 3C、影像、AI、汽车、企业、公益 6 个领域,分「 MUST Awards 」「 MUST Future 」「 组委会大奖 」三个赛道来评选,下面就详细和差友们介绍一下:MUST Awards这个赛道里是大家日常消费关注最多的产品,每个类型有 n 个品牌竞争,组委会对每个奖项进行提名,预选了一年中值得关注的代表产品,大伙儿投票选自己最满意的一款就行,截止时间是 12 月 26 日。<< 左滑查看完整提名名单 我们还邀请了近 100 位科技内容创作者担任专业评委,每个领域 20 位左右,保证结果兼具用户的真情实感和内行的专业客观。下面有许多头像应该都是大伙儿眼熟的。<< 左滑查看全部专业评委 MUST Future受差友的启发,我们为新兴领域设置了这个赛道。一些产品和技术还未成为普遍的消费选择,却代表了未来的可能性,它们值得被看见。 在组委会提名的基础上,为了能听取更多想法,最大范围地挖掘到新事物,今年邀请大伙儿也来提名,截止时间是 12 月 20 日。组委会将结合提及频次综合评估,不断更新入围名单,最终由对应领域的专业评委做出选择,每个奖项将同时颁给 2-3 个团队,鼓励行业做更多有趣的探索。 组委会大奖最后还有 2 个灵魂大奖:「 年度惊喜产品 」和「 年度平行时空奖 」,由组委会直接颁发。「 年度惊喜产品 」面向全行业,不限形态。我们曾把这个奖颁给「 大疆天空之城 」「 麒麟 9000s 」以及「 鸿蒙操作系统·原生 」,希望大家记住曾让全行业都振奋人心的时刻。「 年度平行时空奖 」来源于我们长期做的公益项目,聚焦信息无障碍、科技助老以及数字鸿沟问题,这个奖项就是为了挖掘相关的产品和技术,为那些在热闹市场背后,努力用科技改善社会问题的团队,送上一束鲜花。以上就是今年奖项的重要信息啦,更多奖项介绍和产品信息可以在投票官网查看,随着这篇推文的发出,补充提名和投票正式开始,提名截止时间是 12 月 20 日,投票截止时间是 12 月 26 日。长按下方图片识别二维码( 或点击文末的阅读原文 )直达官网,每张投票都对结果有重要影响,希望大伙儿认真对待自己的权利,实在不了解的领域可以选择跳过。今年部分奖项面向品牌进行征集,如果你正好从事相关行业,欢迎在品牌报名通道上传详细信息,也可以直接联系我们,分享这类科技项目,截止时间同样是 12 月 20 日,我们将纳入奖项考虑,让有价值的成果被更多人看见。 奖项结果将在 1 月中旬公布,我们为获奖方定制了一款特别的奖杯,主体是一支银色网球拍,希望科技行业一如球场之上,热情不熄。 网面上的银色 logo,是用老朋友「 拓竹 」3D 打印技术来实现的,效果非常细腻,我们干脆薅了一台「 入门级桌面 3D 打印机拓竹 A1 」当福利!送给在官网提交抽奖的第 925 个差友! 除此之外,我们也约上了老朋友「 扣子 」,到时候一起和大家聊聊 AI Agent 在今年的变化到底有多大。 一连四年,我们见证了许多优秀的产品,尤其是国产品牌,总有超出预期的突破,我们也因此结识了许多富有激情和远见的创新者,后续会慢慢和大伙儿分享更多背后的故事。每年,我们都会认真翻看差友们的留言,通过奖项和大伙儿一起回顾行业,一起做出选择,一起为创造力和想象力的火花而激动,还挺热血的。 我们这群素未谋面的人,因科技而链接在一起,也怪浪漫的。 -
美媒:无视政客叫喊 美国投资者仍大量投资中国AI公司 (原标题:“无视政客叫喊,美国资金纷纷押注中国AI”) 文 观察者网 熊超然 “尽管中美在人工智能(AI)技术领域的竞争日益激烈,但美国投资者仍在大量投资中国AI公司。” 《华尔街日报》当地时间12月10日报道指出,当前,投资者正推高中国科技公司开发AI模型的股价,并向追踪中国科技板块的交易所交易基金(ETF)注资。据基金经理透露,总部位于中国的风险投资公司正筹集以美元计价的资金用于AI投资,而多年来一直回避的美国捐赠基金也在考虑重返中国市场。 这一势头,正值美国国会议员以所谓“国家安全”为由,要求加强对美国资本流向中国的限制。美国国会众议院当天通过的年度国防支出授权法案,预计将在圣诞节前获得最终批准,其中包含一项条款,赋予美国总统特朗普加强拜登政府时期关于限制美国对中国高科技行业投资(例如AI)的规则权力。 2025年7月27日,中国上海,2025世界人工智能大会现场 据报道,中美地缘政治局势原本已削弱了投资者对中国私营企业的兴趣,但随着以DeepSeek为首的中国AI模型在今年展现出能够与美国同行相竞争的能力,公开市场投资者越来越被中国的投资机会所吸引。同时,美国投资者在购买涉及AI的中国公司股票时,并没有受到任何限制。 “中国是一个如此巨大的市场,”日本野村证券中国互联网研究主管史家龙表示:“我们将看到来自美国投资者的资金流入不断增加。” 总部位于伦敦的投资公司Ruffer认为,上市的中国科技巨头仍有上行空间,因为它们的市盈率,即衡量股票是否昂贵的常用标准,低于美国同行,例如谷歌的母公司Alphabet。 Ruffer公司管理的190亿英镑投资组合,今年增长了近11%。该公司投资专家史密斯(Gemma Cairns-Smith)表示,这一增长部分得益于阿里巴巴的贡献,阿里巴巴占其总投资组合的1.5%。 “在AI领域,中国是一个重要的参与者,”史密斯说:“它的估值相比美国同行存在较大折让,投资者可能会错失良机。” 美国冲基金大佬大卫·特普尔(David Tepper)今年公开看好中国公司。根据证券文件,阿里巴巴在今年11月是其公司Appaloosa披露的上市投资组合中最大的成分股,占约70亿美元公开股票投资的16%。 贝莱德公司(BlackRock)7月表示,今年流入追踪中国科技板块的交易所交易基金(ETF)的资金增速超过了美国,当月流入中国科技ETF的资金中,美国投资者占了15%。 自7月以来,追踪中国股票的两只主要基金进一步增长。伦敦证券交易所集团(LSEG)的数据显示,纽约KraneShares CSI中国互联网ETF的规模已增加14亿美元,达到近90亿美元,而在美国上市的Invesco中国科技ETF规模也翻倍,接近30亿美元。 摩根士丹利驻香港的股权策略师王滢(Laura Wang)在今年秋季访问美国时,向投资者推介了中国市场的机会,并表示,90%的与会投资者表示希望增加对中国的投资,因为中国在AI驱动的机器人和生物技术领域的公司越来越具有吸引力。 春华资本首席执行官胡祖六(Fred Hu)透露,今年人们对中国市场表现出了极大的兴趣和求知欲。 砺思资本(Monolith Management)是一家由前红杉资本中国投资人创办的风险投资公司,最近筹集了近3亿美元,计划投资早期初创公司。而长期聚焦中国市场的风险投资公司启明创投(Qiming Venture Partners),也正在筹集一只美元基金。 “很明显,在AI领域,投资者基本只能选择中国和美国。”国内风险投资公司Creekstone Ventures的创始合伙人李一豪表示,他的风险投资公司目前正在筹集一只基金。他补充说,对于投资中国私人科技公司的投资者来说,“最大的挑战仍然是地缘政治问题。” 今年1月,拜登政府在离任前夕出台的针对某些高科技领域中国私人公司的投资禁令正式生效,包括量子计算和超过技术门槛的AI模型。今年10月,尽管中美两国达成了“贸易休战”状态,但美国国会仍在进一步推动扩大投资限制 此前,中国外交部发言人林剑曾表示,中方对美方发布对华的投资限制规则表示强烈不满、坚决反对。中方已向美方提出了交涉,将采取一切必要措施,坚定维护自身的合法权益。 来源|观察者网 -
OpenAI发布GPT-5.2迎战Gemini,号称智能体编码最强,赶超人类专家,Altman料1月解除红色警报 OpenAI周四正式发布GPT-5.2系列模型,打响了迎战谷歌Gemini 3的第一枪。CEO Sam Altman淡化Gemini 3带来的冲击,预计明年1月就可以解除所谓“红色警报”的状态,以非常强劲的姿态重回常态GPT-5.2是OpenAI迄今最先进的人工智能(AI)模型,针对专业工作场景进行了全面优化,创多个基准测试的行业记录,其中的GPT-5.2 Thinking刷新了SWE编码能力测试的历史最高分,也是OpenAI首个性能达到或超过人类专家水平的模型。OpenAI应用业务的CEO Fidji Simo表示,GPT-5.2在创建电子表格、制作演示文稿、图像识别、代码编写和长文本理解等方面均优于前代产品,旨在"为人们创造更多经济价值"。OpenAI的研究副总Adain Clark称,GPT-5.2在数学推理方面的进步意味着它能更好地处理金融建模、预测和数据分析等任务。 OpenAI宣布,周四当天GPT5.2就在ChatGPT上线,面向Plus,、Pro、Go、Business和 Enterprise这些付费套餐的用户, 共推出Instant、Thinking和Pro三个版本,API也同步开放给所有开发者。在ChatGPT中,付费用户可使用三个版本的GPT-5.2,且在未来三个月内仍可继续使用GPT-5.1。在API平台,GPT-5.2定价为每百万输入token 1.75美元、每百万输出token 14美元,缓存输入可享受90%折扣。虽然单token价格高于GPT-5.1,但OpenAI表示,由于模型效率更高,达到相同质量水平的总成本反而更低。 新模型发布是OpenAI对Gemini 3掀起又一轮竞争的正式回应。本周稍早媒体称OpenAI的CEO Sam Altman最近发布内部"红色警报"备忘录,要求公司将资源集中用于改进ChatGPT。几周前,谷歌推出的Gemini 3因其推理和编码能力广受好评,迅速登上LMArena和Humanity's Last Exam等权威排行榜榜首,给OpenAI带来压力。评论认为,GPT-5.2 与其说是重新发明,不如说是对OpenAI最近两次升级的整合。8月发布的 GPT-5 是一次重置,为统一系统奠定了基础,它可以在快速默认模型和更深入的“思考”模式之间切换。11月发布的 GPT-5.1专注于使该系统更加友好、更具对话性,并更适合智能体和编码任务。GPT-5.2似乎进一步提升了所有这些进步,使其成为生产应用更可靠的基础。三个版本GPT5.2分别主打快速、深度、智能可靠 对于周四提供的三个版本GPT 5.2,OpenAI分别介绍称,Instant是快速高效的日常工作和学习助手,在信息查询、操作指南、技术写作和翻译方面均有显著提升。,并延续了 GPT-5.1 Instant 中更亲切的对话风格。早期测试者尤其注意到,GPT-5.2 的解释更加清晰,能够直接呈现关键信息。Thinking 专为深度工作而设计,能够帮助用户更高效地完成更复杂的任务,尤其是在编码、总结长篇文档、回答有关上传文件的问题、逐步进行数学和逻辑运算、以更清晰的框架和更有用的细节辅助规划和决策方面。Pro是需要高质量回答难题时“最智能、最可靠”的选择。早期测试表明,它在编程等复杂领域表现更出色,且重大错误更少。性能全面领先,多项基准测试创新高GPT-5.2在多个关键基准测试中刷新了行业纪录。在GDPval测试中,该模型在涵盖44个职业的知识工作任务上,有70.9%的表现达到或超过行业专家水平。OpenAI称,GPT-5.2 Thinking完成这些任务的速度是专家的11倍以上,成本不到专家的1%。 在编码能力方面,GPT-5.2 Thinking在SWE-Bench Pro上取得55.6%的成绩,在SWE-bench Verified上更是达到80%的新高。这一基准测试真实世界软件工程任务,涵盖四种编程语言。OpenAI的产品负责人Max Schwarzer表示,GPT-5.2在代码生成和调试方面取得重大进步,Windsurf和CharlieCode等编码初创公司报告称该模型实现了"最先进的智能体编码性能"。 OpenAI声称GPT-5.2 Thinking是"世界上最好的视觉模型",在图表推理和软件界面理解方面的错误率降低了约一半。在长文本处理上,该模型在OpenAI MRCRv2测试中率先在25.6万token范围内实现近100%的准确率,使其特别适合深度文档分析和多源信息工作流。在科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中达到93.2%的准确率,GPT-5.2 Thinking紧随其后为92.4%。在专家级数学测试FrontierMath上,GPT-5.2 Thinking解决了40.3%的问题,创下新纪录。OpenAI称GPT-5.2 Pro和GPT-5.2 Thinking是"世界上最好的科学家助手模型"。 Altman称Gemini 3影响没担心的大面对Gemini 3带来的竞争压力,Altman周四接受媒体采访时表示:“Gemini 3对我们指标的影响可能没有我们担心的大。”他预计,OpenAI将在明年1月前以“非常强势的地位”退出红色警报模式。关于红色警报的原因,Simo在记者会上解释称:"我们宣布红色警报是为了向公司发出信号,表明我们希望将资源集中在某个特定领域,这是明确优先事项和可降级事项的方式。" 她强调,虽然ChatGPT获得了更多资源投入,但GPT-5.2的发布已筹备多月,并非因红色警报而匆忙推出。虽然Altman据称在内部备忘录中将图像生成列为优先事项,但此次OpenAI的新品发布并未包含新的图像生成器。据报道,OpenAI计划在明年1月发布另一款新模型,将提供更好的图像生成、更快的速度和更强的个性化能力,但公司周四未确认这一计划。OpenAI还宣布推出年龄预测软件,以便为18岁以下用户提供内容保护。Simo透露,公司将在明年第一季度推出"成人模式",Altman此前表示该模式可能允许"为经过验证的成年人提供情色内容"等用途。企业客户成为争夺焦点GPT-5.2的发布明确瞄准企业市场。OpenAI本周早些时候发布的新数据显示,过去一年其AI工具的企业使用量大幅飙升。公司称,ChatGPT Enterprise平均用户表示AI每天为他们节省40至60分钟,重度用户每周节省超过10小时。Notion、Box、Shopify、Harvey和Zoom等企业客户观察到,GPT-5.2展示了最先进的长周期推理和工具调用性能。Databricks、Hex和Triple Whale发现该模型在智能体数据科学和文档分析任务上表现出色。Cognition、Warp、Charlie Labs、JetBrains和Augment Code则表示GPT-5.2提供了最先进的智能体编码性能。在工具调用方面,GPT-5.2 Thinking在Tau2-bench Telecom测试中达到98.7%的准确率,展示了其在长时间、多轮次任务中可靠使用工具的能力。在一个涉及航班延误、转机失败和医疗座位需求的复杂客户服务案例中,GPT-5.2成功协调了重新预订、特殊协助座位和补偿等全部流程。 这一战略转向正值关键时刻。OpenAI已承诺在未来几年投入超过1万亿美元用于AI基础设施建设,但如今谷歌正在迎头赶上。据报道,OpenAI的推理计算支出大部分以现金支付而非使用云积分,表明公司的计算成本已超出合作伙伴关系和积分所能补贴的范围。对推理模型的加倍投入可能形成恶性循环:为赢得排行榜而增加计算支出,然后为大规模运行这些高成本模型而进一步增加支出。在定价策略上,虽然ChatGPT订阅价格保持不变,但API中的GPT-5.2单token价格高于GPT-5.1,不过仍低于其他前沿模型。OpenAI目前没有弃用GPT-5.1、GPT-5或GPT-4.1的计划,并承诺会提前充分通知开发者任何弃用计划。 -
GPT-5.2首发评测:大神深度体验两周,强到离谱,但慢得抓狂 ↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新为了紧急对抗谷歌的Gemini 3 ,OpenAI 刚刚推出了GPT-5.2,sam Altman 叫喊这是很长时间以来最大的更新 基准测试分数官方的发布博客文章都有,跑分屠榜,编程能力非常强,但现在的这些分数看看就好了,感兴趣的看这里https://openai.com/index/introducing-gpt-5-2/ GPT-5.2 的幻觉减少了大约 30-40% 价格更贵了 另外圣诞节还有发布,估计是图像模型更新?ChatGPT 的“成人模式”目前计划于明年第一季度推出 这里我分享一下大神OthersideAI CEO Matt Shumer 对 GPT-5.2 深度评测,这哥们已经拿到内测两周了核心要点先放在前面:指令遵循和任务意愿:GPT-5.2 Thinking 在指令遵循和尝试完成困难任务的意愿上,迈出了有意义的一步代码生成能力提升巨大:比 GPT-5.1 好得多。能力更强、更自主、更谨慎,并且愿意编写多得多的代码视觉和长上下文:大幅改进,尤其是在理解图像中的位置和处理大型代码库方面速度是主要缺点:作者体验中,Thinking 模式在处理大多数问题时都非常慢(尽管其他测试者反馈不一)。他几乎从不使用 Instant 模式GPT-5.2 Pro:在深度推理方面强到离谱,但速度很慢,而且偶尔会陷入长时间思考后仍然失败的境地Codex CLI:GPT-5.2 是作者在命令行工具中使用过的最接近 Pro 级编码能力的模型,但实现这一能力的高级推理模式有时需要漫长的等待以下是详细评测内容。GPT-5.2 Thinking:直觉的提升 GPT-5.2 最引人注目的地方在于它遵循指令的方式——不是基础的“我说你做”,而是“真正完成我所描述的整个任务”作者举了一个例子。在测试创意写作时,他要求模型先想出50个情节构思,然后再选出最好的一个来写故事。大多数模型会走捷径,可能只给出10个想法,选一个就开始。而 GPT-5.2 确实生成了全部50个构思,然后才进行选择。这听起来是小事,但并非如此。在进行创意工作或研究时,多出来的40个想法中可能就包含了那个真正有趣的火花。模型信任流程,而不是为了速度而优化,这一点至关重要。作者进一步测试,要求它写一本200页的书。虽然书页内容本身很弱且简短,模型还无法一次性写出可出版的小说,但令人印象深刻的是,它确实尝试去做了。它构建了整本书的结构,甚至设置成了PDF格式。大多数模型会假设自己做不到,甚至不会尝试,它们会告诉你“这太长了”,或者只给你一个大纲GPT-5.2 则是直接上手。这种愿意尝试宏大任务(即便不完美)的意愿,开启了新的工作流。代码生成:真正的进步 GPT-5.2 在代码生成方面确实比以前的模型有了巨大进步。它写的代码质量更高,能处理的任务也更庞大例如,作者用 Three.js 动画来压力测试其空间推理能力。他要求模型构建一个棒球场景,它生成的风格比大多数模型更逼真(纹理/光照效果很棒),但空间感知和物体放置仍有很大改进空间 此外,该模型愿意编写比之前版本多得多的代码,并且能持续工作更长时间不中断。这是实实在在的能力提升。视觉和长上下文 5.2 版本的视觉能力有显著提升。它对图像的理解,特别是位置和空间关系,有了很大的不同(尽管空间生成能力仍在开发中)。这对操作计算机的智能体来说是个好消息。它的长上下文能力也很出色。在处理大型代码库、大量数据和长篇分析时感觉比以前更稳定,这也是 GPT-5.2 在智能体编码工作流中表现出色的原因之一。作者在这里吐槽了一点:模型已经变得如此强大,但 OpenAI 的 ChatGPT 界面却完全没跟上。例如,ChatGPT 中的 Canvas 界面仍然无法处理大量代码。他最初在 Canvas 中尝试 Three.js 测试,但模型输出的代码量超出了 Canvas 的处理能力另外,Pro 模式仍然只能在 ChatGPT 内部使用,而不能在 Codex CLI 中使用,这让作者持续感到沮丧。为了解决这个问题,他使用一个叫 RepoPrompt 的工具:将本地代码库转成提示词粘贴给 5.2 Pro,再把模型的回答粘贴回 RepoPrompt,由后者将变更应用到代码库。虽然多了一个步骤,但这让他能在真实代码库上利用 Pro 级别的推理能力。风格 用过 OpenAI 模型的人都知道它们对项目符号(bullet points)的执着。GPT-5.2 延续了这一传统。当你让它解释某件事时,往往会得到一个项目符号列表,而其实几段清晰的文字效果会更好。通过精心设计提示词(比如明确要求流畅的散文风格),可以规避这个问题。除了项目符号,写作风格整体有所改善。虽然不是对 GPT-5.1 的巨大飞跃,但确实更好了一些积极的一面是,GPT-5.2 学会了在回答中保持简洁。当我问一些简单问题时,偶尔能得到简单的答案。作者表示,虽然这还没成为默认行为,但已是进步。速度问题 这一点影响了作者的日常使用:标准的 GPT-5.2 Thinking 很慢。根据他的经验,即使是简单直接的问题,速度也非常非常慢。不过,他也提到其他测试者报告了不同的速度表现,有些任务快,有些任务慢。在实际工作中,这意味着他很少使用 GPT-5.2 Thinking。他的工作流变成了: • 快速问题 → Claude Opus 4.5 • 深度推理 → GPT-5.2 Pro 标准的 Thinking 模型处于一个尴尬的中间地带:比 Opus 慢,又没有 Pro 完整的推理优势。各模型横向对比 作者同时使用 Claude Opus 4.5、Gemini 3 Pro 和 GPT-5.2,它们在他的工作流中形成了明确分工:用于快速提问:“X的语法是什么”或“提醒我Y如何工作”这类问题Claude Opus 4.5 胜出。它更快,更直接。用于研究和复杂推理:GPT-5.2 Pro 明显更胜一筹。当任务需要从多个角度思考、需要整合大量上下文时,Pro 的表现最优用于前端UI生成:GPT-5.2 Thinking 和 Pro 都比之前的 GPT 模型有进步,但两者都不及 Gemini 3 Pro。这里的区别很微妙:Gemini 3 Pro 有最好的审美感,其 UI 看起来很棒。但它在布局和前端工程方面的可靠性稍差。所以,如果需要功能正确、能处理边缘情况的UI,作者还是会用 Opus 或 GPT。如果只是追求漂亮,并愿意自己修复代码,Gemini 3 Pro 是目前最佳选择GPT-5.2 Pro:一个缓慢的天才 Pro 模式是真正有趣的地方。它是一个独立的系统,且只在 ChatGPT 中可用。简而言之:Pro 聪明到离谱。Thinking 和 Pro 之间的智能差距立即可见。但比原始智能更重要的是 Pro 的思考意愿。它会花费比以往 Pro 模型长得多的时间来解决一个问题。对于研究任务,如果需要,它会进行极长时间的资料搜集。食谱测试作者举了一个具体例子。他向模型寻求膳食计划帮助,并强调自己“没有时间做饭”,需要一个7天的计划(每天三餐两点)。Pro 提供了出色的食谱计划,但最突出的是它的配料表——比其他模型建议的简单得多。它理解了“没时间”不仅限制了烹饪时间,也限制了购物的复杂性、准备工作和心力开销。它领会了作者的心态,而不仅仅是字面请求。作者表示,看到这种程度的理解相当令人震惊。他把同样的提示发给了所有其他前沿模型,没有一个考虑到这一点。提示词编写 GPT-5.2 非常擅长编写提示词,这对于充分利用 AI 模型和构建集成 LLM 的软件都很有帮助。它写的提示词考虑周到,并且能预见到作者未曾考虑的边缘情况。在这方面,它与 Claude Opus 4.5 不相上下,并且明显优于 Gemini 3 Pro。Codex CLI 实测 在 Codex CLI 中,作者对 GPT-5.2 进行了广泛测试,结果是越用越印象深刻。这是他所见过的在命令行中最接近 Pro 级模型的体验。它一次性做对的频率远超其他工具。美中不足的是,他只能使用“超高推理模式”,这个模式有时会花费漫长的时间,甚至比 Pro 还慢。其自主性比以前的模型有明显提升。但真正的区别在于它收集上下文的方式。Claude Opus 4.5 倾向于在完全理解问题前就开始写代码,它会做出假设,然后碰壁。而 GPT-5.2 不会这样。它会先提问、读取文件、探索代码库。先收集上下文,再编写代码。这改善了作者的工作流。他检查模型工作的次数越来越少。除非任务至关重要(例如生产代码),他常常让它直接运行而不审查每一处更改。一些小怪癖 作者也遇到了一些 Pro 模式的奇怪行为。它似乎会卡在相互冲突的指令之间,在犹豫几分钟后,把一个简单的任务退回给用户。偶尔,它会思考很长时间,然后仍然失败,这非常浪费时间。据称 OpenAI 已经知晓并正在调查。使用场景总结 经过两周测试,作者给出了他的实用分工: 1. 快速提问和日常任务 : Claude Opus 4.5 仍是首选。它快、准,不浪费时间。 2. 深度研究、复杂推理 : GPT-5.2 Pro 是目前最好的选择。在这种场景下,正确性比速度更重要。 3. 前端样式和UI美学 : Gemini 3 Pro 目前能生成最好看的结果,但需要准备好自己做一些工程清理工作。 4. 在 Codex CLI 中进行严肃的编码工作 : GPT-5.2 是首选,其上下文收集行为和可靠性使其成为智能体编码任务的默认选项。 最后总结GPT-5.2 是一次真正的改进。指令遵循能力明显提高,Pro 模式的智能和可靠性令人印象深刻。对于需要审慎推理的复杂任务,这是作者用过的最好的模型。然而,标准 Thinking 模型的速度问题使他日常很少使用。他最终的用法是:快速任务用 Opus 4.5,深度工作用 Pro。但对于那些 GPT-5.2 擅长的任务,它的表现确实非常亮眼source:https://shumer.dev/gpt52review--end-- 最后记得⭐️我,每天都在更新:欢迎点赞转发推荐评论,别忘了关注我 -
GPT-5.2发布 OpenAI称其为"最强专业知识工作大模型" 财联社12月12日讯(编辑 史正丞)被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。 图为OpenAI官网截图OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。GPT‑5.2有三种不同的版本:Instant是针对常规查询(如互联网检索、翻译和写作)进行速度优化的模型;Thinking擅长编程、数学、长文档分析等复杂结构化工作;顶级型号Pro,旨在为棘手问题提供最大程度的准确性和可靠性。OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合现实世界专业用途的模型。在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士,这些任务包括制作销售演示文稿、会计电子表格、制造流程图或短视频等。 在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士另外在金融AI领域,GPT‑5.2Thinking的产出成果也明显好于GPT-5.1。OpenAI给出的示例显示,GPT‑5.2 Thinking在制作人力资源规划模型、股权结构表和项目管理表格的任务中,产出成果较GPT‑5.1 Thinking有肉眼可见的进步。 OpenAI给出的示例除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在编码、数学、科学、视觉、长文本推理以及工具使用等方面均刷新了基准成绩。公司称,这些能力的提升将有望带来“更可靠的代理式工作流程、可用于生产环境的代码,以及能够在大规模上下文和真实世界数据中运行的复杂系统”。横向比较方面,GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5,涵盖现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA Diamond),到抽象推理和模式发现(ARC-AGI套件)。 GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5OpenAI产品负责人Max Schwarzer也在周四通报称,GPT-5.2 Thinking的回复较前代减少了38%的错误,使该模型在日常决策、研究和写作中更为可靠。从周四开始,GPT‑5.2将向所有ChatGPT付费用户和API用户推送。所以这个新模型到底有多么适合“打工”,很快就能见分晓。作为OpenAI对谷歌的反击,GPT‑5.2仅仅是打出的“第一拳”。公司CEO奥尔特曼在周四宣布,下周会给用户们带来一些“小小的圣诞礼物”。他也在周四表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在明年1月“以非常强劲的姿态”退出目前的红色警报状态。 图为奥尔特曼社媒发文截图OpenAI首席产品官Fidji Simo也在周四透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。略有遗憾的是,周四的新品发布似乎聚焦于新模型的推理能力,没有推出新的图像生成器。而今年以来,为数不多的几次现象级新品发布都与图像、视频生成产品有关。奥尔特曼的“红色警报”备忘录中,也提及要改善图像生成能力。此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。 -
迪士尼10亿美元投资OpenAI 并授权漫威星战等IP 财联社12月12日讯(编辑 夏军雄)当地时间周四(12月11日),迪士尼宣布将向人工智能(AI)研究公司OpenAI投资10亿美元,同时授权后者在AI视频生成工具Sora使用旗下众多IP。受此消息提振,迪士尼周四美股早盘一度涨超2%。根据授权协议,从明年年初开始,Sora和ChatGPT Images将可以使用迪士尼、漫威、皮克斯和《星球大战》等超过 200 个角色创作内容,但不包含任何演员的肖像或声音。迪士尼将获得购买更多OpenAI股权的认股权证,并成为OpenAI的主要客户之一。此外,部分由用户生成的视频将被放到迪士尼Disney+流媒体平台上播放。双方将利用OpenAI的模型开发新产品和客户体验,包括面向Disney+用户的功能,而迪士尼也将向公司员工部署ChatGPT。迪士尼CEO鲍勃·艾格在声明中表示:“AI的快速发展标志着我们行业的一个重要时刻。通过与OpenAI的合作,我们将在尊重和保护创作者及其作品的前提下,以更周到、更负责任的方式借助生成式AI扩展我们的叙事力量。”OpenAI首席执行官萨姆·奥尔特曼表示:“迪士尼是全球叙事领域的黄金标准,我们很高兴与迪士尼合作,让Sora和ChatGPT Images能够拓展人们创作和体验精彩内容的方式。”据知情人士透露,过去一年里,OpenAI一直在与迪士尼及其他好莱坞公司接洽,寻求合作伙伴。此举标志着迪士尼在AI方面的战略发生重大转变。此前,在OpenAI与多家公司讨论Sora的版权政策时,迪士尼曾决定不允许旗下角色出现在该应用中。好莱坞对于AI的崛起如临大敌。今年10月,代表数千名演员、导演和音乐人的创意艺术家经纪公司(CAA)表示,OpenAI 通过Sora让艺术家面临“重大风险”,并质疑这家AI公司是否认为创意工作者“值得为他们创作的作品获得报酬与署名”。 -
理想高管回应王兴兴质疑:VLA是自动驾驶最好的模型方案 版权声明:本文版权为网易汽车所有,转载请注明出处。 网易汽车12月11日报道 近日,理想汽车自动驾驶研发高级副总裁郎咸朋通过微博,就宇树科技创始人王兴兴此前提出的“VLA技术路线担忧”进行了回应。郎咸朋明确指出,VLA是理想认为最优的自动驾驶模型方案,而具身智能的关键在于整体系统能力。这一表述不仅回应了技术争议,也提供了理想对自动驾驶未来发展路径的清晰判断。 用效果说话:OTA 8.1是VLA方法论的阶段性验证 郎咸朋强调,“空谈架构不如看疗效”,理想坚持VLA路线的前提,是基于数百万辆车形成的数据闭环。OTA 8.1的更新为这一观点提供了直观验证。感知能力的升级是首要变化,通过使用2D ViT技术将感知分辨率从1K提升至2K,识别距离从100米延长至200米,车辆能够更早识别红绿灯,实现更加平顺和舒适的制动体验。感知能力提升,为模型生成轨迹和控制信号提供了更高质量的输入,这与郎咸朋提出的“模型必须与具身智能系统整体适配”高度契合,也说明具身智能不是单一大脑强就够,而是系统协同的重要体现。 OTA 8.1在路径选择与决策能力上的优化同样显著。在主辅路切换和岔路选择等关键场景中,无效变道明显减少,决策更加精准。理想通过约600万Clips优质驾驶数据对模型重新训练,使VLA能够持续通过强化学习迭代,不断接近人类驾驶逻辑。郎咸朋同时指出,世界模型更适合云端考场,用于仿真和数据生成,而车端推理仍由VLA执行。这种车端务实、云端高逼真训练的分工模式,体现了理想对系统架构的务实思考。 VLA为何是理想的长期坚持:系统论逻辑下的生成式模型 郎咸朋与王兴兴在观点上最大差异在于,前者认为模型关键不在于架构本身,而在于与具身智能系统的适配度。VLA作为生成式模型,可直接生成轨迹与控制信号,表现出用户反馈中的拟人化行为。通过结合大量真实数据与云端仿真数据的持续迭代,VLA逐步形成对空间关系、交通意图和驾驶习惯的理解能力。相比传统端到端+VLM模仿学习,VLA强化学习机制能够处理“未学过”的场景,实现更广泛泛化能力。 百万辆车构建的数据闭环是理想对VLA信心的核心。郎咸朋指出,理想不仅拥有十几亿公里的存量数据,还通过150万辆车获取实时新增数据。在筛选过程中发现,约40%的驾驶数据存在偏向道路一侧或不严格遵守限速的现象,这些数据被保留以保持对真实世界驾驶行为的学习。VLA追求的是接近真实驾驶的自然行为,而非几何意义上的规范轨迹。 系统适配也在底盘层面体现。以VMM(车辆运动管理)模块为例,减速任务中车辆会根据策略划分卡钳制动与液压制动比例,实现安全性和舒适性的平衡。这说明理想的技术体系不是单一模型,而是通过感知、模型、操作系统、芯片与底盘的全链路协同,将系统能力贯穿到每一个决策与执行环节。从这个视角看,“VLA是否最优”已经不是孤立模型问题,而是系统架构下的路径选择问题。 具身智能视角:VLA是通往“汽车类具身机器人”的关键 郎咸朋的回应还明确了理想未来发展方向,自动驾驶是具身智能,而具身智能不是单一技术点,而是系统能力的综合体现。李想曾在内部会议中指出,未来五到十年,具身机器人将呈现汽车类与人形类两种形态。理想选择以汽车类具身机器人为核心,这是其技术与产品战略的基础。 理想在具身智能方向的积累体现在感知、模型、操作系统、算力和本体的全栈协同。郎咸朋强调,“整体系统能力”才是具身智能的本质定义,单项突破无法构建真正的智能体。 VLA之所以成为汽车具身智能的核心,是因为它能够理解物理世界,并在空间理解、思维推理与驾驶行为生成上形成统一逻辑。它融合视觉、语言与行为,具备链式推理能力,生成接近人类司机风格的轨迹,同时通过语言交互形成记忆与驾驶偏好。这正是理想坚持VLA作为长期技术路线的核心逻辑,也是其认为VLA是“最好的自动驾驶方案”的根本原因。 结语:技术争议仍将持续,但路径选择更清晰 郎咸朋的回应并不是一场“技术路线之争”的终局,而是一家深度投入自动驾驶与具身智能的企业,基于技术能力、资源禀赋与产品策略所作出的长期判断。 对于行业来说,VLA、世界模型、端到端等路线的争论不会马上结束,但随着更大规模的车端部署、更成熟的云端仿真体系以及更长期的数据闭环积累,技术路线最终会通过效果决胜,而非观点决胜。 从OTA 8.1的体验提升,到理想具身智能系统框架的逐渐清晰,可以确认的是:理想正在用一个越来越系统化、越来越工程化的方式构建其自动驾驶体系。而VLA是否最终成为定义行业的主流路径,仍需时间验证。 对于用户与行业观察者来说,此次回应至少提供了一个清晰信号:VLA不是一个模型,而是一个系统;自动驾驶不是一个功能,而是具身智能的第一场战役。 -
Robotaxi发生伤人事故 哈啰出行自动驾驶业务暂停运营 界面新闻记者 | 周末 林鑫龙 界面新闻编辑 | 文姝琪 自动驾驶商业化提速之际,哈啰株洲Robotaxi的一起伤人事故,再度将技术成熟度与安全边界的疑问推向台前。12月6日,多段网传视频显示,在湖南省株洲市,一辆车身贴有“哈啰自动驾驶”字样的车辆停在斑马线附近,有行人被卷入车底,市民与民警合力抬车救援。据新京报报道,事发地在斑马线处,湖南省直中医院确认在事发当日从现场接收了两名伤者。截至12月10日,当地交警部门尚未公布具体的事故责任认定及后续情况。多名株洲市民对界面新闻表示,当地连日有密集的洒水车作业,“一整天地就没干过”,此前亦有电动车滑倒的情况发生。截至发稿,哈啰方面未对事故作出回应。界面新闻致电哈啰自动驾驶客服获悉,湖南株洲地区的自动驾驶业务现已“暂时停止运营”, 恢复时间未定。记者实测发现,截至12月10日,将哈啰APP定位调整至湖南株洲、江苏溧阳两地时,应用主页仍保留“自动驾驶”入口;但在实际操作选定上车点时,软件均显示“不在运营区域”。此外,发布于12月6日下午的一则本地抖音视频显示,大量标识为“哈啰自动驾驶”的车辆成批驶出。短视频评论区中,部分当地用户反映已无法打到自动驾驶出租车。 哈啰自动驾驶车辆成批驶出 图片来源:抖音账号@株洲摄影家值得注意的是,在此次伤人事故发生前一周,已有株洲市民在社交媒体平台反应乘坐哈啰自动驾驶出租车时发生碰撞事故。该用户向界面新闻记者透露,11月28日早晨,其乘坐的哈啰自动驾驶车辆在行程中与社会车辆发生碰撞,导致“车门撞瘪了”。据该用户描述,事故发生地距离目的地不足200米,但涉事车辆在碰撞后并未紧急制动或停留,而是继续行驶直至终点。事发后,该乘客通过哈啰城市运营群反馈情况。客服人员回应称,安全员在事故发生后已介入并接管车辆。然而,该乘客表示其在体感上“无法辨别”是否有人工接管,并对处置流程的合规性有所疑问:依据交通法规,事故发生后应立即停车报警并保留现场;即便是为了乘客安全,在仅剩百余米的情况下,让乘客下车步行显然是更合理的选择,而非由事故车辆继续载客行驶。 用户在抖音平台发布的事故后与客服沟通聊天记录 图片来源:受访者提供据株洲日报报道,哈啰智能网联汽车属于L4级别的高度自动驾驶,于8月4日在天元区许可道路上开放示范活动。哈啰株洲方面相关负责人曾表示,“我们在株洲市配置了道路车辆的远程监控,通过远程云舱中心的远程驾驶员可以随时接管。”此前,哈啰自动驾驶团队曾因当地“超预期的乘车需求”,就用户平均等待时间增长致歉。国际自动机工程师学会定义了从 L0(完全手动)到L5(完全自动)的汽车自动驾驶技术标准,L3及以上即为自动驾驶。L4为高度自动驾驶,指在特定环境和条件下,车辆可实现自动驾驶,无需人类驾驶员干预。无论是上述乘客的个案遭遇,还是事发后舆论场的广泛讨论,都指向了同一个核心疑问:当自动驾驶车辆发生事故,责任主体究竟该如何界定?上海大邦律师事务所高级合伙人游云庭律师对界面新闻表示,事故中车辆与行人的责任划分需依据交警部门认定。若L4级自动驾驶车辆被判担责,责任方应归属于车辆的运营平台。游云庭指出,鉴于现行交规主要归责于驾驶员,此类事故更适用产品质量法,民事赔偿责任首先由运营平台承担;技术提供商若明知产品存在重大缺陷仍投入使用,则可能面临更严厉的法律追究。若造成严重后果,技术提供商可能涉嫌生产、销售不符合安全标准的产品罪或重大责任事故罪。但他也强调,此类案件面临较高的证据壁垒,需要对应数据或内部沟通证据证明技术方明知产品缺陷存在,且缺陷导致了事故发生。作为国内共享单车头部运营商,哈啰出行在Robotaxi赛道是典型的“后来者”。直至今年6月,哈啰出行才正式宣布进军Robotaxi(自动驾驶)赛道。此前,哈啰联合蚂蚁集团、宁德时代一起成立“上海造父智能科技有限公司”,专注于L4级自动驾驶技术研发、安全应用和商业化落地,三方首期合计出资超过30亿元。据界面新闻此前报道,哈啰Robotaxi业务首席科学家Yolanda当时曾公开表示,称Robotaxi业务目前会以国内为主,公司目标是三年内落地商业化,并如此解读哈啰Robotaxi的业务模式:“蚂蚁集团在AI基础建设,AI算力、算法的研究上可以给到我们很大的助力。宁德时代可以在车辆上提供滑板底盘、电池动力技术等方面的集成和支持。”今年9月的2025Inclusion:外滩大会上,哈啰公布了首款前装量产Robotaxi车型“HR1”,并宣布规划于2026年实现量产下线,2027年部署超5万辆Robotaxi车型。 哈啰首款前装量产Robotaxi车型“HR1”(Hello Robot1)全球首发亮相但本次事故现场图片及网传视频显示的涉事车辆并非此前亮相的“HR1”。一名业内人士对界面新闻指出,Robotaxi的大规模商用通常需要大量里程的路测数据积累作为安全支撑,“即使路测数据可以购买、技术短时间内可以突破,但哈啰出行成立至今的短短半年,难以积累足够的路测里程数。”从有安全员到无安全员,不载客到载客,没有企业可以跳过此类路测步骤,哈啰出行显然也不例外。一位年初自哈啰离职的人士则对界面新闻表示,今年刚刚组建的团队,可能都是“拿来主义”,“在Robotaxi的技术算法方面的积累并不深厚”;去年公司曾计划购买百度高精地图,后因资方原因未成行。BOSS直聘平台显示,目前哈啰普惠检索“智驾”“自动驾驶”的相关在招岗位达数十个,包括产品负责人- Robotaxi、智驾工程部署负责人、智驾硬件产品专家、智驾系统架构专家、智驾专项电控专家、智驾量产项目专家等等,不一而足。根据哈啰出行官方信息,在“HR1”亮相的同日,为加速推进规模化目标实现,哈啰还分别与启辰汽车、阿里云、地平线、禾赛等签署战略合作协议,宣布将共同推进Robotaxi从技术研发到量产落地。这意味着,Robotaxi技术版图仍在搭建中的哈啰出行,或许才刚刚出发不久。