找到
852
篇与
互联网
相关的结果
- 第 22 页
-
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。 海外社区也注意到DeepSeek使用了它而不是OpenAI开发的Triton语言。有接触过的开发者感叹TileLang是一种非常优雅的语言,只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现。 那么什么是TileLang,又为何引人瞩目?首先,TileLang是一种专门用来开发GPU内核的领域专用语言,性能上可以对标英伟达CUDA,DeepSeek官方推荐使用此版本做实验,在方便调试和快速迭代上有优势。更重要的是,TileLang与国产算力生态适配,连华为昇腾都要在第一时间公告对TileLang的支持。 在几周前的华为全联接大会2025的开发者日上,TileLang团队成员董宇骐就介绍了TileLang实现FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。此外TileLang团队成员王磊和沐曦集成电路的高级总监董兆华也在同一个圆桌沙龙上出现过,讨论了沐曦GPU与TileLang的适配。DeepSeek为什么选择TileLangDeepSeek与TileLang第一次同框亮相,其实是在6月的北京智元大会。在DeepSeek实习过的北大博士袁境阳,在报告中就提到“TileLang的算子实现会更快一点”。TileLang的发起人之一,北大博士研究生王磊当时还专门发帖感谢DeepSeek尝试他们的语言。 TileLang由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智。 2025年1月,TileLang在GitHub上正式开源,至今已获得1.9k标星。 简单来说,Tile语言 ( tile-lang ) 是一种简洁的领域专用语言,旨在简化高性能 GPU/CPU 内核的开发。tile-lang采用Python式语法,并在TVM之上构建底层编译器基础架构,使开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。 王磊曾在7月HyperAI超神经主办的Meet AI Compiler技术沙龙分享TileLang的核心设计理念:将调度空间(包括线程绑定、内存布局、张量化和流水线等)与数据流解耦,并将其封装为一组可自定义的注解和原语。这种方法允许用户专注于内核的数据流本身,而将大部分优化工作交给编译器完成。TileLang将“Tile”作为编程模型的核心概念,通过显式的Tile抽象,让开发者能够直观地控制数据在全局内存、共享内存和寄存器之间的流动。TileLang提供了三个不同层次的编程接口,满足不同水平开发者的需求。初学者可以使用硬件无关的高层接口,专注于算法逻辑而不必关心底层细节。有经验的开发者可以使用ile Library,这里包含了各种针对不同硬件架构优化过的预定义操作。对于追求极致性能的专家用户,TileLang还提供了线程原语级别的控制,允许他们直接操作线程同步、内存合并等底层特性。 DeepSeek显然就属于追求极致性能的专家用户了,根据v3.2公告的说法,在早期DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能。v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制(lightning indexer)运行速度远超传统实现。 在TileLang的文档中也有相关的技术介绍,在计算过程中缓存中间数据,比全局内存快得多。 TileLang与DeepSeek双向奔赴更早之前,在DeepSeek连续一周发布开源代码库的第一天,王磊就曾向DeepSeek团队推荐TileLang语言。 后来TileLang也以DeepSeek在这天发布的FlashMLA内核作为评测基准,在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当。 在最新的DeepSeek v3.2发布之后,王磊也发帖致敬DeepSeek敢于使用一门新的编程语言来开发核心产品。并且DeepSeek v3.2也验证了TileLang确实可以用来训练模型。 DeepSeek V3.2技术报告: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdfTileLang: https://github.com/tile-ai/tilelang参考链接: [1]https://x.com/Lei_Wang_1999/status/1932331703747698786 [2]https://x.com/nathancgy4/status/1972613835598299245 [3]https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519 [4]https://hub.baai.ac.cn/view/46173 -
2025云栖大会:高德地图透露AI文博布局 时空大模型重构文化体验 来源:环球网【环球网科技报道 记者 李文瑶】在2025年云栖大会上,高德展区前人头攒动。一位参会者戴上VR设备,瞬间“走入”故宫未开放的造办处遗址,俯身端详清代内务府的陈设细节——这一幕,正是高德地图以AI技术切入文博数字化赛道的缩影。在接受记者采访时,高德商业业务负责人韩鹏系统阐释了高德以“空间智能”为核心,布局文博数字化领域的战略逻辑与技术路径。从地图工具到文化平台:高德的“三维跃迁”高德地图此前已被公众熟知为出行工具,但其底层能力实则是“还原真实世界”。韩鹏指出,而AI时代的到来加速了其从二维平面向三维立体空间的升级。 “以前高德是点、线、面的组合,现在我们要构建的是全方位立体的数字空间。”韩鹏表示,高德云图团队推出的三大空间智能技术——云境(图生三维)、云睿(预测分析)、云迹(轨迹安全)——正是这一跃迁的技术支撑。其中,“云境”三维重建技术能够快速实现对文物单体乃至大型场景的三维重建,成为高德切入文博赛道的技术基石。文博数字化的三大痛点与高德新解法韩鹏分享,文博行业仍然面临三大限制:物理空间限制、数字化成本高、运营压力大。而高德的空间智能正试图从技术层面突破这些瓶颈。单就博物馆文物的数字化建模来说,传统手工建模耗时耗力。高德“云境”模型可将单体文物采集时间压缩至1~2天,并通过“单体化”技术实现展品的快速替换与内容更新,极大降低数字化门槛。此外,通过“云睿”时空大模型预测客流、疏导人流,高德还能帮助博物馆平衡文物保护与游客体验。“我们不仅要帮大型博物馆提质增效,更要让中小博物馆用得起、用得好。”韩鹏强调,高德正在将头部项目中沉淀的能力产品化,推出轻量级管理平台,服务中小型博物馆的数字化需求。从“数字孪生”到“文化串联”:AI重构文化体验高德的布局不止于复制线下博物馆。韩鹏提到,未来希望打破时空界限,实现文化主题的“跨馆串联”。例如,用户可在高德地图上追溯苏东坡一生足迹,联动多家博物馆的藏品、文献与场景,形成一条完整的文化叙事线。“文化传承不应受限于物理空间。”韩鹏举例称,青州佛像的“东方微笑”若能通过三维建模精准还原,将成为东方文化的“蒙娜丽莎”,助力文化自信的输出。这一愿景与谷歌“艺术与文化”项目异曲同工,但高德的优势在于其扎根中国本土文化生态,并拥有10亿用户流量的加持。面对行业在文博领域的布局,韩鹏认为高德的差异化在于“技术纯粹性”与“平台中立性”。“高德一心一意打造文博地图,不做内容生产,只做技术输出。”这种定位更易获得博物馆信任。此外,高德延续“老师傅+新技能”的生态合作模式,与央美、北航等院校及文博专家共建内容生态。例如,湖南博物馆线上展厅既包含官方严肃内容,也开放用户创作入口,形成“严肃+趣味”的双层体验。未来展望:从“示范项目”到“普惠平台”据了解,“十四五”课题将于11月结题,但高德已同步筹备申请“十五五”课题,计划将文博数字化能力进一步普惠化。韩鹏透露,下一步将推动成果标准化,让中小博物馆低成本接入数字化管理平台。在云栖大会的展区,观众通过VR设备“走入”考古遗址的那一刻,或许已预示着文博体验的未来形态。高德地图正试图用时空大模型打破文化的时空壁垒,让文物“活”起来,让文化“流”起来。而这背后,不仅是技术赋能行业的商业故事,更是一场关于如何以AI展现文化的长期实践。 -
Waymo自动驾驶汽车开到高尔夫球场?官方回应称当时由人类驾驶 IT之家 9 月 30 日消息,谷歌旗下 Waymo 已就近期在社交媒体上传播的一段视频作出澄清,视频显示该公司旗下一辆自动驾驶汽车驶入了高尔夫球场并在场地内行驶。 与其他 Waymo 自动驾驶车辆的行驶场景不同,视频中的这辆车直接在草坪上行驶,且距离周边人群仅数米之遥。视频中可清晰听到旁观者的笑声,而涉事 Waymo 车辆则在高尔夫球场上缓慢行驶。在网上各种猜测不断发酵之际,Waymo 作出回应称,这段热传视频中的涉事车辆实际上由人类驾驶员操控,视频拍摄期间该车辆并未处于自动驾驶状态。Waymo 在帖子中写道:“大家好,这辆车当时是由人类驾驶的,正为在彭马尔高尔夫球场(Penmar Golf Course)举办的一场活动做准备。” IT之家注意到,这段视频也引发了特斯拉爱好者群体的关注,不少网友表示,若视频中的自动驾驶出租车换成特斯拉,这家电动汽车制造商很可能会遭到媒体的猛烈抨击。 -
大摩评“英伟达投资OpenAI”:争议再大,这也是实实在在的“重大利好” 本文作者:董静来源:硬AI大摩认为,尽管市场存在质疑声音,但这笔交易为英伟达带来的是实实在在的增量收入。据见闻文章写道,9月22日,英伟达与OpenAI宣布,签署意向书确立达成战略合作,OpenAI将借此利用英伟达的系统打造和部署至少10千兆瓦(GW)的AI数据中心。9月30日,据硬AI,摩根士丹利在最新研报中指出,尽管英伟达投资OpenAI的交易引发市场争议,但该协议将为英伟达带来3500-4000亿美元的潜在增量收入,这一规模完全超出了当前市场预期。研报称,这笔交易完全是增量业务,此前市场预期这部分需求将由其他云服务提供商满足。该协议描述的建设规模是当前市场预估的数倍,将大幅推高英伟达的基本面预期。研报称,英伟达将成为OpenAI的主要计算合作伙伴,获得完全增量的业务增长,而当前估值仍然合理。摩根士丹利维持英伟达"增持"评级,目标价210美元,较当前股价有19%的上涨空间。交易规模远超市场预期 摩根士丹利在研报中详细分析了这笔交易的规模和影响。根据协议,英伟达将帮助OpenAI部署10GW计算能力,这将产生3500-4000亿美元的潜在收入,而这部分收入此前完全不在市场预估范围内。分析师指出,从英伟达的共识预期来看,2027、2028和2029财年的美元增长预期分别为600亿、450亿和420亿美元,这仅相当于每年超过2026年后增加几个GW的建设量。相比之下,OpenAI的更广泛目标是到2033年建设200GW,比今年年底的2GW大幅增长,这意味着未来8年平均每年需要增加31GW。摩根士丹利表示,英伟达在OpenAI宏大计划中只扮演一小部分角色,而这些计划反映的是市场目前尚未承认的看涨情况。研报还指出,交易设计体现了审慎的风险控制机制。摩根士丹利指出,每千兆瓦100亿美元的投资——总计500-600亿美元的资本投资,其中350-400亿美元流向英伟达——只有在公开或私人市场估值支持这项投资时才可能实现。摩根士丹利认为这是健康的机制,并不意味着锁定的10GW投资概况。英伟达的投资将随着每一千兆瓦的部署而进行,这将是对公司整体股权的直接投资,而非基于项目的投资。合理估值下的确定性机会 摩根士丹利强调,无论这笔交易的每一美元是否都能实现,它都在推高基准情形预期。该投行继续看到强劲的建设在加速进行,因为多个客户仍有大量支出意愿。研报指出,底线是,虽然牛市情形存在投机成分,但这些都还没有反映在预期中,估值仍然合理。摩根士丹利给予英伟达"增持"评级,基于其2025年每股收益预期6.36美元的约33倍市盈率。该行分析师认为,这一估值相对于大型AI同行博通有折价,相对于半导体整体板块有溢价,,反映了英伟达在该领域更高的确定性、上调预期的可能性以及溢价的利润率和增长前景。从最新的股价表现数据来看,英伟达年初至今涨幅达到221%,在摩根士丹利覆盖的半导体股票中领涨。当前股价为178.19美元,距离210美元目标价仍有19%的上涨空间 摩根士丹利总结称,虽然存在一些周期性风险的相似之处,但这些都是看涨情况的风险,而非基础情况的风险 -
DeepSeek V3.2发布,API成本减半;特斯拉员工被机器人打伤,索赔5100万美元;Claude新模型登场 |极客早知道 DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价 9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention,针对长文本的训练和推理效率进行了探索性的优化和验证。DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。本次更新带来了 API 大幅度降价,开发者调用 DeepSeek API 的成本将降低 50% 以上。 DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试。为方便用户进行对比测试,官方为 V3.1-Terminus 临时保留了额外的 API 访问接口。(来源:IT 之家) OPPO 回应新品对标大疆、GoPro:已启动研发新形态影像产品系列,预计 2026 年内发布 9 月 29 日消息,据界面新闻报道,OPPO 确认启动立项手持智能影像设备,对标 GoPro、大疆等主流手持智能影像设备厂商。据介绍,该产品负责人为前 Find 系列 GTM 李阳,归属 Find 产品规划部所属的智能影像团队,此前 OPPO 内部曾多次调研手持智能影像设备市场,但结果经常是「不需要下场」,但几个月前高层一反常态,突然下定决心立项。针对此消息,OPPO 在今天下午回应第一财经称,已启动新形态影像产品系列,计划于 2026 年内发布。而根据 IT 之家此前报道,另一家智能手机厂商——vivo 也在积极布局手持云台相机市场,去年年底立项,其首款产品已完成开模,按照节奏预计明年能发布。vivo 内部对运动相机非常重视,由现任 vivo 智慧终端产品总经理洪沂牵头整个项目的推进,目前参与人数超过 200 人,多位 vivo 员工表示已见过「样机」。(来源:IT之家)余承东被任命为华为公司 IRB 主任:仍继续负责华为终端、鸿蒙智行等业务 据媒体报道,华为公司任命余承东为公司产品投资评审委员会(IRB)主任,任命文件由任正非签发,余承东仍然担任华为常务董事、终端 BG 董事长,掌管华为终端、鸿蒙智行等业务。此次任命意味着余承东将主导华为 IRB ,该委员会负责对公司重大战略方向的资源投入、项目立项及预算审批进行关键决策,确保资源高效聚焦核心战略目标。(来源:快科技)EA 正式宣布以 550 亿 美元被收购,史上最大的全现金私有化交易 当地时间周一,美国知名游戏公司艺电公司(简称 EA)正式宣布将被沙特阿拉伯主权财富基金(PIF)、银湖资本和特朗普女婿库什纳旗下 Affinity Partners 组成的投资者财团收购。该交易预计将在 2027 年第一季度完成,交易完成后,EA 的估值将达到 550 亿美元,也将是历史上最大的全现金发起人私有化投资。三家投资方将提供 360 亿美元的现金进行收购,剩余的约 200 亿美元将通过向摩根大通银行贷款的形式进行融资。现有股东将每股获得 210 美元。其中沙特主权财富基金(PIF)已持有 EA 公司 10% 的股份,本次收购交易完成后持股比例将维持在相同水平。收购完成后,EA 股票将从公开市场退市,现任 CEO 安德鲁·威尔逊将继续执掌公司。EA 作为美国游戏大厂,旗下拥有 DICE(Digital Illusions Creative Entertainment)、BioWare、Motive Studios、Respawn Entertainment 等多个知名工作室。近年来,EA 持续推出体育类主力作品,《EA Sports FC 26》《麦登橄榄球 NFL 26》以及重启的滑板系列新作。10 月即将发售的《战地风云 6》,将是 EA 今年最核心产品。(来源:竞核) 鸿蒙 5 终端设备已突破 2000 万 9 月 29 日消息,华为常务董事、终端 BG 董事长余承东刚刚发布视频祝福用户国庆、中秋双节双倍快乐,并宣布鸿蒙 5 终端设备已突破 2000 万。 据华为常务董事、终端 BG 董事长余承东介绍,鸿蒙 5 终端设备从 0 到 1000 万,华为用了将近 10 个月的时间,而从 1000 万到 2000 万,只用了短短 2 个月时间。(来源:IT 之家)iPhone17e 比标准版相差甚远 彭博社记者马克・古尔曼昨天发布新一期《Power On》通讯,透露苹果 iPhone 17e 手机相比 iPhone 17 标准版「相差甚远」。古尔曼表示,iPhone 17e 将升级为「灵动岛」挖孔屏幕,相比 iPhone 16e 的刘海屏更为现代,但刷新率仍维持 60Hz,沿用 iPhone 16e 同款的 4800 万像素后置单摄。古尔曼认为 iPhone 17e 可能搭载 A19 芯片,在性能上看齐 iPhone 17 标准版,符合苹果下放旗舰芯片到预算型机器的一贯作风。因此,iPhone 17e 对消费者的吸引力较弱,但这可能是苹果刻意为之,他们希望 iPhone 17 与 iPhone 17e 的差距更加明显,同时与目前仍在售的 iPhone 16 标准版拉开性能差距,好让消费者更好做出选择。这样一来,iPhone 17e 就成为了一款定位纯粹的预算型手机,有望成为那些预算稍微紧张、希望获得更好性能用户的首选。不过 iPhone 17e 目前还处于前期阶段,消费者们可能还是要等多一段时间才能知道这款手机的具体配置。(来源:IT 之家)问界 M9 多车跨地域组队 K 歌功能官宣「即将上线」,支持异地与朋友一起唱歌 9 月 29 日消息,问界汽车官方宣布,科技旗舰问界 M9 多车跨地域组队 K 歌功能「即将上线」(具体上线时间暂未公布),支持在异地与朋友一起唱歌,宣称「千里之外,一麦相连」。从问界汽车官方发布的宣传视频来看,用户启用多车跨地域组队 K 歌功能后会生成一串邀请码,接受邀请的用户在车机端的 App 上输入这串邀请码即可加入一起唱歌。 (来源:IT 之家) 全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时 9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI 模型 Claude Sonnet 4.5,并声称这是「世界上最好的编程模型」。 与以往模型主要用于构建原型不同,Claude Sonnet 4.5 的核心突破在于能够创建「生产就绪级」(production-ready)的应用程序,标志着 AI 在软件开发的可靠性上实现了显著飞跃。在过去一年中,Anthropic 凭借其模型在软件工程任务上的卓越表现,已成为众多开发者和企业的首选。Anthropic 表示,Claude Sonnet 4.5 在包括 SWE-Bench Verified 在内的多个行业标准编程基准测试中取得了业界领先的性能。公司 AI 研究员 David Hershey 还向 TechCrunch 透露,仅凭基准测试分数难以完全体现该模型的真实能力。他观察到,在部分企业客户的早期试用中,Claude Sonnet 4.5 能够自主编程长达 30 小时。Anthropic 联合创始人兼首席科学官贾里德・卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:「人们注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。」(来源:IT 之家)第三代领克 03 家族 10 月 17 日上市,增加极光银 / 哑光灰车色 9 月 29 日消息,据易车报道,新款领克 03 及领克 03 + 车型将于 10 月 17 日正式上市。领克汽车副总经理穆军 19 日在社交平台分享了第三代领克 03 外观图,第一代领克 03 于 2018 年诞生,已经过去 7 年时间。 穆军介绍称,在基础版的 03 上,领克新增了极光银的全新车色,银色如疾风掠影,映射对速度的追求。整体造型上依旧延续 03 宽体、低趴的风格,斜线设计格栅,像层叠的机械羽翼,专属「03」数字标识,出街亮身份。在 03 + 上,领克为大家带来了「哑光灰」的全新车色,同时搭配上碳纤维前唇、碳纤维尾翼、碳纤维后唇包角等,整体造型,性能感拉满。官方预热显示,第三代领克 03 家族搭载千里浩瀚辅助驾驶 H3 方案,128TOPS 算力芯片 + J6M 驾驶辅助系统芯片加持,配备 11 个高清摄像头、3 个毫米波雷达、12 个超声波雷达大算力芯片 + 高感知硬件组合,支持 39 项安全驾驶辅助功能,新增 NOA 高速领航驾驶辅助、安全驾驶辅助指示灯等。(来源:IT 之家)贾跃亭宣布新车 FX 4:极致性价比、人工智能电车时代下 RAV4 颠覆者 现在的贾跃亭,正是干劲十足的时候,其公开宣布了法拉第未来 FX 4 计划。按照贾跃亭的说法,FX 品牌第二款车型 FX 4 目标是打造 AIEV 时代下 RAV4 的颠覆者。法拉第未来将在 10 月 28 日举行 FX Super One 中东 Final Launch 发布会,并计划 11 月率先在中东市场开启交付,并发布 FX 4 重大项目进展及产品设计图。(来源:快科技) 特斯拉技术员被有故障的机器人打成重伤,起诉要求赔付 5100 万美元 据媒体报道,近日,一名特斯拉技术员因在工作期间被有故障的机器人击打受伤,将特斯拉及其供应商告上了法庭。据了解,这名技术人员是在 2023 年 7 月,在美国加州佛利蒙工厂协助工程师拆卸机器人时受到击打的。事故发生时,工程师试图移除机器人底部的电机以查看内部组件,但机器人臂「突然且毫无警告地释放」,以相当于「约 8000 磅配重」的巨大力量击中上述技术人员的身体,把他「扔到地上」并导致其「失去意识」。为此,这名技术人员遭受了严重身体伤害,包括物理创伤、情绪困扰和财务损失,已累计医疗费用达 100 万美元,预计未来还将额外产生 600 万美元费用。于是,技术人员把特斯拉和机器人发那科美国公司告上法庭,后者是一家日本公司,是肇事机器人生产商。据了解,这名技术人员要求赔偿 5100 万美元,包括工资损失、精神损害、疼痛折磨以及收入能力下降。(来源:快科技)*图片来源:视觉中国 播客上新极客公园的播客节目「开始连接 LinkStart」持续更新中~一直以来,极客公园忠诚于记录创新。我们愿意走近创新者、创业者,聆听和记录他们创造价值、改变世界的故事;同时,我们也愿意近距离观察创新的阻力、代价,以及时代中被科技潮流裹挟的个体。如果你也想「聆听」这些声音,欢迎长按下方「卡片二维码」关注我们的播客「开始连接 LinkStart」~ -
Sora 2做“AI版抖音”,Agent做“AI版亚马逊”,OpenAI力推“AI应用” 本文作者:龙玥来源:硬AIOpenAI在下一盘大棋,其正兵分两路,一边准备推出一款由其最新视频模型Sora 2驱动的社交应用,另一边则已在ChatGPT中集成了即时购物功能。这家人工智能巨头的战略重心正从技术提供商向应用平台服务商加速转变。据《连线》杂志最新报道,OpenAI正准备发布一款独立的Sora 2应用程序。该应用在设计上与TikTok高度相似,采用垂直视频流和滑动浏览的交互方式,但所有内容均由AI生成。据报道,该应用上周已在公司内部推出,并获得了员工的积极反馈。与此同时,在商业应用领域,OpenAI近日宣布与电商平台Etsy和Shopify达成合作,在美国市场推出即时结账功能。用户可在ChatGPT的对话中直接完成商品购买,无需跳转至外部网站。此举被市场视为电商行业的重大变革,消息公布后,Etsy股价收盘飙升近16%,Shopify股价也上涨超过6%。然而,OpenAI的雄心勃勃的应用计划并非没有阻力。其Sora 2应用在版权处理上的策略——默认使用版权内容,除非权利方主动“选择退出”——已经引发了内容创作者和影视公司的强烈担忧,预示着一场围绕AI与知识产权的激烈博弈即将展开。Sora 2:高仿TikTok的AI短视频平台? 据报道,Sora 2应用将允许用户生成最长10秒的视频片段,并在推送右侧提供点赞、评论和再创作(remix)等社交功能。应用还包含一个由推荐算法驱动的“为你推荐”页面。值得注意的是,该应用不允许用户从手机相册或其他应用上传现有视频或照片,旨在打造一个纯粹的AI生成内容生态。该应用还包含一项身份验证功能,用户在验证后便可以在视频中使用自己的肖像,其他用户也可以标记并使用其肖像进行创作。知情人士透露,即使用户的肖像被用于一个从未发布的草稿视频中,本人也会收到通知。OpenAI此举被认为意在复制ChatGPT在文本领域的成功,通过一款颠覆性的应用让公众直观体验AI视频的潜力。OpenAI于去年12月正式推出Sora。最初,人们只能通过网页访问它,但很快它就直接被整合到ChatGPT应用程序中。同时,内部人士认为,在TikTok美国业务前景不明朗的背景下,这对OpenAI而言是一个独特的机遇。此举也让OpenAI直接进入了与Meta和谷歌的竞争赛道,后两者近期分别推出了AI视频平台Vibes和集成了Veo 3模型的YouTube。AI Agent:联手电商巨头开启“即时购物” 在另一条战线上,OpenAI的商业化落地更为直接。华尔街见闻写道,通过与Etsy和Shopify的合作,超过一百万Shopify商家,包括Glossier和SKIMS等知名品牌,将能够通过ChatGPT直接向消费者销售商品。这项功能基于OpenAI与支付公司Stripe合作开发的代理商务协议,旨在将ChatGPT庞大的对话流量无缝转化为商业交易。据OpenAI透露,其应用8月份的周活跃用户已超700万,其中相当一部分提问与购物相关。OpenAI产品负责人Michelle Fradin表示:“我们对ChatGPT的愿景是,它不仅为用户提供信息,还帮助用户在现实世界中完成事务。”目前该功能仅支持单件商品购买且面向美国用户,但OpenAI计划未来推出多商品购物车并扩展服务区域。公司将对通过ChatGPT完成的交易收取费用,但具体费率包含在保密合同中,用户端则无需支付额外费用。“先用后退”:版权争议成最大隐忧 尽管应用前景广阔,但OpenAI在版权问题上的处理方式正成为其最大的潜在风险。华尔街见闻提及,知情人士称,OpenAI已开始通知各大经纪公司和影视公司,告知他们Sora 2即将发布,并说明了如何通过“选择退出”(opt-out)流程来保护其版权内容。这意味着,除非电影公司等知识产权持有者主动告知OpenAI,否则其受版权保护的角色和内容可能会被Sora 2用于生成视频。OpenAI首席战略官Jason Kwon表示,公司一贯将人物肖像权和版权问题分开处理,新版Sora不会在未经允许的情况下使用公众人物的形象。然而,OpenAI不打算接受“整包式”的版权排除请求,权利方必须在发现侵权内容后逐一举报。这一做法引发了业界的普遍担忧。AI授权平台Vermillio的首席执行官Dan Neely表示,此举印证了行业长期以来的担忧。这场争议正值AI公司与好莱坞关系紧张之际。创作者们一直要求AI公司在使用其作品训练模型时应获得许可并支付报酬。尽管近期有法院裁决部分支持AI公司对版权内容的“合理使用”,但迪士尼等巨头已就类似问题起诉了AI公司Midjourney,显示出内容行业的强硬立场。OpenAI的版权策略无疑将使其成为新一轮法律和舆论风暴的中心。本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里 -
十年来首次重大更新:谷歌启用全新渐变色“G”形 Logo IT之家 9 月 30 日消息,据谷歌于当地时间周一发布的公告,该公司正将渐变色“G”标志定为全公司新标识。该新标识于今年 5 月首次在安卓(Android)和 iOS 系统的谷歌应用中亮相,很快将全面应用于公司所有平台,这也是谷歌十年来首次对标识进行重大更新。 谷歌的旧 Logo(左)与新 Logo(右) IT之家注意到,2015 年,谷歌推出的彩色“G”标志中,红、黄、绿、蓝四色相互独立;而此次新标识将四色融合,并提升了色彩饱和度,设计风格与旗下 Gemini 的渐变色标识一致。谷歌表示,这一变更旨在体现公司“在人工智能时代的演进”。 除新“G”标识外,谷歌还悄然更新了 Google Home 的标识,使其视觉风格与新形象统一。 谷歌称,新设计将在“未来数月”内进一步扩大应用范围,这意味着用户很快会在 Gmail、云端硬盘(Drive)、Meet 会议软件及日历(Calendar)等其他谷歌应用中,也看到这一渐变色设计。 -
“最强编程模型”发布,可自主运行长达30小时 9月30日消息,人工智能(AI)公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示,Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异,且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。 Anthropic称,根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试,Claude Sonnet 4.5是“全球最强的编程模型”。 Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)在接受CNBC采访时表示:“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。” 公司表示,新模型能够生成质量更高的代码,更擅长发现代码的改进空间,并且遵循指令的可靠性显著提升。 在此之前,Anthropic已于今年5月发布了Claude Sonnet 4,并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。 Anthropic由前OpenAI研究人员于2021年创立,两家公司自此形成激烈的竞争格局。 2022年,OpenAI发布聊天机器人ChatGPT,引爆生成式人工智能热潮。今年8月份,这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5,但发布过程一波三折,部分用户抱怨无法再使用OpenAI的旧版模型。 Anthropic首席产品官迈克·克里格(Mike Krieger)则表示,Claude Sonnet 4.5将成为用户的默认模型,公司推荐的这款模型适用“几乎所有使用场景”。 他还补充说,付费订阅用户仍然可以选用Opus模型,而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。 克里格补充道,Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小,但“几乎所有方面”都更智能。 克里格说:“我们自己和客户都发现,这个模型在实际工作中极具实用价值。” 据Anthropic介绍,Claude Sonnet 4.5可持续自主运行长达30小时,期间能持续专注于处理复杂的多步骤任务。相比之下,今年5月份发布的Claude Opus 4只能自主运行7小时。 Anthropic还表示,他们通过大量的安全训练成功改善了模型的行为表现,有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。 Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力,可有效避免被诱导执行泄露敏感数据等恶意操作。 卡普兰说:“这可能是过去一年到一年半以来,我们在安全性方面取得的最大突破。” Anthropic还将发布更多新模型。卡普兰透露,更先进的模型即将问世,其中“很可能包括新版Opus”。 他表示:“虽然目前不会做出承诺,但我认为在今年年底前,我们很可能还会发布一到两款新模型。” 各方观点与市场解读 《彭博社》在报道中特意提到,最近数周的多项研究表明,AI并未给竞相采用它的公司带来显著效益。但Anthropic强调,Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为,企业要充分实现AI的价值,“必须要有几个大前提”,其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说,“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。 路透社则认为,Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布,将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能,其中包括Excel和Word中的“智能体模式”(Agent Mode)、Copilot聊天中的“Office智能体”(Office Agent)等等。随后还将在PowerPoint中上线相关功能。 《The Verge》也提到,Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示,Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能,让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受《The Verge》采访时提到,新模型的运作水平达到了“参谋长级别”,能够查询多人日程找出空闲时间并安排会议,查看数据仪表盘整合不同见解,还能根据与下属的一对一会议内容撰写工作状态更新等。 《商业内幕》(Business Insider)认为,此次升级距离前代产品Sonnet 4的发布仅四个月,凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出,新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特( Alex Albert)在接受《商业内幕》采访时表示:“这些进步证实,通过扩展计算能力等输入,AI模型的性能将持续提升。”该报道提到,Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体,从而创造出实际的商业成果。文中援引艾尔伯特的话称,“编码和智能体能力的提升正在转化为实实在在的生产力增长。” 《商业内幕》的报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能,并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外,Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包,为开发者提供精细化的工具,用于开发定制化、具备上下文感知能力的AI智能体。(辰辰) -
Claude Sonnet 4.5 发布,登顶编程测试,可连续工作超 30 小时 Anthropic 发布 Claude Sonnet 4.5,性能大幅提升。在 SWE-bench Verified 测试中,Claude Sonnet 4.5 登顶业界第一,且能连续专注工作超 30 小时。它可一次性敲出约 1.1 万行代码,构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在 OSWorld 测试中拿下 61.4% 的成绩。Claude Chrome 插件可像真人一样在浏览器里操作任务。Claude Code 新增「检查点」功能,终端界面翻新,发布原生 VS Code 插件。Claude API 增加上下文编辑功能和记忆工具,代码执行和文件创建整合到对话里。Anthropic 还开放了 Claude Agent SDK,供开发者构建自己的产品。Claude Sonnet 4.5 定价与 Claude Sonnet 4 一致,每百万 tokens 3/15 美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor 认为其在处理长周期任务时提升明显,Dan Shipper 表示新版本响应速度更快、可控性更强、更稳定。Claude Sonnet 4.5 是 Anthropic 到目前为止对齐度最高的前沿模型,减少了不良行为,在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「Imagine with Claude」临时研究预览功能,但仅对 Max 订阅用户开放五天。Anthropic 估值达 1830 亿美元,8 月年化营收 50 亿美元,但面临 OpenAI 和 Google Gemini 的竞争压力。此前 Claude 系列模型曾经历「降智」风波,此次发布 Claude Sonnet 4.5 是为挽回用户,其实际表现还需后续观察。 -
AI眼镜元年:下一个智能终端,变得比手机更贴身 当地时间2025年9月18日,美国加利福尼亚州门洛帕克,Meta公司在Meta Connect大会上展示Meta Ray-Ban Gen 2特别版人工智能眼镜。 视觉中国 图2025年9月,Meta正式发布新一代Ray-Ban Display智能眼镜,功能之强大,几乎让人分不清这是产品发布,还是一场未来科技展。这款眼镜内建全彩高分辨率显示屏,能直接呈现AI回答、地图导航、照片预览、字幕翻译。用户可以用眼镜查看WhatsApp视频通话,也可以在走路时获得实时AR导航指引。不需要时,它又能自动“隐身”,像一副普通墨镜一样静默待机。更令人惊艳的是,Meta配套推出的EMG神经腕带,可以捕捉手腕上的肌电信号,实现“虚空写字”般的手势控制。用户只需在指侧轻轻滑动或捏合,即可操控眼镜完成音乐切换、音量调节、翻译语种切换等复杂操作。这一技术的潜力远超眼镜本身,有望成为未来人机交互的“通用接口”。这不是Meta第一次尝试智能眼镜,但可能是它最接近“杀手级应用”的一次。当智能手机的红利逐渐褪去,“下一代智能终端”成了所有科技公司念念不忘的咒语。智能手表戴过了,智能音箱喊过了,XR头盔也试图登场,但他们都没能变成“新的手机”。直到多模态大模型从后台跳上前台,人们才慢慢明白:我们不是在寻找下一块“更大的屏”,而是在寻找更自然的人机交互方式。而眼镜,恰好站在视觉、听觉与语言的交汇点。它无需唤醒,无需点按,无需低头,甚至无需你意识到它的存在。它贴在你的脸上,自然而然地嵌入感官系统,像是一块硬件,也像是你身体的延长。更有意思的是,就在许多人花钱做激光手术、希望摘掉眼镜的同时,一股“主动戴镜”的潮流正悄然兴起。从这个意义上说,AI眼镜,也许真的不是“一个新品类”,而是下一代人机关系的起点。如今,市场上最敏锐的玩家已经悄然落子。小米、字节跳动、三星、Meta、苹果……都在暗中押注同一个方向:AI眼镜。根据Wellsenn XR的数据预测,2029年,全球AI眼镜年销量将达到5500万副;到了2035年,这个数字或将攀升至14亿副。换句话说,再过十年,走在街头巷尾,你每遇到两个人,就有一个戴着AI眼镜。2025年6月,小米的首款AI眼镜登场。小米将它定位为“面向下一代的个人智能设备”,也是“随身的AI入口”。它搭载“小爱同学”,融合了拍摄、语音助手、AI翻译、导航等多种能力,配有多款镜框可选,重量可控,佩戴感轻。它外观看上去像一副略厚的墨镜,售价却远低于XR头显的“万元门槛”。首销3天,销量突破5万副,创下中国AI眼镜最快销售纪录。这不再是实验室的演示样机,而是真正意义上的“爆品原型”。从雷鸟到闪极,从INMO到李未可,如今连小米也正式落子。中国AI眼镜产业已从“技术试水”全面进化为“产品战场”。根据《2025年AI眼镜产业链研究报告》预测,今年中国市场AI眼镜出货量将达到31.4万副,同比猛增188.5%。AI眼镜的崛起轨迹,看上去像是智能手机的翻版。但走得越远,分歧也越清晰。智能手机从诞生那天起,就注定是个人数字生活的中枢。无论是支付、社交、搜索还是娱乐,它都是天然的“操作中心”。眼镜则不同。它虽然更贴身,也有成熟的佩戴习惯,却从未在过去的技术演进中扮演“入口”的角色。在它面前的,不是技术挑战,而是一个更棘手的问题:它到底是不是刚需?有人或许记得2012年的谷歌眼镜。彼时它横空出世,头顶“未来已来”的光环,却没熬过第三个年头。太贵、太重、太张扬、也太让人不安。那副价格高昂、体验平平的智能眼镜,最终成了极客圈的小众玩具。它试图将“炫酷感”与“实用性”拼贴在一起,最终却两头落空。那么这一次,这些新入局者能否逃脱谷歌的宿命?至少可以肯定一点:他们悄悄改了路线。尤其是中国企业主导的新一代AI眼镜,已不再执迷于“沉浸感”,不再讲“虚拟世界”,更不靠炫技吸睛。它们主打的是三个词:轻量,自然,日常。就像“李未可”这款AI眼镜,重量不到37克,是真正可以戴一天的AI眼镜。它不搞AR,不玩VR,更不讲XR的未来感,但搭载自研720亿参数的大语言模型,支持180多种语言翻译。你甚至不觉得它智能——它只是默默翻译、轻声提醒,在导航中一句话引你转弯,在旅途中陪你随口唠嗑。Ray-Ban Meta 的爆红正是另一个印证——好莱坞影星戴的飞行员墨镜,如今搭载上Meta的AI助手后,已售出超过200万副。一副智能眼镜,能火得像一款潮牌墨镜,也说明了什么是真正的“轻而有力”。技术只有落在真实生活,才算真的技术。接下来,我和各位读者分享一下AI眼镜正在进入的八个真实场景。这不是想象,也不是科幻电影的概念图,而是AI眼镜已经在悄然介入的现实场景。在翻译、教学、巡检、骑行、运动、导览、安全等各行各业,它正以“智能但不打扰”的姿态,慢慢嵌入日常。1.机场翻译器:环游世界不用换语言包一位中东出差人,在伊斯坦布尔机场用AI眼镜实时翻译土耳其语广播。眼镜自动识别语种与内容,在耳边用中文清晰播报登机信息。无需掏出手机、反复确认,那副眼镜像是一个悄声提醒的随行翻译官。2.课堂讲解器:历史课从“讲台”跳进“镜片”初中生戴上AI眼镜,镜片中出现兵马俑的3D动画模型,伴随同步讲解:制作工艺、出土地点、战国背景……原本昏昏欲睡的课堂,突然变得鲜活。那副眼镜不是知识的搬运工,而是沉浸感的制造者。3.手术辅助器:医生的“第二双眼”一位三甲医院外科医生,在手术中佩戴AI眼镜,调出患者的术前CT和既往病历,系统还自动推荐术式路径。语音操作实时切换模式,远程专家通过镜头同步画面。多了一副眼镜,手术室也多了一份判断力。4.维修助手:工人的“万能说明书”电力巡检员戴上AI眼镜,扫描变压器识别出老化零件,眼镜自动弹出维修流程、注意事项,并支持语音指令拍照存档。纸质手册退场,这副AI眼镜让说明书变成了“耳边人”。5.骑行导航器:你骑车,它看路早高峰时段,一位骑行者佩戴AI眼镜,实时播报红绿灯倒计时、路线变更、积水预警。通勤途中,语音操作接听电话不分心,转弯指令直接入耳,精准到米。这副AI眼镜让你安心前行,它负责思考。6.健康教练:不是健身环,而是健身眼慢跑者佩戴AI眼镜,实时监测心率、步频、呼吸节奏,并智能推荐配速;游泳时,眼镜自动记录划水频率、姿势误差。这副AI眼镜让每一次运动都被看见,每一次进步都被记录。7.景区导览器:文物主动开口说话在苏州园林,一位游客看着太湖石,AI眼镜自动识别出“玲珑剔透”的典故,讲述背后苏东坡的题词故事。无需扫码,无需导游。这副AI眼镜是最不会走神的讲解员。8.安保监控器:AI守夜人演唱会现场,安保人员佩戴AI眼镜,识别出人群异常聚集区域,标记可疑行为者并上传后台;摄像头可实时同步推送至指挥中心。这副AI眼镜没有喧哗,也没有干预,但现场秩序因此更有把握。但这一切,是否意味着它已经准备好,成为“下一个智能终端”?从“可用”到“愿意用”,从“偶尔用”到“离不开”,中间还有多少心理与技术的鸿沟?要让AI眼镜真正走进千家万户,它还必须跨过几道关键门槛。第一关,是佩戴体验。市面上不少智能眼镜依旧又重又笨,像个贴在脸上的小型投影仪。虽然李未可做到37克,但目前大部分AI眼镜依旧重达40—50克,远高于传统眼镜的15—30克佩戴门槛。戴上半小时,鼻梁就开始隐隐作痛。如何让它既轻盈又强大、既全天可戴又不妥协功能,是每个厂商必须攻克的第一道关口。第二关,是隐私焦虑。镜片里藏着摄像头、麦克风,既能收音,又能拍照,还能同步上传。到底是工具,还是潜在的监控器?谷歌眼镜曾因“偷窥争议”被集体抵制,那些围绕数据记录、知情权、信息边界的问题,至今仍没有清晰答案。厂商必须在技术上为隐私提供保障,让佩戴者和被摄者都能安心。第三关,是交互方式。今天的大多数AI眼镜依赖语音、眼球追踪或眨眼操作,听起来前沿,用起来却别扭。想象一下,在咖啡馆里大声说出“打开行程表”,四周目光齐刷刷投来,你会宁愿掏出手机。人机交互必须足够自然,甚至悄无声息,才能真正嵌入日常。智能手机的崛起,曾改变了人与世界的关系。如今,AI眼镜正在试图复制这一奇迹。但这一次,它不是要变成“更小的手机”,而是要成为一种全新的交互范式。Meta用Aria眼镜采集多模态数据,希望AI能读懂你的感知轨迹,重建一个数字化的你。苹果则以一贯的克制打磨产品形态,试图将眼镜变成AirPods级别的时尚单品——一个轻便、封闭、自洽的AI终端。而中国厂商,比如小米和李未可,则选择从生活的细部入手,用翻译、导航、通勤助手,悄悄切入你的日常节奏,成为随身的AI伴侣。三种路径,三种哲学:一个想“读取你”,一个想“服务你”,一个想“陪着你”。谁能最终占据人类的视线,就能主导下一个时代的入口。从某种意义上说,智能眼镜的争夺,不只是下一代硬件的战争,更是AI将如何塑造“人”的方式之争。(作者胡逸为数据工作者,著有《未来可期:与人工智能同行》一书)来源:胡逸 -
在数贸会,看见未来生活模样 人工智能不仅能分析人脸情绪,还能读取脑电波信号,为人定制香氛;恐龙变为AI数字虚拟形象,成为人们的“萌宠”——这不是科幻电影,而是第四届全球数字贸易博览会(以下简称“数贸会”)上的真实场景。9月25日,数贸会在杭州开幕。这是我国唯一以数字贸易为主题的国家级、国际性、专业型展会。当天,记者走进展馆,仿佛走进了一个时空交错的世界。这里展示的不仅是新技术新产品,更是近在咫尺的未来生活图景。在主题展馆,地卫二空间技术(杭州)有限公司(以下简称“地卫二”)的展位“叫号”不断,陆续有参展观众取号排队,体验穿上宇航服登上“月球”,做一回探月使者。在这里,地卫二打造了一个“月球登陆”互动体验区,观众扫码之后可以在心愿界面写上天马行空的想法。这些心愿有机会被传递到遥远的月球上,“搬运工”则是地卫二的月球探索AI机器人。地卫二展台负责人告诉记者,被收集的心愿会被刻录在一块硅基芯片上,计划将由两台AI机器人携带,随嫦娥八号登陆月球。而作为人类的数字印记,这些愿望将永存于月球南极着陆点。这两台AI机器人还将完成人类首次地外天体的“扫码支付”。而这种“支付”,将为未来“地—月数字贸易体系”奠定技术基础。本届数贸会上,地卫二发布了“全球空天数贸2035计划”,包括发布全球首个为数字贸易量身打造的AI原生卫星星座,与星座协同、专注于数字贸易领域的行业大模型,以及一支完全由AI生成的官方概念影片,视觉化呈现从地球贸易到地月经济的宏大蓝图。走遍数贸会展馆,机器人、机器狗依然是“氛围组担当”。不过,如今它们已不再是冰冷的金属,而是能跑、会跳、撒娇卖萌的可爱伙伴。在人工智能展区的镜识科技(上海)有限公司展台,这里的机器人不仅会舞蹈、武术,还能提供情绪价值。镜识科技带来了即将上市的未来家庭智能体“BAOBAO”,预计在今年12月对外销售,售价约2万元。镜识科技CMO(首席营销官)李明政介绍,这是一款双形态机器人,可以是机器狗的形象,也可以按指令“坐下”,变成类人形态。“BAOBAO”可以播放音乐,成为随身KTV,同时也是一个移动监控,可以上下楼梯进行巡视。此外,它还具有心理疗愈的功能,未来会配备心理大模型,可以通过手势、语音对话进行交流,和用户产生情绪上的互动。在数字医疗展区,各种医疗黑科技,变得触手可及、贴心实用。每次拿到体检报告一头雾水,专业术语看着是不是像天书?在数字医疗展区,有一个AI医疗助手,3秒钟就能把报告翻译成大白话。这套系统已经在全国500家医疗机构使用,每天解读超过20万份报告,让老百姓真正“看懂”自己的健康数据。另外,数贸会现场还设置了AI中医问诊体验区,30秒就可以一站式实现AI中医体质检测,通过舌像扫描+AI脉诊生成健康报告,让传统中医智慧以科技的形式焕发新生。智能养老设备更是暖心。陪伴机器人能通过微表情和语音语调感知老人情绪,还能提醒吃药、报警求助,目前已经在30多家养老机构投入使用。居家智慧养老舱配备的洗浴机器人、生命监测床垫,降低护工80%工作量。科技不再是冷冰冰的机器,而是变成了有温度的陪伴。在数智出行展区,“飞行汽车”给人以惊喜。现场,一款酷炫的赛车型飞机吸引人们围观拍照。由天目山实验室研发的“天目山十一号”,设计灵感来自方程式赛车,是一款四轴八桨多旋翼超轻型飞行器,整机重量仅115千克,可承载一名飞行员。有了这款飞行器,普通人也能实现低空飞行了。随着低空经济“飞”得更好更稳,低空物流不断重塑消费场景。在数智出行展区,一个大型的杭州城区沙盘格外引人注目。沙盘上灯光闪烁,清晰标注出全市公共无人机起降枢纽网,包括已建成的梦想小镇、钱江世纪城等4个起降场,规划中的拱墅申花、滨江海创基地等11个起降场,以及多家企业的无人机航线网。杭州低空产业发展有限公司董事长、总经理刘晨告诉记者,数贸会期间,还有无人机送外卖直播。“大家可以亲身参与无人机即时配送的全流程体验,现场下单后实时观看从接单到起飞、配送的完整过程。”发布百余项中国首发、亚洲首秀、全球首展的产品与技术,集中呈现生成式AI、多模态感官交互等尖端科技……这届数贸会,让人们真切看到了未来世界的模样。(河北日报记者 李 巍) -
Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生 论卷编程,还得看 Claude。就在刚刚,Anthropic 正式发布 Claude Sonnet 4.5。 先说 Claude Sonnet 4.5 交出的成绩单,在考察真实编程水平的 SWE-bench Verified 测试里,Claude Sonnet 4.5 直接登顶业界第一。 更离谱的是,它能连续专注干活超过 30 小时。好好好,AI 取代人类的优势又 +1 了。比如让它写个类似 Slack 或 Teams 的聊天应用,它能一口气敲出大约 1.1 万行代码。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能独立工作七小时。用 Anthropic 的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。 比方说,在 OSWorld 这个专门测试真实计算机任务的基准里,它拿下了 61.4% 的成绩,直接第一。要知道,四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先,这才多久性能就又往上抬了一大截。而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务,像个真人在操作似的。推理、金融这些测评项目上也都更强了,各项指标都在往上涨。 有了这么强的能力,Anthropic 这次自然不会只发个模型就完事。具体来看: Claude Code加了「检查点」功能,能随时保存进度,想回退到之前某个状态一键搞定 终端界面翻新,还发布了原生 VS Code 插件 Claude API 增加了上下文编辑功能和记忆工具 代码执行和文件创建现在直接整合到对话里 甚至,Anthropic 把自己内部用来搭建 Claude Code 的底层基础设施也开放出来了,叫 Claude Agent SDK。智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标,这些都是构建和设计 AI 智能体的棘手问题。而借助 Claude Agent SDK,现在你也能拿去构建自己的产品。 今天起,开发者还可以通过 Claude API 调用 claude-sonnet-4-5。定价还是跟 Claude Sonnet 4 一样,每百万 tokens $3/$15,价格没变能力更强。网友 @vasumanmoza 体验完直接发帖:「Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。」这评价,属于又爱又恨那种。Cursor 表示,在 Claude Sonnet 4.5 上看到了最前沿的编程性能,尤其处理长周期任务时提升明显。这也再次说明为什么很多 Cursor 用户会选 Claude 来解决最复杂的问题。知名测评博主 Dan Shipper 则表示,新版 Sonnet 4.5 在使用体验上响应速度更快,可控性更强,也更稳定。性能强是一方面,安全性也得跟上。据介绍,Claude Sonnet 4.5 也是 Anthropic 到目前为止对齐度最高的前沿模型。靠着 Claude 更强的能力加上完善的安全训练,Anthropic 在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,Anthropic 在防御提示注入攻击和减少内容误判这块也有了重大突破。 比较让我感兴趣的是,Anthropic 还在 Claude Sonnet 4.5 发布的同时推出了个临时研究预览功能,叫「Imagine with Claude」。在这个功能里,Claude 会实时生成软件,所有功能不是预设的,所有代码也不是提前写好的。你看到的一切都是 Claude 跟你互动时当场创造和调整出来的。不过,「Imagine with Claude」接下来五天内只会对 Max 订阅用户开放。附上传送门 claude.ai/imagine。 毫无疑问,今年的 AI 赛道依旧是卷编程的一年。目前 Anthropic 估值已经到了 1830 亿美元,8 月还实现了年化营收 50 亿美元,但这其中相当一部分增长靠着来自编程软件的普及。问题是,老对手 OpenAI 和 Google Gemini 也在疯狂推类似工具抢程序员用户。甚至一周之后就是 OpenAI 年度开发者大会,Anthropic 这个时候抢先发布 Claude Sonnet 4.5,时间卡得够精准,明摆着就是要给对手上一波压力。此外,Anthropic 联合创始人兼首席科学官 Jared Kaplan 还表示,更先进的 Opus 模型,预计今年晚些时候推出:「Anthropic 在大小模型的使用上都能占优势。」不过有一说一,Anthropic 自己眼下也有麻烦要解决。过去两个月,Claude 系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连付费的 Max 用户都没能幸免。虽然 Anthropic 后来紧急回滚了 Opus 4.1 更新,还承认了两个独立 Bug,声明「绝非为省成本故意降智」,但由于没提供补偿或退款,GitHub 和 X 等平台上还是出现了退订潮,不少用户直接转投 Codex。这次 Claude Sonnet 4.5 的发布,显然就是 Anthropic 想用实打实的性能提升来挽回流失的用户。至于能不能成功,就看接下来几周的实际表现了。 -
新质观察|AI能否助力国产动画崛起? 谷歌Nano Banana掀起的文生图风暴再次点燃了生成式AI赛道,它以工作流的形式重新定义了文生图大模型,在图像一致性和可控性上取得了令人惊叹的提升,使用户得以告别“拆盲盒”式的提示词游戏。凭借Nano Banana更强大的功能和更便宜的价格,谷歌Gemini应用一举超越ChatGPT成为美国iPhone应用总榜第一名,并跻身108个国家iPhone应用总榜前五名。 《灵笼》第二季剧照而另一条新闻,虽没有引起太大波澜,却预示着一个产业崛起的机会——艺画开天制作的原创国产动画《灵笼》第二季完结一个月后,在海外权威评分网站IMDB获得9.5分的超高评价,一举刷新国产动画最高分纪录。《灵笼》第二季是代表当前国产动画工业化水平的标杆级作品,入选国家广电总局“网络视听节目精品创作传播工程”,同时也是国产动画出海的重要名片。试想,生成式AI与国产动画这两条快速上升的曲线,当它们交织叠加在一起,能否成就国产动画的加速崛起?事实上,Nano Banana以及与它类似的AI模型,已逐渐成为中小团队和个人创作者的重要工具,随着大模型能力越来越强,生成式AI正在向产业端步步逼近。越来越多的动画工作室尝试借助AI模型批量生成角色关键帧,以大幅缩短制作周期,或者将写实图像转换为指定风格的动画图像,比如之前爆火的吉卜力滤镜。许多AI工具已能够完成关键帧之间的补帧,而在传统动画行业,中间帧绘制这种枯燥繁琐的工作一般由新手画师完成。今天我们就来分析一下,AI时代国产动画面临的机遇和挑战。一、黄金年代:需求井喷VS产能瓶颈以被誉为国内“移动互联网元年”的2010年为标志,2010年之前是电视动画时代,这个阶段动画产业的消费形态是时段化、频道化的,边吃晚饭边看动画,是80后、90后一代的共同记忆。2010年开始,则是网络动画时代,不同于固定时段和频道的电视动画,这个阶段的消费形态是开放式、点播式的,依托流量和IP迅速发展,但国内网络动画的消费习惯还没养成,与欧美、日本等成熟市场还有很大差距。在腾讯、B站为代表的国内平台的持续深耕下,国产动画的消费市场逐渐发展成熟,形成了“流量+IP+X”的消费形态,这个X包括游戏、潮玩、众创、众筹等大量的新消费形态,甚至可能是NFT、RWA。正如艺画开天创始人兼CEO、《灵笼》文学策划阮瑞在接受访谈时讲到的:“作为动画剧,时至今日,在各大平台的影响力、播放量,包括商业收入,和真人剧平齐了,甚至可能有一些超越。这在十年前是不太敢想的一件事情。”从核心消费群体的构成看,国产动画正在迎来属于自己的黄金年代。80后、90后看着动画成长的一代人已经成为消费主流,而Z世代(1995—2009年出生)和α世代(2010年后出生)更是与生俱来的动画消费群体。根据中研普华《2025—2030年中国动漫产业深度调研及未来发展现状趋势预测报告》的分析,2025年,中国动漫产业总产值预计将达4500亿元,较2019年增长457%。二次元用户规模突破5亿人,付费用户占比超45%,人均年消费达800元。然而,一半是海水一半是火焰,能阻止动画产业快速发展的因素可能只有一个,那就是产能。动画行业的产能瓶颈集中体现于普遍存在排期现象。业界看来,IP触达核心消费群体最有效的形式是动画剧集,所以优质动画剧集基本处在供不应求的状态,而欧美日,甚至包括中国的产能也都严重供不应求。如果要新开一部动画剧集,等工作室排期就需要两到三年。超出外界想象的是,在数字化高度发达的今天,传统的动画剧集制作仍旧是一个手工行业,40%左右的工作量是在纸上进行的,一部12—24集的动画剧集,制作周期往往需要2—3年,加上等排期就是4—5年。就拿《灵笼》系列来说,观众在第一季完结后,就经历了长达4年的等待。面对困扰已久的产能瓶颈,生成式AI带来了破局希望。二、批量制造“新海诚”8月23日,国内上线了一部以《山海经》为蓝本的AI原生动画剧集《有山灵》,实现了从角色设计到成片输出的全链路AI制作。它的核心制作团队只有5个人加上1个大模型(即梦AI),制作周期仅用了6个月。这种“5人团队+AI大模型”的协作模式,使长篇动画制作成本降低至传统模式的十分之一。据悉,浙江大学已将《有山灵》纳入“AI 叙事”课程案例,并开设“Prompt美学”专业方向。动画强国日本也早已开始拥抱AI,并且是中国AI。在日本,众多创作者利用某知名国产大模型完成从剧本到成片的“端到端”生产。柔树特效制作的动画《观察者悖论》,全网播放量突破300万,角色设计、分镜绘制、特效生成均由AI完成,每周更新一集的效率更是远超传统团队。“一人工作室”模式在日本迅速流行,成为新一代内容创业者的主要选择。因而有动画创作者感叹:“只要掌握了方法,谁都可以使用它。即使是那些过去放弃梦想的人,也有可能成为顶尖的创作者。”相信基于国产大模型对东方美学精准深刻的理解,国产动画行业将涌现出一大批像新海诚一样的顶尖创作者,以个人的才华创造出惊艳世界的表达。但即便天赋如新海诚,也会从早期“一人扛下全流程”的独立创作,过渡到与工业化团队的完美融合。因为,动画行业产能爬坡的关键必须是工业化,今后则是AI加持的工业化。三、产能飞升靠AI就目前AI模型的能力来说,《有山灵》《观察者悖论》以及随后的AI原生作品,在精细程度和制作规模上,与《灵笼》这样的大型项目还难以相提并论。项目越大,管理和成本控制越难。《灵笼》第二季在作品之外的重要意义是——在制作技术与工业化流程上完成了系统性突破,为国产动画工业化树立了新标杆。制作团队通过技术迭代与流程重构,实现了生产效率与画面质量的双重提升,单集渲染成本降低40%,制作周期缩短30%。一方面得益于Unreal Engine 5(UE5)引擎的应用——使场景搭建效率成倍提升,灯光调试时间减少70%,大幅压减了传统流程中的重复劳动。画面精细度大幅提质,实现单帧毛发渲染量超过200万根,角色建模达到“毛孔可见”级别。制作规模上,支撑了全季超过1.7万个独立镜头,镜头复用率低于10%,特效镜头难度较第一季翻倍。另一方面,构建了“人机协同”的工业化流程——通过十余个软件平台的数据互通,实现项目全程“无纸化”开发。通过AI完成生物设计初稿(如噬极兽形态的基础轮廓生成)、分镜草稿的快速迭代,以及重复性资产的批量处理,使美术团队得以将精力集中于角色情感刻画与场景氛围营造。2025年8月,艺画开天官宣《灵笼》第三季定档2026年上线,这份及时交付的底气,与其沉淀的工业化产能不无关系。但AI对动画工业的革命不会就此止步。一是工业级大模型。生成式AI能力会越来越强,操作难度、使用成本会越来越低。比如国内某些图生视频模型,已能够支持"演技生成",精准表现复杂细微表情,并支持复杂运镜切换和精准提示词遵从,提升创作可控性。而混元、即梦、可灵等模型也在持续进化出新的能力,同时还有通义万象等模型陆续加入竞争,不断把模型能力卷出新高度。创新的飞轮正在加速运转,一旦突破创作可控性和精细度的天花板,极有可能跑出工业级的大模型,彻底颠覆传统创作模式。二是智能化创作引擎。UE5等创作引擎或将进一步降低AI工具的集成门槛,内置更多生成式AI插件,形成全流程AI工具链,或者与创作Agent协同工作,持续简化复杂内容的生产流程。同时,会诞生一批AI原生创作引擎,比如谷歌刚刚发布的由Nano Banana提供支持的AI画板工具Mixboard,支持用自然语言编辑图板,并使任何想法即时可视化,可以看作是AI版的Photoshop。而目前主流的动画制作软件平台,均有被AI重铸的可能。三是分布式生产模式。随着技术成熟,未来的动画制作模式很有可能演变为“智能驱动的以导演为中心的分布式生产”。在这个生产系统里,导演是核心,发布生产指令,系统内的人工节点和智能节点(Agent)通过智能化协作平台完成各环节制作任务,快速完成从创意到产品的生产。系统内的每一个节点同时又可能是另一个动画项目的导演,组织生产系统的资源并行实施其他项目的生产。所有的节点,在时空上可以是异步异地的,他们自由组织,按需执行生产任务,他们是无数个宫崎骏、新海诚和饺子,是人类,或者不是人类。而未来的动画行业,一定是混合型人才的时代。四是众创型IP孵化。原创动画IP的产生动能不再只靠个体或制作团队的创意爆炸,更有可能是数据驱动的循环增益。比如腾讯动漫在《时光代理人》第二季通过弹幕投票决定剧情走向。《灵笼》第二季更新期间,制作团队与观众建立了紧密的互动关系,实现了数据驱动的创作调整和叙事优化,最终达成从“作者叙事”到“共创叙事”,B站也诞生出一批颇受观众欢迎的“灵学家”。动画艺术的独特魅力在于,优秀作品的每一帧都藏着画师的美学思考。即使在AI高度发达的未来,人类艺术家的独特创造力和手工技艺仍然具有不可替代的价值。AI加入的意义,不只是把已有的动画艺术表现形式用智能化手段来代替,更在于通过“人机协同”的创作方式,创造光凭人力难以企及的艺术表现形式——把不可能变成可能。期待国产动画加快驶向智能时代的星辰大海。(作者陶鹤山为数字经济工作者,从事数字化领域政策规划)来源:陶鹤山 -
中国造不出AI芯片?黄仁勋:仅落后美国“几纳秒”丨邦早报 【DeepSeek-V3.2-Exp发布】DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。 目前,华为云和寒武纪均表示,已完成对该模型的适配工作。有消息称,智谱新模型GLM-4.6也将于近日发布,目前已可通过API接口调用。(券商中国)【王健林“限高”措施已取消】记者9月29日查询,中国执行信息公开网已经没有万达集团董事长王健林“限高”信息。同时,另据企查查信息,并未显示王健林“限高”风险。财联社此前了解到,本次事件是万达下属项目公司经济纠纷,或因在执行层面信息不对称导致。(财联社) 【停工停产近一个月后,捷豹路虎称即将恢复】9月29日,捷豹路虎全球官网显示,历时近一个月的网络攻击后,随着有控制的、分阶段重启运营的继续,公司正在采取进一步措施,恢复汽车的生产运营。捷豹路虎发言人今日向供应商及员工致信,生产制造将于数日内得以陆续恢复。(第一财经)【余承东增任华为产品投资评审委员会主任,仍担任终端BG董事长】华为公司9月29日任命余承东为公司产品投资评审委员会(IRB)主任,任命文件由任正非签发。据悉,投资评审委员会的核心职能是对公司重大战略方向的资源投入、项目立项、预算审批等关键决策进行评估与把控,确保资源向核心战略目标高效倾斜。同时,余承东仍然担任华为常务董事、终端BG董事长,掌管华为终端、鸿蒙智行等业务。(新浪科技) 【苹果CEO库克确认持有比特币和以太坊等加密货币】苹果公司CEO库克近日透露,自己是一个加密数字货币投资者,并明确持有比特币和以太币。然而,库克已给“美国第三大公司(苹果)接受用加密货币购买iPhone和Mac、或者将公司资产投入比特币”这样的想法泼冷水。库克表示,自己对加密货币经过一番研究,得出的结论是,(个人)为了投资组合多样化而持有加密货币是合理的,“我已经研究了好一阵子了,我认为这是有意思的”。 库克称,一个亿万富翁有自己的(加密货币)持有权,但并不打算将苹果公司的2000亿美元现金投入比特币或其他加密资产,“我认为人们并不会为了对加密货币有风险敞口而购买苹果股票”,与此同时,苹果也(暂时)不会在销售产品时接受加密货币支付方式。(每日经济新闻)【网传要做云台对标大疆等,OPPO回应:该系列新品计划2026年发布】日前,有消息称,OPPO也要做手持云台相机,产品对标GoPro、大疆等。对此,9月29日下午,OPPO方面向记者回应称,OPPO已启动新形态影像产品系列,新产品系列将基于OPPO在手机影像的技术积累,进一步拓展移动影像的体验,为影像创作提供更多的可能性。该系列新品计划于2026年内发布。(证券时报)【赛力斯:已支付完毕购买华为持有的引望智能10%股权的全部对价】赛力斯公告称,公司全资子公司赛力斯汽车拟以支付现金的方式购买华为技术有限公司持有的深圳引望智能技术有限公司10%股权,交易金额为人民币115亿元。截至本公告披露日,《股权转让协议》约定的第三笔付款先决条件已满足,赛力斯汽车已向华为支付完毕《股权转让协议》约定的第三笔转让价款人民币34.5亿元,赛力斯汽车已支付完毕本次交易的全部对价。(财联社) 【韩国外卖平台上线支付宝和微信支付】韩国政府9月29日起面向中国团体游客试行免签入境政策,直到明年6月30日。免签政策试行期间,中国三人以上团体游客可免签入境韩国并停留15天。济州地区与此前相同,个人和团体游客均可免签入境并停留30天。长期以来,由于中国航线被韩国航空业视为黄金航线,航空公司对上海、郑州等主要城市机票进行特价促销;许多韩国免税店重新装修,主要免税店和百货商店还设置多国语言介绍、翻译服务和人工智能翻译台,知名美妆连锁店也增加中文服务;韩国业界排名第一的外卖平台首家上线了支付宝和微信支付。(央视财经) 【阿里通义7大模型霸榜全球开源前十,千问Qwen3-Omni登顶】9月29日消息,全球最大AI开源社区Hugging Face公布了新一期模型榜单,阿里通义7款模型入选全球前十开源模型榜单,几乎实现屠榜,其中刚刚开源的全模态大模型Qwen3-Omni登顶。Qwen3-Omni是阿里最新开源的全模态大模型,音视频能力狂揽32项开源最佳性能SOTA,可处理文本、图片、语音和视频四种不同类型的数据,像人类一样会“听、说、写”。截至目前,阿里通义共开源300多个模型,涵盖全模态、全尺寸,全球下载量突破6亿次,衍生模型超17万个,位居全球第一。(钱江晚报) 【王化:小米17没有削减订单的计划】小米集团公关部总经理王化在微博表示,小米17系列目前没有任何削减订单的计划,因为新增了小米17标准版的 16GB+1TB 版本,加之17Pro系列加单,产品的结构配比会发生改变,整体的产品订单会较上一代增加。(华尔街见闻) 【郭明錤:小米17系列的出货量将大幅下降约20%】天风国际证券分析师郭明錤表示,调查发现,小米17系列的总出货量将下降约20%(原定目标约为1000万台)。如果未来定价策略或市场营销没有进一步提升,17系列的总出货量可能会低于15系列的约800万台。小米17系列销量下调主要由于标准型号的需求低于预期。预计标准型号将占17系列总销量的50-55%左右,但上市后销量仅为15-20%左右。小米17标准款表现不佳的一个关键原因是苹果iPhone17标准款在中国市场的销量强于预期。(新浪财经)【泡泡玛特星星人新品隐藏款溢价16倍】9月29日晚间,泡泡玛特即将发布“星星人美味时刻系列”,产品已经未售先火。正式开售之前,在一些电商平台上,该系列包括隐藏款在内的所有产品已有人挂出链接,且已有不少人出手购买。得物App数据显示,尚未正式发售,截至9月28日,隐藏款“小熊饼干”挂件最高成交价从发售价59元上涨至929元,溢价16倍,是近期溢价最高的系列;单个盲盒成交价从59元上涨至249元,溢价4.2倍;整盒成交价从354元上涨至1499元,溢价4.2倍;成交热度TOP3分别为“香草脆”“抹茶酥”“咸曲奇”,溢价均超过3.6倍,热度最低的“甜奶油”溢价也达到了3.3倍。截至9月28日,发售价59元的美味时刻系列“小熊饼干”毛绒挂件近三天的成交均价为612.7元。单个盲盒的价格在79~525.5元。(第一财经) 【OpenAI宣布在ChatGPT中推出家长控制功能】9月29日消息,OpenAI宣布在ChatGPT中推出家长控制功能。该功能允许家长将其账户与青少年的账户关联,并自定义设置。(IT之家)【大润发一款月饼含违规添加剂?公司回应】近日,有报道称,消费者李先生在大润发(沈阳和平店)发现,购买的鑫思琪五仁小月饼配料表中标注含有“脱氢乙酸钠”,而该添加剂已被禁止在一些食品中使用。大润发工作人员表示,配料表中的“脱氢乙酸钠”是员工复制去年信息未更新导致。对于该起争议,《BUG》栏目从内部人士获悉,“已经和解”。不过,《BUG》栏目查询发现,目前,五款鑫思琪月饼仍在大润发(沈阳和平店)线上售卖。其中,鑫思琪五仁月饼已处于售罄状态。据该款产品线上展示的配料表显示,未出现“脱氢乙酸钠”这一成分。关于线上与线下配料表成分不同的问题,涉事店铺电话始终无人接听。(海报新闻) 【中国造不出AI芯片?黄仁勋:仅落后美国“几纳秒”】据环球时报综合《印度时报》《南华早报》等媒体9月28日报道,美国英伟达公司创始人兼首席执行官黄仁勋表示,中国在芯片制造领域发展迅速,目前仅落后美国“几纳秒”。他呼吁美国政府放宽对华出口限制,允许美国科技公司在中国市场展开竞争,认为那符合中美双方的利益。当地时间9月26日,黄仁勋在一档科技播客节目“BG2”中表示,中国拥有庞大的人才储备、充满活力的工作文化以及存在于各省之间的内部竞争环境,他将中国芯片产业称作是“一个充满活力、创业精神、高科技、现代化的产业”。他还提到,自己曾听到有人说中国造不出人工智能芯片(AI),没有制造能力,落后美国两三年,“这些听起来太荒谬了……中国现在仅落后美国几纳秒,所以我们必须去竞争。”(新浪财经)【最新苹果爆料:苹果M5版MacBook Air和MacBook Pro即将量产】9月29日消息,据科技记者马克・古尔曼报道,苹果的几款关键产品即将量产,预计将于“今年年底至明年第一季度”推出。这些产品包括M5 MacBook Air、M5 MacBook Pro等。古尔曼表示,“据我所知,除了即将发布的新款iPad Pro和Vision Pro机型外,下一代MacBook Pro(代号J714和J716)、MacBook Air(代号J813 和J815)以及两款全新Mac显示器(代号J427和J527)也即将量产。这些设备仍计划在今年年底至明年第一季度之间发布。”(新浪财经)【特斯拉技术员被故障机器人打成重伤,索赔5100万美元】据报道,一名特斯拉(Tesla)技术员在工作期间被有故障的机器人击打,身受重伤。目前医疗费用已达100万美元,后续治疗至少还需要600万美元。他在近日将特斯拉及其供货商告上法庭,提出5100万美元的赔偿。(扬子晚报)【DeepMind发表论文:视频模型或具备推理能力】近日,DeepMind发表一篇关于Veo 3视频模型的论文,其中发现在多项视觉任务中,Veo 3涌现出零样本学习能力,表明视频模型或具备推理能力,且正朝着通用“视觉基础模型”方向发展。对此,风险投资合伙人、谷歌搜索前员工Deedy评价称:“Veo 3就是视觉推理的GPT-3时刻。”(科创板日报) 【阿斯利康将在美国上市,但保留英国基地】阿斯利康9月29日发布声明称,公司计划协调其股票上市结构,在伦敦证券交易所、斯德哥尔摩证券交易所和纽约证券交易所为公司普通股上市。这将升级阿斯利康现有的美国股票上市体系,取代现有的美国存托凭证(ADR)在纳斯达克上市。阿斯利康表示,公司总部将留在英国。(睿兽分析登陆查看更多)【自然堂全球控股有限公司向港交所提交上市申请书】9月29日消息,自然堂全球控股有限公司向港交所提交上市申请书,联席保荐人为华泰国际、瑞银集团。(睿兽分析登陆查看更多)【灵猴机器人完成超亿元A轮融资】近日,苏州灵猴机器人有限公司宣布成功完成超亿元A轮融资。本轮融资由金鼎资本、博原资本、TCL创投共同领投,同时引入苏创投、东运创投、财通资本、银杏谷资本多家投资机构。本轮融资资金将主要用于工业自动化及通用机器人等领域核心零部件的研发、实验室建设以及产能的扩充。(睿兽分析登陆查看更多)【斯年智驾完成数亿元B+轮融资】9月29日消息,斯年智驾(Senior.Auto)宣布完成数亿元B+轮融资,本轮融资由郑州高新产投基金、浙江省创新投资私募基金管理有限公司、华融等投资机构与产业资本联合投资,资金将重点用于无人驾驶产品的研发和市场开拓等布局。(睿兽分析登陆查看更多)【蚂蚁集团领投首形科技新一轮融资】9月29日,首形科技宣布完成新一轮过亿融资。这是该公司今年完成的第三轮融资,本轮由蚂蚁集团领投,锦秋基金联合投资,同时引入厚雪资本、弘晖基金等风险投资基金和鹏城愿景基金等科研机构基金。老股东顺为资本、招商局创投、Taihill追投。本轮融资将主要用于情绪基座模型的迭代,以及多场景应用的落地。(睿兽分析登陆查看更多)【未名拾光获数千万元B+轮融资】近日,生物活性原料创新企业未名拾光成功完成数千万元人民币 B + 轮融资,本轮融资由华泰金斯瑞、海邦投资共同注资。这是继今年5月获得欧莱雅、纳爱斯集团近亿元投资后,公司再次获得产业资本加持。此次融资资金将重点用于深化 AI 技术平台建设、拓展生物材料多元应用场景,以及加速业务全球化布局,为公司在生物活性原料领域的持续创新与发展注入强劲动力。(睿兽分析登陆查看更多)【智策领航完成天使+轮战略融资】近日,智策领航宣布完成天使+轮战略融资,由徐汇资本领投。本轮融资将主要用于人工智能技术研发、产品迭代和市场拓展。截至目前,公司累计融资额已达数千万元。(睿兽分析登陆查看更多) 【极氪9X上市:纯电续航380km,46.59万元起】9月29日,极氪9X豪华旗舰SUV正式上市,推出Max版、Ultra 版、Hyper版以及曜黑版,售价46.59万元起。据官方介绍,新车全系3秒级零百加速,峰值功率1030千瓦,最大马力1400匹,动力相当于配备3台V12发动机。新车全栈自研浩瀚超级电混,全栈900V高压架构,纯电续航里程最高可达380km。此外,还搭载浩瀚AI数字底盘,全球SUV首发闭式双腔空气悬架+双阀CCD电磁减振器。新车还搭载双NVIDIA DRIVE Thor-U芯片,算力高达1400 TOPS,搭载43个感知硬件,行业首发无图园区漫游,可自主寻车位,自主寻出口。(凤凰网科技) 【保时捷Panamera隽永版车型启动预售】9月29日,保时捷宣布Panamera隽永版车型启动预售,建议零售价129.8万元。此外,保时捷还更新了Panamera GTS与Turbo E-Hybrid车型系列。(界面新闻) 【追觅首款震动AI智能戒指10月1日发售】9月29日消息,追觅在9月全场景新品发布会上重磅揭晓首款AI智能戒指,并宣布将于10月1日正式开启全网发售。这款集“健康监测、时尚首饰、交互设备”三重属性于一身的创新产品,以独家震动主动交互技术打破行业常规,将“被动看数据”的传统穿戴体验升级为“主动送关怀”的智能陪伴。追觅AI智能硬件事业部部长潘志东表示,品牌将延续传感器融合与AI算法的核心优势,把追觅AI智能戒指打造成“懂用户的指尖AI健康管家”,进一步完善全场景智能生活方式的布局。(DoNews) 【DeepSeek-V3.2-Exp发布并开源】9月29日消息,记者注意到,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。(科创板日报) 【中汽协:8月汽车商品进出口总额为258.1亿美元,环比增长3.3%】9月29日消息,据中国汽车工业协会整理的海关总署数据显示,2025年8月,汽车商品进出口总额为258.1亿美元,环比增长3.3%,同比下降0.3%。其中进口金额41.7亿美元,环比下降7.4%,同比下降38.4%;出口金额216.4亿美元,环比增长5.6%,同比增长13.2%。2025年1-8月,全国汽车商品累计进出口总额为1820.1亿美元,同比下降1.2%。其中进口金额305.0亿美元,同比下降33.1%;出口金额1515.2亿美元,同比增长9.2%。(中汽协会数据)【2025国庆档新片预售总票房破9000万】据灯塔专业版,截至9月29日16时18分,2025年国庆档新片预售总票房(含点映)突破9000万元,《震耳欲聋》《刺杀小说家2》《志愿军:浴血和平》暂列预售票房榜前三位。(界面新闻) -
缩短“时差”促创新(评论员观察) 来源:人民日报构建产学研用深度融合的创新共同体,有效缩短技术创新与成果转化的“时差”,一定能让科技创新这一“关键变量”加速转化为高质量发展的“最大增量”主持开幕式稳定发挥、竞速比拼奔跑自如、格斗比赛有模有样、自主换电精准高效……近段时间,2025世界人工智能大会、2025世界机器人大会、2025世界人形机器人运动会接连举办,国产机器人的表现让人眼前一亮。机器人产业动能强劲,让“人机共生”的美好愿景离现实更近,也映照着科技创新成果加速向新质生产力转化的稳健步伐。新技术从实验室走向生产线,从创意构思转化为市场产品,中间的“时差”越短,创新的效率就越高,发展的动能就越强。当前,全球科技竞争日益激烈,谁能更快把科技创新成果转化为现实生产力,谁就能在竞争中占据优势。可以说,能否缩短技术创新与成果转化的“时差”,不仅关乎企业的兴衰成败,更对国家核心竞争力有着深远影响。与此同时也要看到,从书架上的论文到货架上的商品,貌似“一步之遥”,实则“关山万重”。习近平总书记指出:“要依托我国产业基础优势和超大规模市场优势,加强国家技术转移体系建设,完善政策支持和市场服务,促进自主攻关产品推广应用和迭代升级,使更多科技成果从样品变成产品、形成产业。”在推进科技创新和科技成果转化上同时发力,真正实现“接得住”“转得出”“用得好”,方能以高质量科技供给推动产业高端化、智能化、绿色化,真正打通从科技强到企业强、产业强、经济强的通道。提升“转得了”的能力,需要强化企业创新主体地位。每年技术成果转化率达75%以上,株洲时代新材料科技股份有限公司的秘诀在于,研发工作以市场需求为导向,建立“基础研究—应用开发—工程验证”三级研发体系,构建了从材料设计到工程转化的完整创新链。在满足市场需要与提升研发能力之间形成互促闭环,这样的创新更有效率。破除“不敢转”的风险,需要强化机制保障,更好营造鼓励科技成果转化的氛围。四川制定方案、修订条例,出台按比例赋权、先确权后转化、先使用后付费等举措,2024年全省登记科技成果同比增长20%,技术合同登记额同比增长33.6%。机制松绑激发源头活水,让“最初一公里”和“最后一公里”都没有后顾之忧,科技成果转化自然更加顺畅。破解“不会转”的困惑,让更多科技成果“落地生金”,需要做好科技服务支撑。从科技创新到产业创新,不是简单地跨越一纸专利,而是一场系统性接力。截至6月底,我国已建成33家国家级制造业创新中心,241家中试平台纳入重点培育库。产业创新平台建设持续推进,为成果产业化提供了坚实支撑。“科技红娘”穿针引线,中介平台支撑托举,让企业找技术、技术找落地场景都有了依托,提升了科技成果向现实生产力转化的速度和效率。“中国式现代化关键在科技现代化。”实现高水平科技自立自强、发展新质生产力,对科技创新和产业创新融合提出了更为迫切的需求。抓好主体、畅通渠道、营造生态,构建产学研用深度融合的创新共同体,有效缩短技术创新与成果转化的“时差”,一定能让科技创新这一“关键变量”加速转化为高质量发展的“最大增量”。(周珊珊)《人民日报》(2025年09月30日第05版) -
美国加州里程碑式 AI 透明度法案生效 IT之家 9 月 30 日消息,作为备受关注的人工智能(AI)透明度法案,美国加州参议院第 53 号法案(SB 53)数月来始终是舆论焦点,不仅引发 AI 企业内部意见分化,更频繁登上新闻头条。如今,这个具有里程碑意义的法案已正式在加州生效,成为法律。当地时间本周一,加利福尼亚州州长加文・纽瑟姆(Gavin Newsom)签署了《前沿人工智能透明度法案》(Transparency in Frontier Artificial Intelligence Act)。该法案由加州民主党参议员斯科特・维纳(Scott Wiener)牵头起草,是此类法案的第二版草案。去年,纽瑟姆曾否决首版法案(SB 1047),理由是担心其条款过于严苛,可能会阻碍加州本土的 AI 创新。原版法案要求所有 AI 开发者 —— 尤其是训练成本达到 1 亿美元(IT之家注:现汇率约合 7.14 亿元人民币)及以上的模型研发方,针对特定风险开展测试。法案被否决后,纽瑟姆委托 AI 研究人员制定替代方案,相关成果最终以一份 52 页报告的形式发布,并成为第 53 号法案(SB 53)的核心基础。研究人员提出的部分建议已被纳入 SB 53,例如要求大型 AI 企业公开其安全保障流程、为 AI 企业员工提供举报人保护,以及为提升透明度而直接向公众披露相关信息。不过,也有部分建议未被采纳,第三方评估机制便是其中之一。根据官方发布的文件,作为法案核心条款之一,大型 AI 开发者需“在其官方网站上公开一份框架文件,说明企业如何将国家标准、国际标准及行业共识最佳实践融入其前沿 AI 框架”。此外,若大型 AI 开发者对自身安全保障协议进行更新,必须在 30 天内发布更新内容及更新理由。文件还指出,该法案为 AI 企业及公众新增了一条反馈渠道,即“可向加州应急服务办公室(Office of Emergency Services)报告潜在的重大安全事件”;同时,法案“为披露前沿 AI 模型所构成的重大健康与安全风险的举报人提供保护,并设立了针对违规行为的民事处罚条款,由州总检察长办公室负责执行”。此外,加州技术部(California Department of Technology)需“依据多方利益相关者的意见、技术发展动态及国际标准”,每年就该法案的修订提出建议。AI 企业对 SB 53 的态度始终存在分歧,多数企业最初无论公开立场还是私下态度均表示反对,称该法案可能导致企业迁出加州。他们深知此事事关重大:加州拥有近 4000 万居民,且分布着多个 AI 产业中心,其在 AI 行业发展方向及监管规则制定上,拥有远超其他地区的影响力。经过数周针对法案措辞的谈判后,Anthropic 公司已公开表态支持 SB 53;而 Meta 则在 8 月成立了一个州级超级政治行动委员会(super PAC),试图影响加州 AI 相关立法进程。此外,OpenAI 也曾在 8 月游说反对此类法案,其全球事务总裁克里斯・莱汉(Chris Lehane)在致纽瑟姆的信中表示,“只有当加州的技术监管与有效的全球及联邦安全体系形成互补时,其在该领域的领导力才能发挥最大效用”。莱汉还建议,AI 企业若签署联邦或全球层面的协议,应可豁免加州的州级监管要求。他在信中写道:“若要让加州在全球、全国及州级 AI 政策领域占据领先地位,我们建议:当前沿 AI 模型开发者签署《欧盟 AI 行为准则》(EU Code of Practice)等类似监管框架协议,或与美国相关联邦政府机构达成以安全为导向的协议时,加州应认可其已符合本州监管要求。” -
OpenAI被曝将推出“AI版TikTok”,所有短视频内容均为AI生成 IT之家 9 月 30 日消息,据《连线》杂志 29 日报道,OpenAI 正计划推出一款独立社交应用,其由即将上线的 Sora 2 视频模型驱动。IT之家从报道中获悉,该应用形式与 TikTok 类似,用户通过滑动浏览竖屏短视频,但所有内容都由 AI 生成,无法从手机相册上传照片或视频。报道指出,OpenAI 会限制 Sora 2 在应用内生成的视频长度不超过 10 秒,至于在应用之外能否突破这一限制,目前仍不清楚。作为对比,TikTok 最初的视频上限为 15 秒,之后则放宽至 10 分钟。据悉,新应用还将提供身份验证功能,若用户选择认证,Sora 2 就能在生成视频时使用自己的肖像。其他用户也能在二次创作时标记这些人并调用其肖像。出于安全考虑,OpenAI 会在用户肖像被使用时推送提醒,即便生成的视频未被公开发布。在版权问题上,该应用会拒绝生成部分视频,但保护力度尚存疑。《华尔街日报》披露,OpenAI 将要求版权方主动提出退出,否则其内容可能会出现在 Sora 2 生成的视频中。通过为 Sora 加入社交功能,OpenAI 可能希望锁定用户并避免其转向其他模型,因为一旦离开,就等于放弃在应用内建立的社群。外媒 bleepingcomputer 曾在今年 7 月称,OpenAI 正酝酿推出 Sora 2 模型,旨在增强与谷歌 Veo 3 的竞争,目标是成为最强视频生成模型。 -
寒武纪已适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU IT之家 9 月 30 日消息,DeepSeek 昨日正式发布了 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。IT之家注意到,寒武纪当天宣布,已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。寒武纪称,一直高度重视大模型软件生态建设,支持以 DeepSeek 为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对 DeepSeek-V3.2-Exp 这一全新实验性模型架构的 day 0 适配和优化。针对本次的 DeepSeek-V3.2-Exp 新模型架构,寒武纪通过 Triton 算子开发实现了快速适配,利用 BangC 融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。依托 DeepSeek-V3.2-Exp 带来的全新 DeepSeek Sparse Attention 机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。vLLM-MLU DeepSeek-V3.2-Exp 适配的源码: