找到
1124
篇与
互联网
相关的结果
- 第 34 页
-
Andrej Karpathy回应强化学习之父Sutton最新观点「LLM是“死路一条”」 国庆节快乐!大家从sora 2的震惊中缓过来没?前几天我写了一篇文章,介绍了图灵奖获得者,强化学习之父Richard Sutton最新采访观点,老爷子认为当前热门的大语言模型是“死路一条”。他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。无论我们如何扩大其规模,它们本质上仍然是在模仿人类数据,而不是通过与世界直接互动来理解世界并实现目标,老爷子的作为大神和先驱思考都是终极问题,就像老爷子自己说的他是古典主义者。详细请看我之前的文章今天AI大神Andrej Karpathy分享了他对 Sutton老爷子观点的看法,总体上Karpathy认同老爷子对当前LLM研究的批评,并且认为老爷子的观点有趣且具有启发性,但当前的LLM更像是一个向现实妥协的东西,Karpathy对此进行了详细解读,并提出了一个比喻:当今的LLM研究并非在创造“动物”,而是在召唤“幽灵“,至于如何理解“动物”和“幽灵“且看下文分解,哈哈 Andrej Karpathy首先点明了一个背景:Sutton的“苦涩教训”(The Bitter Lesson)一文,如今已成为前沿LLM圈子里的“圣经”。研究者们会经常讨论某个方法或想法是否足够“bitter lesson pilled”(意即一个方法能够随着算力的增加而自然受益),以此作为判断其是否有效或值得追求的依据这背后的基本假设是,LLM本身就是“苦涩教训”的绝佳范例——看看LLM的缩放定律(scaling laws)就知道了,只要把算力放在X轴上,性能指标就会一路向右上角增长然而,有趣的是,Sutton本人作为理论的提出者,却并不确定LLM是否真的符合“苦涩教训”Sutton指出,LLM是在巨型数据集上训练的,而这些数据本质上是人类数据,这意味着它有两个特点:1)由人类生成;2)数量有限。当数据耗尽时该怎么办?如何避免人类偏见?这就很有趣了:信奉‘苦涩教训’的LLM研究者们,貌似被‘苦涩教训’的作者本人给打脸了Sutton老爷子的“古典主义”愿景:构建“儿童机器” Karpathy分析,在某种意义上,采访老爷子的Dwarkesh(代表LLM研究者观点)和Sutton有点鸡同鸭讲。因为Sutton心中有一个完全不同的AI架构,而LLM打破了其许多原则Sutton称自己为古典主义者,并援引了艾伦·图灵最初构建“儿童机器”的构想——一个能够通过与世界动态互动、从经验中学习的系统在这个构想中,没有模仿网页内容的巨型预训练阶段。也没有监督微调,Sutton指出这在动物界是不存在的(这是一个微妙但正确的观点:动物可能会观察演示,但它们的行为不会被其他动物直接强行控制或遥控操作)Sutton还强调了一个重要观点:即使你只是将预训练视为强化学习微调之前的先验知识初始化,这种方法也已经被人类偏见所“污染”,从根本上偏离了轨道。他以AlphaZero(从未见过人类棋局)击败AlphaGo(从人类棋局中初始化)为例在Sutton的世界观里,AI的一切都源于与世界的强化学习互动。奖励函数部分来自环境,部分是内在驱动的,例如“乐趣”、“好奇心”,以及与世界模型预测质量相关的因素。并且,智能体在测试时默认是始终在学习的,而不是训练一次就部署总的来说,Sutton更关心我们与动物界的共同点,而非我们与它们的区别。他有名言:“如果我们理解了一只松鼠,那我们几乎就大功告成了。”Karpathy的观点:预训练是我们蹩脚的进化 对于Sutton的观点,Karpathy分享了自己的看法首先,他认为Sutton的批评并非毫无道理。当前的前沿LLM确实是高度复杂的产物,每个阶段都充满了人性的参与——基础(预训练数据)是人类文本,微调数据是人类策划的,强化学习的环境组合也是由人类工程师调整的我们确实没有一个真正单一、干净、完全符合“苦涩教训”、可以“一键启动”并让其从纯粹的经验中自动学习的算法那么,这样的算法存在吗?Karpathy提到了两个常被用来证明其可能性的范例:第一个是AlphaZero的成功。它完全从零开始,没有任何人类监督就学会了下围棋。但围棋的环境过于简单和封闭,很难将其类比到混乱的现实世界。在算法和分类学上,它本质上只是一个更难的井字游戏第二个例子是动物,比如松鼠。对此,Karpathy个人也持保留态度。因为动物的产生是通过一种与我们在工业界实际可用的计算过程和约束截然不同的方式动物的大脑在出生时远非一张白纸。首先,很多通常被归因于学习的东西,在他看来更像是“成熟”。其次,即使是明确属于“学习”而非“成熟”的部分,也更像是在一个强大预设基础上的“微调”他举例说:一头小斑马出生后几十分钟内,就能在稀树草原上奔跑并跟随母亲。这是一个高度复杂的感官-运动任务,Karpathy认为这绝不可能是在“白板一块”的基础上从零开始实现的。动物大脑及其数十亿参数,其强大的初始化信息被编码在DNA的ATCG序列中,并通过进化的“外循环”优化进行了训练。如果小斑马像一个随机初始化的强化学习策略那样乱动肌肉,它根本活不长由此类比,我们现在的AI也拥有数十亿参数的神经网络。这些参数同样需要丰富、高信息密度的监督信号。我们不可能重新运行一次进化。但我们确实拥有堆积如山的互联网文档Karpathy承认,这基本上是动物界所没有的监督学习。但它是一种实用的方法,可以为数十亿参数收集足够的软约束,从而避免从零开始他给出了一个精辟的总结:“预训练是我们蹩脚的进化(Pretraining is our crappy evolution)。” 它是解决冷启动问题的一个候选方案,之后再通过更正确的框架(如强化学习)进行微调——这正是当前最先进的LLM实验室普遍在做的事情召唤”幽灵”,而非创造“动物” Karpathy认为,我们仍然值得从动物身上汲取灵感。LLM智能体在算法上仍然缺少许多可以从动物智能中借鉴的强大思想。同时,“苦涩教训”仍然是正确的,但他更将其视为一个值得追求的柏拉图式理想,而非在现实世界中必然能达到的目标。这就引出了我们目前的处境。Karpathy直言,今天的前沿LLM研究,并非在创造“动物”,而是在召唤幽灵你可以将“幽灵”视为智能空间中一种截然不同的存在。它们被人类性所混杂,并被人类彻底地工程化。它们是一种不完美的复制品,一种人类文档的统计蒸馏,外加一些点缀它们并非柏拉图式的“苦涩教训”产物,但与之前的许多方法相比,或许可以算是“实践上”的“苦涩教训”产物Karpathy推测,随着时间的推移,我们或许可以进一步微调我们的“幽灵”,让它们越来越像“动物”;这可能不是根本性的不兼容,而只是智能空间中的初始化问题但同样很有可能的是,它们会进一步分化,最终变得永久不同、不像动物,但仍然极具帮助并能真正改变世界这可能是:幽灵之于动物,如同飞机之于鸟类。最后,Karpathy总结道,Sutton的这期播客对于前沿LLM研究人员来说是一次扎实的“real talk”,他们可能过于沉浸在“利用模式”(exploit mode)中了。我们可能还不够遵循“苦涩教训”,很有可能存在比穷尽地构建和优化基准测试更强大的思想和范式。而动物,或许就是一个很好的灵感来源。比如:内在动机、乐趣、好奇心、赋能、多智能体自我博弈、文化等等。这需要我们发挥想象力 -
青春有Young|当AI“进山”,我们看到乡村孩子的渴望与思考 当人工智能成为全社会炙手可热的话题,乡村地区的孩子会不会被人工智能抛下?人工智能,又可以为乡村孩子的教育生活带来哪些切实改变?今年,是我做有关乡村儿童公益活动的第十一年,身为湖南人,我去过湖南的不少乡村地区,见证了乡村的发展。这一次,我所在的上海交通大学组成了一支“AI进山记——乡村儿童人工智能接触与挑战”社会实践团(以下简称“实践团”),在7月10日-11日实地奔赴湖南省韶山市杨林乡,后续的访谈和调研也在进行中。我们想聚焦乡村儿童群体,通过实地授课、深度调研与访谈,了解乡村地区人工智能教育的现状、需求与困难,为弥合城乡“数字鸿沟”做出自己的努力。 实践团成员合影 。本文图片均为 赵晨媛 供图在我们看来,探讨乡村地区儿童能不能通过人工智能进行学习,不仅仅需要了解目前孩子们的技术接受程度,还需要考虑落地面对的困难和可行的方式。为了了解当地乡村儿童科技教育的社会支持体系,我们与多位教育工作者进行了访谈。根据他们的介绍,湖南在人工智能教育领域已有初步建设和发展,但在乡村地区的普及仍需重点考虑基础设施完善、专业人才队伍建设等关键因素。学校对科技教育有着迫切需求,但目前师生实际接触AI的机会仍然较少。比如,韶山市杨林乡已经有了人工智能结合思政课的尝试,基础设施、隔代教育等将成为人工智能教育落地的难点,建议可以积极使用原有的知识科普阵地,实现资源的有效利用。他们也强调了项目“持续性”的重要性,认为需要有完整、可落地的方案来确保长期效果。希望以我们的项目为契机,与高校、公益组织等多方力量建立联系,共同构建系统化的AI课程合作体系。跟教育工作者们的访谈让我回忆起,2024年夏天我去湖南安化平口镇探访,有户家庭父母在外务工,只有嫂子和一个初三弟弟住在乡村,房子里面光照暗沉沉的。就是在这样的环境下,那名学生却获得了市级数学竞赛的名次,他希望继续学习数理化,但乡村地区的教师资源有限,当时可以接触到的知识远少于、晚于市内的孩子。我在想,如果将基础设施搭建好,一些人工智能的资源可以倾斜到乡村,有天赋的孩子是不是可以得到更好的发展? 实践团成员为湖南杨林乡当地的留守儿童们授课。无论如何,先从能做的做起。7月11日下午,我们实践团在杨林乡的一间会议室为当地招募的60名留守儿童带来了一场“AI启蒙课堂”。我们精心设计了课程内容,深入浅出地介绍了人工智能的基本概念、应用场景及其对未来生活的深远影响。这个过程中,也有些让我们意外的发现。授课中我问,“大家可以全部用人工智能做作业吗”,一名孩子,大概十岁左右,清楚地说:“不可以,这样我们会丧失自主学习的能力。”通过授课我们发现,孩子们对于人工智能是什么、大模型软件有哪些、该怎么平衡人工智能使用和自学等,居然已经有了基础的了解,在当地,孩子们对于人工智能知识接受程度相较于成人甚至更快。这也再次证明,将人工智能的知识带到乡村孩子们中间,有其必要性和落地的土壤。根据后续的访谈我们也看到,使用人工智能进行课程资料查找与作文修改,在学生当中是比较普遍的,学生们也非常希望了解人工智能技术的发展。对于城乡间的差距,他们是有感受度的,也很希望能够触摸到真正的人工智能产品。后来,我们还发布了乡村地区儿童人工智能使用情况的问卷,积极联系不同地区的乡村儿童进行访谈,还将进一步从儿童的角度推进更加完善和合适的人工智能课程,希望普及到更多的乡村地区。除了进行中部地区实地探访外,我们还在全国范围内收取乡村地区青少年调查问卷1937份,访谈了24名青少年,东部、中部、西部各8名。项目还没有结束,我们计划在九月初前往东部地区再进行实地调研。如此,通过课堂实践与田野调查相结合的方式,希望不仅将前沿的AI知识种子播撒在乡村孩子心中,更深入洞察了乡村人工智能教育的现实图景、迫切需求以及构建有效支持网络的关键要素。做这个项目时,我还常常想到十年前走进一所小学时的场面。当时,我们捐赠了微型图书馆,孩子们立马怀着期待捧起新书读,那些眼神似乎穿越了十年,落入了打开人工智能软件提问的孩子们的眼中。我想,不管是数字化的内容还是纸质的书籍,对于孩子们而言,能够最大程度地获取知识,就是一种希望和力量,而这,才是我们团队希望可以做到的。技术永远是服务于人的,看似冰冷的数字也是有温度的。教育不会也不应该抛下任何一个孩子,希望人工智能作为桥梁,让孩子们接触更多的知识,走到更广大的世界。(中国互联网发展基金会中国正能量网络传播专项基金资助支持项目,澎湃新闻记者邹佳雯对本文亦有贡献) -
网传Instagram会通过手机麦克风录音来收集用户数据,Meta否认 IT之家 10 月 2 日消息,Instagram 负责人亚当・莫瑟里昨天通过个人账号澄清,Meta 并未偷偷“监听”用户以推送相关广告。长期流传的阴谋论认为,Meta 会悄悄开启用户手机麦克风录音,但公司此前已多次否认这一说法。据外媒 TechCrunch 报道,而在莫瑟里澄清的同时,Meta 宣布将利用用户与其 AI 产品的互动数据,在旗下社交应用上进行广告投放。换句话说,如果以前不需要通过录音就能精准推荐内容,现在“更不需要”。莫瑟里在 Instagram 上表示,他多次就 Meta 是否监听用户与人交流,许多用户都难以相信广告投放竟如此精准。他提到,就连自己的妻子也曾提出过类似疑问。很多人都有过这样的经历:你只是想到某个话题或产品,随后相关内容就出现在动态里,让人觉得 Meta 好像能“读心”。对此,Meta 多次予以否认,并解释其推荐系统无需录音就能精准运作。莫瑟里强调,如果通过录音收集数据,将是“严重侵犯隐私”的行为,但 Meta 并非一向以保护用户隐私为决策核心。事实上,Meta 并不需要“监听”用户就能了解偏好。2016 年,Meta(IT之家注:当时仍叫 Facebook)明确表示,不会使用手机麦克风决定广告或动态内容。几年后,扎克伯格在国会作证,再次否认公司为此收集音频数据。莫瑟里在 Instagram 上重申这一点。他指出,如果手机麦克风开启,用户会看到屏幕顶部的提示灯亮起,并且电量消耗会加快。莫瑟里解释,Meta 推荐系统的强大源于广告商合作,广告商提供网站访问数据,帮助 Meta 精准投放广告。同时,系统还会根据兴趣相似用户的喜好推荐内容。这套算法多年来让 Meta 收益丰厚。目前,Meta 将用 AI 来优化广告投放决策。如果以前人们觉得自己被监听,现在将更明显。Meta 表示,新隐私政策将于 12 月 16 日生效,在大多数市场允许使用用户与 AI 产品的互动数据作为信号。这比“喜欢这个的人也喜欢那个”的系统更强大,因为用户与 Meta AI 等聊天机器人交流时,会分享更多个人兴趣、想法和活动信息。莫瑟里还指出,有时超精准推荐并非全靠技术,而可能只是巧合或人类心理作用。“你可能在对话前就看过那个广告,却没注意到。滚动浏览时,我们快速刷过广告,有时会在脑中内化,这反而影响你之后谈论的话题。” -
微软CTO:希望未来主要采用自研AI数据中心芯片,自主设计数据中心系统 微软首席技术官周三表示,该公司未来希望其数据中心主要使用自家芯片,而此举可能会减少其对英伟达和AMD等主要芯片厂商的依赖。半导体和数据中心内部的服务器,是支持人工智能模型和应用发展的核心基础。英伟达目前在该领域占据主导地位,其GPU市场份额遥遥领先,而竞争对手AMD则占据了较小的一部分。不过,包括微软在内的主要云计算公司,也开始为数据中心设计自有的定制芯片。微软首席技术官Kevin Scott在意大利科技周(Italian Tech Week)的一场炉边对话中对媒体介绍了公司在AI芯片方面的战略。目前,微软在自家数据中心主要使用的是英伟达和AMD的芯片。他对媒体表示,公司一直关注的是选择“每颗芯片提供的最佳性价比”。 “我们并不执着于使用哪种芯片……这也意味着,长年以来性价比最好的解决方案一直是英伟达。” “只要能确保我们有足够的产能满足需求,我们愿意考虑任何方案。” 与此同时,微软也已经开始使用自家研发的芯片。2023年,微软推出了专为AI工作负载打造的Azure Maia AI加速器芯片,以及Cobalt CPU。此外,据报道,该公司还在研发下一代半导体产品。上周,微软还发布了一项名为“微流体”(microfluids)的新冷却技术,旨在解决芯片过热问题。当被问到微软未来是否计划让自家数据中心主要使用微软芯片时,Scott回答:“绝对是的。”他还补充说,公司目前已经在大量使用微软的芯片。Scott表示,微软关注芯片发展,是希望最终能够设计出完整的一套数据中心系统。 “这不仅仅是芯片的事,而是整个系统的设计。包括网络和冷却系统。你必须拥有足够的自由,去做出你需要的决策,从而真正让计算资源与工作负载高度匹配。” 微软以及其竞争对手谷歌和亚马逊都在自研芯片,不仅是为了减少对英伟达和AMD的依赖,也是为了让产品在满足自身特定需求方面更加高效。算力仍短缺 包括Meta、亚马逊、Alphabet和微软在内的科技巨头,今年已承诺超过3000亿美元的资本支出,其中大部分都投向了人工智能领域,以应对不断高涨的AI需求。Scott指出,目前依然存在算力不足的问题。 “说现在是严重短缺(a massive crunch)都还是轻描淡写。我认为自从ChatGPT上线以来,我们就一直处于一个几乎不可能快速扩充产能的状态。” 微软一直通过建设数据中心来扩大产能,但Scott警告说,这仍不足以满足需求。 “即便是我们最激进的预测,也常常被证明是不够的……过去一年我们部署了惊人的计算资源,接下来几年还会更多。” -
微软宣布将AI服务整合入Office,与ChatGPT正面硬刚 媒体报道,微软公司正将其面向消费者的人工智能订阅服务整合进Office产品中,押注Office的广泛使用度将帮助公司在与OpenAI的ChatGPT竞争中占据优势。微软周三宣布,将推出一项价格更高的Microsoft 365新订阅方案。该方案将在现有的Word、Excel、Outlook和其他Office应用基础上,新增集成聊天机器人和图像生成等AI功能。微软消费者部门的首席营销官Yusuf Mehdi在接受媒体采访时表示,目前正在付费使用Copilot Pro聊天机器人的用户,未来将被转移至这一新方案中。Copilot Pro目前是一款基于手机和网页的服务。自与OpenAI建立合作关系以来,微软一直在迅速将AI功能融入其产品线。但这两家公司现在越来越多地在争夺用户。目前,微软推出的个人版Copilot应用正面迎战市场领导者ChatGPT。与此同时,OpenAI也在不断拓展其在企业市场的影响力,而企业客户正是微软营收的主要来源。今年1月,微软开始向个人用户提供AI功能,并对原Office套件的订阅价格进行了上调。但用户在尝试如图像生成或编辑等功能时会遇到使用限制。微软新的“Microsoft 365 Premium”高级方案将定价为每月19.99美元,比ChatGPT Plus和即将停用的Copilot Pro便宜一美分。该方案将包含微软的AI研究助手功能、更多的图像生成次数,以及其他已提供给企业客户的工具。对于公司未购买Copilot服务的用户,高级订阅用户也可以将这些AI功能带入工作环境,例如用Copilot编辑文档或整理邮件。Mehdi表示: “现在有这么多人把AI带入工作,而我们终于有了一个我认为对他们来说更好的产品。” 微软将继续以每月10美元提供标准版Microsoft 365个人订阅,或每月13美元的家庭方案。微软向企业客户销售的生产力软件版本不会受到此次变化影响。Mehdi表示,微软目前约有9000万名付费个人用户订阅Microsoft 365。不过,他拒绝透露有多少人正在为Copilot Pro付费。 -
国庆第一天,我被OpenAI的新APP硬控了 说起来你们可能不信,国庆假期的第一天,我刷了一整天的短视频。。。不过我刷的并不是抖音或者快手,而是 OpenAI 今天推出的新 APP。 这么说吧,这玩意在内容形态上看,活脱脱就是 AI 视频纯享版的抖音。无论是什么宝可梦奶龙,使出宝宝肚肚打雷的技能,硬刚赛亚人。还是山姆·奥特曼,用物理方式把谷歌 Veo 3 炸个稀巴烂。甚至是让 Jesus 直播《 我的世界 》,再现造物全过程。。。 你能想到或者想不到的画面,都能在这儿直接生成 AI 视频,并且通过短视频的形式,在平台上分享互动。 你要是上传非 AI 的真人视频,反而可能会被网友们抵制。只能说这 APP 的货真太纯了,我已经好久没遇到,这么容易让人上瘾的 APP 了。 而这 APP 背后的更多故事,则要从今天凌晨说起。是的,就在大伙们刚开始享受国庆假期的时候,OpenAI 偷袭了一波 AI 圈,在凌晨一点直播发布了他们的新模型 Sora 2。直接看他们官方的演示。我只能说,我是真的分不清这花花世界,到底是假是真了。。。因为之前的老模型,会经常扭曲物理定律,动不动就去踹两脚牛顿的棺材板。而这一次,至少从官方的视频看,Sora 2 堪比是物理特长生。无论是跳水的水花,还是翻跟头的人,毫无违和感。 包括在可控性方面,也提升了一大波,像是这种多镜头视角转换,画面已经稳定。并且音效配得也让人挑不出啥大毛病。在视频的质感上,也是真没得说。。。我要是说这视频,是某好莱坞电影的片段,不少人应该都会上钩。不过这一次,Sora 2 并没有像其他视频大模型一样,单纯只发个模型,或者最多集成一下视频剪辑工具。而是之前外媒爆料的类似,Sora 2 将以“ AI版抖音 ”的形态出击。OpenAI 直接官宣了一款名为 “ Sora by OpenAI ”的全新社交应用。而这,就是文章前面介绍的,让我上瘾刷了一整天的新 APP 。 按照他们官网的说法,这 APP 今天开始在美国和加拿大进行初步推广,并计划迅速扩展到其他国家和地区。但实际上,靠着邀请码裂变,今天全网基本都已经在疯玩这 APP 了。江江也是第一时间去试用上手了一波,毕竟之前充过 OpenAI 200 刀一个月的会员,奥特曼给个内测资格不过分吧。 而整个使用的过程,也相当简单。在第一次进 APP 时,咱就可以直接先上传自个的形象,步骤有点像支付宝、或者是银行 APP 的视频认证。上传好资料,到认证成功,大概一分钟左右就足够。 在 APP 中,可以直接文生视频、可以在其他视频里加料。比如我就用刚刚上传的个人资料,生成一个偷金毛狗狗粮的 AI 视频。也可通过“ 客串 ”功能将自己或好友一起塞到视频里。相当于用你或者你朋友的数字分身,开脑洞让 AI 生成各种视频。我也直接拉了山姆·奥特曼,让他签协议把 OpenAI 转让给了我。 甚至还和奥特曼打起了篮球。包括在产品设计上,也有一些小巧思。比如说,APP 就有一个自定义模式,咱们可以输入自个想看哪个类型的内容,平台就会给你推送相关的视频。 又比如双击屏幕点赞视频的时候,会出现一些对应的可爱小图标。像是机器人相关视频,点赞就会跳出机器人的 emoji ,皮卡丘相关的,就会出现电⚡⚡。 总而言之,除了没有美颜和各种滤镜,这是一个完成度相当高的 AI 视频社交 APP 了。也有让我比较遗憾的点,比如在 APP 上是没法调整画质的,只能默认生成 480P 或者 360P 清晰度的短视频。所以真正满血版 Sora 2 到底是啥水平,可能还得鸽好长一段时间才能用得上。 而在另一方面,其实 AI 和视频平台的结合,也早就不是什么新鲜事儿了。谷歌 Veo3 和 Youtube 也在打通,甚至有传言 Veo4 马上也要亮相了,而 Meta 也在他们的 AI 应用中上线了短视频功能,包括字节的剪映中,也有越来越多AI功能加入。只能说 OpenAI 的新 APP ,可能会和这些社交和视频领域的老巨头们正面竞争。不过,对Sora APP 这个短视频社交平台的形态,我觉得还是有无限可能的。就像 OpenAI 官方的介绍,2024 年 2月份 Sora 刚刚问世的时候,算是视频模型中的 GPT-1 时刻。而一次的 Sora 2,在他们的眼里,则很可能是视频领域的 GPT-3.5 时刻。 之所以这么说,我觉得不仅仅是因为模型能力上的提升。当时 GPT-3.5 的爆火和大模型的出圈、乃至整个科技圈的疯狂,其实和 ChatGPT 这个最初的非商业化导向的Chatbot Demo 相关。是 Chatbot 这个产品形态,让 ChatGPT 和大语言模型从实验室、或者是专业人士手里的工具,走进了真正的普罗大众。大伙们也在 ChatGPT 这个 Demo 产品中,发现了生产力工具、生活陪伴、知识获取等等价值。所以如果没有 ChatGPT 这个接地气的产品形态,大模型肯定也会火,但估计得晚几年。 同样在视频大模型领域,大家都认可它的未来,但在过去,一直就少了一个类似 ChatGPT 这样能让大众玩起来的产品。同样,Sora APP 也很明显不是专门给 AI 从业者、视频内容产出者设计的。它很巧妙地用短视频社交的产品形态,让大众单纯觉得这个好玩,就下载试用了。把使用门槛降低,让所有人都有能力参与到 AI 能力使用和探索过程中。 这何尝不是一种把寻找PMF(Product Market Fit 产品和市场达到最佳的契合点)的任务,外包给广大普通大众的一步棋?所以Sora APP 的定位,或许不仅仅只是“ AI 版的抖音 ”,而是一个视频版的“ ChatGPT "。 最后回头想想,去年我们同事还在吐槽 AI 视频太鬼畜,今年公司的后期团队,已经在日常使用AI了。去年年初 Sora 才初亮相,今年就已经遍地是视频大模型了,甚至到今天,还要单独给 AI 视频出个社交 APP。也只有AI圈儿,有这种速度和变化了吧。也希望 AI 能慢一些走,停下飞驰的车轮,等等你的用户们,毕竟一堆 AI 产品我还没等来邀请码,就已经快要被淘汰了。撰文:小文爱 AI编辑:江江&面线美编:江江图片、资料来源:OpenAI官网Sora官网 -
王腾快手被封禁、抖音已私密 此前因泄密被小米开除 10月1日,记者搜索发现,王腾的快手账号显示已被封禁。 搜索结果显示王腾账号已封禁其抖音账号已设为私密账号。 王腾抖音账号已设为私密账号视频号、小红书账号已清空内容。此外,微博账号正常显示。 王腾视频号、小红书账号已清空内容据报道,9月8日晚,小米公司通报对中国区员工王腾的违规违纪行为处理结果,查明中国区市场部员工王腾,泄露公司机密信息,且存在利益冲突等严重违规违纪行为。根据《小米集团员工违规违纪行为处理办法》《小米集团诚信廉洁守则》等制度规定,公司决定给予王腾辞退的处分。(此前报道:小米通报:王腾因泄露公司机密信息被辞退!王腾本人发文道歉) 王腾发布微博回应被小米辞退随后,王腾发布微博回应被小米辞退:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价。 王腾再发文回应被小米辞退9月9日,王腾再发文回应被小米辞退,其表示没有窃取公司机密出售,没有收人钱财。有失职行为,在深刻反省中,但没有做违法行为!(此前报道:王腾:没窃取公司机密出售,没收人钱财!此前被小米通报“因泄露公司机密信息被辞退”)据悉,雷军早前曾在直播中公开点名王腾泄密,称“小米有保密制度,除了我们腾总(王腾)动不动泄密,被罚款以外,我的口碑还是可以的”。此外,雷军和王腾一起拍视频介绍新产品时也曾当面对王腾说,“你这次一定要保密。”今年6月19日,小米公关部总经理王化发文透露,其收到了需要单独签署的保密协议,“看来,保密办已经把我列为防护对象。都怪你们经常套我话,我去看看王腾收到没。”王化随后回复称“他(王腾)也收到了”,评论区大量网友调侃王腾“经常泄密”。 2016年,29岁的王腾加入小米公开信息显示,2016年,29岁的王腾加入小米。2020年3月,王腾加入REDMI产品团队,任REDMI产品总监一职。2021年11月,王腾轮岗到小米公司河南分公司任职。2023年8月,王腾结束轮岗回到小米北京总部;9月,任REDMI品牌发言人、REDMI市场部总经理。2024年2月3日,王腾任REDMI品牌总经理为小米中国区市场部总经理,REDMI品牌总经理。综合| 九派新闻 红星新闻此前报道小米高管王腾被辞退 曾被雷军点名"动不动泄密"9月8日,据新京报报道,小米公司中国区市场部员工王腾,泄露公司机密信息,且存在利益冲突等严重违规违纪行为。根据《小米集团员工违规违纪行为处理办法》《小米集团诚信廉洁守则》等制度规定,公司决定给予王腾辞退的处分。根据公开资料显示,2016年王腾加入小米;2019年任手机部产品部总监;2020年3月,王腾加入REDMI产品团队,任REDMI产品总监;2021年11月,王腾轮岗到小米公司河南分公司任职,负责河南的市场销售工作;2023年9月11日,王腾通过其个人微博宣布,在结束两年线下轮岗后重新回到小米总部,已担任REDMI品牌发言人、REDMI市场部总经理;2024年2月3日,王腾任REDMI品牌总经理。2024年5月8日,小米发布相关人事任命,王腾担任中国区市场部副总经理兼REDMI市场部总经理,分管电商市场部和零售市场部,向中国区市场部总经理许斐汇报;并继续兼任REDMI品牌总经理,向集团总裁卢伟冰汇报;2024年12月31日,微博认证显示,王腾升任为小米中国区市场部总经理,并兼任REDMI品牌总经理。但是在担任中国区市场部总经理不到十个月,王腾因严重违规违纪在小米公司黯然退场。王腾自己也发布微博回应“很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价。”红星新闻记者注意到,王腾曾多次在小米公司宣传视频中被点名“泄密”,2024年8月的一场直播中,雷军就曾提到:“除了我们滕总(王腾)动不动泄密被罚款以外,我的口碑还是可以的。” 华中科技大学官网上有关王腾的介绍在华中科技大学的官网上,至今能看到有关于王腾的资料页面。相关网页中介绍,王腾表示,他毕业于华中科技大学,语文和英语成绩一般,但数学还可以,当年考了148分,高考总分668分,比当年一本分数线还高出60多分。红星新闻记者 钟梦哲编辑 张波 -
将人分为"安卓人"和"苹果人" 网红户晨风账号全网封禁 9月30日晚,极目新闻记者搜索发现,网红户晨风全网账号被彻底封禁,且无法通过搜索找到账号,账号主页已无法查看信息。此前,该博主在微博、抖音、哔哩哔哩等社交平台的账号仅遭到部分功能限制。 户晨风微博账号截图其微博账号页面显示:该账号因被投诉违反法律法规和《微博社区公约》的相关规定,现已无法查看。账号头像变灰,关注及粉丝数量清零。 户晨风抖音账号截图抖音账号页面显示,该用户因违反相关法律法规和政策,已被禁言。账号头像变灰,昵称变为一段数字。 户晨风哔哩哔哩账号截图哔哩哔哩账号则直接搜索不到。 图为网红户晨风据了解,网红户晨风此前曾多次发表对立言论,将人群与“安卓手机”和“苹果手机”挂钩,并挑动对立情绪。9月30日,“浙江宣传”发布评论写道:要纠正“苹果人”与“安卓人”带来的认知扭曲,关键在于压实网络平台的主体责任,不能让标签化的撕裂成为暴力起号、流量变现的路径依赖。唯有让制造对立者无利可图、寸步难行,才能从根本上引导内容创作回归理性与真诚,共同守护清朗有序的网络空间。来源 | 极目新闻延伸阅读媒体:户晨风、张雪峰、蓝战非"3连封" 给网红敲响警钟近期,“网红圈”有点不太平静:继网红户晨风在抖音、微博等多个平台账号被封禁之后,知名高考志愿导师张雪峰的微博、抖音、快手、B站及小红书平台的社交账号出现异常,千万粉丝网红蓝战非抖音、小红书、B站账号主页也显示“该用户被禁止关注”。三名网红,都是什么人?户晨风,提出“苹果精英论”。他将手机品牌、学历等与社会地位挂钩,贬低安卓用户和国产货,通过贴“苹果思维”和“安卓思维”的标签,无差别攻击普通人。张雪峰,多次在直播中使用争议性言论,如曾公开表示新闻专业就业面窄、收入较低,“闭着眼睛报一个专业都比新闻好”“孩子非要报新闻学,我一定会把他打晕”。 张雪峰多次在直播中使用争议性言论蓝战非,在直播中透露收入潜力及资产状况,自称若全力投入商业化运作,年收入可达九位数,宣扬“不结婚便不破产”“无家庭负担可随意花钱”等观点。 蓝战非在直播中透露收入潜力及资产状况这几名网红的个人账号连续出现问题,虽然原因不明,处罚力度也不同,但结合最近网信部门重点整治“破坏网络生态”的动向来看,这大概率是一次针对网红的集中整治。某种程度上,这正是如今网络生态的一角。有的利用消费符号制造社会割裂,将商品异化为身份标签,长期煽动对立与歧视;有的把一些复杂的教育选择简化为“就业成败”的二元判断,制造情绪焦虑;有的将“炫富”当作成功的唯一标识,宣扬“拜金主义”,鼓吹“奢靡之风”。事实上,有太多网红深谙互联网传播之道——利用极端叙事,将本就存在分歧的观点推向对立的两极,刺激用户参与争论、转发扩散,进而实现流量的指数级增长。也有人不理解,比如有声音认为张雪峰是“普通家庭的嘴替”,是“穷人孩子的报考救星”。不可否认,张雪峰的一些言论,代表了一类群体的看法,某些话题也有延展思考的空间。但具体在实践层面上,却表现为非黑即白的“暴论”。比如所谓的“劝人学医,天打雷劈”“金融圈要颜值能喝酒”“文科都是服务业”等,可谓“语不惊人死不休”“一言不合就抬杠”“一竿子打死一船人”。这样的表达方式,只会带来过度反应,而绝无温和讨论的可能。网络发展极大地改变了媒介格局,每一个人都可以传递原生态的社会情绪、诉求和意见。一个健康良好的网络舆论生态,容纳得下多元多样的声音,但绝不该成为负面情绪的“垃圾堆”、极端言论的“角力场”。最近,中央网信办部署开展“清朗·整治恶意挑动负面情绪问题”专项行动,着力整治挑动群体极端对立情绪、宣扬恐慌焦虑情绪、挑起网络暴力戾气、过度渲染消极悲观情绪,就体现出明确的针对性。在此背景下,对一些账号的多平台处理,无疑是对拥有巨大社会影响力的知名网红的一次严肃惩戒,也为很多网红和公众人物敲响了警钟:在追求表达个性与传播效果的同时,必须严守法律法规与平台规则,共同构筑良好的网络生态环境。 -
淘宝闪购,三城开“团” 今天是黄金周的第一天。中国的十一假期,是全球罕见的大规模集中出行场景,今年又恰逢中秋与国庆再度相遇形成的8天超长假期,预计将有数以亿计的中国人通过铁路、民航、公路等多种方式开启假期旅程。这个十一,除了常见的旅游和餐饮热,全行业的视线正投向一个新动向:淘宝闪购正式上线到店团购,初期在上海、深圳和嘉兴三城试点。团购不是新模式,经过十余年发展,它已深度融入电商生态。但淘宝闪购的入局,为原本相对固化的本地生活市场注入了新的变量。这意味着用户有了更多比价和选择的空间,商家也获得了更多议价能力和渠道选择。用户买得省,商家赚得多,平台链得牢。这场三城开“团”,隐含着淘天在本地生活版图上的新野望,也标志着淘天从即时到家迈向到店团购的关键战略落子。黄金周试炼场“淘宝闪购团购来了。”9月20日,淘宝闪购到店团购业务上线,嘉兴多地的沿街大屏上,活动海报循环滚动播放。在同为试点城市的上海和深圳,“出门用淘宝闪购”的广告灯箱、电子屏点亮了多个繁华的核心商圈和人流密集的交通枢纽。社交媒体平台上,第一批探店博主已经开始安利团购省钱攻略:“10.1-10.8,0.01元抢单!错过这次真的要哭!”淘宝闪购到店团购业务上线的第12天,十一黄金周假期正式开始。经过10余天的磨合,到店团购的购买、核销流程已经丝滑顺畅。参与团购的餐饮商家们也已厉兵秣马,准备迎接客流高峰。他们期待这波由淘宝闪购、支付宝、高德App三端汇聚而来的线上流量,转化为实实在在的到店消费客流。 自今年4月底,淘天旗下即时零售业务“小时达”升级为“淘宝闪购”以来,市场对淘宝闪购何时发力到店业务的猜测就从未停止,并在9月10号高德地图宣布推出“扫街榜”之际达到顶峰。整整十天后,靴子才终于落地:淘宝闪购正式启动到店团购业务,涵盖茶饮、甜品、正餐、自助餐及城市特色小吃等多个餐饮品类。除淘宝闪购外,这批团购商品还在支付宝、高德地图App等多个入口同时上架。到店团购业务推出的试点城市经过了精挑细选。从地缘禀赋来看,上海、深圳和嘉兴,这三城一为国际消费中心,一为粤港澳大湾区枢纽,一为长三角产业和人口流动节点,叠加十一餐饮出行高峰,堪称天然的试炼场。淘宝闪购意图明确:在以8天超长假期为“纵轴”,三座人口密集、流动性强的一二线城市为“横轴”的象限内,圈画出一个理想的时空沙盘,验证到店团购业务的潜力和边界。最先体验淘宝闪购到店团购优惠的,是那些价格敏感,又追求品质的用户。家住深圳福田的蒋琪在淘宝闪购点外卖时,发现频道内新增了“到店团购”入口。经验告诉她,平台推出新业务时,供给通常有限,“慢慢地才会丰富起来”。然后,在一番浏览后,团购选择的丰富度和优惠力度都大大超出了她的预期。在淘宝闪购的到店团购频道内,有火锅、烧烤烤肉、地方菜系、异域料理、饮品面包等10个分类。蒋琪发现,上线的团购商家中,既有陶陶居、奈雪的茶、尊宝披萨、蛙来哒、农耕记等连锁品牌,也有不少烟火小店,几乎每一个分类下都有步行可至的商家,且优惠力度可观。例如,陶陶居推出的广府粤味特色双人餐,团购价178元,相当于原价的6.9折;尊宝的苏丹王榴莲披萨2人餐,团购价43.9元,仅为原价4折。更有LINLE林里柠檬茶“招牌三选一”到店套餐,仅需要0.01元的超值限量爆品。 除深圳外,上海与嘉兴两座试点城市也有多家知名餐饮品牌瞄准“十一”黄金周的出行客流,同步上线了淘宝闪购到店团购套餐。雪豹财经社了解到,在上海,popeyes、桂满陇、许府牛、楼下酸奶等品牌都贴出了“出门用淘宝闪购,团购再减15元”的海报;在嘉兴,当地的爆款餐品如游萬才、黔家婆等,同样推出了优惠力度可观的团购套餐,力图在假期消费高峰中抢占先机。团购商品在淘宝、支付宝和高德地图三端同时上架,带来的是多元场景下的用户导流:有人从地图找餐厅,有人从淘宝搜索团购券,也有人在支付宝支付场景中自然触达。目前淘宝闪购月活已达3亿,支付宝月活10.4亿,高德地图日活1.7亿,三端流量同时注入,三个超级App的差异化使用场景和用户群,相当于为线下商家开启了加速获客引擎,是一次兼顾获客和利润的增量机会。而对淘宝闪购来说,黄金周8天假期为到店团购提供了理想的观察和测试窗口。从消费人群的画像看,首批试点的上海、深圳和嘉兴,一个是衍生出了“沪币”概念的高消费超一线城市,一个是常住人口平均年龄仅有32.5岁的移民城市,一个是线上消费活跃,餐饮包容度高的卫星城市。三个城市如同三个功能各异的试验场,能帮助淘宝闪购在将到店团购推向全国之前,以最小成本完成商业模式验证,并快速提升整个业务链条的成熟度。三座城市截然不同的地缘禀赋、人口画像和消费特点,已经可以形成一个能够全面检验新业务模式的“最小化可行市场”。随着首批合作商家陆续迎来核销高峰,淘宝闪购的到店团购从三城试点扩展至全国规模,已只是时间问题。到店团购,水到渠成淘宝闪购相关负责人曾将到店团购称为“水到渠成的业务发展”。做到店团购,淘宝闪购不是白手起家。阿里在本地生活领域十余年的深耕,已为到店业务积攒了足够的家底。淘宝闪购在4个月时间日订单峰值突破1.2亿单,月活用户超3亿的极速增长,也成为到店业务开展的底气。到餐和外卖业务本就是相生关系,对应着同类用户在不同时空场景下的消费需求。外卖作为餐饮消费的高频刚需,符合一人食或简餐需求,到店餐饮相对低频,但承担了一定的社交属性。同一商家外卖和堂食用户的高度重合,决定了外卖业务的规模增长,必然会催生堂食就餐的团购需求。而对商家来说,到店团购的优惠能直接带来客流与收入,规模效应还能进一步摊薄边际成本,利润提升立竿见影。特别是已接入外卖的商家,到店业务可复用现有资源,新增成本近乎为零。由于不涉及履约环节,商家成本更低,客单价通常更高,前期积累的外卖客源进一步转化为到店客流,将撬动一条全新增长曲线。亿级用户多场景消费需求和百万商家线下拓客的意愿,会自下而上地推动平台开拓到店业务,也就构成了淘宝闪购“水到渠成”走向到店团购的内在逻辑。顺势发力到店业务,淘宝闪购的先天禀赋也得以最大化展现。首先是存量资源的复用。闪购业务积累的超百万商家,可无缝迁移至到店业务中,线下BD团队采用原班人马,也最大程度降低了沟通对接成本。其次是大数据赋能。团购不是新模式,其核心的“集采优惠”逻辑是传统的商业策略,网络只是提升了聚合效率,其本质仍是通过线上化来实现更高效的人货匹配。作为一款拥有近10亿月活的国民级App,淘宝拥有海量、多维的用户消费行为数据,据此描摹出的人群画像,与不同商圈、价位和风格的餐饮商家进行供需匹配后,可以更精准地推荐触达,优化营销效果。最后,到店团购商品采用了“一套供给,多端分发”的模式,在淘宝闪购频道、支付宝卡包神券频道、高德地图商家详情页等都有入口。这种多端布局覆盖了用户“逛买-支付-出行”的全链路消费场景,使得用户无论在淘宝购物、用支付宝付款还是在用高德地图导航时,都能无缝触达团购服务,提供了更丰富的触点,将分散在不同平台的消费需求加以整合,有助于实现跨场景流量协同。淘宝、支付宝、高德地图三个App,虽然各自的功能都早已包罗万象,但每个用户都有自己的高频使用场景,三端入口并行,用户可以依循过往使用习惯,无需切换App即可自然触达新功能。这一“服务找人”的策略,最大化收窄了因跳转或适应新界面可能造成的用户流失漏斗。从单个业务线的角度看,由“即时配送”延伸至“到店核销”,形成了一个消费场景闭环。若从生态视角来看,到店业务将流量、数据、商家资源、支付和地理位置服务等多要素重新整合,是淘宝又一次成熟的协同作战。而这套“生态型”打法,也是淘宝闪购未来在本地生活领域构建差异化优势、实现高效扩张的制胜武器。市场需要“鲶鱼”互联网从不缺少竞争。从游戏、社交、在线广告,到打车、货架电商、即时零售,移动互联网的战场不时有硝烟升腾。挑战者总会掀起波澜、重塑格局、推动进化。过往经验也证明,虽然每一轮激烈的商战过后,市场都会达到短暂的均衡,进入一段平静期,但竞争才是常态,也是行业进步的第一推动力。每一次新玩家入场,在打破旧格局的同时,总会做大市场蛋糕,优化服务体验,倒逼所有玩家精细化管理、强化内功。市场需要鲶鱼,而淘宝闪购的“三城开团”,可能正是搅动本地生活江湖的第一击。2022年,美团在到店市场一枝独秀,到店业务GMV为千亿级别。这一年,抖音开始发力到店业务,快手也通过“快手小店”支持到店餐饮等交易,全新的消费场景和流量玩法激发了潜在需求,带动行业到店业务GMV在次年冲破万亿量级。在淘宝闪购到店团购上线之前,美团+抖音的双寡头格局持续已久。但稳态不意味着饱和,淘宝闪购下场,让到店战场有了新可能。对增量的挖掘是最显性的。现阶段,到店业务不是零和博弈,而是增量竞争。根据浙商证券测算,2023-2028年,到店市场规模CAGR为13.7%,预计2028年市场规模将达到5.4万亿元。阿里系三端流量的充沛供给释放给到店业务后,在生态协同效率的加持下,有望链接更多商家和消费者,为其带来更多选择。而一旦到店团购业务与阿里生态深度结合,存量用户的需求潜力也会被激发。比如,基于电商消费数据与LBS数据做出的精准推荐,会改变行业传统的流量分配逻辑,实现线上对线下的反哺。一个可能的典型场景是,在天猫超市购买了火锅食材的用户,有更大概率对火锅团购感兴趣;一个有母婴产品消费行为的用户,更有可能选择亲子友好餐厅。因此,一张团购券在哪里买,不仅取决于平台货品货盘供给的丰富度、团购商品的性价比,也将取决于用户需求洞察的精准性、供需匹配的契合度,以及评价体系的真实性等多方面构建的综合消费体验。在商家侧,渠道选择增加后,餐饮商家对单一平台的依赖降低,话语权增强。平台能在多大程度上为商家赋能,帮助商家减低库存、优化商品组合和营销策略,提升数字化运营能力,可能成为商家选择入驻平台的新标准。更进一步,当巨头的核心业务开始交叉、融合,业务边界越来越模糊,未来到店市场的竞争,或将升级为生态系统的协同效率之争。在购买换季衣物时随手囤一张奶茶券;在导航去和朋友聚餐时,顺便下单一份目的地餐厅的双人套餐券……平台基于对用户当下场景的深度理解,将消费决策自然嵌入用户已有的行为路径中,提供润物细无声的服务,或许才是未来留住用户的关键。结语短期的折扣能带来一时的热闹,但长期的价值才决定格局。消费的本质,是人群与场景的匹配。淘宝闪购将团购嵌入购物、支付、出行的日常高频场景,不只是一次简单的流量重构,它看似细微,却可能重塑用户的消费路径。当用户习惯被重新锚定,商家供给被不断丰富,这条链条会被拉长、加厚,进而孕育出新的行业能量。中国的本地生活市场仍处在快速扩容阶段,留给后来者的空间并未封闭。淘宝闪购选择在此刻切入“到店团购”,瞄准的正是用户希望“花得更值”、商家渴望“赚得更稳”的核心需求。对消费者而言,这是一次更省更便利的体验升级;对商家而言,这是一次更低成本、更高利润的增量尝试;对行业而言,这是一个增量空间持续释放的过程,它不仅是淘宝闪购的机会,也是产业链的一次跃迁。消费,始终是中国经济最具韧性的力量。本地生活的战场看似日常,却关乎数亿人的饮食选择和万千商家的生意兴衰。随着供给与需求的耦合愈加紧密,一个更开放、更高效、更可持续的市场格局正在成型。最终受益的,不只是平台与商家,更是被重新定义的消费体验。作者 | 于米 -
马斯克将推xAI驱动的百科平台Grokipedia,声称准确性超过维基 IT之家 10 月 1 日消息,马斯克昨晚通过自家的 X 平台公开表达了对维基百科的不满,并宣布即将推出“由 AI 驱动的新百科全书 Grokipedia”。 马斯克表示,该产品将由 xAI 负责开发,并声称其准确性和中立性会超越维基百科。同时,此项目将与其“理解宇宙”的更大愿景紧密相连。 马斯克是在 X 上回应投资人戴维・萨克斯时作出的上述表态。“我们正在 xAI 构建 Grokipedia,它会比维基百科好得多。坦率地说,这是实现 xAI 理解宇宙目标的必要一步。”马斯克计划将 Grokipedia 的成果开源,不过项目的具体细节尚未披露,例如发布时间、技术架构,以及如何防范 AI 本身的偏见。据IT之家了解,早在几周前,马斯克就暗示过这一方向。他曾表示 xAI 聊天机器人 Grok 能通过删除错误信息并利用合成数据进行修正来“重写维基百科”,而 Grokipedia 正是这一思路的延伸。 -
OpenAI发布Sora 2模型:支持AI音频生成 9月30日,OpenAI宣布推出新一代视频生成模型Sora 2,该模型首次支持与画面匹配的AI音频生成。Sora 2的发布标志着视频生成技术在物理模拟、真实感和可控性方面的显著提升,能够处理复杂的动作场景并遵循物理规则。OpenAI同时推出了一款名为Sora的iOS独立应用,该应用让用户能够通过“入镜”(Cameo)功能,将自己或好友置入生成视频中。Sora应用的API将在数周内上线,面向第三方开发者开放,安卓版Sora应用目前仍在开发中。Sora 2免费向所有用户开放,但有使用次数限制;ChatGPT Pro用户可使用更高画质的“Sora 2 Pro”模型;ChatGPT Plus用户与免费用户一样,不额外享受升级权益。美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用,随后将逐步扩展至其他国家和地区。 -
Meta计划收购Rivos以加强AI芯片研发能力 据知情人士透露,Meta计划收购位于美国加州圣克拉拉的芯片初创公司Rivos,此举旨在加强Meta内部半导体研发能力,特别是在人工智能领域的芯片开发工作。Rivos是一家专注于基于RISC-V架构设计芯片的初创公司,该架构具有更高的灵活性和成本效益。Rivos由英特尔首席执行官陈立武(Lip-Bu Tan)投资支持,今年8月曾寻求以超过20亿美元的估值进行融资。Meta一直是Rivos的重要客户之一,双方此前已就潜在的收购交易进行过接触。Meta近年来在AI领域的投入不断加大,致力于开发自主AI芯片降低对外部供应商的依赖,尤其是对市场领先的英伟达GPU的依赖。Meta内部已组建AI训练和推理加速器团队,自主开发AI芯片,但其芯片开发进展未达首席执行官马克·扎克伯格的预期。Meta在芯片领域的努力旨在控制AI基础设施成本并提升效率。尽管Meta发言人表示公司定制芯片工作进展迅速,且此次收购将进一步加速相关努力,但内部人士指出,Meta的芯片研发速度仍需提升。今年3月曾有报道称,Meta尝试以8亿美元收购韩国芯片初创公司FuriosaAI,借此增强AI训练芯片开发能力,但该交易未达成,FuriosaAI选择独立发展。Meta正与OpenAI、谷歌母公司Alphabet等公司展开激烈角逐。扎克伯格将AI列为公司首要任务,计划在2025年投入高达720亿美元用于资本支出,其中包括AI相关基础设施建设。 -
早报|OpenAI发布Sora 2:AI视频进入GPT-3.5时刻/罗永浩称小米小字是行业陋习/三星戒指电池鼓包,用户手指被卡就医 OpenAI 发布 Sora 2:AI 视频进入「GPT-3.5 时刻」罗永浩谈小米「小字」争议:各家都这样Galaxy Ring 电池鼓包取不下来,受害者:再也不戴智能戒指了谷歌更新「G」Logo,采用更亮渐变色设计营收约 43 亿美元,OpenAI 上半年财报披露得力集团就「跛脚员工入职当天被辞退」事件致歉法拉第未来总部子办公楼失火,官方回应:与量产车无关宇树科技回应机器人安全漏洞:大部分修复已完成理想汽车推出 i6 跨年购置税兜底方案福特 CEO 警告:美国 AI 发展掩盖「蓝领危机」全尺寸人形机器人 Oli 成为「赛博球童」:自主完成捡球与深蹲动作索尼发布 1 亿像素 100 fps 全域快门传感器⌚️699.3 元,Nothing CMF 推出新款头戴式耳机豆包大模型 1.6-vision 发布:多模态能力全面升级,支持图像生成智谱 GLM-4.6 正式上线:代码能力对齐国际顶尖模型百灵团队发布万亿规模思考模型,推理能力显著提升 OpenAI 发布 Sora 2:AI 视频进入「GPT-3.5 时刻」 OpenAI 今日正式发布全新一代 AI 视频生成模型 Sora 2,并同步上线面向 C 端用户的应用 Sora。官方称这是 AI 视频生成的「GPT-3.5 时刻」,标志着技术从演示阶段迈入大规模应用阶段。Sora 2 核心升级: 首次实现音视频同步生成,可同时生成画面与匹配的环境音、交互声及对话 物理精确性显著提升,动作与流体效果更符合真实世界动力学 图像分辨率与细节真实感增强,风格操控能力更灵活 指令一致性提高,跨镜头复杂场景的可控性更强 Sora App 亮点功能: 「客串 (Cameo)」:用户可将自身形象与声音无缝融入 AI 生成场景 「Remix」:支持对他人视频进行二次创作或混编,共同生成内容 信息流内所有视频均由 AI 生成,用户可直接修改提示词或加入自身形象 目前,Sora App 已在美国、加拿大首发,支持 iOS 与网页版,采用邀请码机制。Sora 2 初期免费开放,ChatGPT Pro 用户可优先体验更高质量的 Sora 2 Pro 模型,OpenAI 还计划推出 API 供开发者使用。 相关阅读:刚刚,OpenAI发布Sora 2!AI视频GPT-3.5 时刻来了,还有一个超好玩的app| 附下载链接罗永浩谈小米「小字」争议:各家都这样 近日,罗永浩在直播中谈及网络上针对小米「逆光之王」海报中右下角小字的质疑。他表示,外界热议的相关做法并非小米独创,而是整个手机行业的「陋习」,各家厂商长期以来都在采用类似方式。罗永浩在直播中指出:「这两天很多人在拿这个黑小米,其实这个是行业陋习,各家都这么做。并不是小米独创的。手机行业其实也一直都这么搞,不信你们自己去查一下。」他直言「并不是说这样做对」,但舆论将问题集中到小米身上并不公平。日前,星纪魅族集团 CMO 万志强也就此问题在微博发文表态。他表示,企业在产品宣传中加入备注说明,主要是为了遵循法规要求。 其实都是为了遵循法规,各家都会有一些备注说明。不过魅族内部当时特别强调了,保留语境语义前提下,补充限定词我们要写的尽量明显些,不要让人有被误导的感觉,产品观中包含价值观。当天下午,罗永浩在微博回复网友,表示希望经过本次事件,行业能够消灭「误导性的小字」,但「没有误导性的大小字,有时候还是必要的」。 Galaxy Ring 电池鼓包取不下来,受害者:再也不戴智能戒指了 昨天,海外科技博主 Daniel(@ZONEofTECH)在 X 发帖,称其佩戴的三星 Galaxy Ring 在准备登机前出现电池鼓胀情况,导致戒指卡在手指上无法取下。由于情况紧急,他被送往医院处理,最终通过冰敷与医疗润滑剂协助才将戒指移除。Daniel 表示:「我的 Galaxy Ring 电池在手指上开始鼓胀,当时我正要登机,戒指无法取下并且非常疼痛。」他补充称,事故导致其被拒绝登机,不得不额外支付酒店费用,并推迟返程。Daniel 配图称:「你能看到电池全部鼓胀了。再也不戴智能戒指了。」据其推测,可能的原因包括「夏威夷的高温、盐水接触、连续乘机」以及「电池本身存在缺陷」。他还指出,过去数月该设备的续航表现一直不佳。目前,三星方面尚未就此事件作出公开回应。Daniel 强调:「任何带电池且需要贴身佩戴的设备,都应该设计得非常容易取下,以防电池膨胀。」谷歌更新「G」Logo,采用更亮渐变色设计 日前,谷歌宣布对其标志性「G」图标进行更新,启用更亮的四色渐变设计。官方表示,这一设计最初在今年早些时候应用于搜索服务,如今将扩展至公司范围内的所有产品与平台。谷歌称,新图标在保持经典四色的同时,通过更鲜明的渐变效果,象征 AI 时代的创新活力与创造能量。此前,这一设计已率先应用于 Gemini 相关产品,未来数月将逐步推广至更多服务。营收约 43 亿美元,OpenAI 上半年财报披露 据 The Information 报道,OpenAI 在 2025 年上半年实现营收约 43 亿美元,同比增加 16%,已超过去年全年水平。报道指出,OpenAI 在同期的研发与运营投入高达 67 亿美元,其中包括大规模训练与运行 ChatGPT 的成本,导致现金消耗约 25 亿美元。截至上半年末,OpenAI 持有约 175 亿美元现金与证券。公司预计全年营收可达 130 亿美元,并将现金消耗控制在 85 亿美元以内。此外,消息称 Nvidia 计划向 OpenAI 投资最高 1000 亿美元,并提供数据中心芯片支持。此前有报道称,OpenAI 还在考虑进行员工股权出售,潜在估值或达 5000 亿美元。得力集团就「跛脚员工入职当天被辞退」事件致歉 得力集团昨天发布致歉声明,回应网络热议的「因跛脚入职当天被辞退」事件。公司表示,经专项小组调查核实,该员工反映的情况基本属实。集团执行总裁已第一时间向当事人致歉,并安排总裁办主任直接沟通,今日上午更派人飞往当事人所在地,期望当面表达歉意。声明指出,此次事件暴露了公司在价值观践行与内部管理机制上的不足。为此,得力集团宣布将采取三项整改措施: 依规依纪问责涉事人员; 全面复盘人力资源管理流程,清除任何可能存在的歧视性、隐性标准; 强化全员反歧视培训,完善管理制度,确保文化理念落地。 得力集团强调,将以最严格的标准落实整改,持续优化人力资源管理机制,坚定贯彻「以人为本」的用人理念。法拉第未来总部子办公楼失火,官方回应:与量产车无关 昨天,法拉第未来官方在微博发表文章称,美西时间 9 月 28 日凌晨,Faraday Future 美国总部一栋子办公楼发生火情。公司在说明中强调,此次事件未造成人员伤亡,总部运营一切正常。官方披露的情况包括: 起火点位于楼内一台 FF 91 展车,办公楼墙面轻微受损,玻璃完好; 初步排除电池包起火或爆炸的可能,最可能原因是展厅电路短路或 12V 低压线路接触不良; 涉事车辆代号为 B40,为 FF 91 最早的 BETA 样车之一,已使用近 9 年,动力系统和电池包均为早期版本,内饰材料也不符合量产车阻燃标准。 公司强调,事故车辆与量产车完全不同,因此不会引发 FF 91 量产车召回。官方表示:「安全始终是第一要求,此次事故为办公区火灾防范敲响警钟。公司将尽快完成最终调查,并采取必要改进措施。」宇树科技回应机器人安全漏洞:大部分修复已完成 媒体报道指出,「IEEE Spectrum」近日披露多个型号的宇树科技机器人在通过 BLE(蓝牙低能耗)配置 Wi-Fi 接口时存在关键漏洞,攻击者可能借此获取最高权限控制。对此,宇树科技在社交平台发布声明称,公司已第一时间展开修复,目前大部分问题已得到解决,后续更新将很快推送。宇树科技强调,其机器人产品在默认情况下设计为离线使用,不会主动连接互联网;只有在用户手动配置并授权时,设备才会接入网络。连接后,机器人可能会向服务器发送序列号、健康状态等基础信息,这一机制与智能手机等电子设备类似。公司同时表示,将持续优化权限管理机制,以减少潜在误解并提升用户安全体验。理想汽车推出 i6 跨年购置税兜底方案 理想汽车昨天宣布,为应对用户对跨年交付可能带来购置税政策变动的担忧,正式推出「理想 i6 跨年购置税补贴方案」,并配文「有兜底,放心买!」。根据官方介绍,凡在 2025 年 10 月 31 日前完成锁单的用户,如因理想汽车原因需在 2026 年完成开票交付,将可享受跨年购置税补贴。补贴方式为尾款现金减免,金额将根据购车配置抵减相应购置税差额,以确保用户无需额外承担购置税支出。同时,理想 i6 还提供最高价值 35,000 元的首销权益,具体包括: 现金减免 10,000 元; 价值 15,000 元的双腔魔毯空气悬架免费赠送; 价值 5,000 元的智能冷暖双用冰箱免费赠送; 价值 5,000 元的全车静音电吸门免费赠送。 需要注意的是,用户在支付定金后 7 天内可修改配置或申请退款,7 天后订单将无法修改或取消,且定金不可退。理想方面表示,目前 i6 订单量已超出预期,公司正全力提升产能,缩短交付等待时间,让用户尽早提车。福特 CEO 警告:美国 AI 发展掩盖「蓝领危机」 据 The Verge 报道,在最新访谈中,福特 CEO 吉姆·法利提到,美国社会在热议 AI 提升白领生产力的同时,却忽视了制造业和基础岗位的严重短缺。他指出,美国目前存在超过 50 万制造业工人和 50 万建筑工人的缺口,急救、消防、医疗、技工等「基础经济」岗位同样面临危机。法利强调,AI 工具正在快速改变办公室工作的效率,但蓝领岗位并未获得同等的技术支持和培训资源,「白领有了 AI,而蓝领没有」。他警告,这种失衡比 AI 本身更威胁社会的可持续发展。为应对这一挑战,福特已投入 10 亿美元改善工厂环境,并推动技工培训和奖学金计划。法利呼吁社会重新认识「基础经济」的重要性,重建对蓝领职业的尊重与支持,「我们必须像关注 AI 一样,投入资源提升蓝领岗位的生产力」。 全尺寸人形机器人 Oli 成为「赛博球童」:自主完成捡球与深蹲动作 近日,全尺寸人形机器人 Oli 展示了「赛博球童」的全新能力。该机器人能够全自主完成网球识别、跟踪、捡球、放置等动作,并在过程中实现行走、弯腰、深蹲等复杂姿态。Oli 基于主动感知的全身移动操作(Whole-Body Loco-Manipulation with Active Perception),无需动捕数据,也不依赖远程操控,整个流程完全自主完成。据介绍,Oli 身高 1 米 65,全身共 43 个自由度,其中身体 31 个、灵巧手 12 个。其双手的跟踪范围可覆盖纵向最高 2 米、横向最长 1.8 米。值得注意的是,Oli 的下蹲动作稳定自然,操作过程流畅,与近期 Speed 的 1X 直播中 Neo 蹲下捡衣服的片段颇为相似。两款全尺寸人形机器人均展现了在深蹲并向前伸臂操作时的协调性,这类动作对大长腿人形机器人而言极具挑战。索尼发布 1 亿像素 100 fps 全域快门传感器 据 PetaPixel 报道,索尼半导体正式发布新一代高性能图像传感器 IMX927。这是一款背照式堆栈 CMOS 传感器,采用全局快门设计,具备约 1.05 亿像素分辨率,并支持最高 100 帧/秒的高速输出。据介绍,IMX927 传感器对角线尺寸为 39.7mm,接近全画幅规格。其核心搭载索尼自研的 Pregius S 全局快门技术,通过优化像素读取与 A/D 转换器,实现高速低功耗的数据处理。索尼表示:「这一高分辨率与高帧率的组合,将有助于提升工业设备领域的生产力,满足日益多样化的识别与检测需求。」IMX927 系列采用全新陶瓷封装,内置标准化连接器,支持多种接口形式,方便相机厂商在设计中快速集成。该系列共推出 16 款产品,均具备可拆卸设计,便于根据应用场景更换传感器。在规格方面,IMX927 支持 8/10/12 位输出模式,分别对应 112、102 和 73 帧/秒的拍摄速度。传感器输出画幅为 10,272 × 10,272 像素的正方形图像,并支持多种像素合并模式,以兼顾灵敏度与速度。索尼强调,该传感器不仅适用于半导体、面板等高精度检测场景,也能在大尺寸物体成像中提供无畸变、低噪声的高分辨率画面,从而推动机器视觉相机在更多工业应用中实现更高精度的测量与检测。699.3 元,Nothing CMF 推出新款头戴式耳机 Nothing 旗下品牌 CMF 今日在中国大陆市场同步推出两款新品:Headphone Pro 头戴式蓝牙耳机与 Watch 3 Pro 中国定制版智能手表。两款产品均已开售,主打高性价比与差异化设计。CMFHeadphone Pro:699.3 元,100 小时续航 搭载客制化 40mm 镀镍振膜驱动单元、16.5mm 铜制语音线圈、精密低音导管以及双腔体设计,内置 720mAh 电池; 获得有线/无线双 Hi-Res 认证; 支持 40dB 深度自适应混合 ANC 降噪,并具备通透模式、在收音方面配备 ENC 技术。 CMFWatch 3 Pro 中国定制版:首发 649 元 配备 1.43 英寸 466×466 60Hz 圆形 OLED 屏幕(亮度 650 尼特,激发亮度 670 尼特); 内置 120 款可定制表盘,并支持独家「视频表盘」功能; 配备 Z 轴线性马达,拥有 IP68 防护等级,号称为「中端表中唯一双频 GPS」产品; 内置 350mAh 电池,典型使用续航 13 天,99 分钟可充满。 豆包大模型 1.6-vision 发布:多模态能力全面升级,支持图像生成 昨天,火山引擎正式推出「豆包大模型 1.6-vision」,主打多模态理解与生成能力,已在官网开放申请试用。据介绍,「1.6-vision」具备图像生成、图像问答、图像理解等能力,支持上传图片进行内容识别、场景分析、图文混合推理等任务,适用于电商、教育、社交等多种场景。火山引擎表示,新版本在图像生成方面引入了「文生图」能力,支持输入文本生成图片,适配多种风格与尺寸,并可结合提示词进行内容控制。此外,「1.6-vision」还升级了图像问答能力,可识别图中物体、文字、表格、地图等复杂元素,支持多轮对话与上下文理解,提升了跨模态推理的准确性与稳定性。目前,豆包大模型已开放 API 接入,支持文本、图像等多模态输入,企业用户可通过火山引擎官网申请试用。智谱 GLM-4.6 正式上线:代码能力对齐国际顶尖模型 昨天,智谱宣布旗下旗舰大模型 GLM-4.6 正式上线。据介绍,作为 GLM 系列的最新版本,该模型在代码编程、长上下文处理、推理与搜索、写作能力等方面实现全面升级。官方数据显示,GLM-4.6 的代码能力较上一代 GLM-4.5 提升 27%,在真实编程任务中已对齐「Claude Sonnet 4」,成为国内已知最强的 Coding 模型。在上下文处理方面,GLM-4.6 将窗口长度从 128K 扩展至 200K,更好适配复杂代码与智能体任务。值得注意的是,GLM-4.6 已在寒武纪芯片上实现 FP8+Int4 混合量化部署,并在摩尔线程新一代 GPU 上基于原生 FP8 精度稳定运行。这意味着国产芯片在大模型本地化推理上迈出关键一步。在评测方面,GLM-4.6 在 AIME 25、SWE-Bench Verified 等 8 大权威基准中表现突出,部分成绩对齐「Claude Sonnet 4/4.5」,稳居国产模型首位。目前,GLM-4.6 已在 bigmodel.cn、z.ai 及智谱清言全面上线,海外用户可通过 z.ai 使用 API,模型也将陆续在 Hugging Face 与 ModelScope 开源。百灵团队发布万亿规模思考模型,推理能力显著提升 昨天,百灵大模型团队宣布,基于 Ling 2.0 家族 1T 语言基座打造的推理模型「Ring-1T-preview」正式开源。据介绍,该模型在大规模强化学习训练的早期阶段,已展现出强大的自然语言推理能力。「Ring-1T」在 AIME 2025(美国数学邀请赛)中,仅凭自然语言推理就取得了 92.6 分的成绩,逼近 GPT-5 with thinking(no tools)的 94.6 分水平。据悉,「Ring-1T-preview」延续 Ling 2.0 高效 MoE 架构,在 20T 高质量语料上完成预训练,并结合「棒冰(icepop)」方法,在自研高效强化学习系统 ASystem 上进行了 RLVR 训练。团队表示,虽然预览版已展现出强大推理能力,但仍存在语种混杂、推理重复、身份认知错误等问题,后续将持续优化。目前,「Ring-1T-preview」已在 Hugging Face 平台开放下载,团队期待社区探索与反馈,共同加速万亿基座模型的迭代完善。 国庆假期「纵向单间」卧铺动车引热议,12306 回应:仅夜间运行 据密度财经报道,国庆中秋假期临近,不少旅客在社交平台晒出乘坐「纵向单间」卧铺动车的经历,并称其为「移动宾馆」,引发广泛讨论。据 12306 工作人员介绍,该类纵向卧铺动车已运行一段时间,在购票页面不会有特别提示,具体情况以旅客上车为准。工作人员同时表示,这类列车为「夕发朝至」模式,仅在夜间运行。此前,中国铁路方面曾披露,该卧铺动车往返北京西与深圳北,全程 2424 公里。在假期前后,该线路将增加车次,包括 9 月 30 日、10 月 1 日、10 月 2 日、10 月 7 日和 10 月 8 日。有网友认为,单间设计有效避免了陌生人之间的干扰,更符合长途夜行需求;也有人反馈纵向布局在高速行驶中容易产生不适感。整体来看,这一新型卧铺动车的体验仍在持续引发讨论。icebreaker Touch Lab 重庆万象城店开幕 新西兰美丽诺羊毛户外品牌 icebreaker 在重庆开出首店,新店位于重庆万象城北区 1 层。开业当天,品牌挚友、青年演员陈鑫海及多位品牌好友到场助阵。新店延续了 icebreaker 一贯的视觉语言与自然气质,现场设置「100% 无塑化之旅」主题墙,展示了从天然原料甄选、可持续生产模式,到合作牧场标识复刻等环节,凸显品牌「人与自然和谐共生」的理念。店内陈列了全系列美丽诺羊毛产品,包括经典基本款与功能性服饰,覆盖温控调节、柔软亲肤、防臭抑菌、轻盈透气及支持机洗等特性,适合全年穿着及多种运动场景。开业活动中,陈鑫海身着本季秋冬新品——美丽诺羊毛「毛壳」冲锋衣与美丽诺混纺弹性户外长裤。据介绍,「毛壳」冲锋衣采用 96.8% 天然原料比例,结合美丽诺羊毛紧密编织工艺与 DWR 环保防水膜,兼具防风、防水与环保特性,同时带来亲肤、柔软、防静电的穿着体验。东鹏特饮与炫迈跨界联名推出无糖口香糖 据小食代信息,日前, 东鹏特饮与亿滋旗下的炫迈宣布达成跨界合作,正式推出东鹏特饮风味无糖口香糖。这是双方首次打破品类界限,将能量饮料与口香糖进行融合,旨在为消费者带来全新的风味体验与精神提振效果。据介绍,这款联名产品融合了东鹏特饮的经典风味与炫迈的薄荷因子,形成双重「BUFF」。一方主打「喝得提神」,另一方强调「嚼得带感」,双方希望通过这种组合,打造出年轻人日常生活中的「高能搭子」。东鹏特饮方面表示,双方团队历经数月,从风味研发、口感打磨到包装设计与营销规划,层层把关,最终完成了这款创新产品。联名口香糖将面向全国市场发售,并通过线上线下多渠道联合推广。尼尔森数据显示,东鹏特饮 2024 年销量占比达 47.9%,连续四年稳居中国能量饮料市场第一。借助此次联名,东鹏特饮希望以更轻盈的方式融入年轻消费群体,而炫迈则有望借助东鹏特饮的渠道与用户基础实现人群破圈。索尼与锐步推出 PlayStation 30 周年联名鞋款 为庆祝 PlayStation 诞生 30 周年,索尼与锐步携手推出全新联名鞋履系列。此次合作以 90 年代经典游戏机为灵感,三款鞋型将在美国、英国和日本三地限量发售,每个地区均配备独特设计元素。 英国市场将于 10 月 15 日在 END 独家发售 Reebok Workout Plus,提供双系带方案及可拆卸配件; 美国市场 10 月 17 日起在纽约 CNCPTS 上架 Reebok Pump Omni Zone II,配备定制 PlayStation 色系泵球与复古细节; 日本市场则将在 10 月 24 日通过 Beams 推出 Reebok Instapump Fury 94,鞋舌设计融入「Press Play」元素,向 1994 年经典主机致敬。 三款鞋均采用灰色鞋面,呼应初代 PlayStation 的标志性配色,并在鞋舌与鞋跟处点缀经典按键符号。此次合作被视为游戏与运动潮流文化的跨界融合。 《辛普森一家》电影续集定档 2027 年夏季上映 迪士尼与 20 世纪影业正式宣布,《辛普森一家》电影续集将于 2027 年 7 月 23 日登陆全球院线。这是继 2007 年首部电影上映后,时隔整整 20 年的回归。据悉,续集由创作者马特·格勒宁亲自监督制作,延续该系列一贯的讽刺幽默风格。影片剧情暂未公开,但官方通过社交媒体释出标志性的粉色甜甜圈海报,并配上标语「荷马要再来一次」,引发粉丝热议。《震耳欲聋》发布新预告 电影《震耳欲聋》今日发布「我有错吗」预告,影片以「灰度律师」李淇的成长经历为主线,深刻揭示了 CODA 身份带来的原生创伤与现实困境。影片讲述李淇因卷入聋人反诈案而逐渐走向欲望与道德的十字路口。虽然他极力抗拒与「聋人」身份的关联,却在一次酒后吐露心声:「从我出生那天开始,我每天都说话,没有人听得见。」这一台词直击人心,折射出 CODA 群体的复杂处境。官方介绍称,本片部分取材自 CODA 律师张琪的真实经历。导演万力表示,希望通过李淇的故事传递「做自己的英雄」的价值观,让观众在角色的挣扎与救赎中获得共鸣与勇气。《震耳欲聋》由檀健次、兰西雅、王戈领衔主演,王砚辉、迟蓬特邀出演,影片将于 10 月 2 日至 3 日进行全国点映,并于 10 月 4 日正式上映。《浪浪人生》今日上映 电影《浪浪人生》昨天正式登陆全国院线。影片由韩寒监制、马林执导,黄渤、范丞丞、殷桃领衔主演,常远、李嘉琦、刘雪华、付航等参演,讲述一家人在逆境中「疯浪」搏命守家的故事。影片改编自蔡崇达畅销书《皮囊》,以真人真事为创作基础,融合喜剧、家庭与剧情元素。该片点映期间口碑持续走高,猫眼点映评分 9.5,大 V 推荐度高达 98%。不少观众表示「笑点与泪点并存,家的意义被诠释得淋漓尽致」。目前,《浪浪人生》正在全国热映中,适逢国庆中秋双节档期,被视为合家欢观影的热门之选。 -
Opera 推出 AI 浏览器 Neon,月费 19.99 美元 IT之家 10 月 1 日消息,浏览器开发商 Opera 于周二推出了以 AI 为核心的浏览器 Neon,该浏览器具备通过 AI 指令生成应用的能力,并可借助名为“Cards”的功能创建可重复使用的指令。此举使 Opera 加入了日益壮大的阵营,与 Perplexity、The Browser Company 等企业一道,致力于打造具备智能代理能力的浏览器。 Opera 早在今年 5 月就宣布正在研发 Neon,但当时该浏览器处于封闭预览阶段。目前,Opera 将开始向选定用户发送邀请,用户需每月支付 19.99 美元(IT之家注:现汇率约合 142.4 元人民币)才能使用该浏览器。Opera 浏览器部门执行副总裁克里斯蒂安・科伦德拉(Krystian Kolondra)在一份声明中表示:“我们开发 Opera Neon,既是为了满足自身需求,也是为了服务所有在日常生活中大量使用 AI 的用户。如今,我们欢迎首批用户加入,与我们共同塑造智能代理浏览器的未来。”这款浏览器包含几大核心功能模块。首先,其内置了一个基础聊天机器人,用户可通过对话获取问题答案。浏览器更具智能代理特性的功能名为“Neon Do”,能协助用户完成各类任务。例如,可以总结博客内容,并将摘要发布到 Slack 频道。由于浏览器能获取用户的浏览历史上下文,用户还可要求它提取上周观看的 YouTube 视频或昨日阅读文章中的关键信息。此外,Opera 这款新浏览器还能编写代码片段,助力用户创建包含表格与图表的可视化报告。目前尚不清楚用户能否将这些迷你应用分享给他人。The Browser Company 旗下的浏览器 Dia 拥有一项名为“Skills”的功能,用户可像调用指令或应用一样重复使用某个 AI 指令。Neon 则通过“Cards”功能实现类似的重复性指令创建,其逻辑类似于 AI 指令领域的“IFTTT”(即“如果这样,那么那样”)规则。用户可将“提取详情”(pull-details)与“对比表格”(comparison-table)等“Cards”组合,创建新指令,用于跨标签页对比产品信息。与 Dia 类似,用户既可以自定义“Cards”,也可以使用社区创建的“Cards”。Opera Neon 还新增了名为“Tasks”的标签页管理功能,该功能可将 AI 聊天内容与标签页整合为独立工作区。在演示视频中,Opera 展示了 Neon 完成订购杂货等任务的场景。但以往经验表明,演示内容往往无法完全反映真实使用场景,尤其对于 AI 产品而言。这意味着 Neon 需在实际应用中证明其功能宣传的真实性。 -
DoorDash推出配送机器人:最高速度32km/h,“嘴”里能存放食物 IT之家 10 月 1 日消息,当地时间周二,美国最大外卖平台 DoorDash 推出了自主研发的配送机器人 Dot。这款小型机器人能够在马路、自行车道和人行道上自动行驶,最高时速可达 32km/h,用于运送餐食和小件包裹。Dot 被设计成卡通形象,通体鲜红,配有大大的 LED 眼睛,嘴巴能打开存放食物。 DoorDash 已经在菲尼克斯都会区进行测试,计划在 2025 年底向当地 160 万居民开放服务。据外媒 TechCrunch 报道,DoorDash 联合创始人 Stanley Tang 表示,自动配送未来在城市和郊区都有巨大潜力。Tang 强调,关键在于解决“前十英尺和最后十英尺”的问题,即如何取货和送货。人行道机器人能处理狭小空间,但速度慢、不能上路,Dot 则结合了灵活和高效。Tang 说:“送一管牙膏或一包尿布,不必用整辆车。Dot 正是为每天数百万次配送量身打造的。它体型小巧,能穿过门口和车道;速度足够快,保证食物新鲜;还足够智能,能自动选择最佳路线。”据IT之家了解,Dot 高不到 1.5m,宽不足 1m,重约 160kg,体积仅相当于汽车的十分之一。其货舱能装六个披萨或 13kg 食物,商户还可根据需要放入杯架或冷藏箱。Dot 配有 LED 屏和扬声器,还内置麦克风,未来可能与顾客进行 AI 对话。其采用可更换电池,充电与存储分开进行。导航依靠八个摄像头、四个雷达和三个激光雷达,结合 AI 模型规划路线。DoorDash 在公告中称,大部分订单仍将由人类完成,自动化只会让他们更专注于需要判断和服务的高价值订单。安全同样是挑战。Rege 强调,Dot 会礼让行人和骑行者,同时体型足够大,不至于被汽车忽视。若遇到问题,Dot 不会远程操控,而是会停靠等待,必要时由现场人员前往处理。在菲尼克斯,DoorDash 已建立包括机器人仓库、充电站和现场人员在内的支持体系,负责清洁和救援。Dot 的货舱配有摄像头,且能够防止小孩钻入,且若被推翻,工作人员能将其扶正。 -
国产大模型集体国庆!最强国产编程模型诞生 智东西 作者 李水青 编辑 漠影 智东西9月30日报道,国庆前夕,全球AI竞赛迎来一波小高潮,国产大模型纷纷放大招。今天下午,智谱AI正式发布新一代大模型GLM-4.6,就在昨晚,DeepSeek也宣布推出DeepSeek-V3.2-Exp实验版模型。两家国产大模型领军企业在国庆假期毫不放松,加班加点推进技术迭代。而在大洋彼岸,Claude Sonnet 4.5同期发布,谷歌Gemini 3.0也预计将在10月迎战,全球大模型竞争进入白热化阶段。作为智谱GLM系列的最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升,整体性能超越DeepSeek-V3.2-Exp。这也是新晋“国内最强Coding模型”,据称能使用户仅用1/7的价格即享受到接近Claude Sonnet 4的代码能力。智东西第一时间对GLM-4.6进行了实测体验,发现其编程能力表现惊艳,在代码质量和实现效果上相比GLM-4.5大幅提升,并可与Claude Sonnet 4.5、GPT-5媲美;同时在文本理解、逻辑、记忆、检索、智能体调用等方面都有明显体验提升。目前,GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope同步开源。寒武纪、摩尔线程等国产AI芯片厂商在第一时间完成适配,标志着国产大模型与国产芯片的协同发展正在加速推进。体验地址: https://chat.z.ai 技术报告地址: https://z.ai/blog/glm-4.6一、GLM-4.6横扫八大权威测评,编程能力创新高,token消耗节省三成 按照惯例,我们先来看看GLM-4.6的测评成绩。在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified等8大权威基准测试中,GLM-4.6在大部分权威榜单表现赶超了DeepSeek-V3.2-Exp、Claude Sonnet 4等顶尖模型,稳居国产模型首位。 这些成绩来之不易。GLM-4.6的上一代模型GLM-4.5最初发布于7月28日,首次在单个模型中实现将推理、编码和智能体能力原生融合。GLM-4.5在代码能力上的突出表现,让智谱MaaS平台的API商业化实现了10倍以上增长。 GLM-4.6在这一基础上实现全面跃升,不仅在代码能力上创新高,在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现显著升级,整体性能已超越DeepSeek昨日发布的DeepSeek-V3.2-Exp。这些提升也体现在真实编程评测中,GLM-4.6同样实现了全面超越。为了测试模型在实际编程任务中的能力,智谱在Claude Code环境下进行了74个真实场景编程任务测试。结果显示,GLM-4.6实测超过Claude Sonnet 4,也优于其他国产模型。 在平均token消耗上,GLM-4.6比GLM-4.5节省30%以上,为同类模型最低。 为确保透明性与可信度,智谱已公开全部测试题目与Agent轨迹,供业界验证与复现。链接:https://huggingface.co/datasets/zai-org/CC-Bench-trajectories二、实测编程惊艳,胜任复杂交互任务,媲美Claude、GPT-5 智东西着重对GLM-4.6的编程能力进行了体验,发现其不仅相比GLM-4.5大幅提升,能够实现更加复杂的编程任务,完成度更高,且在多个任务中的代码生成质量及预览效果达到与Claude Sonnet 4.5、GPT-5媲美的水准。首先我们还是尝试了“旋转六边形弹跳球模拟”。体验发现,GLM-4.6能够较准确模拟旋转容器的作用、质量对碰撞的影响、能量守恒现象及动量传递效果,并且提供了调整旋转速度、控制重力和摩擦力等控制选项。输入:模拟一个旋转六边形内弹跳球,有两个球体积相同,球a的质量是球b的2倍。GLM-4.6输出: 当我们将同一提示词发送给GLM-4.5,输出效果如下,弹球弹出了六边形边界,模拟效果不如GLM-4.6,且没有更多的控制选项。从这一例子我们可以直观看到GLM-4.6相比于GLM-4.5的代际提升。 GLM-4.6与今日最新发布Claude Sonnet 4.5相比如何呢?如下图所示,这是X平台用户“提示词”展示的一个让他“惊叹”的例子——一次性创建交互式太阳系。这位用户称,在GPT-5尝试相同的提示没有得到有效代码,GLM-4.6是否能胜任? 如下图所示,即便输入非常简单的提示词,GLM-4.6也能理解抽象词“交互式”和天文概念“太阳系”的含义,并进行比较准确的模拟。该控制台模拟了太阳系行星的位置和运转,支持拖动查看3D模型,并且支持调整运行速度和行星大小等变量,看起来丝毫不逊色于Claude Sonnet 4.5。输入:创建一个交互式太阳系的模拟。GLM-4.6输出: GLM-4.6在SVG动画生成的例题中,也实现了超过GPT-5的理解和编程能力。如下图所示,一位X平台用户用GPT-5去生成“水豚骑自行车”的SVG动画,然而动画中却没有准确生成出水豚,令这位用户怀疑:GPT-5好像只会生成训练数据中出现过的内容,或许因为水豚没出现过所以不能生成。 我们让GLM-4.6尝试做了同一道题,发现其快速生成了一个准确逼真的动画——动画版水豚的形态接近真实世界的水豚,且水豚是坐在自行车座位上手扶着车把骑行的,生成较准确。 输入:SVG,水豚骑自行车的动画。GLM-4.6输出: 交互式游戏更加考验大模型的编程能力。当我们让GLM-4.6生成一个简单的3D射击游戏,GLM-4.6快速生成了一个736行代码的程序,预览就是一个具备三维立体感的空间,点击鼠标就可以射击移动物体,并且具有击中奖励效果和计分机制。输入:用Three.JS做一个简单的3D射击游戏。GLM-4.6输出: GLM-4.6在全栈开发方面实现了增强的前端设计、GitHub集成、更长的上下文等升级,我们也尝试了一下。我们要求GLM-4.6生成“速度型集群和力量型相互作用演化”的模拟,这将考察GLM-4.6在前端开发、物理模拟、状态管理、系统架构、抽象建模、简化复杂度、工具链使用等多重能力。如下图所示,GLM-4.6完成了一步实现,不仅模拟出速度型种群快速被力量型种群消灭的物理规律,还通过模块化的控制板,给出了模拟控制、参数设置、种群A和B的动态指标等发展情况,前端视觉效果已经非常美观,可以说“内外兼修”。输入:有两个种群,种群a注重力量的发展,种群b注重速度的发展,请模拟一下两个种群之间的相互作用并给出说明。需要以“小球”的形态模拟出可视化的状态。输出: 除了体验GLM-4.6的代码能力,我们还通过AI PPT制作这一功能,验证了GLM-4.6在文本理解、智能体调用、检索及多模态方面的能力。通过多轮对话,我们直观感受到GLM-4.6的“手眼并用”能力更灵了。其不仅准确理解了生成需求,并围绕主题进行了准确的检索和信息提炼,文本和图片内容都紧扣主题,同时多轮对话指令遵循准确。输入:第一轮:制作一份关于 “当代年轻人新型社交方式” 的PPT。请生成一个4页的PPT大纲,涵盖“搭子社交”、“MBTI社交”、“全职儿女”和“追星社交”四个话题。第二轮:全职儿女更偏向家庭关系,请将这一页替换为关于“City Walk中的社交属性”的内容,并保持与其他页面相同的格式和深度。第三轮:画面有点单调,增加一些时尚视觉元素。在4张PPT中分别添加一些相关的配图。输出: 总的来说,我们发现GLM-4.6相比于GLM-4.5虽然在名称上仅仅迭代了0.1代,但实测效果却有非常直观的提升,并且在一些案例中比GPT-5、Claude Sonnet 4.5效果更好。国产大模型的迭代速度十分惊人,这与我们昨日实测DeepSeek新模型时的感受是一致的。三、国产芯片立刻适配,国产之光降价提质,AI惠及更多人 GLM-4.6发布的同时,国产AI芯片厂商迅速响应。寒武纪与摩尔线程几乎在第一时间完成对GLM-4.6的适配,国产大模型与国产芯片协同效率正超出我们的想象。GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。与此同时,摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势。GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。这一协同效应不仅体现在技术层面,更直接惠及终端用户。随着GLM-4.6发布,智谱同步升级GLM Coding Plan,推出最低20元包月畅玩套餐,让用户以1/7价格享受到Claude的9/10智商。同时其推出GLM Coding Plan企业版套餐,为企业级用户提供兼具安全、成本效益与国际顶尖性能的编码解决方案。此前订阅GLM Coding Plan包月套餐的用户自动升级至GLM-4.6,新增图像识别与搜索能力,支持Claude Code、Roo Code、Kilo Code、Cline等10+主流编程工具。智谱还面向高频重度开发者提供GLM Coding Max,是Claude Max (20x) plan三倍用量。可以看到,国产大模型“提质降价”趋势更加明显,有望推动大模型技术更快普及,让更多开发者和企业能够以更低成本享受到顶尖的AI能力。结语:模型提质降价背后,架构升级与国产芯协同加速 从GLM-4.5到GLM-4.6,智谱AI在短短两个月内实现显著跃进,展现出强劲的技术迭代能力。在模型提质的同时,价格持续下探,让大模型成为广大开发者和企业触手可及的工具。这不仅是单纯的性能提升,更是国产大模型整体技术架构加速升级的缩影。国产大模型与国产芯片的深度协同正在构建更加自主可控的AI技术生态。寒武纪与摩尔线程完成对GLM-4.6的适配,以及DeepSeek与华为、寒武纪等AI芯片的适配,标志着国产AI芯片与前沿大模型已具备协同迭代的能力,为构建自主AI基础设施奠定坚实基础。 -
全国首家机器人体验中心开放!智元开始向大众市场发力了 无锡惠山古镇映月里街区,一间1300平方米的体验中心内,游客被机器人店长带领着四处参观,智元的“远征”“精灵”“灵犀”系列机器人化身服务官,或在炫技舞台上表演后空翻、精准避障等高难度硬核动作,或与游客对弈棋牌、竞技冰壶,或是上演上海戏剧学院编排的主题剧……这就是近日刚开业的全球首个开放式具身智能体验中心的场景。据悉,这家由智元机器人推出、聚焦人形机器人沉浸式互动的场所,是业内首个面向C端消费者开放的具身智能文旅融合项目。它采取“日场+夜场”双运营模式,白天聚焦家庭亲子与大众游客群体,打造轻松趣味的机器人主题演出;夜晚则转型“科技风 Livehouse”,搭配轻食、饮品服务,精准吸引年轻消费群体打卡。 技术体系大阅兵从实验室走向文旅消费场景,不仅是智元机器人商业化的重要一步,也是其技术体系的集中“阅兵”。在舞台上表演各种炫技动作的灵犀X2,在今年9月中旬曾因一段短视频在业内引发震动:它在平地上靠双脚蹬地跃起,在空中完成连续转体与翻腾动作后,稳稳落地,成为全球首个实现“韦伯斯特空翻”的人形机器人。 这项源自竞技体操的高难度动作,要求机器人在0.7秒内完成角动量控制、姿态调整与落地缓冲,被业内视为运动控制技术的“珠穆朗玛峰”,其难度已经超越了众擎机器人的前空翻,以及宇树机器人的后空翻。而担任“服务官”的机器人,可通过Genie Studio平台快速适配文旅场景,具备自定义唤醒词、30余种表情动效及触摸反馈功能,精准响应游客需求,这种“千人千面”的交互能力,正是智元GO-1开源模型跨场景适配的具象化体现。据智元披露,GO-1是全球首个Vision-Language-Latent-Action(ViLLA)架构的通用具身基座大模型,可将视觉语言信息转化为简化动作指令,使机器人在餐桌清理、展品讲解等任务中表现优于同类产品。就在几天前,智元刚宣布将GO-1全面开源;9月22日,智元机器人又以 29.99%持股比例正式控股上纬新材,将产业链布局延伸至基础材料领域;与此同时,智元还宣布获得了业内首张人形机器人CR认证证书,这不仅是产品入场券,更标志着中国在该领域掌握了标准制定主动权。短短几周内的密集动作,让这家成立两年的企业与宇树、众擎等同行逐渐拉开身位。 从打磨拳脚到制定规则在业内分析师看来,相比传统人形机器人侧重单一动作稳定性,智元实现后空翻的突破在于建立了“动态运动通用解决方案”,这使其在工业巡检、应急救援等需要快速适应环境的场景中具备天然优势。而GO-1模型的开源,填补了图像-文本输入与机械动作执行间的语义鸿沟。与多数企业绑定自家硬件的封闭模型不同,该模型已在多家第三方机器人本体及机械臂上完成适配测试,配合集成百万级数据集的Genie Studio开发平台,因此开发者可实现真机一键部署,这相当于安卓系统对功能机时代的颠覆。对比之下,竞争对手仍聚焦于硬件性能迭代。宇树科技创始人王兴兴近日透露,其算法已能支持机器人完成舞蹈、武术动作,计划下半年发布1.8米高的新款机型,但承认“离实时生成任意动作的目标仍有距离”。尽管宇树以4605万元中标中国移动代工项目,且 2025年工业订单同比增长220%,但其模型尚未实现跨硬件兼容,数据集也未通过权威认证。同样为行业瞩目的众擎机器人则仍停留在基础运动能力突破阶段,尚未公开生态布局计划。“当同行还在打磨‘拳脚功夫’,智元已开始制定‘武林规则’。”有业内人士这样分析,后空翻验证硬件实力,模型开源掌握生态主导权,认证抢占标准高地,体验中心扩大市场认知,几大动作形成的协同效应,正让人形机器人行业的竞争边界发生本质变化。随着众多具身智能等企业加速推进上市辅导以募集研发资金,这场竞速赛的差距或将进一步拉大。南都·湾财社记者 胡雯雯 -
Sora模型重磅升级,OpenAI挑战AI视频社交赛道 当地时间9月30日,OpenAI宣布推出一款全新社交媒体应用,依托升级版AI视频生成器Sora 2,用户只需输入文本提示即可生成带音频的高清短片,并能上传视频至虚拟场景中与他人互动。该应用计划率先在美国和加拿大通过苹果App Store以邀请制上线,被认为是OpenAI在视频赛道上的一次重要尝试。AI生成视频的“ChatGPT时刻”?与去年底发布的初版相比,Sora 2在物理规律呈现和提示一致性上均有显著改进。用户不仅可以生成更复杂的画面场景,还可自动添加背景音效、多语言对白及环境噪声,从而形成更逼真的沉浸式短片。新版本还引入“化身”功能,用户能够创建高度拟真的AI头像和声音,并允许其嵌入自己或朋友的视频中。OpenAI视频团队负责人比尔·皮布尔斯(Bill Peebles)表示:“这可能是视频生成领域的‘ChatGPT时刻’。”他举例称,新软件能够生成如“人在水面板上完成后空翻,并展现符合流体动力学的真实效果”这样的复杂画面。OpenAI方面强调,新应用生成的视频将统一加上水印,并禁止利用公众人物形象或单张照片制作视频,以应对市场对虚假内容泛滥的担忧。向Meta等发起更直接的竞争Sora 2采用类似TikTok和Instagram Reels的滑动浏览方式,被认为这显示了OpenAI在AI视频生成与社交领域结合上的野心。业内认为,这不仅是推动AI技术大众化的一步,也可能成为OpenAI探索广告变现的重要路径。当前,ChatGPT的成功已使OpenAI在对话式AI领域占据先机,而在视频生成领域OpenAI则面临来自谷歌、Runway等竞争对手的激烈角逐。业内人士认为,此次推出独立社交应用,是OpenAI迄今为止最接近社交媒体产品的一步,意味着它将在用户注意力和广告市场上与TikTok、Meta等平台展开更直接的竞争。这一升级同样被视为在好莱坞等创意产业中的潜在落地机会。但与此同时,也有声音担忧,大规模普及可能冲击传统影视从业者的生计,并加剧互联网内容“真假难辨”的风险。 -
Opera Neon 正式发布:首款 AI Agent 浏览器 据悉,Opera Neon浏览器正式发布。这是一款付费订阅制的主动执行型AI浏览器,专为大量使用AI的用户设计。首批邀请名额已发放给此前加入等待列表的用户,他们成为“Neon创始人计划”的成员。 Opera Neon的设计初衷是解决用户在多任务处理时的痛点,如在多个标签页、文档和AI聊天之间频繁切换。它通过“任务”功能,为用户提供具备语境理解能力的独立工作空间,支持用户借助AI同时对多个信息源进行分析、对比与操作。此外,Opera Neon还具备“卡片”功能,用户可以创建自定义卡片或从社区资源库中选用卡片,以引导浏览器生成符合需求的响应。“Neon Do”功能能够主动执行任务,如购物、预订等,并且操作过程实时可见,用户可随时暂停或接管控制权。Opera Neon还配备了“制作”工具,可帮助用户创作网站、游戏、视频等内容,并生成专属链接供分享。该浏览器基于Opera浏览器开发,继承了广告拦截器、VPN、书签等核心功能,同时为高级用户提供了更强大的AI功能。