找到
1104
篇与
互联网
相关的结果
- 第 5 页
-
豆包DAU正式破亿,“变现大考”才刚开始 作者 | 李小霞编辑 | 乔芊、杨轩36氪独家获悉,豆包的日均活跃用户数(DAU)已突破1亿大关,字节跳动APP王国里亿级DAU产品再添一子。经过36氪多方求证,该数据属实。据字节内部人士透露,豆包的UG、市场推广费用,是字节历史上,所有破亿DAU产品中花费最低的。有知情人士表示,今年豆包的产品留存还可以。此外,豆包Seedream生图模型、Seedance生视频模型,持续激活创作场景。三宫格等豆包P图玩法连续登上热搜,每天带动的自然下载量高达百万级。字节是国内较早布局AI领域的公司,早在2023年6月,字节就上线了豆包APP,相比之下,kimi于2023年10月9日推出,腾讯元宝2024年5月30日上线,这为其赢得了抢跑的时间。此后,豆包长期霸榜APP下载榜榜首。这一成绩之外,豆包还在有系列密集动作:从推出豆包手机完成 “硬件 + AI” 布局,再到接入抖音电商打通 “AI + 消费” 场景,豆包还试图快速构建覆盖多个场景和生态。产品的爆发离不开技术与组织的支撑豆包大模型所属的字节跳动 Seed 团队,被视为公司核心战略业务,2025年不仅完成了 AI Lab 等多个团队的合并整合,更迎来组织架构升级,吴永辉成为团队 “一号位”,全面聚焦大模型基础研究与应用落地。为激励团队,字节跳动还为 Seed 成员提供了额外期权奖励,并取消部分长期研究项目的季度 OKR 考核。与此同时,豆包的迅猛崛起,正搅动着国内AI应用市场的竞争格局。面对其强大的流量与优秀的关键指标,其他科技巨头也在加紧投入。上半年,腾讯元宝持续发力推广。AppGrowing数据显示,自今年2月开始,元宝的投放金额一路走高,截止到7月的累计投放额近60亿元。元宝也一度登顶中国区App Store免费App下载排行榜。今年年底,随着阿里启动AI to c计划,千问、阿福、灵光先后开启大力度推广。千问更是在上线23天后宣布,月活数据已经超过3000万。据了解,火山引擎将成为 2026 年中央广播电视总台春节联欢晚会独家 AI 云合作伙伴,豆包也将配合上线一些互动玩法。作为全国关注度最高的文化 IP,央视春晚的互动合作历来是公司和品牌必争之地,而抖音曾于 2019 年与 2021 年两次成为春晚的独家互动平台。2025年被视为AI元年,这一年以DeepSeek的横空出世与现象级爆火拉开帷幕;而步入2026年,接过普及重任、扛起让AI深入亿万民众日常这一重任的,或将变成豆包。但字节内部也有声音认为,豆包的商业化还看不到明确路径,大DAU的推理成本,也对公司利润有一定压力。不过,据悉,豆包大模型MaaS服务商业化进展大幅超出预期,通过技术优化实现超高性价比的同时也有不错的毛利。 -
AI走进心理学,还应平衡效率与风险 来源:科技日报科技日报记者 张梦然人的心灵是个复杂而精妙的宇宙,充满了千变万化的思绪、难以名状的情绪和深藏心底的动机。心理学,作为探索这片内在宇宙的学科,其核心在于理解每一个独特个体背后鲜活的生命体验与情感连接。 这种深刻的理解,往往依赖于人类特有的共情、直觉和建立在信任基础上的治疗关系——按通常想法,这些并非仅靠海量数据训练的人工智能(AI)所能真正领悟。然而,随着全球心理健康需求的持续攀升与科技的无界渗透,AI也不可避免地走进了心理学的大门。一方面,AI工具在提升心理学家工作效率、缓解行政负担方面展现出巨大潜力;另一方面,其广泛应用也引发了关于数据安全、伦理偏见和临床可靠性的深切担忧。在此背景下,探讨AI如何以负责任且有效的方式融入这门深度关注人性的学科,平衡其效率与共情,已成为关乎行业未来的核心议题。优势与风险参半根据美国心理学会12月发布的2025年从业者调查,过去一年中,超过一半的心理学家在实践中尝试使用AI工具,但几乎所有人都担心这项技术可能会对他们的患者和社会产生影响。这项年度调查共有1742名心理学家参与。其中56%的心理学家,在过去12个月中至少使用过一次AI工具辅助工作,高于2024年的29%;29%的心理学家表示,他们每月至少使用一次AI,这一比例是2024年(11%)的两倍多。这些技术可以从多方面为心理学家提供支持,例如提供行政支持、增强临床护理等。然而,随着心理学家对AI的了解日益加深,他们也越来越关注其潜在风险。超过九成(92%)的心理学家对AI工具在心理学领域的应用表示担忧,最常见的忧虑包括:潜在的数据泄露、意想不到的社会危害、输入和输出中的偏差、缺乏严格的风险缓解测试以及输出不准确或出现“幻觉”。美国心理学会首席执行官小亚瑟·C·埃文斯博士表示,AI可以帮助缓解心理学家面临的一些压力。例如,提高效率和改善医疗服务的可及性。但人工监督仍然至关重要,患者需要确认,他们依然可以信任医疗服务提供者。截至目前,还很少有心理学家依赖AI直接对患者进行治疗。在使用AI的心理学家中,约有8%的人表示他们只将其用于辅助临床诊断,只有5%的人表示他们使用聊天机器人为患者提供帮助。在利用AI辅助工作的心理学家中,最常见的用途包括:协助撰写电子邮件和其他材料(52%)、生成内容(33%)、总结临床笔记或文章(32%)以及记笔记(22%)——几乎都是日常文书工作。这些往往占用了心理学家大量时间和精力,而他们其实更愿意把这些时间和精力花在患者身上。年轻患者更容易接受AI心理学行业考虑引入AI,其中一项推动因素是全球范围内心理健康服务需求持续增长,这一点在青少年群体中表现得尤为突出。爱丁堡大学最新发表在《英国精神病学杂志》上的一项研究揭示了这一严峻趋势。该研究追踪了1991—2005年间在威尔士出生的儿童,以衡量有多少人在18岁前接受过儿童和青少年心理健康专科服务(CAMHS)。研究发现,在1991年出生的人群中,仅有5.8%的人在成年前接受过CAMHS服务。相比之下,在2005年出生的人群中,这一比例急剧上升至20.2%。这意味着,在不到20年时间里,英国年轻人在18岁前寻求专业心理服务的比例,增长了近4倍。研究负责人伊恩·凯勒赫教授表示,这项研究清晰展现了心理咨询需求(尤其是青少年)的激增,但相关研究却远远不够,人们尚无法彻底了解其背后的原因。年轻患者增多,也暗示着传统工具不足。专家警告说,现有服务可能无法满足当今年轻人的需求。凯勒赫教授强调,与肿瘤科或心脏科服务不同,CAMHS领域的研究和评估远远不够。“心理医生希望提供尽可能最好的护理,但我们需要更有力的现代证据来指导我们的治疗决策。”这种日益增长的供需矛盾,凸显了利用AI等最新技术来提高服务效率的必要性。从另一个角度来讲,一些心理学家们认为,激增的年轻用户对AI助理给出的意见,更为接受和信任。负责任地将AI引入心理学面对AI的潜力和风险,以及不断增长的服务需求,心理学家们需要一套清晰的规范,以确保AI能够安全、负责任地融入他们的工作。美国心理学会对心理学家的建议,体现了这一态度。相关建议包括:通过清晰地向患者传达AI工具的使用方法、益处和风险,获得患者的知情同意;评估AI工具是否存在可能加剧心理健康结果差异的潜在偏见;审查AI工具是否符合相关的数据隐私和安全法律法规;了解提供AI工具的公司如何使用、存储或共享患者数据。AI并非万能药,在与人类心理、情感息息相关的领域,更应谨慎“用药”。AI的角色应定位于一个强大的辅助工具,在人类专家的严格监督下,帮助心理学家从繁重的行政工作中解放出来,将更多宝贵时间投入到复杂的临床判断、建立治疗联盟和人性化关怀中。AI技术可以减轻行政文书上的负担。埃文斯说:“心理学家之所以投身这个领域,是因为他们热衷于改善人们的生活,但他们每天都要花费数小时处理文书工作、应对保险公司繁琐复杂的要求。利用安全且符合伦理的AI,可以提高心理学家的工作效率,使他们能接收更多病人,更好地为他们服务。” -
人工智能塑造科研服务新业态 来源:科技日报科技日报记者 陈可轩AI for Science(人工智能驱动的科学研究,以下简称“AI4S”)如何推动更多社会资源投向科学研究,形成科研服务新业态?在日前中国科协立项支持,中国科技新闻学会主办的“AI4S场景创新”研讨活动上,多位专家对此进行了解读。“AI4S首先带来了科研的自动化,将科研人员从文献分析、试验模拟、数据分析等科研活动中解放出来,从事更需要创造力的工作。同时,AI4S降低了科研的门槛,更大量、更多元的新主体得以从事科研,大批初创企业和行业龙头企业有能力开展高水平的科研活动。”北京市长城企业战略研究所副总经理黄波认为,在AI4S的科研范式中,大模型和大数据正在成为科研突破的关键。“AI4S致力于解决海量科研投入与极其有限的科学发现之间的不平衡,缓解科学生产力供给不足的问题。”北京深势科技副总裁刘会师认为,AI4S应该让科学家有适宜的工具去发展科学。“未来,我们希望科研智能体能够帮助科学家在刚刚产生灵感或思路的时候,就可以快速利用AI完成方案模拟和实验验证。”刘会师说。AI4S正在应用于更多前沿科学领域。例如在材料发现领域,谷歌DeepMind利用GNoME模型,预测了数百万种全新稳定晶体结构,并成功指导实验室合成了数百种新材料。在生物医药领域,其应用更是不胜枚举。在我国,AI4S的科研服务已在制药领域获得全面应用。一些制药领域的上市公司、独角兽企业以及多个获得高额融资的初创企业,已经能够提供AI蛋白质设计平台、生命科学大模型、自动化实验室等AI4S平台服务。用AI来进行虚拟临床试验,将“试错”在计算机上完成,再到真实试验中进行“验真”——未来,AI将大幅提升药物研发的效率。中科计算技术西部研究院研究员赵宇介绍,目前中国科学院计算技术研究所计算医学团队从全部人类基因组数据出发,将疾病模型、功能信息、细胞特征等内容数字化,形成个体数字孪生患者,这使得原本需要基于人体进行的大量临床试验,可以在数字孪生的患者模型中预先进行虚拟临床试验,进而筛选出适宜进行临床试验的患者。在AI4S带来的激励下,商业、资本有更多可能参与科研投资。“这种情况下,科技与商业的融合速度显得非常重要。比如,当科学界发现一个具有制药潜力的新分子时,谁能够率先进行商业化的落地,谁就能抢得先机。”黄波说。“AI4S催生的科研成果还需要一个能够赚钱的商业机制和市场环境。只有‘从0到1’的科研成果能够赚到钱,企业才有创新的动力,才能投入更多资源,支持原始创新。这是AI4S产业化需要面对的问题。”清华大学药学院教授、原副院长尹航说。 -
“产品经理” 王诗沐,造了个 3D 游戏模型丨100 个 AI 创业者 “我其实天生就是一个适合创业的人。” 文丨祝颖丽编辑丨宋玮王诗沐最鲜明的标签曾是网易云音乐创始人。之后,他的职业轨迹就显得有些 “迷失”:在腾讯的几年里,他主导过 NFT、社交电商等创新项目,执掌过腾讯新闻,但都因为业务关停、缩小或战略调整而显得沉寂。2022 年,王诗沐离开腾讯,一度 “消失” 于公众视野。但对王诗沐自己来说,过去一段时间事情一直在沿着他的路线图往前走。他是对内容形态很敏感的人,早在快手和抖音崛起前,他就看到了短视频作为新范式的价值;同时也看到了视频这种媒介的缺陷:它是单向的、被动的、让人沉迷的。在他看来,视频之后的下一代内容形态,应该是 3D——一种具备极强互动性和动态反馈的介质。早在腾讯时,他就开始接触 3D 内容。当时他负责的创新事业部,定下了三个核心点:AI、3D 和区块链。在他看来,这分别代表了新的生产力、新的介质和新的生产方式。AI 加上 3D,也最终成为了他现在的事业。2022 年底,王诗沐创立了全灵(Seele)。他从零开始训练 3D 游戏大模型,直到今年最终完成。接下来,他们还将发布一个 4D “世界模型”,让游戏从 “渲染” 走向 “实时生成”、以及一个统一 3D 理解、生成与编辑的大模型。如今,搭载他们自研模型的网页产品 Seele 已能实现分钟级生成游戏:一个简单的跳一跳或俄罗斯方块,几分钟搞定;复杂的 3D 场景和玩法,几个小时内就能成型。目前,Seele 积累了超过 100 万用户,生成游戏数量超过 3 万个。回看过去,王诗沐遗憾自己 “出来晚了”,这种目标纯粹的创造状态令他沉迷:“我早就该创业了,我现在非常快乐。”炼出一个 3D 游戏模型游戏早就证明了 3D 的吸引力:强互动、高沉浸、参与感极强,但 3D 内容过去没有长出 “平台”,是因为制作门槛太高了。过去二十年,3D 几乎等同于 PGC(Professionally Generated Content 专业生产内容)。一个像样的 3D 游戏,动辄上亿成本、百人团队。UGC (User Generated Content 用户生产内容)在这个世界里几乎没有生存空间。王诗沐一直在思考,能不能把 3D 内容的生产门槛降低。2022 年底他离职创业,在大语言模型尚产品尚未面世前,就已经开始研究 “如何让 3D 内容规模化生产”。那时能用的技术非常原始:GAN(对抗生成网络)、强化学习。做得很慢,也很重,且生成的模型 “泛化性” 极差——比如做完一个欧洲人模型,要切换到亚洲人或动物,几乎得重头再来。很快,大语言模型的爆发彻底改变了规则。用基于 Transformer 的自回归模型(时间序列的统计方法)来做 3D 模型的训练,能将生产效率提高 100 倍不止。然而,训练这套 3D 游戏大模型面临一个 “冷启动” 障碍:数据。互联网上遍地是文本和代码,但高质量的 3D 游戏数据,包括 3D 模型、动画序列、脚本代码,极其稀缺,且分散在艺术家手中。为了解决这个问题,全灵团队采取了一个巧妙的产品策略:他先做了一个名为 koko 的应用。koko 是一个 3D 虚拟人工具,用户可以上传 3D 模型,生成一个可以对话、跳舞的 Avatar(化身)。当时 Chatbot 类型的应用 正在大火,团队利用这个时机,迅速就吸引了三千多位拥有高质量 3D 数据的创作者,并以此积累了最原始的 3D 数据。但拿到数据只是第一步,真正的难题在于如何处理。在 3D 领域,数据的复杂程度远超文本和图片。一个 3D 模型不仅包含几何结构,还包含材质、骨骼动画、物理属性以及它在空间中的交互逻辑。为此,公司内部甚至专门建立了一个近百人的数据团队,“你很难想象,一家创业公司会有一个上百人的数据团队(含外包和实习生)。”通过 koko 积累的数据,团队高精度的标注与清洗,Seele 最终在 2023 年底开始了正式训练,经过一年多的迭代,2025 年 5 月,Seele 游戏大模型第一代诞生了,基于此的产品 “Seeles.ai” 也正式上线。自此,用户只需要输入一段文字,通过与 AI 自然语言交互就能得到一个可运行的游戏。目前这个模型能力还在初期,王诗沐将之定义为 “L1 阶段”,智能水平还只能生成简单的预览版游戏。他预计,大约到 2026 年上半年,其能力上限就可以做出类《动物森友会》级别的复杂游戏;到 2029 年,能做出 《头号玩家》级别的全沉浸式世界。技术驱动的产品对于王诗沐来说,做 Seele 与当年做网易云音乐有本质区别。网易云靠的是市场敏锐度、是对用户的洞察;而 Seele 的底色是技术。对技术理解的深度,不仅会直接影响产品的锻造,还会影响运营以及商业化等方方面面。不同于行业目前普遍采用的 “AI+工具链” 模式——利用模型能力辅助现有工作流进行提效,Seele 相信未来模型的能力足以支撑起商业级游戏的完整生成。因此,他们不想止步于单点工具的开发,而是自研底层模型,试图让用户仅通过多轮对话造出完整的游戏,实现从灵感到完整游戏的 “端到端” 创造。另一个认知是,他们看到,当自回归大模型训练出来后,只要持续迭代下去,未来的边际成本会越来越低。目前 AI 行业普遍面临一个困境:成本无法收敛。一千个用户生成一千张图或一段视频,每一帧都是新的推理消耗。但 Seele 的游戏模型逻辑不同,“游戏是解耦的,一个用户跑步的视频,你没办法把里面的人背景,跑步的动作都分离出来,但是游戏是可以的,因为游戏本质上是分离的数据。”王诗沐解释,他们的用户如果生成相似的射击游戏,里面的建筑、枪械、地图的是多模态对齐的资产;而当另一个用户要做跑酷游戏时,相似风格的建筑资产也是可以复用的。这种资产复用带来的 “成本收敛”,让 Seele 生成一个复杂游戏的边际成本降到了几美金。目前,Seele 主要还主要以会员订阅来收费,但在未来,随着创造一款游戏的成本降到更低,团队不希望不再从用户手上收使用产品的钱,而是通过广告分成来实现商业化。比如,平台通过会算法筛选优质游戏、再进行分发,而创作者就可以通过在游戏中植入广告获得收入分成。“天生适合创业的人”虽然在大公司做到高管,但王诗沐更愿意定义自己为一个 “天生适合创业的人”。他享受创业带来的专注感和目标感,甚至会为了 ‘身体力行’ 搞明白开公司是怎么回事,而亲自去跑工商注册。全灵目前保持着精简的团队规模,正式员工仅 40 余人。未来,他们希望最上限也不要超过 1000 人。他们公司没有专门的 HR,王诗沐亲自负责最后一轮面试,决定新员工能否录用。为了适应大模型的飞速发展,全灵大约每个季度进行一次组织架构调整。 例如,在 2024 年,当技术实验证明 “自回归” 路径优于 “扩散” 路径后,团队迅速取消了按模态(3D、图像、文本、语音)划分的方式,转而进行整体合并。随着 L1 阶段的游戏趋于成熟,公司准备再次调整团队的资源分配。他们目前 70% 的人力资源在模型侧;下一步,他希望加大游戏的发行和商业化的力度,预计未来组织资源分配在模型和产品商业化上将达到 1:1 。王诗沐认为传统的 “诚信”、“正直” 等正面价值观是人类基本道德,无需赘述;在 Seele,他们通过规定 “红线” 来约束组织:不要官僚主义、不要贪污腐败 。在 AI 创业公司普遍争夺最聪明的人时,王诗沐对人才的思路也显得特别。他认为,勤奋的作用比聪明更重要;为了理解图形学底层逻辑,他们核心团队曾全员利用工作之外的时间,在一个月内都看完了几十个小时的专业视频课程(Games 101),这让他们整个团队都拉齐了对 AI 技术的理解。他也不迷信顶级名校或多年资历,而是倾向于相信年轻人的学习能力 。全灵公司里,现在就有 2024 年毕业的非名校本科生直接参与大模型训练,并已能独当一面。十几年前,刚做出网易云时,王诗沐说自己有一种 “春风得意” 的感觉,感受的是大江大河、时代汹涌的推背感;再次置身 AI 的浪潮里,他觉得自己已经淡定得多。他偶尔焦虑,但从不痛苦,因为创业带给他的专注、自由以及掌控的 “快乐” 已经足够多。为呈现创业者的个人特点和保留思考的完整度,以下为部分对王诗沐的采访问答,与正文互为补充:晚点:你创业,选择的为什么是 3D 游戏这个切口?王诗沐:我看好 3D,也不只是说它的商业价值大。显然,是我觉得 “互动” 对人类的价值是很高的。人本质上是个社交型的群居的动物,你一个东西的互动性很强,并且能打破时空限制的话,是可以大大增强人类的交互性的。晚点:有必要自己做一个模型出来吗?为什么你们有能力做,怎么做?王诗沐:如果能够广泛降低生产成本的话,那 3D 交互会成为人们互相交流的新的想象空间。所以,怎么样去能够把这个互动成本趋近于 0,这是我们首要去考虑的问题。以前人们互相发短信是一毛钱,后来发微信,你有个包月流量,这个边际成本趋近于零了。那从终局来思考的话,要达成的是技术范式的转变,意味着我们要选择一个边际成本持续往下降的技术路线。我本科本来也是学这个计算机图形方向的,我原来在浙大的 CAD 实验室。第一个就是我们自己学,我去读了大量的论文,然后看了大量的视频,自己一步步地去搞明白,要实现这个大模型到底需要什么东西,有哪些模块。也去找对应的,能做出这样技术路线的人才,能力图谱就是理解大模型结合游戏,但对游戏的理解,不需要特别深,尤其忌讳太深。因为如果你是一个游戏行业非常资深的人,会觉得我们这个做法有点太搞笑或者是太小儿科,一开始是绝对出不来高质量的东西的。晚点:从产品经理到自己做模型,是个转型吗?王诗沐:我对自己的定义不是一个产品经理,我不喜欢给人打标签,也不给自己打标签。我觉得做产品是一项综合能力,包括原来我在网易云音乐的时候,我很早就开始搞算法。网易音乐一开始的那个私人 FM 的算法,我还自己写,还去看过 meta 所谓的信息流推荐,我觉得一个好的产品经理要有很综合的能力,不只是说我调研一下用户需求、市场需求,写一下 PRD,到后面他需要有很好的架构能力,商业思想,还有技术理解能力。你的综合能力越强,你才能操这个盘,所以我肯定是很勤奋努力的。晚点:你们想用 AI 降低生产 3D 游戏的门槛,但有那么多用户有创造游戏的需求吗?而且它似乎比做一个视频对能力要求更高?王诗沐:游戏门槛是不是会更高?不会。电子游戏是经过专业人士是去制作的,它的制作、程度非常复杂,因此你会觉得这个游戏我肯定做不出来。但你对一个小孩说跳房子,他只要看别人跳过一遍,马上会跳。打弹珠也是。游戏互动是人类的天性,仔细想想看,从我们小时候出生开始,什么东西不用教,你只要是个人你就能学会的?婴儿从小就会摸,会玩,会跟周围环境互动,互动是人类的天性。晚点:但 “互动” 是游戏吗?王诗沐:其实游戏是非常宽泛的。为什么最早的时候把它定义成 “第七艺术”,现在可能大家不怎么提了,反而越来越往 3A 游戏这个方向去靠?这个是个资本化的结果,我不否认。但是一旦游戏的生产门槛降低,你时空打破了,自然会有更好玩的内容,会有大量的个性化的内容涌现出来。晚点:你们现在游戏大模型能力下,上限能做到什么?王诗沐:坦白讲,我们目前整个游戏大模型的技术还在起步偏起步阶段。现在平台上,超越我们认知的,一个是有用户做出来一个挺好玩的第一人称射击游戏;一个开放世界游戏。晚点:你现在怎么回想在网易的经历?王诗沐:我自己其实比较少去想。那个时候确实很年轻,我是 86 年的人,网易云上线的时候,我 26 岁,三个创始人之一,确实是有一种春风得意的感觉。到了 2016 年,我 30 岁的时候,整个网易云也做起来了,后面的整个增长势能也是挺好的。我也没有觉得荣耀或者是什么,可能比较喜欢沉浸在做产品的感受中。那个时候做网易云,我觉得很强的感受是大江大河、整个时代潮流在汹涌;现在,我仍然处于时代洪流之中,但是我淡定很多,我能够很清晰感受到这个潮水的浮浮沉沉,但整个人会看得更加清楚,心智会更加坚定。晚点:你在腾讯获得了什么?王诗沐:有更多创新的机会。我在腾讯是开始从零去做孵化器,要从战略层面思考,比如为什么选 3D,当时找了几个关键点,我是逐层一点一点去摸索,从零开始。在网易云音乐,我虽然是早期的员工,但是网易做音乐这件事情并不是我决策的,这个是丁老板决策的,我是个执行者,但是到了腾讯,我要去想做什么?应该怎么做?还有没有机会和价值?这个过程中就会更进一步,中间也会有很多的困难和挫折,然后再复盘。晚点:在腾讯的几个产品(小鹅拼拼、幻核)都关了,你觉得算是失败吗?王诗沐:如果纯粹从产品角度上来讲,那当然是失败了,对吧?因为最终下线了。但我能够辩证地看。因为腾讯是一家很大的公司,他的战略决策不是以产品为单元的。比如说,腾讯需不需要需要电商,我觉得是需要的,但腾讯需不需要小鹅拼拼我觉得要打个问号。所以我会拆分来看。包括像幻核也是,我们当时做了半年的时间,营收很可观,其实对于创业公司来讲不得了,但对腾讯这种体量的公司来说,新业务场景还在早期探索阶段、合规边界尚在确立中,所以他要有一个调整,我也可以理解。晚点:从大公司做管理,到自己创业,你发生了什么变化?王诗沐:我从来不觉得自己是大公司里 “典型” 的人,我其实天生就是一个适合创业的人。我只是阴差阳错。因为我在内陆环境生长起来的,年轻的时候胆子没那么大,眼界没那么开。我二十来岁的时候,树立的理想是做个产品总监,年薪 10 万。这个是真事儿,我跟我爸妈都讲过。我后面到了 30 岁左右,才开始更加了解自己,我真正人生想追求的并不是金钱,或者是纯粹的地位,我就是喜欢创新、创造,所以我就应该创业。22 年下半年出来创业的时候,我第一个感受是我创业晚了。我早就该创业,16 年就应该创业。我现在非常快乐,我快乐不是指自己多成功,而是指我整个人的生活状态,我很享受。我并不觉得这些困难、苦恼让我难受。我记得我没创业之前,看到一些文章,有很多人焦虑什么的,我也会焦虑,但是我从来不痛苦。晚点:你觉得自己是是个什么样的创始人?王诗沐:亲力亲为。我们公司现在没有 HR,HR 就是我,然后有一个财务同学是今年才入职。最开始那个公司的工商注册,包括融资都是我自己去跑的,就是给公司省钱。当然不是说我抠门到几百块钱都不愿意出,而是我不觉得这个东西是浪费我的时间、浪费我的精力。我反而身体力行,觉得得搞明白公司工商实际上它是个什么东西。我觉得这个应该去做,我们公司现在大概 50% 的员工都是我过往十多年老同事,阿里的、网易的、腾讯的大家互相都有所了解。题图来源:Seele 创始人王诗沐 -
之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025 “大语言模型受限于「语言的边界」,无法理解高维度、跨模态的科学数据。”作者丨胡清文 编辑丨徐晓飞12月12日,第八届GAIR全球人工智能与机器人大会在深圳正式启幕。本次大会为期两天,由GAIR研究院与雷峰网联合主办,高文院士任指导委员会主席,杨强院士与朱晓蕊教授任大会主席。作为观测AI技术演进与生态变迁的重要窗口,GAIR大会自2016年创办以来以来,始终与全球AI发展的脉搏同频共振,见证了技术浪潮从实验室涌向产业深海。2025年,是大模型从“技术破壁”迈向“价值深耕”的关键节点,值此之际GAIR如期而至,携手智者触摸AI最前沿脉动,洞见产业深层逻辑。大会上,之江实验室科学模型总体组技术总师,天壤智能CEO薛贵荣博士亲临现场,为参会者带来了一场精彩纷呈的演讲分享。薛贵荣博士指出,以大语言模型为代表的AI技术虽已在多个学科研究中展现出潜力,但其本质上仍受限于“语言的边界”,难以真正理解高维度、多类型的科学数据,更无法独立完成可验证的科学发现。基于此,薛贵荣博士系统分析了大语言模型与科学基础模型之间的本质差异,并详细阐述了之江实验室所研发出的021科学基础模型在突破语言维度、统一化科学数据、科学推理与发现,跨学科知识融合等方面的关键优势。同时,他提出一些关于面向“AI+科学”新范式的思考:1、大语言模型在解决科学问题上还存在很大的局限,在覆盖100多个学科的高难度HLE测试中,表现最优的模型目前也只达到了25.4%的准确率。2、要想解决科学问题,大科学基础模型的需要超越语言空间,做到真正理解化学、天文学、地球科学、生命科学、材料科学等各类科学知识。3、科学基础模型与当前的大语言模型之间的主要差别是,大语言模型以文本数据作为Token化的基础,而科学基础模型所对应表达的Token是跨学科、多类型的科学数据。4、要想把科学数据Token化得先解决OneTokenizer的问题,就是把光谱、化学结构、DNA数据等结构化之后统一到一个高维空间中。5、将科学数据Token化对齐后可以建立起不同类型数据之间的关联,就可以在解决不同学科、不同专业的科学问题时做出全链路解析。6、为打破大语言模型解决科学问题的局限性,之江实验室推出了021科学基础模型,在对科学世界形成客观认知的基础上,具备迅速、精准、高泛化性的科学知识问答能力。精彩演讲回顾现场演讲完整视频,详见链接:https://youtu.be/NZ4nW4cegLg以下是薛贵荣博士演讲的精彩内容,雷峰网作了不改变原意的整理与编辑:01 为什么说大语言模型不够用了? 接下来我跟大家介绍一下我们在之江做的工作,科学基础模型。大家都知道今年我们国家发布了“人工智能+”战略,其中的第一个就是+科学技术。那么科学技术有什么作用?如何训练将它转变成真正的基础模型呢?我们就这些问题跟大家介绍一下。AI+科学是非常具有挑战性,但也同时也非常exciting的领域。上个月美国发布了“创世纪计划”,类比于曼哈顿计划。曼哈顿计划大家都知道,美国集合了非常多的工程师与科技人员,一起攻坚了一个历史上最重要,并且是规模最大的科技工程项目。这次的“创世纪计划”,也被定义为“AI曼哈顿计划”,美国集合了17个国家实验室、4万名科学家,是冷战以来对联邦科技资源的一次最大动员。这个计划非常详尽,对于不同时间点的任务部署有着明确规定,作为国家科技工程项目,势必要人工智能技术在科学领域做出重大产出。 这个项目的相关负责人Dario Gil提出,如今人工智能科学应用可以用对话的方式作为开始。正如AI真正的价值不只是写论文的摘要,更重要的是能够形成可验证的结果。需要调用模型以及实验室在几十年间积累的数据,形成一个可验证、可迭代的数据集,通过训练模型,并最终应用到科技行业当中。人工智能在科技里的应用其实非常早,我主要讲述大语言模型在科学研究中的应用。 这是一份美国的报告,聚集了很多科学家共同研究如今的人工智能在科学发现能解决什么样的问题?一共总结出了5个部分,多模态和多尺度学习、迁移学习、数字孪生、实验设计和交互学习。那么今天的AI,在科研当中究竟起到什么作用呢?这份报告显示,他们又找了1600名研究人员,其中三分之二认为人工智能工具提升了数据处理的方法,另外有超过一半认为人工智能加快了计算速度,节省了成本和时间。2024年,当今数学界最年轻的教授陶哲轩提出,到2026年,人工智能会成为数学研究中值得信赖的新合作者。他个人非常积极地应用AI来做科学研究,最近他也频繁使用大语言模型解决数学难题,例如最近他使用GPT-5Pro成功探索了微分几何难题“有界曲率球体问题”的本质。这件事最有趣的是他并不擅长这个领域,也就是说:今天,我们能够借助人工智能,解决更多科学领域问题,科学的人工智能时代已经来临了。OpenAI最近也有一个计划:要把人工智能用到科学当中,早前9月3日,OpenAI宣布启动一项新倡议——OpenAI for Science,想要打造一个由人工智能驱动、加速科学发现的平台,并实现了如量子场论的推导过程和干细胞相关的蛋白质优化等相关问题的研究。最近,OpenAI又招了一名主要做黑洞研究的天文学家亚历克斯·卢斯帕卡,来帮助找寻宇宙银河系中黑洞的所在位置。这个研究人员之前也是做这方面理论研究的,之前他花费数日才计算出来的“黑洞扰动理论中新对称性”的精确形式,GPT-5 Pro仅花30分钟就解决了。02 科学基础模型如何补齐 LLM 的科研短板? 虽然大语言模型解决了很多科学问题和推理,但大语言模型要想真正服务于科学,还面临着非常多的挑战。语言是人类交流过程中表达思想的一种符号,它是人类认知的皇冠上的明珠,正如Ludwig Wittgenstein所说:“语言的边界,就是世界的边界。”今天大家都纷纷想用能够代表我们认知的语言模型,来解决科学问题。然而根据HLE发布的最新研究结果,大语言模型在科学知识与推理方面暂时没有达到人类认知的极限,在覆盖100多个学科的高难度HLE测试中,表现最优的模型目前也只达到了25.4%的准确率。 所以目前要用大语言模型来服务科学,其中仍然存在很大的挑战。要想真正服务于科学,需要模型能够跨越语言的边界,做到真正理解所谓的分子、基因、地震、光谱等各种各样高维的科学数据。众所周知,一张图片胜过千言万语,图片是另外一种让我们能够表达思想的重要渠道,但后来我们发现,在科学数据中还有一种更复杂的东西,叫做光谱。刚刚我们说一张图片胜过千言万语,而一张光谱胜过千万张图片。无论是遥感图片,还是在化学实验室中做实验分析,我们都会用一个非常重要的仪器,就是光谱拍摄仪,而拍出来的东西就是光谱数据。这些数据不仅能告诉我们它是什么,还可以告诉我们它表达了什么样的波段值,是由什么元素构成的。还有一类生命科学数据就是基因。基因信息量非常大,每个人携带的基因序列大概是30亿个。有人做了一个分析,一个咖啡杯容量的DNA可以存储世界上所有的数据。人类所携带的这么长的基因序列,它能表达的信息量也是非常高维的。接下来就是地球科学研究的一个典型数据叫地震波。地震波其实就是地球的语言,在告诉我们哪个地方会发生地震,或者有可能会发生地震。当然,我们通过地震波不仅仅只是预测地震,我们还可以知道地下的结构。要想找油探矿,就必须清楚地了解地下的空间结构,而地震波分析就是非常好的手段,类似于我们看光谱一样,地震波也是非常复杂的数据表达。根据香农的信息论和经典语言学模型来看,自然语言实际是一种低维的离散符号系统。而科学数据包含时间、空间和能量等更高维的特性,它需要表达的维度空间,要远远大于语言所能描述的空间。 从上面这张图可以看到,语言表达只是非常小的一部分。再看右边,这是我们人类疾病关联到的所有学科的知识维度,大概是二十几维。如果只是纯粹用语言来表达我们所看到的世界,空间会非常小,或者说没办法完全表达我们所理解的世界。我们希望,科学的基础模型能够解决这个难题。科学基础模型和如今的大语言模型之间存在本质的差别。首先是数据维度,当前的大语言模型还是以文本数据作为Token化的基础。但科学基础模型所对应表达的科学数据Token化,是科学空间加上语言空间。因此要表达的维度要远超语言。这里所指的空间不仅包括我们刚刚讲的一系列空间,它是跨学科、多种类类型的。这其实是一件非常有挑战性的事。而这一切的前提,就是如何有效的对科学数据进行Token化,即解决Tokenizer的问题。所谓的OneTokenizer,就是把我们见到的所有东西尽量都统一到一个科学数据当中。包括我们刚刚说到的所谓的光谱、化学结构、蛋白质结构、DNA、地震波数据等等,我们都希望把它结构化到一个空间里面。 当然,这些数据本身有它所表达的数据,比如分子式。我们希望哪怕是用文本描述,也可以将它们区隔来表示。比如同样一个C,在分子式、蛋白质、DNA,以及正常的英文单词当中,它所表达的意思是有区别的。这是一件很复杂的工作,这个事情要真正做好,不仅需要AI科学家团队,还需要很多科学家跟我们一起合作完成。这就是我们正在做的工作,我们正在把基因组学、细胞组学、光谱、晶体材料、时序数据、空间结构数据等全部Token化,将它们放到一个空间当中。其次是,Token化之后,很多事情就对齐了,这也是数据治理非常重要的事。刚刚郑宇老师讲了很多城市数据要对齐,其实科学数据也需要对齐。科学数据对齐以后就有真正的科学发现了。我举四件案例来解释一下对齐的价值:1、动物迁移&环境变化。大家都知道大雁南飞,那么为什么要往南飞呢?是随着温度变化在本能的飞行吗?通过地球的温度数据以及鸟的迁移会发现,鸟的迁移是根据温度的变化在选择路径的,其实是通过感官角度来做这个事。2、住房密度&温度。这也是跟城市相关的数字,这个数据如果能很好地对齐,非常有助于我们做科学规律的发现。3、GDP变化&夜光分布。我们在太空拍摄的夜光图片以及城市GDP的变化,相互之间也是有关系的。4、卫星上&望远镜上拍摄太空。这两种观测方一种拍摄的图像质量高,一个拍摄的图像质量低。同时对一颗恒星进行拍摄的时候,其实本身已经做到了对齐,但数据质量不一样,把两个数据一起拿来,可以进行新的数据发现。把数据Token化,建立数据与数据之间的关联,从而保证不同学科或同一学科、不同专业之间的对齐,就像将DNA、蛋白质、疾病表征的对齐,我们就可以进行全链路的科学解析。从0到1,我们训练了科学基础模型。这个过程也很复杂,不仅仅需要有足够的算力、数据,同时也要有高效的模型训练系统。我们做了预训练、到CPT、Long CPT、SFT、CoT SFT,再到强化学习。现在我们还在内测中。以上就是我们科学基础模型的技术探索,因为没有参考对象,是从零到一的创新,所以我们的科学基础模型就命名为021。03 科学基础模型的应用场景有哪些? 接下来我介绍一下这个模型的应用场景。其实我们用了非常多的专业科学知识,这是它的大概分布图,涉及数学、物理、化学、计算机等19个重要学科,覆盖174个领域的科学知识。这些领域,需要花大量的人力成本来收集数据,大概是几个T的Token,相较于互联网语料,真的只占1%的规模。所以这个数据未来如果想做大,如果想做Scaling Law,还有很大的挑战。当然我们也在不停收集新的数据纳入进来,比如实验室的实验数据。其次是科学推理,基于这个模型我们可以根据一段语言的描述,通过对话的方式,做分子结构的生成、编辑、修改,达到它所要求的性能。这些原本需要通过高通量的实验,需要花上几个月到一年的时间才能够做到的事情,今天通过对话方式很快就可以做到。 同样,我们也打穿了从基因到疾病诊断的整个流程,能做从基因组学到细胞生物学、病理学、临床医学的整个链路。上图中就是一个基因的突变,我们想知道它是良性的还是恶性的,就可以用这个模型来获得答案。因为我们训练了非常多的科学数据,这应该是当前世界上从基因到疾病精准诊断流程精度最好的模型。在将来,我们希望所有的人能享受到这样的模型服务,所以语言也是非常重要的,我们这个模型支持应用全世界204种语言。做这个科学基础模型,非常挑战的是需要非常多的科学家参与进来。那么怎么搞这件事呢?我们也有三套路径。首先是种子班。我们跟天文、地学、材料科学、生命科学等很多国家实验室、高校、企业建立了大模型种子班,大家一起共创。他们派几十个做科学的人,我们这边派几十个做计算的人,大家一起来了解这件事怎么做。但前提要求是大家得相互了解,所以我们培训他们来了解模型,他们培养我们来认识什么是该领域的关键数据、关键问题。其次是科学家工作坊。我们建立了科学家工作坊。刚才我们碰到的那些问题,都是科学家告诉我们的,我们一起开展联合合作,请他们过来跟我们一起干三个月或半年,他们可以带他们的学生。当前我们在跟国内、国际的一些专家在做深度协同创新。我们深知这个事的难度,所以我们希望越来越多的科学家能够参与进来。所以我们也发起了一个倡议,希望通过全球征集各学科的科学问题,来探索人工智能在科学领域的极限,当然我们也设立了奖金池以及一揽子科研支持方案。第三是开放研究平台。我们开发的所有数据、模型都会在zero2x平台上进行开放。zero2x平台是一个开放科学研究平台。我们希望更多的人能够来直接使用平台进行科学发现,也可以通过平台跟我们一起进行科学研究的创新。本次报告的最后,我们希望,通过科学基础模型,真正推动科学研究范式的变革。让我们一起加速科学的人工智能时代到来,谢谢。 -
京东最新回应“仓库被盗”:法国巴黎仓库已恢复正常运营 来源:中国证券网上证报中国证券网讯(记者 冯心怡)12月23日晚,京东向上证报表示,北京时间12月22日,位于法国巴黎地区的京东仓储遭遇盗抢,当地警方已介入调查处理。京东称,目前仓库已恢复正常运营,相关方面披露的“重大损失数据”,与实际情况有较大出入。此前,有消息援引外媒报道称,京东位于法国塞纳-圣但尼省的仓库遭窃,超过5万台3C数码设备(包括手机、电脑和平板电脑)被盗,价值约为3700万欧元,折合人民币3.06亿元。京东表示,近年来,京东加速推进“全球织网计划”,已在全球23个国家和地区建设了超130个各类型海外仓,并合法合规运营。“我们将持续建设好超级供应链,为广大企业和用户提供高质量的物流服务。” -
法国仓库被指遭盗窃损失超3亿元 京东深夜回应 12月23日晚,京东表示,北京时间12月22日,位于法国巴黎地区的京东仓储遭遇盗抢,当地警方已介入调查处理。京东称,目前仓库已恢复正常运营,相关方面披露的“重大损失数据”,与实际情况有较大出入。此前,有媒体援引外媒报道称,京东位于法国塞纳-圣但尼省的仓库遭窃,超过5万台3C数码设备(包括手机、电脑和平板电脑)被盗,价值约为3700万欧元,折合人民币3.06亿元。京东表示,近年来,京东加速推进“全球织网计划”,已在全球23个国家和地区建设了超130个各类型海外仓,并合法合规运营。“我们将持续建设好超级供应链,为广大企业和用户提供高质量的物流服务。”来源 上海证券报编辑 成嘉怡审核 毛迪 王晨郁校对 崔劲峰 -
机器人租赁从零散服务到生态化布局,打通走向大众的“最后一公里” 封面新闻记者 孟梅 易弋力12月22日,全国机器人租赁生态峰会暨擎天租平台发布会在上海举行。会上,“智汇众力 共擎新元” 机器人租赁平台“擎天租”发布。“擎天租”有何创新?能够解决哪些行业痛点?智元AGIBOT合伙人、擎天租董事长姜青松接受了记者采访。当前,机器人租赁从零散服务走向生态化布局,一场构建行业规则的变革正在悄然进行。为汇聚行业智慧、链接生态资源,推动机器人租赁产业标准化、规模化发展,“擎天租”平台应运而生,旨在构建全链路价值共创和分享机制,共启机器人租赁的全新纪元。智元AGIBOT合伙人、擎天租董事长姜青松在演讲中回顾了机器人租赁行业的发展历程,指出当前市场对机器人租赁存在的切实需求和行业面临的现实难点。在市场需求的助推下,“擎天租”平台汇聚用户、租赁商、内容开发者与本体设备商等多方力量,将放大机器人租赁行业的整体价值,定义RaaS(Robot as a Service)新时代,打通人形机器人走向大众的“最后一公里”。姜青松还在现场分享了“擎天租1234战略计划”,即2026年实现10+本体厂家-200+金牌服务租赁商-3000+内容创作者-400000+租赁客户,并对机器人租赁行业表达出强大的信心:“我们主张‘智汇众力 共擎新元’——只有凝聚产业链各方的力量,才能共同开拓这个崭新的时代。我们的终极信念一直是‘以智能机器创造无限生产力’,让高效、灵活、智能的机器人服务渗透千行百业,真正将前沿科技转化为驱动社会进步的强大动能。”记者了解到,“擎天租” 平台的核心创新是将高门槛的机器人使用场景转化为类似共享充电宝的便捷租赁模式,从而打破当前机器人租赁市场运营成本高、合作链路复杂、内容同质化严重等行业痛点,让企业和用户能按需便捷租用机器人。姜青松向记者进一步解释称,一是搞租赁联盟,将机器人通过租赁的方式让大众的生活变得更简单一点,因为机器人到目前为止是在探索当中,大家对机器人使用最多的方式还是文艺表演居多,这样是比较孤岛式的,都是运营合作商找客户,或者是在各种媒体上发布视频来引起大家的兴趣,这样用户租机器人比较难。二是租赁商想把机器人卖得贵也比较难,没有那么大客户的路径。所有的是孤岛性、割裂性的,我们想把大家组织在一起来进行信息沟通和分享,进一步提高效率,在平台点一下机器人过几个小时或一天就能够到你手上。擎天租让大家能在平台上快速地拿到想要的机器人和服务。大会分享环节中,多位行业代表带来了机器人应用的生动实践与前瞻展望。海底捞信息科技部副部长杨炫之分享了智能机器人如何重塑其服务体验与运营效率;浙江硅基方舟机器人有限公司总经理刘宇袖表达了对构建内容开发生态的合作展望;广州火花机器人有限公司CEO韩义阐述了共创、共享机器人行业生态的实践路径;中国人民财产保险股份有限公司浙江省分公司副总经理曹明华,则探讨了保险机制如何助力机器人产业实现高质量发展。 -
Alphabet(GOOGL.US)重磅加码AI数据中心:以47.5亿美元收购清洁能源商Intersect,“绿色”破解缺电瓶颈 智通财经APP获悉,谷歌母公司Alphabet(GOOGL.US)已同意以 47.5 亿美元现金加上现有债务收购清洁能源开发商Intersect Power LLC,这是该科技巨头为大幅扩展其人工智能数据中心规模而进行的最大规模交易之一。这项收购旨在为Alphabet旗下的谷歌提供更多电力,以满足其数据中心的需求。由于人工智能等因素的影响,美国老旧的电网难以满足数十年来首次出现的电力需求激增。此前报道称,谷歌去年通过与Intersect合作,在数据中心园区附近建设大型发电厂,从而获得了这家能源供应商的少数股权。Alphabet首席执行官Sundar Pichai在一份声明中表示:“Intersect将帮助我们扩大产能,更灵活地建设新的发电设施,与新的数据中心负荷同步增长,并重新构想能源解决方案,以推动美国的创新和领导地位。”人工智能竞赛推动了数据中心和电力行业的并购活动。例如,软银一直在研究潜在的收购目标,其中包括数据中心运营商Switch Inc.。Sandbrook Capital周一宣布,随着电力需求的增长,该公司将收购公用事业公司United Utility Services。能源咨询公司 Wood Mackenzie Ltd. 的 Ben Hertz-Shargel 表示,Intersect 的这笔交易标志着大型科技公司首次收购一家主要的可再生能源开发商,并且“再次确认了谷歌用清洁能源为其数据中心供电的意图”。与亚马逊(AMZN.US)和微软(MSFT.US)一样,谷歌一直在努力平衡其雄心勃勃的气候目标与人工智能日益增长的能源需求。2024年,该公司表示,由于数据中心运营,其碳排放量在过去五年中增加了48%。Intersect是一家由私募股权公司TPG Inc.支持的清洁能源解决方案提供商,致力于为大型数据中心提供电力,包括光伏和电池储能项目。今年,该公司与多家超大规模数据中心运营商保持密切联系,推广其位于德克萨斯州的巨型设施。Intersect首席执行官Sheldon Kimber称德克萨斯州为“能源界的迪士尼乐园”,因为那里拥有丰富的风能和太阳能资源。Hertz-Shargel 表示,Intersect公司目前运营着约7.5 GW的太阳能和储能项目,另有8 GW的项目正在开发中,其中大部分位于数据中心聚集地德克萨斯州。(1 GW大约相当于一座核反应堆的输出功率,可为约75万户家庭供电。)据该公司网站显示,Intersect在美国拥有价值150亿美元的能源资产,这些资产目前已投入运营或在建。据 Alphabet 发言人称,作为交易的一部分,Alphabet 将收购 Intersect 的电力开发平台和团队,包括谷歌已经签约的现有开发资产。Intersect将保留其独立于谷歌的品牌,并继续由Kimber领导。该公司在德克萨斯州和加利福尼亚州的电网资产以及已签约给其他客户的资产(部分已投入运营,部分正在开发中)将不包含在此次收购范围内。此前曾投资Intersect的TPG Rise Climate将保留这些资产的股份。Hertz-Shargel 表示,这项交易也降低了谷歌面临的监管风险。她指出,如果像Intersect这样的第三方公司为谷歌数据中心供电,可能会被视为侵犯当地公用事业公司的特许经营权,但谷歌自行为其设施供电则不会。他说:“谷歌通过收购开发商,而不仅仅是电力购买协议,获得了在需要的时间和地点进行建设的灵活性。” -
苹果已修复:MacSync窃密恶意变种通过“合法签名”绕过Mac检查 IT之家 12 月 23 日消息,科技媒体 bleepingcomputer 昨日(12 月 22 日)发布博文,报道称信息窃取恶意软件 MacSync 近期出现重大升级,其最新变种成功绕过了 macOS 的 Gatekeeper 安全检查。Gatekeeper 是苹果电脑里的“安检员”,当用户打开一个从网上下载的软件后,它会检查这个软件有没有“身份证”(数字签名)以及是否经过了苹果官方的“体检”(公证)。如果一切正常,它才允许软件运行,否则会拦截并警告。Jamf 安全研究人员发现,MacSync 恶意软件的最新变种采用了一种更为隐蔽的传播方式。与以往依赖“诱导用户运行终端命令”或“ClickFix”等低级战术不同,该变种被封装在一个名为 zk-call-messenger-installer-3.9.2-lts.dmg 的磁盘镜像中。 有效的数字签名和公证,图源:Jamf 研究人员指出,该恶意软件伪装成一个经过代码签名和公证的 Swift 应用程序,拥有合法的开发者团队 ID(GNJLS3UYZ4)。这意味着它能够欺骗 macOS 的 Gatekeeper 安全系统,让用户在安装时不会收到常规的安全警告,从而在毫无察觉的情况下感染系统。 反混淆后的有效执行代码,图源:Jamf IT之家援引博文介绍,MacSync 为了进一步规避安全检测,植入了一系列反分析机制。首先,该恶意软件通过嵌入诱饵 PDF 文件,将 DMG 安装包的体积人为膨胀至 25.5MB,这种“文件膨胀”策略通常用于绕过某些不仅检测文件特征还限制扫描大小的自动化安全沙箱。 膨胀的磁盘镜像内容,图源:Jamf 其次,该程序在执行前会主动进行互联网连接检查,以判断自身是否运行在隔离的测试环境中。此外,一旦负载解码并执行完毕,恶意软件会自动擦除执行链中使用的脚本,以此抹除入侵痕迹,增加取证难度。作为 Mac.C 恶意软件家族的衍生物,MacSync 的主要目标是窃取高价值用户数据。根据 MacPaw Moonlock 的分析,该窃取程序能够提取 iCloud 钥匙串凭证、浏览器存储的密码、系统元数据以及加密货币钱包文件。该恶意软件最早于 2025 年 4 月(注:原文时间)由威胁行为者“Mentalpositive”发布,并于同年 7 月开始在网络犯罪生态系统中活跃,与 AMOS 和 Odyssey 等同类恶意软件争夺市场份额。针对这一威胁,Jamf 研究人员在分析确认后立即向苹果进行了通报。苹果方面迅速采取行动,目前已正式撤销了被该恶意软件滥用的开发者证书,意味着该特定签名的变种将无法再通过 Gatekeeper 的验证。 -
OpenAI承认Atlas浏览器提示词注入攻击难以根治 IT之家 12 月 23 日消息,尽管 OpenAI 正致力于强化其 Atlas 人工智能浏览器的网络攻击防御能力,但该公司承认,提示词注入攻击 —— 一种通过操纵人工智能智能体、使其执行隐藏在网页或电子邮件中的恶意指令的攻击手段 —— 带来的风险短期内无法消除。这也引发了人们对人工智能智能体在开放网络环境下能否安全运行的质疑。 OpenAI 在当地时间周一发布的一篇博客文章中详细阐述了该公司为增强 Atlas 的防御能力、抵御持续攻击所采取的措施,并写道:“提示词注入攻击就像网络上的诈骗和社会工程学攻击一样,几乎不可能被完全‘攻克’。”该公司坦承,ChatGPT Atlas 的“智能体模式”“扩大了安全威胁面”。据IT之家了解,OpenAI 于今年 10 月推出了 ChatGPT Atlas 浏览器,随后安全研究人员迅速发布了相关演示,证明只需在谷歌文档中输入寥寥数语,就能改变底层浏览器的行为。就在同一天,浏览器厂商 Brave 也发布博客指出,间接提示词注入攻击是所有人工智能驱动型浏览器面临的系统性挑战,Perplexity 公司的 Comet 浏览器也未能幸免。意识到提示词注入攻击威胁将长期存在的并非只有 OpenAI 一家。英国国家网络安全中心本月早些时候发出警告,称针对生成式人工智能应用的提示词注入攻击“或许永远无法被完全缓解”,这使得各类网站都面临数据泄露的风险。这家英国政府机构建议网络安全从业者,应着力降低提示词注入攻击的风险及影响,而非寄希望于将这类攻击“彻底阻止”。就 OpenAI 而言,该公司表示:“我们将提示词注入视为一项长期的人工智能安全挑战,未来需要持续强化防御措施。”那么,面对这项永无止境的任务,OpenAI 给出了怎样的解决方案?答案是建立一套主动式快速响应机制。该公司称,这套机制已初显成效,能够在新型攻击手段被用于“实战攻击”前,提前在内部发现这些攻击策略。这一思路其实与 Anthropic、谷歌等竞争对手的主张并无本质区别:要应对提示词注入攻击的持续威胁,必须构建多层防御体系,并持续开展压力测试。例如,谷歌近期的研究重点就聚焦于智能体系统的架构层面与策略层面管控。不过,OpenAI 采取了一种与众不同的策略 —— 开发“基于大语言模型的自动化攻击程序”。本质上,这是一款由 OpenAI 借助强化学习技术训练而成的机器人,其作用是模拟黑客行为,寻找向人工智能智能体植入恶意指令的途径。这款机器人可以先在模拟环境中测试攻击手段,再投入实际应用。模拟环境能够还原目标人工智能在遭遇攻击时的思维过程与可能采取的行动。随后,机器人可分析目标的反应,调整攻击方式,并反复进行测试。这种能够洞悉目标人工智能内部推理逻辑的优势,是外部攻击者所不具备的。因此从理论上讲,OpenAI 的这款机器人发现系统漏洞的速度,要快于现实中的黑客。这是人工智能安全测试领域的一种常用方法:打造一个智能体,让它找出系统的极端漏洞场景,并在模拟环境中开展快速测试。OpenAI 在博客中写道:“我们通过强化学习训练的攻击程序,能够诱导目标智能体执行复杂且需要多步骤推进的有害任务流程,这些流程的操作步骤可达数十步甚至数百步。此外,我们还发现了一些全新的攻击策略,这些策略既未出现在我们的人工红队测试中,也没有相关外部报告提及。” 在一份演示案例中(上图为部分截图),OpenAI 展示了其自动化攻击程序如何将一封恶意电子邮件植入用户收件箱。当人工智能智能体后续扫描收件箱时,它执行了邮件中隐藏的恶意指令,发送了一封辞职信,而非按要求撰写休假自动回复邮件。不过 OpenAI 称,在完成安全更新后,“智能体模式”已能成功检测到提示词注入攻击的企图,并向用户发出告警。该公司表示,尽管要实现对提示词注入攻击的万无一失防御难度极大,但仍在依靠大规模测试与更快速的补丁更新周期,力争在相关攻击手段出现在现实世界之前,完成系统防御加固。针对 Atlas 的安全更新是否已显著降低攻击成功率这一问题,OpenAI 发言人拒绝透露具体数据,但表示该公司早在 Atlas 浏览器发布前,就已与第三方机构合作,共同强化其针对提示词注入攻击的防御能力。网络安全公司 Wiz 的首席安全研究员拉米・麦卡锡指出,强化学习技术确实能实现对攻击者行为的持续自适应防御,但这只是解决方案的一部分。麦卡锡在接受科技媒体 TechCrunch 采访时表示:“衡量人工智能系统风险的一个有效方法,是计算其自主性与访问权限的乘积。”他进一步解释道:“智能体浏览器恰恰处于这一风险模型中的高挑战区域:它们拥有中等程度的自主性,同时又具备极高的系统访问权限。当前许多安全建议,其实都反映了这种利弊权衡。比如限制登录状态下的访问权限,主要是为了减少暴露面;而要求对各类确认请求进行人工审核,则是为了约束智能体的自主操作权限。”这两点也被列入 OpenAI 向用户提供的风险降低建议中。该公司发言人还表示,Atlas 浏览器经过训练,在发送邮件或执行支付操作前,都会向用户发起确认请求。OpenAI 同时建议用户,应向智能体下达具体明确的指令,而非直接授予其收件箱访问权限,简单告知其“自行采取必要措施”。OpenAI 指出:“即便已部署安全防护措施,过高的自主操作权限也会让隐藏的恶意内容更容易对智能体产生影响。”尽管 OpenAI 声称,保护 Atlas 用户免受提示词注入攻击是公司的首要任务,但麦卡锡仍对这类高风险浏览器的投入产出比持怀疑态度。他在接受 TechCrunch 采访时表示:“对于大多数日常使用场景而言,智能体浏览器目前带来的价值,尚不足以匹配其当前的风险水平。由于它们能够访问电子邮件、支付信息等敏感数据,因此风险系数极高 —— 但与此同时,也正是这种高访问权限赋予了它们强大的功能。这种利弊平衡状态未来或将逐步改善,但就目前而言,其中的取舍权衡依然十分显著。” -
构筑自主创新的智能基座 百度以大模型驱动产业跃迁 在城市的道路上,红绿灯仿佛学会了思考,依据实时车流自主调优,悄然缓解拥堵;在广袤的田野间,电网巡检无人机沿输电线路飞行,高效完成巡查……建立在自有技术体系之上的国产大模型,正深度融入产业肌理、助力千行百业转型升级。其中,百度持续夯实自主智能底座,致力于以大模型驱动产业跃迁。 当前,“人工智能+”行动深入实施,推动人工智能与经济社会各行业各领域深度融合。“十五五”规划建议明确提出,“深入推进数字中国建设”“加快人工智能等数智技术创新”。 目前,一系列中国企业自主研发的大模型,正凭借前沿的技术突破、全栈的自主根基与广泛的产业实践,日益成为服务数字中国建设、驱动经济社会高质量发展的智能底座。百度基于文心大模型与飞桨深度学习框架打造的人工智能基础技术底座,正助力千行百业提高效率。 以实力获认可,努力跻身世界第一梯队 当前,全球人工智能竞争日趋激烈,我国凭借超大规模市场、丰富应用场景和快速工程化能力,为大模型技术迭代与产业落地提供了独特而丰厚的土壤,也构筑了全球领先优势。 据今年7月举行的世界人工智能大会数据,我国已发布大模型1509个,占全球已发布总量的比重达40%,数量居世界首位。在规模领先的基础上,国内企业推出的先进模型在国际权威评测中屡创佳绩,进一步展现了我国人工智能技术的硬核实力与迭代能力。 国际评测榜单是衡量大模型技术实力的重要标尺。在国际知名人工智能模型评估平台LMArena的最新排名中,百度文心大模型的文本能力位列全球第二、国内第一,在创意写作、复杂长问题理解、指令遵循等方面表现突出,视觉理解能力位居国内第一,展现出国际一流水平。 同时,以百度文心为代表的国产大模型,正在关键技术维度上持续探索与创新,对全球开源生态作出了贡献。 在汇聚全球开发者的开源平台,中国模型的“能见度”显著提升。百度文心开源的思考模型ERNIE—4.5—21B—A3B—Thinking一经发布即登上开源社区Hugging Face的全球模型总趋势榜榜首;百度文心衍生模型PaddleOCR—VL发布16小时内也登顶Hugging Face的全球模型总趋势榜。优质中国大模型架构与技术路线,正吸引全球开发者广泛应用,汇聚全球智慧进行二次创新。 国际知名专利检索公司Questel数据显示,百度在深度学习与大模型领域的专利申请数量位居全球第一。这些可量化的评价,共同印证了百度人工智能技术能力已进入世界第一梯队。基于此,百度将继续参与并奋力推动全球人工智能发展。 实现自主可控,全栈技术体系夯实发展底座 人工智能是新一轮科技革命和产业变革的重要驱动力量,其底层能力的自主可控,直接影响产业发展的主动权。 构建从芯片、框架、模型到应用的全栈技术体系,是在人工智能领域赢得市场与国际竞争的关键。近年来,百度致力于在“体系竞赛”中取得关键性突破。 深度学习框架相当于“智能时代的操作系统”。百度前瞻布局,自主研发飞桨深度学习框架,并以此为基础开展大模型训练,形成了从框架到模型的自主技术路径。飞桨作为中国首个产业级开源开放平台,不仅开发便捷、高效稳定,更能支持超大规模大模型训练。这意味着,百度不仅在文心大模型层面具备竞争力,底层的“操作系统”也实现了自给自足,为自主发展人工智能筑牢基底。 向下扎根,离不开强大的算力底座。百度自主研发昆仑芯系列产品,与飞桨、文心深度协同,目前,昆仑芯已迭代三代,为AI产业化落地提供强大算力支撑。由此,百度打造了一条覆盖“昆仑芯(芯片)—飞桨(框架)—文心(模型)—千行百业(应用)”的自主可控的完整技术链。这种全栈式的布局,不仅确保了技术链条的安全可靠,更能形成从真实产业场景反馈驱动技术迭代的闭环,让大模型越用越聪明、越用越贴合产业实际需求,为人工智能产业自主创新探索一条切实可行的路径。 以应用为方向,大模型加速赋能实体经济发展 技术的价值,最终要由应用来检验。衡量大模型成败的关键,在于其能否在实体经济的主战场上“落地生根”,切实转化为生产效率的提升与商业模式的革新。 当前,大模型技术正沿着“降本增效”“流程再造”“模式创新”等路径,在国民经济重点行业中寻找突破口。工业仿真、金融服务、科研辅助等领域已涌现出一批成功案例,验证了技术赋能产业的实际价值。 在能源领域,智能技术正成为保障关键基础设施安全、提升运营效率的重要力量。通过大模型与行业知识的深度融合,传统能源系统的运维模式得以革新。百度与国家电网联合打造了千亿级光明电力大模型,其构建的全国统一AI平台,已实现无人机自主巡检规模化应用,年巡检杆塔超过500万基,人工登塔次数减少40%,显著提升了电网运维的安全性与效率。 在高端制造领域,人工智能驱动的研发范式变革,正大幅缩短产品创新周期、提升设计精度。基于大模型与科学计算相结合的新型仿真手段,为解决复杂工程问题提供了全新路径。百度携手中国中车集团构建的空气动力学仿真大模型,将高铁动车外形设计周期从数月缩短至数分钟,推动研发创新加速。双方还合作研发出虚拟传感器模型,在不增加硬件的前提下,实现了更精细的设备健康管理,故障检测准确率在现有传感器检测的基础上提升了10%。 在城市治理领域,大模型正化身“智慧大脑”。北京市海淀区接诉即办系统每月受理量大,涉及部门多、类型杂,过去依赖人工标签统计,标准不一,导致派单、处置、统计和预警等多方面工作难度大。系统接入百度文心大模型后,依托大模型的交互能力,提升接诉即办座席办理效率和准确性,大幅度提升工作效能。 从上海交通大学的AI for Science科研平台,到服务超千万开发者的智能代码助手“文心快码”,从支撑高拟真数字人进入电商直播间,到赋能金融、法律、招聘等服务行业提质增效,百度文心大模型的产业生态日益繁荣。 从跻身全球技术前沿,到构建全栈自主体系,再到深耕产业沃土,百度文心大模型的成长路径愈发清晰:以技术创新夯实底座、以场景应用驱动落地、以开放协同拓展边界。 人工智能正深度融入经济社会发展的各领域、全过程,以大模型为代表的人工智能技术,日益成为构筑现代化产业体系、提升社会治理效能的重要基础能力。百度将持续夯实自主智能底座,助力完善产业融合生态,推动技术攻坚与产业赋能并重、自主创新与开放生态协同,为高质量发展注入强劲动能,为全球人工智能创新贡献智慧和力量。 数据来源:百度 -
以AI之名,亚马逊、微软等美巨头今年已裁员近5.5万人 IT之家 12 月 22 日消息,据 CNBC 报道,裁员已成为 2025 年就业市场的一个显著特征,多家大公司在人工智能的推动下宣布裁员数千人。 据咨询公司 Challenger, Gray & Christmas 的数据显示,今年美国因人工智能导致的裁员人数已接近 5.5 万人。2025 年美国全年裁员总数达到 117 万人,创下自 2020 年新冠疫情以来的最高纪录,2020 年底公布的裁员人数为 220 万人。数据还显示,10 月美国雇主宣布裁员 15.3 万人,11 月裁员人数超 7.1 万人,其中当月有超 6000 人的裁员直接归因于人工智能技术。在通胀高企、关税增加企业成本,且各大公司纷纷寻求削减开支的背景下,人工智能成为解决这一问题的诱人短期方案。IT之家注意到,麻省理工学院于 11 月发布的一项研究表明,人工智能目前已能承担美国劳动力市场 11.7% 的岗位工作,并有望在金融、医疗保健及其他专业服务领域节省高达 1.2 万亿美元的薪资成本。并非所有人都认为人工智能是大规模裁员的真正原因。牛津互联网研究院人工智能与就业领域助理教授法比安・斯蒂芬尼此前接受采访时表示,人工智能或许只是一个借口。斯蒂芬尼指出,许多在疫情期间业绩表现良好的公司“大幅超编招聘”,而近期的裁员行动实则可能是一次“市场出清”。他补充道:“从某种程度上来说,这些公司是在解雇那些原本就缺乏长期可持续发展岗位的员工。他们不愿承认‘我们在两三年前的招聘决策出现了误判’,反而找了一个替罪羊,声称‘裁员都是人工智能惹的祸’。”以下是 2025 年公开将人工智能列为裁员及重组战略一部分的几家头部企业。亚马逊10 月,亚马逊宣布启动公司历史上规模最大的一轮裁员,削减 1.4 万个企业岗位,以便将资源投入到以人工智能为核心的“重大战略押注”领域。亚马逊员工体验与技术高级副总裁贝丝・加莱蒂在一篇博客文章中写道:“这一代人工智能是自互联网问世以来最具变革性的技术,它正推动企业以前所未有的速度实现创新…… 我们坚信,必须精简组织架构,减少管理层级,强化权责归属,才能以最快速度为客户和业务创造价值。”亚马逊首席执行官安迪・贾西在今年早些时候就已预警过裁员计划,他告知员工,人工智能将缩减公司的员工规模,这家科技巨头未来“从事部分现有工作的人员会减少,而从事其他新型岗位的人员会增加”。微软2025 年全年,微软累计裁员约 1.5 万人,其中 7 月公布的最新一轮裁员涉及 9000 个岗位。微软首席执行官萨提亚・纳德拉在致员工的备忘录中表示,公司需要“重塑新时代的使命愿景”,并进一步强调了人工智能对微软的战略意义。纳德拉称:“在人工智能时代,赋能的内涵是什么?这不仅仅是为特定岗位或任务开发工具,更是要打造能让每个人都自主创造工具的平台。这正是我们正在推动的转型 —— 从一家软件工厂,转变为赋能个人与组织构建所需一切、实现发展目标的智能引擎。”Salesforce9 月,Salesforce 首席执行官马克・贝尼奥夫证实,借助人工智能技术,公司已裁减 4000 名客户支持岗位员工。贝尼奥夫在接受《洛根・巴特利特秀》播客采访时表示:“我已将客户支持团队的规模从 9000 人缩减至约 5000 人,因为我们不再需要这么多人力。”今年夏天,贝尼奥夫就曾透露,人工智能已经承担了公司内部近 50% 的工作任务。IBM今年 5 月,全球科技巨头 IBM 首席执行官阿尔温德・克里希纳向《华尔街日报》透露,人工智能聊天机器人已取代了数百名人力资源岗位员工的工作。不过,与其他借人工智能之名裁员的企业不同,克里希纳坦言,IBM 同时在软件工程师、销售、市场营销等需要更强批判性思维能力的领域扩大了招聘规模。11 月,IBM 宣布在全球范围内裁员 1%,此次裁员或将影响近 3000 名员工。Crowdstrike网络安全软件制造商 Crowdstrike 于 5 月宣布裁员 5%,涉及 500 名员工,并直接将裁员原因归咎于人工智能技术的应用。Crowdstrike 联合创始人兼首席执行官乔治・库尔茨在一份证券备案文件的备忘录中写道:“人工智能一直是我们运营模式的核心基石。它不仅平缓了我们的招聘增长曲线,还帮助我们加速了从创意构思到产品落地的创新进程;它简化了产品上市流程,提升了客户服务效果,并推动公司前台与后台部门实现全面增效。人工智能已成为驱动公司各项业务发展的强大倍增器。”Workday人力资源管理平台服务商 Workday 公司是 2025 年首批以加大人工智能投入为由宣布裁员的企业之一。该公司于 2 月宣布裁员 8.5%,涉及约 1750 个岗位。Workday 公司首席执行官卡尔・埃申巴赫表示,此次裁员是为了优先保障人工智能领域的投资,从而释放更多资源。 -
255次“异常”退货退款都能成功,暴露出什么问题? 半月谈评论员 王淑娟 魏雨田 近期,山东一消费者通过多个账号下单高价商品,“巧妙”掉包后退回低价物品,半年内接连操作225次“异常”退货退款,导致涉事商家直接损失超5万元,如今已被警方立案调查。随着该事件持续发酵,涵盖食品、服饰、箱包、数码产品等多个品类被“薅羊毛”的电商商家,纷纷选择跨省维权。这一现象深刻折射出当前电商领域买卖双方的权益失衡困境。“仅退款”“七天无理由退货”等本是保障消费者权益的制度设计,如今却被少数人滥用,让商家维权深陷“举证难、成本高、渠道堵”的泥淖,亟需以制度之力校准权利天平。消费者的“后悔权”有着明确法律边界。《中华人民共和国消费者权益保护法》规定的无理由退货,以“商品完好、不影响再次销售”为前提,绝非任性退货的“尚方宝剑”。2024年5月6日,国家市场监管总局发布的《网络反不正当竞争暂行规定》更明确指出,“恶意批量购买后退货或者拒绝收货等”行为已构成违法。一些“恶意掉包”人士的高频退货行为,早已超出合理维权范畴,而是对商家合法权益的恶意侵害,这与职业“代退”等黑灰产利用规则漏洞牟利的本质如出一辙。商家跨省维权的无奈,暴露出电商纠纷解决机制的短板。现实中,商家举证面临着多重困境:买家借助AI技术伪造商品破损证据、通过多个账号轮换购买退货退款、平台对首次恶意行为多从轻处置、大促期间审核周期延长……更棘手的是,跨省维权的时间与金钱成本,往往远超商品本身的价值。权利失衡的根源,在于“疏堵”机制的双重缺位。“堵”的层面,对恶意退货的识别与惩戒不够精准,平台黑名单尚未实现跨平台共享,违法成本远低于商家损失。“疏”的层面,商家正规维权通道不够畅通,全国范围内仍缺乏统一高效的纠纷解决体系,导致商家被迫选择“跨省追讨”这种原始维权方式。构建健康电商生态,需筑牢“三维治理”防线。平台要扛起主体责任,利用大数据建立恶意退货识别模型,对高频异常退货行为及时预警,既要惩戒不良商家,也要识别恶意买家。监管部门宜加快完善规则,细化“恶意退货”认定标准,推动跨区域监管协作。司法机关可以探索电商纠纷速裁机制,降低商家维权成本,让合法权益得到快速保障。买卖双方本是共生关系,消费者的合理诉求应被尊重,商家的合法权益更需守护。越来越多商家自发跨省维权的事件警示我们,任何权利的行使都不能突破法律与诚信的边界。唯有让恶意退货者付出代价,让商家维权有章可循,才能让“仅退款”“七天无理由退货”回归制度初衷,让电商市场在公平公正的轨道上实现良性发展。 来源:半月谈新媒体 编辑:张子晴