分类互联网下的文章 - 第 4 页 - 智观行业

登录

找到 1958 篇与互联网相关的结果 - 第 4 页

专访火山引擎谭待：模型好对MaaS是最重要的事，豆包2.1算「上牌桌」了

专访火山引擎谭待：模型好对MaaS是最重要的事，豆包2.1算「上牌桌」了文 | 邓咏仪编辑 | 张雨忻火山引擎总裁谭待来源：火山引擎过去三年，火山引擎总裁谭待给团队定 MaaS（模型即服务）营收目标的过程，也重复了三次：年初，定一个很高的目标，团队都觉得太难了，完不成；到了年中，“居然完成的差不多了”，随后目标再度上调。2026 年初，字节的视频模型 Seedance 2.0 让火山引擎迎来了一场漂亮的开门红。作为云市场的后来者，火山引擎乘着 AI 的风，实现了让行业意想不到的增长。“两年前我就和大家说 MaaS 是个大生意，当时你们都不信。”谭待对36氪说。从 2025 年下半年开始，Coding 和视频模型陆续解锁了商业化生产的场景，这让大家发现，现阶段，模型的能力边界依旧难以预测，顶尖模型是 MaaS 服务当下最核心的增长引擎，甚至没有之一。在 6 月 23 日的火山引擎 Force 大会上，字节新一代旗舰模型豆包大模型 2.1 Pro 登场。这也代表着字节在视频生成之外，模型侧终于补上了 Coding 的拼图。谭待对豆包大模型 2.1 Pro 的定义是，在 Coding 和 Agent 能力方面，“终于可以上桌了”。在知名编程评测 Terminal Bench 上，豆包大模型 2.1 Pro 已经能与 Claude Opus 4.7 基本持平，在长程任务，复杂任务上都表现优秀，达到可用门槛。来源：火山引擎这是火山更在意的市场。Coding/Agent 能力的进步，意味着模型能进入更多企业、个人的核心生产环节。换句话说，也能创造更多商业价值。除了旗舰模型，火山还带来了一系列模型更新，包括 Seedance 2.0 4K 版、图像生成模型 Seedream 5.0，豆包语音生成模型 1.0 ，以及即将在 7 月发布的 Seedance 2.5。“视频生成模型其实是世界模型的其中一种实现方案，并且目前来看，是一种比较成熟的，可以通过无监督的方式进行大规模扩展的技术方案。” 谭待提到，Seedance 模型，因为表现出对物理世界精准的还原与理解，这也使得高质量的视觉数据合成更可行，加速了具身智能、无人驾驶等等领域的研究进展。2024 年，我们访谈谭待时，他认为大模型才刚到“大哥大”时代；两年后的今天，已经快进到了功能机——大模型不再是少数人的玩具，而是真实地进入到了更多人的生活和工作中。目前，火山在 MaaS 市场已经做到行业领先水平。最新的数据是，相较 2025 年底，火山的日均 Token 消耗量又提升了50%，达到 180 万亿，相比两年前增长超过 1500 倍；“万亿俱乐部”（累计 Token 消耗达到万亿量级）的客户数也实现翻倍，超过 200 家。来源：火山引擎谭待说，随着这次发布的模型，以及今年还有可能发布的模型，火山今年的营收目标已经上调。这背后是模型的定价逻辑有所变化。2024年，火山曾经是最早让大模型降到“地板价”的厂商，但这次大会上，他们不再谈及这点。“2024 年之所以降价，是因为所有模型能做的就是 Chatbot，模型就值那个价。”他对36氪表示。但如今，模型已经能够进入到核心生产环节。这也引出了一个更大的问题：当大模型真正进入到更多行业的核心生产环节，AI 究竟会给云行业带来什么变化？2024 年底，有人曾经问谭待：如果卖 API 就能挣钱，为什么还要做云？后者曾经被认为是长坡厚雪的好生意，但经过十多年发展，在国内也已经卷成红海。在谭待看来，这个问题本身就不成立。MaaS 和云从来不是对立关系——未来的云，更可能是用 Agent 去调度 IaaS、PaaS、SaaS，传统云不会消失，而是会变成 AI 云的一部分。“基于模型和 Agent 构建的新负载，可能是传统云的 10 倍、20 倍大。”谭待也反驳了“MaaS 服务没有忠诚度”的观点。“云计算早期卖主机的时候也没有粘性，” 他说，“现在大家对 AI 用得还比较浅，等模型真正进入一家企业的核心生产系统，耦合性就大了。”很显然，当下无论是火山还是其他云厂商，都把 AI 当作最重要的、甚至唯一的增长引擎。谭待觉得这是理所当然的：“如果回到 2012 年字节成立那一年，你会在那个时间点大做 PC 搜索吗？”而接下来留给火山的问题则是：要如何在 MaaS 市场中一直赢下去？谭待对此还没有一个完整的答案，但有一件事是确认的，也是难度最大的，那就是：要让模型长期保持领先。一、模型终于真正进入了核心生产环节 36氪：过去一年，火山增长得很快，核心驱动力来自哪里？谭待：本质是因为模型解锁了真正的生产级场景，进入了核心生产环节。越是有挑战、有价值的生产力场景或环节，解锁之后带来的价值就越大。一条主线是视频生成，Seedance 是全球第一个真正解锁了商业化生产场景的模型。另外一条主线是 LLM/Agent，生产级的解锁是去年 Claude Opus 4.6 出来之后做到的。Cursor 有个分析：Agent 自动完成代码和点 Tab 补全代码这两种模式的比例，在Claude Opus 4.6 出来之前，点 Tab 补全的比例是更高的，但在那之后，就发生了逆转。说明 4.6 之后，模型的能力有了很大提升，能真正用在生产级的 Coding 和 Agent 场景上了。36氪：怎么判断 Seedance 2.0 真的做到了商业化生产？谭待：Seedance 2.0 出来之前，大多数视频模型都是用来生产些 UGC、PGC 的娱乐视频，比较难应用到严肃创作场景，比如电影、电视剧、广告。我们从用户的用量情况里也可以看到这个变化：以前，视频生成模型的用量是周末大于工作日的，跟很多娱乐类的 C 端产品一样。但 Seedance 2.0 出来之后就不是这样了，它的工作日负载会比周末大两倍以上，说明大家真的是用它在工作。视频生成也是通往世界模型的路径之一，在实体产业中有很大的应用潜力。Seedance 已在具身智能、工业制造、智能驾驶等领域落地，为数据合成、场景仿真、流程演示等业务需求提供新的工具能力。36氪：Seedance 2.0 出来前，你们内部预料到了会大爆吗？谭待：也不算大爆吧。我们本来还定了一个更激进的目标呢，但现在看起来完成还是有挑战的。36氪：Seedance 2.0 为什么能做到这么好的效果？谭待：它是我们综合能力的体现。你要把视频生成做好，需要有比较好的语言模型作为基础，并且图片生成、以及 VLM（视频理解模型）的能力也要够强。Seedance 2.0 做得好，可以认为它依托了豆包本身的能力。这是我们相比单纯做视频模型的垂直公司的一个重要优势。还有一个点是，中国的内容创作领域在全球来看都是很活跃的。中国最早做出最好的视频模型，跟这有关系。36氪：一些市场声音觉得视频生成领域的战争已经告一段落了，字节占据了统治级地位，你怎么看？谭待：还没到那个阶段。整个 AI 在视频生成上的渗透率其实还非常低。现在外界过多关注了 Seedance 的短期收入，忽视了 Seedance 的技术价值。视频生成是一种比较成熟的，可以通过无监督的方式进行大规模扩展的技术方案。Seedance 模型表现出对物理世界精准的还原与理解，这也使得高质量的视觉数据合成更可行，加速了具身智能、无人驾驶等等领域的研究进展，在实体产业中会有非常大的应用潜力。而且 AI 如果真的创造价值，不是要替代过去，而是让这个行业整体变得更大。36氪：这次 Force 大会，你们也发了新的旗舰模型豆包大模型 2.1，你们怎么定义这个模型？谭待：我觉得豆包大模型 2.1 Pro 已经达到了可用的标准，可以对标 Claude Opus 4.6 的水平，进入到了 Agent 的可用门槛。豆包大模型 2.1 也标志着我们在 Coding 领域真正上牌桌了。这是很重要的事，国内真上牌桌的还没有几个。36氪：你们对“可用”的定义是？谭待：有几个特点：第一，Coding 能力很强。在数字世界里 Coding 能力强意味着你能灵活地调用脚本、调用工具，泛化能力也很强。第二，能完成复杂的通用 Agent 任务。这意味着要能更好地调用工具，有长程任务的能力，跟记忆有好的结合，能适配各种 Harness 和框架，还要有很好的 VLM 能力——很多输入是要通过视觉处理的，比如 Computer Use。第三，具备可规模化应用的能力。如果模型很好但价格太贵，是不行的；延迟太高，比如 Throughput（吞吐量）20多毫秒也不行；模型还要能大规模支持更多服务。豆包大模型 2.1 在这些方面都做得非常不错。Coding 能力跟 Claude Opus 4.6 比的话，也能超过。规模化应用方面，豆包 App 刚上的任务模式，就是用豆包大模型 2.1 来做的。36氪：在 Coding 场景，你觉得中国的模型什么时候才算是真正追赶上来了？谭待：大概会在今年 Q2 的时候。虽然很多模型以前都说我要比肩谁谁谁，但光说是没用的。你如果真的追上了、甚至超越了，大家会为你付费。看 ARR 就能知道你到底有没有做到。36氪：和视频相比，为什么国内在 Coding 场景上速度整体要慢一些？谭待：首先，全球范围来看 LLM 的竞争都是更激烈的。第二，我们起步还是晚的，Anthropic 和 OpenAI 起步早非常多，Coding 这个方向也是他们最早定义并且发力的。我们起步晚，现在整体进度比人家晚也正常，它本来就是很难的一件事。36氪：原来 Seed 还有单独的 Coding 模型 SeedCode，现在还会做吗？谭待：豆包大模型 2.1 发布后就没有了，Coding 和 Agent 能力都合到主版里面去了。模型现在迭代太快了，我们不想等一两个月才发一次版，所以现在出了一个新的系列叫 Seed Evolving，它在豆包大模型 2.1 的基础上，每一两周就会更新一次。36氪：这是主要面向开发者群体的模型吗，围绕 Coding 和 Agent 方向做优化？谭待：不只是开发者。有的企业追求模型的稳定表现，不要有惊吓也不需要惊喜，那他们直接用豆包大模型 2.1 就行。但还会还有很多人就希望始终能用到最新最智能的版本，Seed Evolving 就是来满足他们的。但它不是小白鼠版本，会有很严格的评估。36氪：你们现在两条生产级场景的主线都解锁了，那 LLM 和视频生成，你觉得目前哪个更重要？谭待：站在我的角度，LLM 其实更重要一些，它能创造的价值空间更大。虽然我们的现状是 Seedance 卖的多一点，但我希望后面 LLM 能成为大头。二、要让模型充分释放能力，还需要一个“中间层” 36氪：一个市场共识是，现在是模型牵引产品增长的年代，大家会觉得模型足够 SOTA 就能卖得好，那火山的价值怎么体现呢？谭待：我们能做的其实有很多。模型能力越强，责任越大。比如，春节前 Seedance 2.0 就火了，但火山的 API 推出至少晚了两个月，到 4 月份才推出。我们在干啥呢？主要就是在做版权保护的事。因为我们觉得，模型推理要做好，Guardrail（模型护栏）也很重要。我们看 LLM，它的模型能力其实是通过 Harness 才充分释放出来的。现在 Seedance 其实还缺少一层属于它的 Harness。我们最近就在思考，应该怎么和行业结合，把不同模型的这层 Harness 做起来？我们现在就有 FDE（前沿部署工程师）的团队在跟各个行业一起做这个事情。36氪：展开讲讲，各行各业需要有什么样的Harness？谭待：比如在影视创作领域里，有很多数字资产没有被管理起来，很多技能也没有积累起来，这些都限制了模型的发挥。我们觉得未来在视频创作领域，也会有像 Claude Code 这样的东西出来。36氪：视频领域的 Harness，必须字节自己做吗？谭待：我们会跟大家一起合作，重要的是要找到懂这个事情的人。Coding，因为程序员很懂，所以能做出对应的 Harness。那么视频创作领域，你也得懂创作流程，所以我们最近也在努力给团队招导演。比如说，这次Seedance新上线的功能“3D白模预演”，就是来自一位业内知名导演，也是火山引擎客户的建议。科幻电影里有很重要的一个制作环节叫“白模”，可以来表达场景、人物关系，剧情怎么推演，把白模作为参考，直接让模型生成对应镜头，我们也是全球第一个在视频模型上线这个功能的。36氪：那你觉得现在视频模型的能力还没有被充分释放出来吗？谭待：不能这么说。视频模型在国内的落地速度是快的，因为有一个很不错的中间层——中国的视频创作领域一直很活跃，所以创作者能很敏感地知道怎么用这些新技术，作为中间层把 API 变成内容，最终商业落地。当然，火山在这个过程里也还有优化的空间。36氪：LLM（大语言模型）的落地也是难在没有中间层吗？谭待：如果 SaaS 生态足够好的话，是可以做一个桥梁的。国内 SaaS 基础是比较薄弱的，终端的企业直接用上 API 有点难。当然反过来想，也意味着有弯道超车的机会。36氪：企业客户现在最关心的是“模型怎么落地”的问题吗？谭待：大家都相信 AI，但 AI 在我这个企业怎么落地，确实大家还不是特别清楚。有一类场景已经走通了从 0 到 1，变成更具体的需求问题了，比如 Seedance 的客户会跟我们说，我要 4K 版本。还有一类是复杂问题，特别是针对非 Digital Native 的企业，它要怎么通过 AI 最终产生业务价值，这还需要我们陪跑，给建议。36氪：现在模型的边界还很模糊，怎么能够在模型迭代很快的时候，又做好企业端的落地？谭待：落地有敏态和稳态两种方式。稳态是把工作流程抽象出来，通过 AI 改造；敏态是把好的工具给人，让大家广泛尝试，试出好的实践再用稳态落地。对于敏态来说，陪跑是很重要的事情。36氪：你觉得 MaaS 市场要再往下一个阶段走，还差什么？谭待：还是模型，模型需要更好。另外各个行业相关的 Harness 要能做出来。三、火山会成为一个纯 MaaS 公司吗？ 36氪：听说一鸣在 2024 年问过你，既然卖 API 或者卖 Token 可以挣钱，为什么还要做云？谭待：不是他问的，是别人问的。36氪：那你现在会怎么回答这个问题？谭待：我一直讲的一个观点是， MaaS 就是云的一部分，不要把 MaaS 和云对立起来看。两年前 MaaS 规模还特别小，我当时老说 MaaS 会是个很大的生意，毛利也不错，但别人都不信，都觉得我们在亏钱卖。36氪：什么时候大家开始信了？谭待：就是今年。今年老黄（黄仁勋）讲了 Token 经济学，大家都开始相信这件事情了。36氪：听说火山今年的 Token 消耗一直在涨，最近的情况是怎么样的？谭待：客户肯定是越来越多的，我们企业和个人用户数已经 100 多万了。“万亿俱乐部”（累计消耗过万亿 Tokens 的企业）现在已经 200 家了，去年 12 月是 100 家。而且我们的客户留存很好，原来那 100 家基本没有流失的。36氪：今年 MaaS 的增长，主要来自什么模型？谭待：现在 Seedance 肯定还是大头，超过一半，但 LLM 这块也不少。长期来看 LLM 会是更大的市场。比如你做一个视频创作的 Agent，除了调 Seedance，肯定也要调 LLM。36氪：一些火山同学想问你，未来火山会成为一个纯 MaaS 公司吗？谭待：火山的目标一直没有变化，就是要做最好的 AI 云公司。但我一直强调的观点是，不要把 MaaS 和云对立来看。以前云叫 IaaS、PaaS、SaaS，以后的云就是 AI 云，就是 MaaS、Agent。AI 云时代，IaaS 还会在，只不过以后是 Agent 去调用这些 IaaS 组件了。36氪：但是从市场的角度看，火山一直强调的是 MaaS 营收。谭待：我们一直对外讲 MaaS 的口径、市占率，是因为只有这个东西才是 AI 云真正的核心。如果 AI 云还要去卖 IaaS，跟以前有什么区别？无非是把 CPU 变成 GPU 而已。36氪：那传统云计算的存量市场，火山还要不要抓？谭待：如果你回到 2012年，字节成立那一年，你会去大做 PC 搜索吗？AI 驱动的云是比传统云大 10 倍的市场，以后更多的负载会跑到这上面。可能现在传统云是 1000 亿美金的市场规模，将来也还是1000亿美金，但 AI 云可能是 1 万亿美金。36氪：你认为 MaaS 的壁垒来自哪里？如果说 MaaS 就是跟着 SOTA 模型在走，那粘性似乎比公有云还低。谭待：把模型做好确实很重要，但这也意味着上牌桌的壁垒本身就很高。把模型这个事做好的挑战，比把云做好更大。做云是更偏工程驱动的事，做模型除了有工程能力，还需要一群有天才想法的人。但我并不觉得 MaaS 比云粘性更低，它只是阶段的问题。云最开始只卖主机也没有粘性，后来有了很多产品后才有粘性。36氪：什么时候 MaaS 服务会变得有粘性？谭待：如果只是用来做 Coding 提效，没有跟生产系统深度结合，这种应用程度是很浅的，容易没有粘性。但如果把它做成公司安全或其他核心生产系统的一部分，耦合性就大了。36氪：MaaS 市场刚兴起的时候，你们主要说的是 Token 消耗量。一些友商觉得这不够本质，你怎么看？谭待：他们现在都叫 Token 事业部了，不就认同这个观点了吗？36氪：当下，你觉得 MaaS 什么指标最重要？谭待：Token 营收肯定是最重要的事。36氪：我们听说火山上半年不断在调高 MaaS 营收目标，最新的数字是 150 亿，实际上呢？谭待：具体数据就不说了。照这个增长趋势来看，我们年初的目标肯定是能完成的，也确实提高了目标。36氪：火山目前的首要目标还是营收规模吗？谭待：我们从成立第一天起，一直追求的就是有毛利的规模，没有毛利的规模我们是不要的。第一是要有毛利，二是在这个基础上要有规模。36氪：大模型时代，我们会更早看到利润吗？智谱的 GLM 因为供不应求，已经往上调了三次价格。谭待：你的模型好，创造的价值高，就能赚更多钱。2024 年做模型降价，是因为那时模型就只值那个钱。现在能力更强，能帮客户创造更大的价值，所以能定更高的价格。36氪：怎么理解模型的定价逻辑？谭待：定价不是按毛利率多少来反推的，而是看 Token 到底能创造多少价值。你的定价要让客户的迁移收益高于迁移成本至少两三倍以上，大家才有意愿来用。比如，以前拍一个广告 1 秒钟成本 100 块，现在用 Seedance 做只要几块钱，那肯定值得用。客户都很聪明的，他知道模型创造的价值跟过去比是值这个定价的，本质还是模型价值提升了。36氪：据说 Seedance 的利润在 70% 左右？谭待：这个数据是外部传的，我们没怎么算过这块的毛利。四、AI 带来的变化，比绝大多数人想象的都要巨大 36氪：2024 年的时候，你说大模型还在“大哥大”时代，现在呢？谭待：比大哥大好一点点，至少到功能机了吧。大哥大的年代，只有少数人能用，现在已经很多人把 AI 用起来了，但肯定还没有完全到智能机时代。一个很重要的变化是，模型进入到了创作、Coding、Agent 的商业生产级领域。一旦进去之后，它就可以走出商业闭环，可以赚到钱，有钱就可以做更好的模型，创造更大的价值，这个飞轮就转起来了。36氪：海外市场在火山今年的优先级里面有多高？谭待：我们一直都很重视全球化，火山成立的同年，我们也同步成立了BytePlus，来做非中市场（中国以外的市场）。36氪：今年，海外市场投入力度会有多大提升？谭待：我觉得这不取决于我们，而是取决于你模型有没有竞争力。没有竞争力的时候，你怎么投入也没用嘛。36氪：我们听说，Seedance 的市占率已经超过了谷歌的 Veo，成为全球第一了？这显然已经有竞争力了。谭待：在国内是第一，在海外发展也很快，海外市场在 Seedance 整体的占比已经快一半了。但不清楚全球市场的排名。36氪：今年，海外市场在你们的业务优先级里会有多高？谭待：很多中国的创作领域工具公司都在出海，我们也鼓励和陪伴他们一起出海。海外也会有本地客户来用我们，比如 WPP 全球的 Agency，在很多地方跟我们都有合作。36氪：现在 MaaS 市场已经到了白热化竞争的阶段？谭待：很难估算。MaaS 市场每年还是 5 到 10 倍的增长，我说的都是增量市场。36氪：还是一起做大蛋糕的阶段。谭待：对，现在的竞争都是一些局部竞争。36氪：你今年的 OKR 是什么？有变化吗？谭待：没什么变化，我们战略很稳定—— MaaS 做第一，把 AI 的云原生的产品栈打磨好，把组织建设好。有变化的一点，前年写的是扩大云市场份额，今年改成了聚焦在 AI 云上。36氪：你自己这两年最大的变化是什么？谭待：英文变好了一点，因为要见好多海外客户。36氪：对组织和管理有什么新的思考？谭待：第一，最重要的还是把战略想清楚，不要老变，要看得更长久。火山在 AI 这件事上战略做得比较早，也比较坚定。第二是人才，多样性很重要。比如最近 Seedance 就得招一些导演来团队，AI 要渗透各行各业，不能纯靠 IT 背景的人去做。第三是自己要不断反省，人在看到一点成绩的时候很容易飘。36氪：最近一次的反思是什么？谭待：不要做太多微观操作。我发现前段时间自己的微观操作太多了，一般你很有自信的时候就容易这样。但现在事情细节太多了，很多事情你又不够了解，少干涉一点会好一些，要信任团队。36氪：火山成立时，定下了 2030 年千亿营收目标，时间表会提前吗？谭待：2025 年就已经把这个时间表提前了，今年还会再提一点。36氪：时间表不断提前，你觉得现在任何对 AI 市场的规模预估还是有效的吗？谭待：我们过去三年都是这样的：年初定一个很高的目标，团队都觉得太难了，然后年中发现快完成差不多了，就要往上调。AI 带来的变化比绝大部分人想的都要更大、更快。

智观行业 6月24日

0 66,016 0

直击“链博会”丨链博会首设人工智能专区　应用加速落地

直击“链博会”丨链博会首设人工智能专区　应用加速落地　　新华社北京6月24日电　《经济参考报》6月24日刊发记者吴蔚、熊琳采写的文章《直击“链博会”丨链博会首设人工智能专区　应用加速落地》。文章称，“今年链博会的最大变化是AI成了‘主角’。”一位连续四届参展的企业负责人如此评价。正在举行的第四届链博会上，原“数字科技链”升级为“数智科技链”，首次设立人工智能专区。　　6月23日，参观者在链博会数智科技链展区参观。新华社记者张晨霖摄　　这一创新布局，既是我国人工智能产业技术日趋成熟、生态持续完善的生动缩影，也是我国推动数字经济与实体经济深度融合、深化全球数智产业开放合作、畅通国内外产业循环的重要实践。　　“人工智能专区遵循AI产业链内在规律，按照数据感知、算力算法、应用与解决方案的产业演进路径系统化设计，呈现从数据采集、智能分析到场景落地的完整生态。”第四届链博会数智科技链副链长尹华欣告诉记者。　　记者在AI专区看到，英伟达、英特尔、阿里巴巴、科大讯飞等中外AI领军企业，集中展示智能芯片、大模型、行业解决方案等前沿成果，勾勒出从算力底座到应用纵深的产业图景。　　在英特尔展台，竖起了一面AI　PC与AI服务器供应链生态链墙，以实物与图谱相结合的方式，全景化呈现了英特尔及合作伙伴的产业生态链。英特尔市场营销集团副总裁、中国区总经理郭威介绍，这是英特尔第三次参加链博会。今年展台以“AI落地，芯筑基石”为主题，聚焦产业链生态全景与场景化应用，展示覆盖了AI　PC、AI服务器、边缘计算、具身智能、智能汽车等领域。　　英伟达此次也携手国内生态合作伙伴，完整呈现从能源、芯片、基础设施、模型到应用的AI产业图谱。记者在展区看到，亚信科技多款产品基于英伟达算力进行了迭代升级，并深度参与了英伟达相关系统的本土化落地。从物理AI、算力精益管控、系统部署到垂直行业赋能，双方正从“技术集成”走向“价值创造”的全新阶段。　　从算力底座向上延伸，AI产业竞争的逻辑正在发生深刻变化。“人工智能产业的发展已经进入‘系统能力竞争’的阶段。”科大讯飞品牌市场中心副总经理董斌表示，过去大家关注单项算法、单点应用，现在更重要的是把大模型能力、端侧智能、传感器、芯片、操作系统、整机制造、测试验证和行业场景打通。“AI要真正从‘工具’升级为‘基础设施’，关键不只是单点提效，还要进入产业链、供应链的核心环节，成为支撑协同、决策和执行的底层能力。”　　这一判断正在链博会的各个展台上得到验证。不只是数智科技链，先进制造链、绿色农业链、健康生活链、智能汽车链、清洁能源链和供应链服务展区，每个展区都能看到人工智能的生动实践：先进制造链展现AI助力新型工业化的现实场景，智能汽车链呈现AI在汽车研发、制造、生态协同等方面的创新应用，清洁能源链展示AI如何改变能源生产、调度和交易方式，供应链服务展区则呈现AI让跨境贸易、物流、金融从人力驱动转向智能调度的新路径。　　在健康生活链，欧莱雅全景呈现了AI在产品开发设计、前端采购、精益制造以及智能物流等美妆全链路的深度应用，包括首发在中国设立的“智能包装创意中心”、今年正式启用的苏州尚美工厂UPX二期智能车间以及欧莱雅苏州智能运营中心的多个集成智能化科技案例。欧莱雅北亚及中国运营高级副总裁柏迈昂表示：“随着AI的全景落地，我们建立起更敏捷、更安全、更绿色的端到端智慧供应链，大幅提升在中国的运营与创新势能，彰显了对中国创新生态和供应链高质量发展的信心。”　　“当前，‘AI+’正加速重塑全球产业链供应链格局，推动其迈向更具韧性的新阶段。链博会是汇聚行业智慧、促进上下游协同创新的重要平台。”在先进制造链展区，西门子全球执行副总裁，西门子中国董事长、总裁兼首席执行官肖松表示，“西门子将持续融合全球技术沉淀与中国的创新速度、产业规模和丰富应用场景，依托西门子Xcelerator平台，与客户及合作伙伴共创AI在真实工业场景中的价值，携手打造更智能、更开放、更具韧性的产业链供应链生态。”　　“链博会的价值，正在于它能够把产业链上中下游企业放在同一个平台上，让技术创新更快找到应用场景，也让场景需求更快反哺技术迭代。”董斌认为。　　正如中国贸促会副会长李兴乾所言，第四届链博会是数智链博会元年，数字化、智能化应用无处不在，全面呈现我国以技术创新为驱动、以高质量为导向的新质生产力发展情况，透过其中可以更清晰地看见未来、体验未来。　　从“数字”到“数智”，一字之差，折射出中国数字经济正在经历的深刻变革。链博会正以“链”为媒，加速这一变革从展厅走向工厂、从概念走向量产、从单点走向全链。　　“中国远远不止是一个超大规模的消费市场。”欧莱雅北亚及中国公共事务总裁兰珍珍认为：“未来的世界，不仅会深度‘链’接中国创新，更会深深地‘恋’上中国‘炼’就的开放创新生态。”（完）

智观行业 6月24日

0 46,537 0

你放心让AI养宠物吗？（有事说事）

你放心让AI养宠物吗？（有事说事）王琦琳数据显示，在第六届TOPS它博会宠物展上，专业观众超8.2万人，海外买家增长，采购节交易额也交出亮眼成绩单。另据媒体报道，越来越多的企业涌入这条赛道，并借助人工智能技术探索新的产品形态和服务模式。随着独居人数增加，宠物正逐渐从“饲养动物”转变为不少养宠物人生活中的重要陪伴者。《2026年中国宠物行业白皮书(消费报告)》显示，消费者越来越愿意为宠物提供的情感价值买单。在此背景下，人工智能的应用为养宠生活带来了不少积极变化。智能喂食器、陪伴机器人等产品，在一定程度上缓解了宠物独处和主人陪伴不足的问题；健康监测设备通过数据分析，为疾病预警和日常管理提供参考，让养宠更加科学便捷；从行业发展角度看，AI技术的融入也有助于推动产品创新，进一步释放消费潜力，为宠物经济注入新的增长动力。与此同时，面对快速发展的市场，也需保持理性思考。目前，一些AI宠物产品在实际应用中仍有待完善之处。一方面，部分产品定价较高，但功能与消费者的实际需求之间存在落差。宣传中的“智能诊断”“情绪识别”等功能，在实际使用场景中的体验还有提升空间。另一方面，部分健康监测设备的数据准确性和稳定性需进一步验证。例如宠物明明活蹦乱跳，设备却频频报警，反而增加了宠主的心理压力。从长远看，消费者对AI赋能宠物行业寄予厚望。这份期待应建立在真实需求和可靠体验之上，而非停留在概念包装层面。只有当技术能够切实解决问题、创造价值，AI与宠物经济的结合才能实现可持续发展，更好满足消费者日益增长的养宠需求。

智观行业 6月24日

0 66,213 0

扎克伯格谈Meta AI智能眼镜：必须在时尚与功能之间取得平衡

扎克伯格谈Meta AI智能眼镜：必须在时尚与功能之间取得平衡 IT之家 6 月 24 日消息，马克 · 扎克伯格希望 Meta 最新款人工智能眼镜不只是一件电子设备。对这位 Meta 首席执行官而言，难点不在于往镜框里堆砌更多人工智能功能，而是做出人们真正愿意日常佩戴的眼镜。在与资讯栏目《Feed Me》主创艾米丽 · 桑德伯格的访谈中，扎克伯格的谈吐不像是硅谷企业高管，反倒更像一名时装设计师。“我认为未来眼镜会形成丰富产品线，款式多样、功能配置各有区分，价格档位也层次分明，”扎克伯格表示，“但核心难题在于，每一款产品都要找到平衡点：外观好看、佩戴舒适，同时功能体验不拉胯。”“公司所有自研产品，我都会深度参与打磨，”扎克伯格补充道。当地时间本周二，Meta 推出全新系列智能眼镜，起售价 299 美元（IT之家注：现汇率约合 2029 元人民币），低于该品牌入门款雷朋智能眼镜，以此加码可穿戴设备赛道。这款新品由眼镜巨头依视路陆逊梯卡联合开发，但不会搭载雷朋或欧克利的品牌标识。扎克伯格称，研发智能眼镜让他接触到一套和软件行业截然不同的产品考量标准。通过 Meta 与依视路陆逊梯卡的合作，他了解到“这家企业如何打造品牌、开展设计，以及他们眼中的产品核心价值”。这位 Meta 掌门人也培养出了自己的时尚审美，告别了千禧年代他口中曾经最爱的单品 —— 阿迪达斯凉拖。 “未来各类可穿戴设备平台，都会和时尚融为一体，”扎克伯格说道。在扎克伯格看来，人工智能硬件的未来模样，不该偏向游戏配件，而要趋近时装秀上的潮流单品。如今谷歌、Snap 等竞争对手都在争先推出搭载 AI 的智能眼镜，这套设计思路也正持续主导 Meta 在可穿戴领域的布局。比如 Snap 6 月初刚发布的新款 AI 眼镜，一经上线就因售价高昂、外形笨重遭到网友集体吐槽。“而我觉得所有这类穿戴设备的核心要义，”扎克伯格补充道，“不管是戴在手腕、架在脸上，还是其他穿戴形式，都要做到两点：一是戴出去让人有面子，二是佩戴起来足够舒适。”

智观行业 6月24日

0 70,676 0

AI“算力稀缺”信仰开始动摇？

AI“算力稀缺”信仰开始动摇？ 21世纪经济报道记者石恩泽过去三年，AI产业一直沿着一条简单而有力的逻辑线狂奔：算力越稀缺，资本开支越合理；资本开支越大，估值越高；估值越高，融资越容易。这个循环自我强化，几乎无人质疑。但进入2026年仲夏，这条逻辑链上的每一个环节都在承受压力测试：算力租赁价格从高点回落，科技巨头集体收紧AI预算，电力与工程交付暴露物理极限，资本市场开始用ROI来审视每一家AI企业。最先发出警报的是二级市场。从亚太到美股，资金正在以肉眼可见的速度从高Beta科技股撤离，转而寻找更安全的避风港。这种转向并非孤立事件，而是多重底层力量同时作用的结果。在上游的算力租赁市场，现货价格与远期合约价格出现了罕见的背离，揭示出短期供给与长期瓶颈之间的深层矛盾。在中游，曾经不计成本烧钱的大厂们突然踩下刹车，Token从“无限畅饮”变成了“定量配给”。而在更深处，物理世界的电力与工程交付能力，正在成为比芯片制造更硬的约束条件。这三层裂缝同时张开，共同推动着AI产业从上半场走向下半场。被誉为全球经济“金丝雀”的韩国股市，最先开始“啼血”。6月23日早盘，韩国交易所因KOSPI指数下跌8%触发熔断机制，交易暂停20分钟。截至收盘，韩国综合指数报收8203.84点，下跌9.99%。其中，三星电子下跌12.31%，SK海力士大跌12.47%。压力同样传导到了A股。A股午后扩大跌幅，三大股指进一步下跌。截至收盘，创业板下跌3.84%，AI算力产业链集体调整，光模块、PCB、HBM等概念股大幅杀跌。港股午后亦跌势加剧，恒指、恒科指盘中双双扩大跌幅，权重科网股大幅下挫，阿里、腾讯、美团均跌超3%，AI大模型股集体调整，智谱、MINIMAX双双跌超10%。具体到AI算力芯片链条的核心标的，更是出现高位剧烈分化和拥挤度回吐。港股存储芯片板块震荡走低，南方两倍做多海力士跌超20%，澜起科技跌超10%，兆易创新跌超9%。把盘面信息合在一起读，本质就一句：同一根AI硬件链上已不再是齐涨齐跌，资金在“卖拥挤”而非“卖AI”。板块资金面把这个结论钉得更死。其中，PCB与算力硬件上游出现加速解压，德福科技下跌达14.65%，光华科技、诺德股份跌停，进一步说明资金正从最拥挤的“算力硬件叙事”里往外搬，短线向非银金融、有色等顺周期方向做结构性再平衡。前一交易日的美股走势反而更像一个提前定调。纳指跌1.32%，科技板块拖累标普500走低，道指却在传统工业股带动下逆势涨0.29%。风险偏好从高Beta科技撤出，往能兑现、能分红、能防御的一侧切换。SpaceX单日暴跌超16%，市值单日蒸发约4000亿美元。Alphabet跌超5%，Amazon跌近5%。市场担心的已不只是一次人事变动或两个百分点的波动，而是“四大”云厂商的天量AI资本开支。财报数据显示，谷歌、亚马逊、微软、Meta四家公司2026年资本开支提升至7250亿美元，较2025年的4100亿美元同比暴涨77%。对应的回报到底在哪里，正在成为悬在所有投资者头顶的问号。把镜头拉回算力租赁这一细分领域，矛盾感更强。6月22日，A股算力租赁概念刚掀起涨停潮，协创数据涨超10%，利通电子、中科金财、特发信息多股涨停。6月23日午间，情绪已迅速出现分化。整个算力租赁板块午后跌超1%，主力净流出超百亿元。而这一道道盘口裂缝之所以重要，是因为它们恰好扣住了AI算力叙事的三条底层裂口。据纽约数据提供商Ornn数据，英伟达B200每小时租赁价自5月30日攀至6.11美元/时的三个月高点后持续回落，截至6月21日已跌至4.22美元/时，三周内回落约30%。表面看，B200租赁价回落只是季节性波动。但高盛交易台主管Rich Privorotsky把问题点得更直白：如果稀缺性持续存在，价格应保持坚挺，资本开支才说得通；如果供应增加且价格持续走低，“算力资源短缺”这一整套定价前提就会被撬动。这段话的指向很明确：如果下游客户的租赁价格在跌，但英伟达的芯片售价没跌，中间就会形成利润率挤压，最终传导为订单放缓。AI推理基础设施服务商Baseten CEO向媒体透露，英伟达B200千卡级GPU集群采购订单的交付周期已延长至2027年，等待时间长达12到15个月。由此可见，现货宽松与长期交付紧张已经同时出现，这些信号使得市场的判断开始出现混乱。中游的信号比上游更统一。海内外互联网大厂集体踩刹车，Token从“畅饮”变“配给”。腾讯6月将员工月度Token额度从2000美元（约1.35万元人民币）压缩至1500元人民币，并取消全员普惠，改为部门统筹、按需分配。内部口径很直白：AI使用的唯一评判标准不是算力消耗多少，而是业务提效和价值创造。国外大厂同步跟进。Uber对员工设置每月1500美元Token上限；亚马逊叫停内部Token排行榜，禁止“为用AI而用AI”的刷量式KPI；微软取消大部分第三方Claude Code授权，强制改用自研Copilot；Meta上线AI使用监控系统，限制无效算力消耗。麦肯锡2025年全球AI调研显示的数据更冷：全球仅39%的企业通过AI实现正向利润贡献，超过六成的企业长期处于“只烧钱、无回报”的状态。行业正在从“以Token用量论优劣”全面转向“以商业价值论成败”。当大厂开始精打细算，一个更底层的约束浮出水面。一份在投资圈流转的AI硬件链做空框架分析，把约束拆成了两条曲线。第一条是芯片供给曲线，决定“可制造的GPU数量”；第二条是电力建设曲线，决定“可点亮的机柜数”。两条曲线取低值之后，电力与工程建设才是真正的瓶颈。据头豹研究数据，2027年芯片侧可供给14.4万柜，但电力侧仅能交付7.2万柜，交付缺口达到50%；2028年缺口更扩大至70%。高盛对美国数据中心电力需求的预测也佐证了这一点：未来一到两年排期中的数据中心容量，仅约50%到60%可能按时上线。资本开支可以快速上调，物理交付却不能。而AI硬件链不少标的的市值正在以“无限机柜扩张”定价，但真实交付由物理曲线而非叙事决定。三层裂缝叠加在一起看，AI交易的底层逻辑正在发生不可逆的转换。当Token从“空气”变成“石油”，当机柜交付由电网而非PPT决定，当华尔街开始拿Excel表逐项核对企业AI支出的产出，褪去资本泡沫、回归业务本质，才是AI行业可持续发展的唯一路径，也是下一阶段资金愿意继续买单的唯一理由。

智观行业 6月23日

0 17,552 0

光镊有了永不疲倦的机器人操作员

光镊有了永不疲倦的机器人操作员来源：科技日报科技日报记者张梦然瑞典哥德堡大学和查尔姆斯理工大学研究团队在人工智能（AI）应用方面取得新成果，教会一款名为SmartTrap的AI系统使用光学镊子，从而让光镊实现了全自动运行。这一成果有望大幅提升微观粒子分析的效率，将科研人员从繁琐的手动操作中解放出来。相关成果发表于最新一期《自然·方法》杂志。光镊是一种利用高度聚焦的激光束来操控微小物体的技术，其操作对象包括单个DNA分子、活细胞以及其他直径远小于发丝的微观粒子。这项技术在2018年为科学家亚瑟·阿什金赢得了诺贝尔物理学奖。它能帮助科学家观察分子马达如何为细胞提供能量、DNA如何进行复制与修复，以及疟疾和镰状细胞贫血症等疾病如何影响红细胞功能。然而，传统的光镊操作门槛极高，必须由经过专业训练的研究人员全程监控并作出决策。这导致实验通量低下、耗时漫长，且不同研究者之间容易产生操作差异。SmartTrap的出现改变了这一局面。该系统融合了图像分析、实时深度学习、定制电子硬件、精密流体控制以及封闭环境内的反馈机制，实现了完全自主的运行流程。它能够自行捕获颗粒，以纳米级的精度在三维空间中对其进行定位，完成测量，并在实验结束后自动装载新的样本，开启下一轮实验。研究团队对这套AI平台进行了多项严格验证。结果显示，SmartTrap每小时可对数以百计的粒子进行分类和特性描述。在生物物理学领域难度极高的单分子DNA拉伸实验中，该系统每小时能完成10—15次实验。此外，它还成功测量了红细胞的机械刚度，并绘制了不同盐浓度下粒子间的纳米级静电力图谱。相比之下，由人类操作员来完成同样任务，所需时间通常是AI的十倍甚至百倍，而且操作员还会面临疲劳和注意力下降的问题。研究负责人乔瓦尼·沃尔佩表示，测试表明，AI在各项任务中的表现不仅与经验丰富的操作员不相上下，甚至在部分环节更为出色。SmartTrap基于开源软件开发，研究团队希望它能成为行业内共享的平台。随着智能化显微镜技术日益成熟，类似SmartTrap这样的AI平台有望像自动化技术改变制造业那样，彻底革新未来的实验室工作模式。总编辑圈点这可能又是一次科研生产力革命。光镊可以“夹住”单个微粒做各种实验，不过，它的操作门槛太高，每次实验都得有一个训练有素的科研人员全程在场调控。此次，SmartTrap把“老师傅的手艺”学成了算法，光镊有了一个永不疲倦且手法稳定的机器人操作员，光镊操作这样的精细实验成了规模化数据采集，实验室甚至可以像工厂流水线一样持续运转。新的技术，把科研人员从“苦力活”中解放出来，让他们把时间精力花到更有价值的事情上。

智观行业 6月23日

0 66 0

OpenAI推出“修补地球”计划，用AI助力开源社区提升网络安全

OpenAI推出“修补地球”计划，用AI助力开源社区提升网络安全 IT之家 6 月 23 日消息，OpenAI 于当地时间周一宣布推出一项全新计划，旨在助力开源社区提升网络安全防护能力、防范代码漏洞。这项名为“修补地球”（Patch the Planet）的计划，名称明显化用了 1995 年经典影片《黑客》中的标志性台词“入侵地球”（Hack the Planet）。OpenAI 将与网络安全公司 Trail of Bits 展开合作，协助开源项目维护者加固项目安全。OpenAI 表示，Trail of Bits 的安全技术人员将直接对接开源项目维护者，排查代码中潜藏的各类风险问题，同时搭配 OpenAI 自研的 Codex Security 等安全工具开展辅助检测工作。IT之家注意到，OpenAI 在周一的声明中称：“如今多数开源维护者人手、时间资源十分有限，却还要加急处理数量持续暴涨的安全漏洞上报工单。‘修补地球’计划旨在减负而非增负：安全工程师会先对漏洞检测结果做前置核验，再协同项目团队编写漏洞补丁与配套测试用例，并搭建可复用的自动化工作流，让项目在完成首轮漏洞修复后，能持续迭代优化自身安全防护水平。”简单来说，Trail of Bits 的工程师相当于代码领域的急救人员：依托 OpenAI 的 AI 工具，帮助开源项目维护者定位、分级处置各类潜在安全隐患。该计划愿景宏大，但长期落地运行模式、规模化推广方案目前尚不明确。开源项目是整个商用软件行业的数字基石。但遗憾的是，开源生态分散化、监管薄弱的特性，导致大量开源代码存在安全缺陷。开源程序中的漏洞，极易给各类商用代码库带来重大安全事故，几年前轰动业界的 Log4j 漏洞事件就是典型案例 —— 一款广泛普及的开源工具被曝出高危漏洞，引发全球大范围安全危机。业界对 Anthropic 旗下备受关注的安全工具 Mythos 等同类产品的担忧，大多源于一个核心隐患：人工智能如今能够自动扫描代码库中的现存漏洞，并据此生成可利用的攻击程序。网络犯罪自动化并非新鲜事物，但这类 AI 工具无疑会大幅降低不法分子实施网络攻击的门槛。而 OpenAI 反其道而行之，借助人工智能赋能开源社区，主动强化自身防御能力。此举一方面难免被视作针对竞品 Anthropic 的行业竞争动作，另一方面也确实切中了开源社区长久以来迫切的安全需求。

智观行业 6月23日

0 69,227 0

亚马逊在ChatGPT投广告引流，却严防AI抓取自家商品数据

亚马逊在ChatGPT投广告引流，却严防AI抓取自家商品数据 IT之家6月23日消息，亚马逊想抢占 ChatGPT 的用户流量，却不愿向 OpenAI 开放自家用户数据。电商分析师尤奥扎斯 · 卡济乌凯纳斯透露，亚马逊已开始在 ChatGPT 投放广告，成为入驻 OpenAI 新兴广告业务最知名的零售企业之一。这类广告会引导用户跳转至亚马逊店铺页面，所有用户体验与交易流程均由亚马逊全权把控。卡济乌凯纳斯在接受 Business Insider 采访时表示，亚马逊选择在 ChatGPT 投广告这一举措具备“象征意义”：以往这家零售巨头基本不愿参与各类 AI 购物合作项目，这类项目会允许第三方聊天机器人、AI 智能体抓取整合亚马逊的商品、定价及库存数据。此举暴露出亚马逊人工智能核心战略内部的矛盾：企业愿意花钱触达 ChatGPT 庞大的用户群体，同时又持续严密保护自有购物数据，限制各类 AI 系统调取、使用这些信息。这家电商巨头没有选择向各大 AI 平台开放商品库供其整合收录，反而将 AI 平台当作引流渠道，把消费者导回亚马逊线上商城。IT之家注意到，当地时间本周一，卡济乌凯纳斯在领英发文，放出了亚马逊在 ChatGPT 投放广告的截图。截图显示，用户搜索咖啡机时，对话机器人会列出多款相关商品，下方紧跟着一条亚马逊付费推广广告，主打“高分精选厨房用具”。亚马逊在ChatGPT投广告引流亚马逊早已出台多项措施，限制各类 AI 爬虫程序抓取数据，防止竞品依托这些数据搭建同类购物服务。卡济乌凯纳斯称，去年亚马逊停止向谷歌购物板块提供商品数据推送，同时更新底层代码，封禁多款爬虫机器人，其中就包括 OpenAI 的采集程序；今年早些时候，亚马逊还通过法院禁令，强制阻断 Perplexity 人工智能代理抓取平台数据。亚马逊入局 ChatGPT 广告，对 OpenAI 尚处于起步阶段的广告业务而言也是一大利好信号。早期广告数据显示，当用户在 ChatGPT 搜索带有购物需求的内容时，经常会刷到广告；越来越多广告主也将这款对话机器人视作全新渠道，用来对接主动查询商品的潜在消费者。卡济乌凯纳斯表示：“在我看来，这足以说明，OpenAI 依靠广告实现购物需求商业化变现，会比尚未验证、且已被其放弃的智能体电商模式轻松得多。它的广告业务将会迎来高速增长。”

智观行业 6月23日

0 56,752 0

存储成为AI负担，这对投资意味着什么？

存储成为AI负担，这对投资意味着什么？存储芯片价格的全面上涨，正在将成本压力从消费端蔓延至AI基础设施，并迫使超大规模云计算厂商重新审视其资本开支回报模型。据追风交易台，伯恩斯坦研究（Bernstein）最新报告，HBM（高带宽存储）价格预计明年将上涨2至2.5倍，叠加传统DRAM与NAND价格的大幅攀升，超大规模云厂商部署AI数据中心的资本开支或因此增加约30%。这一成本冲击的传导路径并不简单。以英伟达为例，HBM被封装于其GPU产品之中，若英伟达希望维持75%的毛利率，则需将HBM成本涨幅放大约4倍转嫁给客户，进一步加重云厂商的资本压力。伯恩斯坦认为，这种压力不会令超大规模云厂商放缓AI投资，但一场针对供应链各环节的"成本再平衡"已不可避免，实力较弱的供应商可能在此过程中遭到挤压。对投资者而言，这一格局的直接影响是：三星、SK海力士与美光的2027财年每股盈利预测将迎来显著上调，伯恩斯坦目前的预测已较市场一致预期高出25%至40%；而纯NAND供应商铠侠则无缘此轮上修红利。HBM定价倒挂，涨价压力积聚 HBM价格上涨的核心逻辑，在于其与传统DRAM之间日益扩大的盈利差距。据伯恩斯坦估算，自2025年第三季度至2026年第二季度，传统DRAM价格已累计上涨约4.5倍，而HBM价格受制于年度合同锁定，几乎原地踏步。这导致在2026年，将产能部署于传统DRAM所产生的每晶圆收入，是HBM的约2倍，毛利则高达近3倍。三星在其2026年第一季度财报电话会议上明确表示，非HBM的DRAM利润率已超过HBM，且随着传统DRAM价格持续攀升，两者差距仍在扩大。三星同时暗示，预计2027年这一利润差距将"大幅收窄"，意味着HBM涨价已是大势所趋。SK海力士亦强调，将致力于实现HBM与普通DRAM之间的"最优产能分配"，而非单纯追求收入最大化。基于上述考量，伯恩斯坦预测HBM价格明年将上涨2至2.5倍——低于令HBM收入追平传统DRAM所需的3倍涨幅——反映出供应商对HBM战略价值的认可，以及对过激定价可能损害整体AI生态的顾虑。即便如此，HBM的盈利能力明年仍将低于传统DRAM，但差距将明显收窄。成本放大效应：GPU供应商的"加价乘数" HBM涨价对超大规模云厂商的冲击，远不止于直接采购成本的上升。伯恩斯坦以英伟达Vera Rubin（VR200）机架为例进行测算：在HBM涨价前，HBM约占VR200售价的5%。若HBM价格上涨2至2.5倍，仅此一项便需推高VR200售价约6%。但若英伟达为维持75%毛利率而将HBM成本涨幅放大4倍转嫁，则机架售价可能上涨约24%。综合计算，若仅考虑HBM成本直接传导，超大规模云厂商的数据中心总资本开支将增加约4%；若计入英伟达的全额加价，则增幅扩大至约15%。此外，传统DRAM与NAND价格的大幅上涨，还将额外贡献约14%的资本开支增量。三项叠加，超大规模云厂商的AI资本开支总体需要提高约30%，方能覆盖存储成本的上涨。伯恩斯坦指出，GPU及加速器供应商可能辩称其对HBM并无加价，而是将其视为"直通"收入，并强调HBM与逻辑芯片、封装及软件的整体集成价值。但无论如何，若不进行加价，HBM成本上涨将直接压缩GPU供应商的毛利率，这将形成强烈的加价动机。超大规模云厂商面临"成本再平衡" 面对约30%的资本开支增量，超大规模云厂商不得不重新核算AI投资的回报模型。伯恩斯坦认为，竞争压力与资金可及性将支撑云厂商维持AI投资节奏，但"成本再平衡"已不可避免。这一过程可能涉及多个维度：向供应链各环节施压以分摊成本，以及潜在地调整向不同客户收取的算力服务价格。在此过程中，实力较弱的供应商面临被挤压的风险，而伯恩斯坦覆盖范围内的公司则处于有利位置，部分甚至可能成为受益者。其中，联发科（MediaTek）被视为潜在受益方之一。伯恩斯坦指出，若超大规模云厂商为规避GPU供应商的HBM加价而选择直接采购HBM，亚洲ASIC服务商的商业模式恰好能够满足这一需求，联发科有望从中获益。该股过去两个月已累计上涨约130%，伯恩斯坦仍维持"跑赢大市"评级，目标价为新台币4,380元。盈利预测大幅上调，三星、SK海力士、美光获目标价提升 HBM涨价预期尚未充分反映在卖方一致预期中，这意味着一轮显著的盈利上修即将到来。伯恩斯坦将HBM价格预测上调2至2.5倍，并同步上调传统DRAM及NAND价格预测，由此得出的2027财年每股盈利预测较市场一致预期高出25%至40%：三星高出约26%，SK海力士高出约32%，美光高出约38%。随着HBM价格谈判在未来数月逐步落定，伯恩斯坦预计市场一致预期将向上修正，并对三家公司的股价形成支撑。在估值方法上，伯恩斯坦将三家公司的估值基础由市净率切换至市盈率，理由是当前利润率与股本回报率将达到历史前所未有的水平，历史市净率参照意义有限。基于接近历史底部的市盈率倍数对周期高峰盈利进行估值，伯恩斯坦将三星目标价上调至韩元440,000元（对应6.2倍一年期远期市盈率，较当前股价有约26%上行空间），SK海力士目标价上调至韩元3,300,000元（同为6.2倍，约20%上行空间），美光目标价上调至1,300美元（7.7倍，约15%上行空间），三者均维持"跑赢大市"评级。值得注意的是，此轮盈利上修红利不惠及纯NAND供应商。铠侠因不涉及HBM业务，无法受益于HBM涨价，伯恩斯坦维持其"跑输大市"评级，目标价为日元40,000元。

智观行业 6月22日

0 56,471 0

马云携阿里高管下田插秧笑容灿烂现场照片披露

马云携阿里高管下田插秧笑容灿烂现场照片披露 6月22日消息，据媒体消息，近日，阿里合伙人、高德董事长刘振飞在阿里内网发布题为《手里有秧，才能确保未来有粮》的帖子，分享自己与一众高管在杭州农田集体插秧的亲身经历，并附上现场实拍照片。此次下地农耕体验阵容堪称豪华，到场人员覆盖阿里巴巴、蚂蚁集团核心管理层，包含阿里巴巴集团创始人马云、阿里巴巴集团CEO吴泳铭、蚂蚁集团董事长井贤栋，还有蚂蚁集团CEO韩歆毅、阿里合伙人邵晓锋、淘天集团CEO蒋凡等阿里资深高管参与。相关照片显示，正式下田劳作前，众人站在田埂上集体比耶合影，精气神十足，场面十分热闹。马云携阿里高管下田插秧踏入水田后，平日身居写字楼的企业高管纷纷变身“禾伙人”，统一挽起裤腿、光脚踩进泥田弯腰插秧。不少人貌似都是第一次体验水田农事，插秧动作生疏，身姿歪歪扭扭，画面极具反差感。企业高管纷纷变身“禾伙人”现场拍摄的照片里，马云捧着一捆秧苗招呼身边同行的高管，全程笑容满面。马云被拍到在田间笑容满面阿里巴巴首席科学家周靖人也出现在稻田中，他面带微笑站在一旁，身旁是埋头插秧的蚂蚁集团董事长井贤栋，二人同框的画面也引人好奇，分不清是谁在向对方交流农事经验。阿里巴巴首席科学家周靖人也出现在稻田中刘振飞在内网文中提到，十几位高管忙活整整一上午，最终只完成半亩水田的插秧工作，劳作效率并不高。图为披露的现场照片据悉，该帖子在阿里内网引发大规模讨论，内部员工纷纷留言调侃：有人直言田里秧苗行列参差不齐，需要重新对齐；熟悉农事的员工则点评，众人统一身着浅色衣物下地，足以看出这群高管都是农耕新手。需要补充的是，阿里合伙人制度又称湖畔合伙人，是阿里独有的企业治理机制，相关规则、合伙人名单均会在集团年度财报、投资者官网公开披露。根据阿里最新财年财报显示，本次参与插秧的马云、吴泳铭、井贤栋、刘振飞、蒋凡、周靖人、邵晓锋、蒋芳、吴泽明均为在册合伙人，覆盖集团业务、金融、技术、本地生活多条核心业务线。本次参与插秧的马云、吴泳铭、井贤栋、刘振飞、蒋凡、周靖人、邵晓锋、蒋芳、吴泽明均为在册合伙人来源：快科技

智观行业 6月22日

0 60,763 0

两个AI模型实现诊断到治疗全面管理

两个AI模型实现诊断到治疗全面管理来源：科技日报科技日报记者张梦然最新一期《自然》杂志发表了自主医疗AI智能体能力方面重大进展：两个独立的AI模型能够为患者的全面管理提供多个阶段的重要协助，包括从诊断到治疗决策。这两套系统是德国的MIRA和谷歌公司的AMIE，当前表现至少已与人类内科医生相当，证明了对话式AI工具在疾病管理方面的协助潜力。德国海德堡大学医院介绍了MIRA，一个能够访问独立电子病历系统中患者数据的AI模型。该模型通过500多例急诊科临床病例的真实世界数据进行了评估。结果显示，MIRA通过与患者AI智能体进行对话并收集信息后，其回应与临床记录中记载的病史相匹配。MIRA可从85000多种选项中进行选择，以安排诊断检测、解读结果并制定治疗方案，包括开具处方、安排手术及办理入院手续。其平均诊断准确率达到87.8%，而由六位跨专科医生组成的专家组准确率仅为78.1%。团队总结指出，未来需要进一步开展研究以提高准确率，并在真实世界研究中验证其泛化能力。谷歌团队则介绍了AMIE，一个针对临床管理和对话进行优化的基于大语言模型的系统。该模型能够对多次就诊数据进行连续推理，从而追踪疾病进展和治疗反应。AMIE利用谷歌Gemini分析从患者处获取的信息，并使其输出结果与相关且最新的临床实践指南及药物目录（经批准且临床首选药物的清单）保持一致。在一项虚拟临床检查研究中，AMIE与21名全科医生在100多个就诊案例场景及五个医学专科领域进行了对比，这些场景旨在反映英国国家卫生与临床优化研究所的指导意见及《英国医学杂志》最佳实践指南。在管理推理能力方面，AMIE的表现与真实医生相当；而在治疗和检查的精准度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面，AMIE的表现均优于医生。在最新推出的药物推理基准上，AMIE在处理疑难病例时的表现优于医生。团队指出，AMIE标志着利用对话式AI工具辅助医生进行疾病管理迈出了重要一步。总编辑圈点大型语言模型在临床应用方面，已经展现出令人鼓舞的发展势头，但之前它们往往专攻一些特定任务。而患者的临床管理，需要的是多维度的方法，包括深入了解病史、适度检查、准确诊断、规划治疗方案、确定药物剂量、安排手术进程，还需要在多次就诊中监测治疗效果。如果AI智能体能够执行此类任务并实现有效的管理，就可以成为人类医生的助手，“扛起”这些日复一日的常规工作，甚至可能缓解全球多个地区内科医生短缺问题。

智观行业 6月22日

0 27,919 0

独家丨京东618，全员加班但没爆单

独家丨京东618，全员加班但没爆单文 | 超聚焦“战报一个比一个漂亮，一看后台利润都不说话了”，这是商家们对618大促最直观的感受。今年是最长的一个618，战线从5月初一直铺到端午节，快手34天，抖音35天，淘宝39天，其中京东最长46天，一直到过完端午假期。今年也是最冷淡的618，没有跳转不完的开屏广告，没有刷屏的卡点直播间红包和品类券，也没有限时付款才能享受的折上折，微博上找不到几次热搜。由于不再允许恶意低价，平台们纷纷扬长避短，淘天推AI和新品牌，抖音补全商城货架，京东对自有物流和采销供应链寄予厚望。超聚焦了解到，在宣布开启巅峰28小时收官战后，京东物流端收到通知未来几天早上4点-6点到岗，统一接受调度安排，个别地区会包早餐。部分采销和客服运营人员被要求晚上12点前不准下班，公司会报销餐食、下午茶、水果、夜宵等，考虑到员工的出勤和问题，宿迁地区还安排了宿舍给加班过晚的员工。显然京东比谁都更想赢下这场618，只是碎片化、常态化的大促，很难见到曾经一夜爆单的辉煌了。01 单量未爆仓，考核却爆表 “凌晨4点半到岗上班并点名，结果忙活了一上午并没有特别多货，跟平时比单量是差不多的，一天跑两趟就回去了。” 京东小哥张靓发现，今年618的单量并没有出现明显的波峰。据他所述，他平时上午的单量大概在100至130单，下午在40至65单左右，但今年618当天的单量还不如往常，只有100单出头，“跟当地下雨有一定关系，但确实没有往年脚不沾地的忙碌感”。另一位浙江地区的配送员郭乐提到，去年618当天的单量可能在500单上下，今年则回落到了300多单，而从前几天也能感觉到不像往年那般火热，直到临近618的时候整体单量才开始回升。当然，其中也有京东自己的考量。与往年将最后一轮活动在619凌晨就结束不同，今年活动的战线有所拉长，特别是6月17日晚8点到18日全天的收官大促，订单的履约日自然会后移1-2天，进而减轻了618当日物流端的压力，高峰大概率落在19日甚至更靠后。然而，为了应对这场大促，京东物流侧做足了准备。多位一线配送人员向超聚焦表示，尽管今年618的声量不如往年，但末端网点仍然按照最高规格备战。以华南某营业部为例，网点管理人员反复强调生鲜、冷链等时效件优先派送，需提前进行卸货、分拣和线路准备，并要求签收环节严格执行外呼、拍照留存等流程规范。值得注意的是，备战不仅体现在到岗时间，更多体现在考核压力上。多位一线人员提到，一旦被认定为操作不规范，轻则要求说明、复盘，重则可能面临罚抄SOP、罚款甚至内部约谈。今年618一线员工的感受并不是“多劳多得”的冲单氛围，而更像是一套高压履约机制，单量未必比往年高，但出错成本明显更高。这种压力也反映在京东内部论坛中。在“#618我们战一起”的tag下，有多位一线末配人员围绕签收规则、退货责任和扣罚标准发帖反馈。有员工提到，部分订单因外包装、客户需求或系统识别问题产生争议后，一线配送员往往需要自行申诉；但申诉材料、拍照规范、客户沟通记录只要有一项不完整，就可能被认定为责任在配送端。还有人反映，一些异常场景并不完全由配送员造成，比如客户要求放门口、包装本身不完整、退货流程衔接不顺等，但最终仍可能落到小哥身上，一次罚款100元扣25分。不过，从第三方数据来看，京东确实在618期间表现不俗，复旦消费大数据实验室显示，今年618全网零售额同比增长约3.2%，其中京东和抖音进一步缩小了与淘天集团的差距。《中国电商平台品牌商家生态研究报告（2026）》调研数据也显示，各平台日销收入占线上总日销收入比例中，京东以31.82%大幅领先，是商家日销最核心阵地。增长与压力并存，热情与疲惫交织，这大概是京东618真实的底色。02 越卖越亏的集体狂欢 “在6月10号买了美的自营旗舰店的，当时叠加各种券成交价是4196元，离谱的是我后来看价格从3793元一路降到了3570元，第一次京东说有价保给我补了403元，后面又说不是同一个型号的订单不支持比价，过了7天也不让无理由退货了，那首页写价保不是骗人吗？” 曹朗后面去淘宝抖音也查证了下，发现今年电商平台不光没有绝对的最低价了，每天价格都在起落，618当天也未必是整个大促折扣力度最大的时候，京东的情况不是个例。通过第三方查价App和自己购物车里的价格提示，他了解到，由于平台规定和补贴的调整，很多商品早在4月份就开始提价了，从提价200元到价格翻3倍的情况都有，618并没有比平时便宜多少。在部分消费者没在618大促期间买到最便宜的产品的同时，商家侧的成本压力却依然巨大。服饰商家丁建透露，现在买流都没效果，还是要靠采销给推荐，官方经常不通知商家就提报活动、拉低价券，店里原价152元的产品，客户付款价106元，扣掉7个点的抽成和推广费，到账上只有80多块钱，但是整体成本到了120元，越卖越亏当引流款。“官方立减20%报了，五折活动也参加了，618当天也就是日销2-3倍的增长，比起往年增量其实下降了，只能说以后要平常心对待了，存量市场核心是做好利润，以后比拼的都是供应链”，丁建觉得大促效果一年不如一年，商家未来都会以保日销为主。某新店商家透露，自己是年后从拼多多转来京东的，之前的一些运营技巧根本没用，由于产品星级不够、付费单次点击价格没有竞争力，点击率、加购、下单等数据推广转化率低，导致店铺和产品权重太低，小品牌只能靠短视频带货分销，基本熬不到双11了。京东采销小刘也挺无奈，自己上面好几个领导提目标，经常半夜改需求怀疑自己能力不行，手上活交给入职不久的助理和实习生干不放心，客诉跟价、设券活动、各种报名审核，内部要沟通、外部要博弈，还有一些服从性测试，跟商家吵架是不可避免的。需要审视的，是这场大促背后的代价。财报显示，京东2026年第一季度营收3157亿元，同比增长4.9%；但归母净利润仅为51亿元，较2025年同期的109亿元同比下滑53.17%。这一跌幅创下了京东近五年来的季度利润新低。利润下滑的重要原因之一是营销费用同比大增45.8%，在“国补”政策边际效应递减下，一季度带电品类收入应声下滑8.4%，而日用百货商品收入虽有14.9%的增长，尚不足以弥补带电品类的缺口。与此同时，京东在2025年掀起的外卖大战留下了沉重的财务包袱。从2025年二季度到2026年一季度，京东新业务累计亏损高达557亿元。外卖、AI、国际化，都是被寄予厚望的新引擎，但从财报来看，投入压力正在集中释放。一季度外卖DAU及季度购买用户数同比虽然均增长超20%，但新业务（含京东外卖、京东产发、京喜及海外业务）经营亏损却从去年同期的13亿元扩大至103亿元，经营亏损率高达164.9%。2026年4月，京东因外卖平台商家资质审查合规问题，被国家市场监管总局处以罚没款约6.35亿元。越努力，越亏损。越创新，越承压。当低价从战术上升为战略，当“全网最低价”从营销口号变成一种信仰，京东正在为自己的路径依赖付出阶段性代价。而在行业彻底告别低价内卷的粗放竞争模式，转向技术赋能、体验升级、价值创造为核心的高质量发展阶段。对京东而言，真正难的不是把618再打成一场漂亮的战役，而是算清楚每一笔订单、履约和低价让利背后的成本账。

智观行业 6月22日

0 54,173 0

“看见”未来，也要“看见”边界（有事说事）

“看见”未来，也要“看见”边界（有事说事）周姝芸今年AI眼镜首次被纳入国家补贴范围，引来不少消费者体验和选购。智能眼镜行业迎来爆发式增长，稳居当下消费电子热门赛道。蔡宽元摄(人民视觉) 近日，某品牌智能眼镜用户社区中出现偷拍空乘并公开传播的视频，引发广泛关注。与此同时，电商平台上用于遮挡拍摄提示灯的“遮光贴”热销，高考考场将智能眼镜列入违禁物品名单，部分公共场所也开始限制佩戴相关设备入内。从产品设计到社会讨论，智能眼镜正在经历一场“信任考验”。智能眼镜突破了人们对传统拍摄设备的理解边界。过去，无论是手机、相机还是摄像机，拍摄行为往往有很强的可见性，被拍摄者能够察觉并作出回应。而智能眼镜将摄像头隐藏于日常穿戴设备之中，拍摄过程更加隐蔽，记录行为与日常行为之间的界限变得十分模糊。尤其是在人工智能、大模型等技术加持下，设备不仅能拍摄，还能识别、分析、存储和传播信息。这种能力提升带来便利的同时，也给公众带来对隐私泄露的担忧。诚然，智能眼镜有其潜力价值。从实时翻译到导航辅助，从会议记录到无障碍服务，不少智能眼镜的创新功能正改善我们的工作和生活体验。对产业发展而言，智能眼镜也被视为下一代重要的人机交互终端之一。问题不在于技术本身，而在于当技术快速突破时，相应的伦理规范和社会共识尚未同步建立。尤其在智能穿戴设备发展迅猛的当下，规范治理明显滞后，技术便利与风险管控之间就会出现较大失衡。如果一项技术的发展建立在削弱公众安全感的基础之上，即便功能再强大，也难以真正融入社会生活。技术越先进，越需要获得公众的信任；设备越贴近日常生活，越需要建立清晰的使用边界。因此对待智能眼镜，既不能因个别乱象而否定技术创新，也不能以创新之名忽视潜在风险。在产业快速发展的阶段，隐私保护和伦理约束应当被嵌入技术研发全过程。对于企业来说，主动承担主体责任，在产品设计上强化隐私保护机制。对于平台来说，要加强内容审核和社区治理，及时处置侵犯隐私的内容，完善投诉举报机制。对于监管部门而言，则应进一步细化相关制度规范，明确智能穿戴设备在公共场所使用的边界和责任，为行业发展划出清晰红线。科技创新的最终目的，是让生活更美好。创新跑得快，规则也要跟得紧，才能让技术真正服务于人，而不是成为新的焦虑来源。

智观行业 6月22日

0 66,119 0

这门“躺赚”的生意，要凉了？ “纯血Claude，免费试用，0.07倍率，速来”……今年以来，类似的广告帖如潮水般涌入短视频平台。在“0元学AI”和“AI副业赚钱”的讨论区里，AI中转站摇身一变，成了号称“2026年最赚钱”的草根生意，被亮眼流水吸引的用户不断涌入这个赛道。在各大社交平台上，用户对“被封号跑路”“付完钱服务质量下降”和“模型被偷偷替换”的声讨也随之而来。AI中转站站长唐科坦言，这些中转站“不太干净”，风险太高，触及灰色地带。乱象已引发监管层的关注。6月8日，国家安全部正式发布风险提示：当前“AI中转”市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用户隐私泄露与数据倒卖问题时有发生。部分“AI中转站”使用低配模型冒充高端模型，缩减算力供应，导致模型输出严重失真；有的甚至缺乏正规数据加密机制，私自截留用户数据倒卖给模型厂商用于系统训练。更有甚者，暗藏后门程序向用户设备植入恶意代码，借机窃取账号密钥与云端凭证，进行远程监控。近期，上海有一名AI中转站站长被公安机关依法刑事拘留，取保候审后公开发文称，曾用非法技术手段获取廉价大模型。由“二道贩子”堆积起的AI接口市场正在经历一场剧烈的合规风暴。对于广大用户而言，面对“白菜价”推广，或许更应警惕数据“裸奔”背后的“代价”。 AI插画/adan靠AI“躺赚”的站长慌了“现在只有具备相关营业资质的机构才能申请代理。”唐科近期收到了上游渠道商的通知，渠道商会对想要成为下游代理的申请者进行资质审查，若没有ICP（互联网信息服务备案），就不会下放权限。这意味着从事“大模型中介”这门生意的门槛迅速提高。唐科了解到，申请ICP的核心条件包括依法设立的公司、注册资金达标（省内100万元起）等，此外还需要专业人员、资金、安全保障措施以及前置审批文件等7项硬性指标。唐科在等待上游渠道商走向合规。他透露，新平台正在搭建中，最终接入的大模型将会获得官方授权。“价格肯定比那些薅羊毛的中转站要贵一些，但稳定且不掺假。”上个月，他看到“中转站站长被抓”的消息后，就意识到此前做AI中转站的路子可能行不通了。2026年5月，网名为“瓜皮”的上海AI中转站站长在技术社区发布了一份关停声明，透露自己因非法获取API模型，被上海警方刑事拘留37天，目前处于取保候审状态，“将来肯定会被判刑”，他已经退赔退赃，还要缴纳罚金，中转站没赚到钱，也无力赔偿用户充值款。这一消息在圈子里引起了轩然大波，唐科看到有同行紧急关停了经营数月的中转站。他告诉《中国新闻周刊》，这种非法的中转站生意并不复杂，就是批量注册或购买ChatGPT、Claude等境外大模型的订阅账号，攒成一个“号池”；在海外架一台服务器做跳板，把接口封装成标准API，再以远低于官方的价格转卖给国内用户。一套流水线运作起来，很多“二道贩子”喊出了“一杯奶茶钱兑换数百万Token”的口号。启动成本有多低？另一位中转站站长莫立测算，2000元到5000元就可以开张。这类开源项目已经把代理转发、计费系统、用户管理全部打包好，一行命令就能部署。不懂代码的人，照着教程也能当上中转站老板。此前有媒体公开报道，曾有一位在工厂车间打工的工人，照着教程用AI搭建了一个网站，套上New API框架，居然真的接到了客户。连“vibe coding”这个词，都是他入行后才查明白的。最终，他的站点平均每天有上千元到上万元的充值流水。莫立认为，市面上大部分中转站不靠谱，于是选择自己搭建中转站。他做的开源项目最终是通过将一个账号分给多人使用来赚取差价，最多的时候一个账号一天之内能够调度给几十个人使用。他认为这种方式并不违法。莫立表示：“不是中转站本身违法，而是走黑灰产路数的这批人使用的技术手段违法。通过逆向官方协议伪装请求，大量通过实名手机号批量注册账号甚至盗用信用卡信息薅各大平台免费羊毛，最终打包销售的中转站站长，都很危险。”危险的价格战“同行都对价格极为敏感，不打价格战就无人问津。”莫立说道。许多竞争对手以免费额度当作日抛号售卖，价格低至 0.03 倍率。他解释道，倍率是业内术语，站长们常提及的“倍率”，本质上就是 API 中转站的价格折扣系数。在这个体系中，中转站会先设定一个“基础价格”，倍率表示的是实际消耗Token的速度。举例而言，每消耗官方价值1美元的 Token，你账户里只需扣除价值0.1美元的额度，也就是说，结算价格仅为官方价的10％。“倍率越低，价格越便宜。”“根据经验，成本低于官方售价十分之一，基本走的就是黑灰产路线。”莫立分析认为，价格压低至官方一折甚至更低，站长仍能盈利，大概率是通过不正规渠道获取接口，本质上这门生意赚取的就是价格差。加州大学圣塔芭芭拉分校在读博士刘涵之曾为方便使用中转站，这些中转站价格实惠且触达便捷。然而在使用过程中，她发现诸多中转站的反馈结果存在问题：“有中转站宣称接入的是某个官方模型，但返回格式、错误信息、元数据都与官方接口不一致。这种现象本身不一定说明存在问题，但至少表明中间层并非完全透明的管道。”于是，刘涵之与所在研究组对400多个中转站进行测评，系统性地揭露中转站已成为AI Agent领域最致命的中间人攻击点：9个站点已主动注入恶意代码；1个站点直接侵入研究者的ETH钱包，损失高达50万美元；累计处理超过21亿Token流量；暴露99个真实凭证；401个Agent会话处于安全风险完全失控状态。刘涵之表示，目前的研究规模足以说明：这并非个别小站的问题，而是一个相当庞大但透明度极低的灰色基础设施市场的问题。低价、免费甚至部分付费中转站的监管缺失，加剧了使用风险。在海外担任中转站站长的苏宁，目睹过更为危险的操作：“很多中转站会在返回代码中夹带恶意指令，上传恶意脚本，用户不假思索直接执行，电脑就会被黑。有的恶意程序不会立刻使电脑瘫痪，而是潜伏许久后才激活。”上海曼昆律师事务所刑事部负责人邵诗巍总结道，免费额度转卖、退款套利、虚报Token和调包模型是较为常见的灰色手段，甚至有人会向站长购买数据。“有人将用户的完整对话记录，尤其是编程场景下的代码、推理过程、工程决策等高质量的训练数据，打包卖给模型厂商。中转站为何如此便宜？其实是靠售卖数据盈利。”邵诗巍分析，境外平台的鉴权机制（如 Token 验证、设备指纹、IP 限制）是平台设定的技术保护措施，通过逆向工程绕过这些措施，在我国刑法框架下可能被认定为“侵入计算机信息系统”，或者被认定为“提供用于侵入计算机信息系统的工具”。月流水 50 万、用户过万的中等规模站长，将面临 3 到 7 年的刑期。数据安全是最需警惕的红线。邵诗巍表示，数据安全法、个人信息保护法没有“规模小即豁免”的条款。中转站将用户输入的代码、合同、对话记录路由到境外服务器，构成数据出境，达到一定规模，须履行安全评估、订立标准合同或通过认证，否则有可能涉嫌侵犯公民个人信息罪。“大玩家”开始入场根据海外AI模型聚合平台OpenRouter的最新数据测算，6月1日至7日，全球AI大模型总调用量达到36.1万亿词元，较前一周增长13.5％，已连续七周呈上涨态势。其中，中国AI大模型周调用量达14.19万亿词元，环比增长27.49％，连续三周实现增长。从数据来看，算力市场的热度依旧不减。曾被普遍视为“草根营生”的AI中转站，如今也成为资本追逐的热点。早在5月底，OpenRouter宣布完成1.13亿美元的B轮融资。据外媒报道，该公司融资后估值飙升至13亿美元。其创始人Alex Atallah早在2023年就看中了这门生意，将市面上主流的开源和闭源模型接入同一个网关，开发者通过一个接口就能调用超过400款模型，涵盖OpenAI、Anthropic、Google、DeepSeek、腾讯、阿里等大模型厂商。每次调用时，平台会抽取5％的费用。刘涵之分析，开发者此前使用中转站的主要原因，一是为了方便。不少开发者希望同时使用多个模型，但官方接口在账号、付款、额度、地区访问等方面存在门槛。中转站将这些整合为一个统一入口，对个人开发者和小团队而言确实省事。二是为了低价。过去官方模型价格较高，中转站会通过不同方式降低价格，对于大量调用模型的人来说颇具吸引力。然而，为争夺客户并应对竞争压力，主流大模型开始密集降价。OpenAI正考虑大幅下调其API代币价格，DeepSeek宣布V4 - Pro模型永久2.5折，百万Token输出价格为6元。“如果中转站仅靠低价，其价值相较于以往会更低。相反，安全性、稳定性、合规性将变得更为重要。”刘涵之判断，中转站的需求仍会存在，但仅依靠低价转卖的模式将越来越难以为继。在国内，一批算力超市正在兴起。据媒体报道，普惠化、可共享的“算力超市”的算力来源多样，用户选好产品后，“超市”负责匹配、调度和交付，其最终目标是让中小AI企业能够按需灵活获取算力资源。一位聚合平台创业者表示，自去年进入该领域，目前已接入300多款模型，均获得官方授权。邵诗巍指出，若想打造合规的AI模型聚合平台，创业者需申请ICP等许可证，并与国产大模型厂商签订官方代理协议。但她强调，境外大模型目前尚无完全合规的途径。Claude、GPT等产品本身在中国大陆没有合法代理渠道，“无论如何包装，本质问题无法改变”。苏宁意识到，安全、合规才能让生意长久。她已将重心从文字模型转向视频和生图领域，短剧、MCN机构、游戏公司的需求正呈现爆发式增长。“针对这些用户开发一些工具，帮助他们更好地进行创作，售卖服务将是中转站生意未来的发展方向。”刘涵之则认为，未来中转站若想保持价值，不能仅仅局限于转卖词元。它必须提供官方接口所不具备的能力，如多模型统一管理、预算控制、缓存优化、私有化部署、企业账单等，灰色中转站需转变为可信的模型网关。（文中唐科、莫立和苏宁为匿名）发于2026.6.22总第1240期《中国新闻周刊》杂志杂志标题：AI中转站，面临整治“风暴”记者：孟倩（616676485@qq.com）编辑：闵杰

智观行业 6月22日

0 45,557 0

今秋发布！微软正式官宣Windows 11 26H2：2分钟完成更新、硬件要求没变化

今秋发布！微软正式官宣Windows 11 26H2：2分钟完成更新、硬件要求没变化快科技6月21日消息，微软今天正式官宣确认，Windows 11 26H2版本将在2026年秋季面向全球用户推送，按照以往的发布节奏，这个上线时间大概率会落在10月前后，延续此前保持多年的年度功能更新惯例。和2025年上线的Windows 11 25H2定位完全一致，26H2依旧不属于重量级大版本迭代，后续不会打包大量全新功能推送给用户，而是通过体积仅约200KB的启用包形式下发给存量设备，核心作用只是翻转系统的版本号和内部构建编号，不会带来具备突破性的大规模新功能改动。对于已经在运行Windows 11 24H2或者25H2版本的存量设备来说，升级到26H2的过程几乎完全无感。这类启用包的整体体积普遍不超过500KB。绝大多数场景下的安装时长仅需要2分钟左右，全程只需要一次重启操作，升级完成后用户几乎看不到任何界面层面的可见变化，相当于后台悄无声息完成了版本迭代。在后续系统服务周期方面，26H2依旧沿用Windows 11近年一直落地的标准支持政策，面向家庭版、专业版、专业教育版以及工作站专业版的服务更新将持续到2028年10月，用户在这段周期内都能正常收到官方推送的安全补丁和常规功能优化。硬件准入门槛上，如果你的设备已经可以流畅运行Windows 11 24H2或者25H2版本，后续升级到26H2不会遇到任何额外的准入限制。微软官方同步确认，26H2不会新增任何新的硬件适配门槛，依旧沿用Windows 11推出时设定的基础要求，设备需要至少搭载4GB内存、64GB存储空间，搭配主频1GHz及以上的64位双核处理器，同时满足Windows 11既定的安全与平台相关校验规则。这也意味着所有当前符合Windows 11运行条件的存量设备，在26H2正式推送之后都可以顺畅完成升级操作，用户完全不需要为了新版本特意更换整机硬件。

智观行业 6月21日

0 79,584 0

马斯克旗下AI助手Grok正式登陆CarPlay

马斯克旗下AI助手Grok正式登陆CarPlay 来源：环球网【环球网科技综合报道】据海外科技媒体iphoneislam报道，xAI 的AI 助手 Grok 终于不再局限于特斯拉汽车，而是正式加入支持 CarPlay 的车载阵营。在经过一段时间的等待和多次预告之后，xAI 终于在 iOS 平台上为 Grok 应用开通了 CarPlay 功能，用户可以在驾驶过程中直接通过语音与 AI 对话，无需触碰手机。在此次更新之前，在 CarPlay 屏幕上打开 Grok 应用只会看到一条“即将推出”的提示。而现在，你可以在车载中控屏幕上直接向 Grok 提问、获取信息，进行实时互动。这一改变极大地拓宽了 Grok 的用户基础，因为它不再绑定特斯拉生态，而是面向数以百万计使用 CarPlay 的车主开放。这一举措恰逢科技行业经历深刻变革的关键时期。消息不仅关乎软件层面，还延伸到芯片制造领域的合作——例如苹果与英特尔近期达成的协议，旨在提升未来设备的算力，为更复杂的 AI 应用铺平道路。Grok 登陆 CarPlay 并非巧合，而是得益于苹果在 iOS 26.4 更新中推出的新政策，该政策允许第三方语音聊天应用出现在车载屏幕上。当然，开发者需获得苹果特别授权，并遵循经核准的界面模板，以确保不会分散驾驶员的注意力。苹果的更新不止于汽车领域。公司还在强化娱乐服务，比如在 Apple TV 上推出全新纪录片，聚焦体育界的励志故事。这显示出苹果正试图渗透用户日常生活的方方面面。（勃潺）

智观行业 6月21日

0 6,615 0

对话丨被AI震动的两年人生，数学博士生的新难题：如何证明自己？

对话丨被AI震动的两年人生，数学博士生的新难题：如何证明自己？那些曾需要数年才能攻克的数学难题，如今正被AI以惊人的速度破解。卡耐基梅隆大学的博士生哈里哈兰近期发现，他和团队在过去两年钻研并即将收尾的项目，被一家AI公司利用大模型“抢先发表成果”，且该公司宣称AI的用时仅为5天。当“数学天才”都不再稀缺，人类智慧最引以为傲的边界还剩下什么呢？澎湃新闻记者和哈里哈兰聊了聊。澎湃新闻记者马栎程

智观行业 6月21日

0 88,357 0

中信建投：国内模型崛起多模态场景反超关注算力、云产业等高景气方向

中信建投：国内模型崛起多模态场景反超关注算力、云产业等高景气方向智通财经APP获悉，中信建投发布研报称，2026年，计算机板块正迎来基本面修复与AI范式转移的共振拐点，模型能力迭代未见上限，Claw类应用渗透率快速提升，国内算力需求陡增，AI infra走进新阶段。国产大模型步入密集爆发期，能力高位收敛，全线挺进全球第一梯队。大模型能力增强提升渗透率，推动Token指数级增长。下半年建议关注：1)AI产业建议从需求维度出发，关注涨价、缺货的算力方向、提效的infra与云产业、部分景气度高的应用方向。2)非AI产业的投资建议关注政策催化下的数币2.0、智驾以及商业航天等政策催化机会。中信建投主要观点如下：海外模型三足鼎立，商业化战略分层海外大模型格局已基本集中于OpenAI、Anthropic和Google，三者在底层模型的迭代方向上已呈现出一定程度的分层：OpenAI：战略重心向B端商业化倾斜，加速构建系统级Agent生态。过去OpenAI更追求AGI，但面对另外两家竞对尤其是Anthropic在ARR与估值的反超，已逐步向B端适配倾斜。其中，GPT-5.5深化长周期复杂任务执行能力为基础，更试图借助全面升级的Codex实现对终端操作系统的底层接管与自动化调度。同时，原生推理视觉模型GPT Image 2的推出，也标志着其在多模态领域全面补齐短板。Anthropic：巩固B端壁垒，冲击模型智能上界。凭借早期在代码及合规方面的布局，Anthropic已成功在金融、医疗等高门槛企业级市场建立用户粘性与商业化壁垒。在确立B端基本盘后，Anthropic也开始探索智能边界。顶级模型Mythos在网络漏洞挖掘等复杂场景中展现出颠覆性能力，验证了模型能力的加速突破，更通过极高的溢价策略证明了顶尖智能的价值。Google：依托生态壁垒，实现全矩阵布局。谷歌凭借底层算力基础设施与YouTube等高质量视频数据生态，始终保持着最完善的模型矩阵。从通用基座Gemini、视频模型Veo、图像模型Nano Banana，到端侧小模型Gemma及世界模型Genie，谷歌已完成全赛道的覆盖。通过算力统筹与技术降本，谷歌有望凭借性价比优势，加速AI能力在千行百业基础设施中的全面渗透。OpenAI： GPT系列逐步优化B端场景应用，Image-2补齐多模态能力。OpenAI 4月24日发布最新旗舰模型GPT-5.5。作为全新旗舰模型，GPT-5.5在推理精度、复杂任务规划及系统级自治能力上实现了对当前行业基准的全面超越。在衡量复杂命令行与代码流的Terminal-Bench 2.0测试中，GPT-5.5准确率达到82.7%，相较前代GPT-5.4提升超7个百分点，大幅领先Claude Opus 4.7的69.4%；在评估真实专业知识工作流的GDPval测试中，GPT-5.5亦取得84.9%的成绩，超越了垂直行业专家基线。此外，在考验模型独立操作真实计算机环境的OSWorld-Verified评测中，其准确率达到78.7%，标志着其在跨应用协同操作能力上亦已追平Opus 4.7。长上下文与复杂任务执行能力大幅跃升，自我优化潜力显现。从案例测试看，GPT-5.5自主拆解、多步推理及自我代码审查与纠错能力较强。在面对前端应用开发、3D引擎渲染(如WebGL/Three.js应用重构)及高难度数学证明(如在纯数学领域协作发现拉姆齐数的新证明路径)等复杂任务展现出较好的表现。在超长上下文处理方面，GPT-5.5支持400K-1M上下文，在MRCR v2(512K到1M长度)测试中准确率高达74.0%，显著优于Claude Opus 4.7的32.2%。此外，OpenAI在技术披露中指出，GPT-5.5驱动的Codex系统已能够分析底层数据中心的生产流量日志，并自主编写负载均衡启发式分区算法，使系统Token生成速度提升逾20%,已反应模型自我优化潜力。商业化路径逐步清晰，高Token效率+Agent能力突破助力B端部署。在定价策略上，GPT-5.5 API输入与输出定价分别为5美元与30美元每百万Token。虽然绝对单价较前代翻倍，但得益于极高的Token利用效率，其完成单次复杂任务的实际Token消耗量显著减少，整体系统运行成本反而具备优势——据Artificial Analysis的智能指数，GPT5.5在成绩最高的同时，其成本仅为同类前沿编码模型的一半；在内部benchmark测试中，GPT-5.5较GPT-5.4在相同表现下消耗Token数同样更低。此外，GPT-5.5的Agent能力同样得到了大幅突破，在官方测试中，GPT-5.5可以在真实终端环境中连续运行接近10小时，完成从任务拆解、执行到调试交付的完整流程，有望更好助力B端场景落地。 Image 2重塑视觉生成范式，原生推理架构建立断层式技术优势。OpenAI 4月21日推出全新视觉基座模型GPT Image 2，上线即以创纪录的241分优势绝对登顶Text-to-Image Arena等核心榜单。在底层架构上，该模型打破传统扩散模型路径依赖，首次引入原生推理机制，使模型在渲染前具备自主检索、推演布局与内容自检能力。核心指标方面，其彻底攻克多语种密集文本渲染难题，准确率推升至99%，并具备生成复杂几何证明图解、长文本精确排版及最高3840像素动态分辨率重构的极强工程水准。 Anthropic：Claude系列持续迭代，Mythos探索智能上界。Opus 4.7实现视觉与Agent自主能力的跃升，高价值垂类场景有望突破。4月16日，Anthropic发布最新商业级旗舰模型Claude Opus 4.7。在核心能力上，Opus 4.7在多项复杂工程与知识工作基准中取得突破，其SWE-bench Pro得分从前代的53.4%跃升至64.3%(超越GPT-5.4的57.7%，亦高于后续发布GPT-5.5的58.6%)。在Agent领域，模型不仅在Finance Agent evaluation中实现SOTA，更在衡量金融、法律等高实际经济价值知识工作能力的第三方评测基准GDPval-AA中达到业界顶尖水平。此外，模型视觉感知能力实现代际飞跃，支持最高2576像素长边的图像(约375万像素，分辨率达前代3倍)，XBOW视觉敏锐度基准得分从54.5%飙升至98.5%，为依赖精细视觉细节的多模态应用如界面重构、复杂图表解析等打开了空间。加码企业级长周期任务，精细化Token控制优化商用ROI。定价方面，Opus 4.7维持了前代Opus模型每百万Token 5美元/25美元的输入/输出价格。为匹配日益复杂的B端工作流，Opus 4.7引入了“自我验证”机制，能够在长周期任务交付前自主审阅与纠错。同时，Opus 4.7推出了针对深层代码审查的ultrareview功能，并将支持无间断执行的Auto Mode下放至MAX用户。据Notion团队反馈，接入Opus 4.7后其整体性能提升14%，工具调用出错率下降约三分之一。为应对新Tokenizer(相同的输入内容，token数量会比以前多出约0% 到35%)及新增的xhigh推理档位带来的潜在Token消耗增长，Anthropic同步开放了任务预算功能，允许企业在长任务中精细化管理Token支出，进一步完善了B端商业化的成本可控性。 Mythos编程能力跃升突破，展现颠覆性网络安全漏洞挖掘能力。区别于常规商业迭代，Anthropic于4月7日官宣了未向公众开放的顶级模型Claude Mythos Preview。据悉，该模型参数规模或达到10T，且在以编程能力为代表的基准测试中呈现出突破式跃升。其中，SWE-bench Verified得分高达93.9%(较Opus 4.6提升13.1%，亦高于Opus 4.7的87.6%)，SWE-bench Pro得分达77.8%(高于Opus 4.6的53.4%和Opus 4.7的64.3%)，Terminal-Bench 2.0亦达到82.0%(高于Opus 4.6的65.4%和Opus 4.7的69.4%)。更为关键的是，Mythos展现出极强的自主漏洞挖掘能力，在几周内成功挖出数千个高危0day漏洞，包括隐藏27年之久的OpenBSD远程崩溃漏洞及16年前的FFmpeg边界漏洞，其以美元计价的漏洞发现效率据测算达前代模型的10倍。成立Project Glasswing联盟，极高定价印证顶尖算力的极高商业价值。鉴于Mythos带来的系统级网络安全风险，美财政部与美联储甚至举办针对系统性金融风险的紧急会议，而Anthropic亦选择暂缓向公众开放，转而联合AWS、微软、谷歌等12家核心大厂及40余家关键基础设施组织成立Project Glasswing联盟，旨在为防御方争取6-18个月的安全加固窗口期。在定价侧，Mythos Preview向受邀机构开出了每百万Token 25美元/125美元的输入/输出的极高价格，达到Opus 4.6/4.7的5倍，持续验证了模型智能上界突破带来的价格上行趋势。 Google：模型矩阵丰富，全面布局各类场景。Gemini 3.1 Pro核心推理能力升级，稳固全模态与复杂任务解决优势。谷歌于2月20日发布新一代旗舰模型Gemini 3.1 Pro。在衡量前沿抽象推理能力的ARC-AGI-2测试中，该模型以77.1%的准确率大幅领先竞品，相较Gemini 3.0 Pro的31.1%实现翻倍跃升。在代码与Agent领域，其LiveCodeBench Pro得分达2887，并在评估第三方任务执行能力的MCP Atlas测试中以69.2%的成绩领先。此外，Gemini 3.1 Pro在3D空间推理与复杂图形生成方面取得突破，仅需文本指令即可快速生成高质量、带交互的SVG动态图形，且原生支持百万Token超长上下文，MRCR v2大海捞针准确率达84.9%，进一步巩固了其在复杂逻辑推理与全模态输入领域的头部地位。从应用案例看，Gemini 3.1 Pro自然语言编程与应用生成能力较强。通过Vibe Coding范式，用户不仅能生成动态可视化图表，更能在数分钟内定制专属高级应用软件，显著降低复杂工作流的开发门槛。定价方面，Gemini 3.1 Pro API维持了与上代一致的平价策略，百万Token输入与输出分别为2美元和12美元，展现出较高的性价比优势。目前该模型已全面接入Google AI Studio、Vertex AI及面向消费者的Gemini App和NotebookLM，全面服务用户各类需求。模型布局全面：多模态、端侧小模型与世界模型构建护城河。除Gemini系列外，谷歌全面布局模型矩阵。图像生成领域发布Nano Banana 2，以极低算力成本提供旗舰级画质，并在复杂文本渲染与高保真度上实现突破；视频生成领域更新Veo 3.1，大幅增强对音频与叙事逻辑的精细化控制，并支持最长148秒的连贯视频延展，进一步打通AI影视制作工作流；端侧与开源领域推出Gemma 4系列并全面切入Apache 2.0协议，其26B MoE与31B Dense版本性能比肩千亿级闭源模型，极小参数版本原生支持边缘设备完全离线运行，有望打开端侧AI的商业空间；世界模型领域推出Genie 3，率先落地生成式交互环境，从底层颠覆传统游戏化编码至渲染的开发逻辑，提前卡位游戏、工业等场景AI需求。国内模型崛起，多模态场景反超通用模型：进入密集发布期，迭代加速国产大模型步入密集爆发期，能力高位收敛，全线挺进全球第一梯队。据Artificial Analysis统计，今年以来，国内头部厂商如阿里(09988)、DeepSeek、Kimi、MiniMax、小米(01810)、智谱(02513)等的模型迭代速度显著加快，并在多模态输入、长上下文窗口、长周期复杂任务执行、代码能力上补齐短板。同时，通过压缩方式、注意力机制等底层架构方面的创新，国产模型在SWE-Bench Pro、GDPval等核心基准上追平甚至反超GPT-5.4与Claude Opus 4.6等海外头部模型的同时，亦展现出相当程度的Token性价比。能力+性价比有望构成国产模型在AI商业化落地下半场中的技术壁垒。 MiniMax：3月18日推出M2.7模型，核心聚焦于“模型的自我进化”。通过创新引入Agent Harness与Agent Teams架构，模型能够自行构建生产力任务并进行基于强化学习的底层参数迭代。在专业办公与任务交付领域，M2.7在GDPval-AA测评中以1495分位列开源模型第一；其具备原生的Office套件(Excel/PPT/Word)复杂编辑能力，在超40个复杂技能调用(>2000 Token)场景下，指令遵循率高达97%。此外，模型在端到端项目交付(VIBE-Pro 55.6%)及复杂系统深层理解(Terminal Bench 2 57.0%)中均达到行业前沿水平。智谱：4月8日开源的GLM-5.1实现长达8小时的纯自主闭环工作流，且首次解锁开源模型与当时全球顶尖闭源模型Claude Opus 4.6的全面对齐。其中代码能力方面，在业内最具代表性的三个代码评测基准(衡量模型专业软件开发工作的SWE-Bench Pro、操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo)的平均结果上， GLM-5.1取得全球模型第三、国产模型第一、开源模型第一的表现。尤其在SWE-Bench Pro基准测试中，GLM-5.1以58.4的得分强势登顶第一，超越Claude Opus 4.6的57.3分和GPT-5.4的57.7分。 Kimi：4月20日发布并开源K2.6模型，带来代码执行与集群能力的全面跃升。在单体Agent能力上，模型以58.6的得分登顶SWE-Bench Pro榜首；在集群协同上，K2.6架构原生支持高达300个子Agent并行完成4000个协作步骤，并支持长达5天的持续自主运行。依托官方自研的M3 Max大模型推理引擎，K2.6深度重构了核心线程拓扑结构，使其峰值吞吐量从1.23 MT/s大幅跃升133%至2.86MT/s。此外，其在前端UI全栈自建水平上展现出显著优势，在专门创建的前端开发设计基准测评Kimi Design Bench上的胜率大幅领先Gemini 3.1 Pro。阿里巴巴：4月20日通义千问发布新一代旗舰模型早期预览版Qwen3.6-Max-Preview，重点提升了智能体编程能力(和前代相比，SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识储备(和前代相比，SuperGPQA +2.3、QwenChineseBench +5.3)与指令遵循(和前代相比，ToolcallFormatIFBench +2.8)表现。在权威第三方评测Artificial Analysis最新榜单中，该模型综合性能登顶国产模型榜首，超过GLM5.1、MiniMax-M2.7等模型。在工程化部署侧，阿里云百炼API同步首发了preserve_thinking功能，允许在消息流中保留前序轮次的思维内容，专门针对复杂的智能体多步连续执行任务进行了底层状态维护与可靠性增强。小米：4月23日，小米正式发布MiMo-V2.5系列基座大模型。其中MiMo-V2.5-Pro专为长难Agent任务打造，具备1M超长上下文窗口，在通用智能体能力、复杂软件工程以及长程任务等维度上已能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型相媲美。据官方测试，MiMo-V2.5-Pro在从零构建SysY编译器及模拟电路EDA(FVF-LDO)设计等重度测试中表现优异，综合实力逼近全球顶尖闭源模型。此外，该系列在全模态感知实现全线跨越的同时，重点对Token使用效率进行了深度优化。在达到相同Agent基准榜单ClawEval分数情况下，MiMo-V2.5-Pro相比Kimi K2.6节省了42% Token，MiMo-V2.5相比Muse Spark节省了50% Token；配合夜间专属优惠及不区分上下文窗口的API统一定价策略，大幅优化了企业级客户的商业化调用成本。 DeepSeek：4月24日，DeepSeek-V4正式发布，包含Pro(总参数1.6T，激活49B)与Flash(总参数284B，激活13B)两个版本，原生支持1M上下文长度。在公开测评集表现上，DeepSeek-V4确立开源新标杆，紧逼顶尖闭源模型。在知识与推理维度，V4-Pro在MMLU-Pro测试中得分达87.5%，在编程竞赛基准Codeforces中获得3206的Rating评分，不仅大幅领先开源竞品，更比肩甚至局部超越了GPT-5.4(3168分)与Gemini 3.1 Pro(3052)。在长文本领域，其MRCR 1M(百万上下文多海捞针)准确率达83.5%。在Agent复杂任务基准中，V4-Pro在SWE Verified(80.6%)、Terminal Bench 2.0(67.9%)以及贴近真实商业场景的GDPval-AA(1554分)评测中，展现出极强的端到端执行与工具调用能力，稳居全球第一梯队。核心技术方面，DeepSeek-V4主要实现了CSA、HCA与mHC三项关键技术创新，大幅压缩KV Cache节省Token计算量的同时，保证了模型训练的稳定性。此外，在后训练阶段，V4放弃了传统的RLHF，转而采用多教师同策略蒸馏与生成式奖励模型，有效避免了传统强化学习导致的对齐税(对齐带来的模型降智)及模型通用能力退化现象，实现了模型多维能力的高度均一化。多模态模型：工程化产物，国内产品后来居上字节跳动与MiniMax原生多模态矩阵布局完整。作为国内最早在多模态领域完整布局的厂商，字节跳动与MiniMax持续深化其全模态产品矩阵。其中，字节跳动于2月12日正式更新Seed2.0与Seedance2.0，前者深度融合LLM与Agent功能，在视觉推理与动态场景理解等测试中达到SOTA水平；后者则依托原生统一架构，实现音、画、文本的深度协同生成，支持多镜头长叙事与原生级声音画同步，在动作一致性与物理规律遵循上展现出极高的工业级标准。MiniMax通过视频模型Hailuo、语音模型Speech及音乐模型Music 2.6构建了完整的多模态布局。其中，Hailuo 2.3在肢体动作呈现与人物微表情方面实现显著提升；Speech 2.6将端到端延迟降低至250毫秒内，并提供高保真的Fluent LoRA音色复刻；Music 2.6则在乐理结构理解与指令控制上取得突破，全面支持BPM、Key及段落结构的精细化编排；三者协同配合，极大降低了复杂多模态内容的创作门槛。大厂全面补齐多模态能力。国内其他大厂通用在多模态发展浪潮下加速补齐能力版图。其中，智谱AI联合华为开源了首个基于国产算力底座(昇腾800T A2+昇思MindSpore)训练的多模态SOTA模型GLM-Image，采用自回归+扩散解码器架构，在复杂文字渲染(CVTG-2K)榜单取得开源第一，验证了国产全栈算力在多模态大规模训练上的可行性。阿里巴巴ATH创新事业部推出原生多模态视频生成模型HappyHorse，不仅实现电影级的叙事质感与极强的指令遵循，更以720P低至0.44元/秒的价格彰显极致性价比。DeepSeek则在最新技术论文中提出多模态理解新思路，针对多模态模型普遍存在的指代鸿沟(模型难以精准指出画面的中的物体)问题，DeepSeek首创将边界框与空间坐标点作为视觉原语离散化，并直接嵌入大语言模型的思维链中，实现了跨模态的精准空间锚定。底层计算层面，该模型依托284B参数/13B激活的MoE主干与自研ViT，创新性引入压缩稀疏注意力机制(CSA)，将视觉Token经过空间级联压缩，实现高达7056倍的极端压缩率(单张756×756图片仅占用81个KV Cache条目)。在后训练阶段，团队通过先专家、后通用的在线策略蒸馏及针对性设计的GRPO强化学习机制，使模型在拓扑推理及细粒度计数等基准测试中，对GPT-5.4与Claude Sonnet 4.6等顶尖闭源模型形成断层式领先。多模态赛道竞争白热化，国内视频生成模型实现霸榜反超。据LlmArena排行榜数据，在图像生成与编辑领域，美国头部大厂暂处领先，OpenAI的GPT-Image-2与谷歌的Gemini 3.1系列包揽了双榜单的前五名，而国内模型如Qwen-image 2.0(文生图第9名)与字节Seedream 4.5(图像编辑第10名)亦成功跻身全球Top 10阵列，保持着极强的追赶态势。而在视频生成与编辑领域，国产模型已实现对海外巨头的反超。字节跳动的Seedance 2.0与阿里的HappyHorse 1.0凭借原生多模态架构的优势，强势包揽了文生视频、图生视频以及视频编辑三大核心榜单的全球冠亚军，将谷歌Veo 3.1、OpenAI Sora 2 Pro及xAI的Grok均压制在其后；此外，快手Kling系列在视频编辑榜单中亦稳居前列(第4与第6名)。大模型能力增强提升渗透率，推动Token指数级增长全球大模型智能水平呈陡峭上升，中美双模型能力差距持续缩小。正如2.1和2，2中提及的，中美大厂模型均快速迭代，对应模型能力加速跃升。参考Artificial Analysis大模型智能指数，自2022年底以来，美国模型智能指数持续增长，且呈现加速趋势，重大能力迭代的时间窗口持续缩短。同时，国内大模型则自2023年下半年起加速，在短时间内大幅缩小了与美国头部模型的差距。随着时间推移，中国开源模型能力有望持续逼近海外头部模型能力。模型密度法则显现，算力向能力转化的效率步入指数级爆发阶段。模型能力跃升不仅依赖算力堆叠，底层算法效率的突破同样推动模型智能上界突破。清华大学团队最新研究揭示，大模型领域已呈现出显著的密度法则(Densing Law)，即模型能力密度随时间呈指数级增长，开源大模型的最大能力密度约每3.5个月即可实现翻倍。此外，自ChatGPT发布以来，受资本密集投入与高质量数据工程驱动，模型能力密度的增长斜率较此前大幅提升约50%。这意味着，在同等参数规模及算力消耗下，模型性能上限正以前所未有的速度被打破。算法效率的极速提升不仅实质性优化了端侧部署与推理成本，更为下游大规模调用Agent工作流及执行复杂长周期任务提供了充足的底层支撑。基于模型密度法则，研究团队进一步揭示了算力效能提升在商业化应用端的两大方向：1)模型推理成本将呈断崖式下降趋势，为AI高频调用提供基础。模型能力密度快速上升，达到特定智能所需的实际参数量呈现指数级缩减。反映在商业端，同等性能大模型的API调用价格呈现出比模型能力更陡峭的下降斜率(但智能上界模型则价格或将提升)。实证数据显示，跑赢GPT-3.5性能基准的模型 API 价格约每 2.5个月即可实现折半。例如，Gemini-1.5-Flash每百万Token定价较2022年底已累计暴降逾266倍。2)密度法则+摩尔定律共振，算力普惠向端侧延伸。密度法则反映了软件算法层面的效率迭代，而摩尔定律(同价位芯片算力约2年翻倍)则框定了硬件的物理进步。两者叠加产生的乘数效应，使得在同等价格消费级端侧芯片上，能流畅运行的模型规模加速提升，约每88天即可实现翻倍，为当前AI PC、AI手机及IoT设备在本地低功耗跑通高阶大模型提供了坚实的底层技术可行性。全球大模型应用Token调用量陡峭上行。过去的几年里，AI应用token消耗量加速上行，主要系模型能力的持续提升拓宽了多模态处理与长文本能力边界，同时Agent工作流的普及使得单次指令转化为模型内数十次复杂循环调用。以谷歌为例，2024年4月谷歌月token消耗量仅9.7万亿，一年后的2025年4月即提升50x至480万亿，同年7月和10月更是分别达到980和1300万亿； 2025年12月，谷歌第一方模型在通过客户直接API调用部分，每分钟消耗量已突破100亿Token，折合月度总量高达4320万亿Token。微软此前也披露，Azure AI基础设施在2025年一季度处理了超100万亿Token，较2025年同期暴增5倍，其中仅3月单月的Token调用量即高达50万亿。国内字节豆包的日均token调用量增长同样陡峭，2024年5月首次披露时仅1200亿，2025年12月已达到50万亿，较2025年5月的16.4万亿增长超过200%；2026年3月，豆包大模型日均tokens使用量更是突破120万亿，较2025年12月的63万亿在三个月翻了一倍。整体而言，全行业的Token消耗飙升标志着AI应用正从低频的单次辅助交互向高频复杂工作流发展。风险提示：应收账款坏账风险；行业竞争加剧；国际环境变化影响。

智观行业 6月21日

0 34,084 0

微信AI助手“小微”灰度上线；小米“寻天”SUV原型车再曝光

微信AI助手“小微”灰度上线；小米“寻天”SUV原型车再曝光 “IT早报”时间，大家好，现在是 2026 年 6 月 21 日星期日，今天的重要科技资讯有：1、提升流畅度：谷歌安卓 17 给 App 内存占用套上“紧箍咒” 科技媒体 Android Authority 6 月 19 日发布博文，指出在安卓 17 系统更新中，谷歌为 Pixel 10 等设备带来 4 项隐藏改进，包括自动终止内存占用过高 App 等。2、微信 AI 助手“小微”灰度上线，可通过文字或语音对话操作微信原生功能微信原生 AI 助手“小微”开始扩大灰度测试范围，支持通过对话操作微信功能、调起小程序，并实现“一句话生成小程序”。该功能旨在打通微信生态，为用户提供跨场景的智能服务。 3、小米“寻天”SUV 原型车再曝光，自带车顶帐篷汽车博主 @SugarDesign 6 月 20 日发布微博，分享了一张图片，展示了展开车顶帐篷后的小米寻天测试车，并调侃称“Loft 有了”。 4、微软官宣今秋上线 Win11 26H2 更新：启用包方式推送，硬件要求不变微软 6 月 20 日发布公告，宣布将延续 25H2 更新模式，于 2026 年秋季通过启用包（eKB）方式发布 Windows 11 26H2 更新。5、“大学生维权”促使海南航空修改运输规定：只要航司原因造成航班提前，无论时长多少都能全额退票一名大学生因航班提前 10 分钟导致额外住宿花费，起诉海南航空。最终海航不仅赔偿其费用，还承诺修改运输总条件，取消了航班提前 15 分钟才能免费退改的门槛。此事引发行业连锁反应，天津航空、春秋航空等也已跟进调整规则。6、SK 海力士大规模招聘引发行业巨震，中小规模芯片企业“深感不安” 业内消息人士透露，SK 海力士正通过面向新员工的滚动招聘项目招募数百名设计工程师，申请将于 6 月 23 日截止。单独针对设计岗位展开如此大规模招聘，在业内极为少见。7、高通 CEO 安蒙：智能眼镜市场有望比肩手机在各种新设备中，安蒙目前最看好智能眼镜。他预计，智能眼镜最终可能发展到与智能手机相当的规模。据IT之家了解，去年，全球智能手机出货量超过 12 亿部。8、本田推出纯电“小钢炮”Super-N：最快 10 秒破百，不到 1.9 万英镑 Super-N 是一款小型纯电掀背车，以日本市场的 K-Car 车型 Super-One 为基础，设计灵感来自上世纪 80 年代的传奇“小钢炮”City Turbo II。 9、我国公众 22 日可观测月面“X”状光影奇观对我国公众而言，这是今年第二次观测条件良好的“月面 X”现象，感兴趣的公众可于当日 17 时 10 分至 19 时 30 分尝试观测这神奇一幕。 10、小鹏回应网传“L3 必须双冗余、L4 必须加激光雷达”：都是假新闻小鹏汽车副总裁 @托马斯电火车表示，这个谣言既无任何条款依据，也与编制说明解释相悖，标准是公开的，编制说明白纸黑字就摆在那里，自己看都没看就胡乱编造，有悖新闻的基本原则。11、OpenAI 最强 AI 模型：GPT-5.6 系列有望下周登场，生成 Win11 SVG 测试优于 Claude Mythos 科技媒体 testingcatalog 6 月 19 日发布博文，报道称 OpenAI 有望下周推出 GPT-5.6 系列模型，涵盖 mini、标准版以及 Pro 版。12、小米平板 9 标准版曝光：高通骁龙 8s Gen4 芯片，9720mAh 电池科技媒体 ximitime 6 月 19 日发布博文，报道称小米平板 9 预估将推出标准和 Pro 两个版本，其代码显示小米平板 9 标准版可能复用小米平板 8 的相关硬件和固件平台。13、安卓最强 2nm 芯片：曝高通骁龙 8 Elite Gen 6 Pro 芯片仅有 LPDDR5X/LPDDR6 两个版本消息源 @Reptalicant 6 月 19 日在 X 平台发布推文，指出高通目前正测试 6 个骁龙 8 Elite Gen 6 Pro 芯片样品，但该芯片上线后仅有支持 LPDDR5X 的普通版和顶配 LPDDR6 版两个版本。14、山东济南开启新一轮国补，购买智能摄影设备 / 无人机等单件销售价格超过 6000 元产品可获 10% 补贴个人购买指定智能数码产品可享最终售价 10% 补贴，每件最高补 1000 元，每人每类限补 1 件，补贴为线下支付立减，需现场激活15、零跑汽车：今年 Q3 将公布多项创新技术成果在 2027 款零跑 C 系列上市发布会后的媒体群访活动中，零跑汽车方面透露，公司将在今年第三季度举行“技术日”，公布多项创新技术成果。同时，更具创新性、差异化的产品也在规划中。16、英格兰、威尔士要求司法部门停止在 X 平台发帖，除非用于“辟谣” 据英国《卫报》报道，英格兰和威尔士总检察长理查德 · 赫默要求办公室停止在 X 发帖。17、西安公安 19 小时打掉世界杯网络赌局：刑拘 7 人，斩断 10 万赌资链条西安未央公安在世界杯期间打掉一个隐蔽的网络赌博团伙，7 名嫌疑人被刑拘。该团伙利用社交群组开设赌局，通过抽头非法获利，累计涉案流水达 10 万余元。警方提醒，网络赌博隐蔽性强，易诱发诈骗、洗钱等次生犯罪。18、中国科学家提出“AI 语言”：人类难懂但模型能懂，文本压缩至 27.9% 仍保留 99.5% 语义研究发现，大语言模型间的自然语言交互存在大量冗余。上海交大等高校团队提出 BabelTele 压缩方法，将文本压缩至原长的 27.9%，语义保留 99.5%。这种人类几乎无法阅读的“AI 语言”，在 Gemini 等模型间传递时理解准确率稳定，为 AI Agent 通信和长文本处理提供了新思路。19、张雪直言：自己创业时比李书福“幸福” @央视财经 6 月 20 日发布博文，称在《对话》节目录制现场，张雪直言自己创业时比李书福“幸福”，因为他创业时中国工业制造的高度已今非昔比，而李书福当年“啥也没有”。 20、理想 i6 第 15 万辆量产车正式下线 @理想汽车 6 月 20 日发布微博，宣布理想 i6 第 15 万台量产车下线。21、2026 年暑期档电影总票房已突破 10 亿元，《给阿嬷的情书》累计票房超 18 亿元居首 @央视新闻 6 月 20 日发布微博，称基于网络平台数据，截至目前，2026 年暑期档总票房（含预售）已突破 10 亿元。《给阿嬷的情书》《火遮眼》《消失的人》暂列前 3 位。22、2026 年度京东 618 下单用户数再创新高：格力、小米等家电品牌成交额均超 10 亿多家电品牌成交额超 10 亿，AI 数码产品、生活服务成交额同比大幅增长，新商家表现亮眼，直播相关数据也同比提升23、超越 Claude Fable 5：智谱 GLM 5.2 登顶 Design Arena 网页设计 AI 榜单 @Designarena 6 月 20 日在 X 平台发布推文，宣布在 Design Arena 单轮 HTML 网页设计（非智能体）评测中，智谱的 GLM-5.2 模型超过 Claude Fable 5 等模型，首次登顶总分第一。24、苹果印度 iPhone 零件工厂被控废水污染农田：井水 TDS 超标 1 倍，作物枯萎路透社 6 月 19 日发布博文，报告称印度泰米尔纳德邦卫生部门正调查苹果供应商塔塔电子（Tata Electronics）位于霍苏尔（Hosur）的 iPhone 零部件工厂废水排放问题。今天就先聊到这里，IT早报，咱们明天见。

智观行业 6月21日

0 94,734 0

微软推出DirectX转储文件预览版：统一诊断英伟达、AMD、英特尔、高通GPU崩溃问题

微软推出DirectX转储文件预览版：统一诊断英伟达、AMD、英特尔、高通GPU崩溃问题快科技6月20日消息，微软近日面向开发者推出DirectX Dump Files（DirectX转储文件）公开预览版。该功能旨在为英伟达、AMD、英特尔及高通全阵营GPU提供统一的崩溃诊断方案。显卡"掉驱动"问题长期困扰Windows玩家，开发者排查GPU崩溃同样困难，不同硬件、驱动与系统版本的组合导致问题排查难度极大，此前缺乏跨硬件厂商的通用诊断流程。 DirectX Dump Files的工作原理类似系统崩溃时生成的内存转储：当发生图形相关崩溃、挂起或冻结时，系统自动记录GPU执行状态快照，生成.dxdmp格式转储文件。转储文件涵盖寄存器值、着色器程序计数器、页错误虚拟地址、命令缓冲区等GPU硬件状态，以及DirectX运行时和内核信息。开发者还可通过新D3D12 API附加最多2MB自定义应用数据。微软设计了三种采集模式：无开销模式适合广泛部署且无运行时成本；中开销模式平衡诊断数据与性能影响；高开销模式信息最全但性能开销最大。在兼容Tier 2硬件上，零开销模式默认启用。硬件支持方面，AMD已推出AgilitySDK开发者预览版驱动（版本26.10.07.02），支持Radeon RX 9000和RX 7000系列显卡。英特尔、英伟达和高通的驱动支持通过开发者渠道提供。目前该功能需开启开发者模式，并需Agility SDK 1.721.1-preview及特定版本Windows系统支持。微软表示，更广泛的硬件和驱动覆盖预计2026年秋季面向零售用户推出。

智观行业 6月20日

0 68,334 0