理想的"机器人"叙事:一场关于定义权的押注

网易汽车6月16日报道 6月15日的Livis Day发布会上，理想汽车CEO李想花了大量时间解释一件事：理想不是"不务正业"。

面对外界对其AI布局的质疑，他给出了一个完整的产品定义："真正的具身智能汽车，是一辆能够保护人类安全、独立完成任务、比人类更高效的汽车。"紧接着，他补上了更具情感张力的注脚——"过去十年，我们创造了一个移动的家。第二个十年，我们会给车和家，赋予生命。"

这句话值得拆解，在"造车"和"做AI"之间，理想试图开辟第三条道路：汽车即AI最好的载体，一个产品，四重角色。

一、四重角色

理想对"具身智能汽车"的定义，比我此前想象的更具层次感。它首先是一辆电动车，拥有身体、能移动、真正参与用户生活。然后是一位职业司机，理解道路与风险，随时待命安全可靠地完成出行任务。同时是一台AI计算机，处理复杂信息并完成任务。最终是一位生活助手，了解用户习惯、管理信息、处理事务，成为长期信赖的伙伴。

这个定义的高明之处，在于它把汽车从一个交通工具属性的机械产物重新定义为"智能体"。传统智能汽车的本质是"功能驱动"，服务于特定场景，对安全的定义也是"功能安全"。而理想的具身智能汽车，追求的是"独立完成任务"的自主性。但自主性的前提是交互。

理想在发布会上展示了全新一代座舱交互体验。全球首发的高通8797 Elite旗舰芯片，具备504K CPU任务处理能力、8.1T GPU高精渲染、320TOPS NPU端侧AI算力，硬件性能"全面超越主流手机"。配合行业首个90Hz高刷新率全景屏，自研底层系统实现极致触控响应。

有人会觉得汽车上对屏幕这么下功夫有必要吗？但恰恰在智能汽车时代，屏幕是除了方向盘之外最频繁的交互界面，理想要在细节里筑起新的护城河，如果你体验过，就会喜欢上这种丝滑带来的“爽感”。

"克制与直白"是理想的交互设计理念：让用户看一眼就懂，点一下就响应。超宽全景屏在单人场景下将驾驶员显示区域拓展至上一代双联屏的1.5倍；双人场景下，驻车观影时显示面积增加1.7倍。声音体验上，9.3.6无瑕星环剧院音响峰值功率5440W，行业首创前后排双音区布局，可同时播放全景声。

这些配置看似是"堆料"，实则服务于一个核心目标：让车成为"家"的延伸。

十年来，理想坚持"照顾车里的每一个人"——为副驾提供独立娱乐空间，为二排打造亲朋共享体验，为第三排创造真正好用的出行感受。这种产品哲学，是理想敢于谈"赋予生命"的底气。

二、双引擎大脑

具身智能的大脑，由语言智能与机器智能深度融合构成，理想在构建完整的是"认知+行动"体系，语言智能由自研马赫Mind-Pro与马赫Mind-Edge承载，负责语言与逻辑思考，听懂指令、推演行动方案。

马赫Mind-Pro依托独创的混合强化学习并行训练体系，实现Token平均消耗降低38%、工具调用冗余轮次减少47%，TPS（每秒Token生成量）峰值达到208 token/s，推理效率是主流Agent模型的两倍以上。在权威基准测试中稳居行业第一梯队，Agent专项评测中综合性能超越多款主流大模型。

马赫Mind-Edge则是行业领先的端侧原生具身智能体，基于车载芯片和车辆硬件原生设计，采用多模态流式时序建模，具备全天候主动感知、人车交互、自主控车能力，全部在车端本地完成，低延迟、高可靠、高隐私性。

机器智能由自研马赫VLA承载，负责三维视觉感知与躯体动作控制，看清物理世界、精准执行操作。在效率层面，马赫VLA综合响应速度达到0.28秒，相比普通人类驾驶员0.45秒的平均反应速度快约40%，接近顶级F1车手0.25秒的人类生理极限。在120km/h行驶速度下，这意味着提前6米完成刹停。

能力层面，马赫VLA实现了真正的能力涌现：可自主完成倒车让路、识别交警手势指挥、应对低矮不规则障碍物、穿越无车道线的城中村雨夜窄路等过去难以靠规则实现的场景。

背后是算力、数据、模型规模和架构的同时跃升。双马赫M100提供2560TOPS算力；模仿学习数据量增加50%，强化学习数据量增加15倍；行泊一体模型参数量增加10倍，TPS增大15倍；原生多模态MoE混合专家大模型取代传统模块化模型；3D ViT行业首次上车，让智驾系统从"看见"进化为"看懂"；训练范式升级为模仿学习和强化学习混合训练，强化学习数据规模提升15倍，训练算力增加5倍。

三季度，理想将为搭载Orin和Thor芯片的AD Max用户推送全新马赫VLA模型。四季度，马赫VLA模型能力将对齐全球顶尖水平。

三、马赫M100的架构革命

支撑这一切的底层硬件，是理想自研的马赫M100芯片。

面对AI推理算力需求快速增长、算力供给放缓的行业挑战，理想选择从计算基础架构层面重新出发。传统指令驱动的冯·诺依曼架构，在面对AI大规模并行计算时存在效率瓶颈。而AI计算天然适合由数据驱动计算发生。基于这一判断，理想设计了全新的数据流架构芯片。

从2022年正式立项起，历经三年半打磨，马赫M100于2026年5月实现量产上车，成为全球首款量产的动态数据流AI芯片。随着马赫M100部署，理想已实现芯片、编译器、操作系统、AI算法及域控制器的全栈自研。

理想汽车CTO谢炎在发布会上的表态颇具历史纵深感："冯·诺依曼架构用七十年推动了通用计算的辉煌。今天，我们以马赫M100为起点，希望用数据流架构，接过历史的这一棒，继续推动AI计算再辉煌七十年！"

在马赫M100基础上，理想构建了完整的具身智能系统：芯片是"心脏"，提供算力支撑；全车感知系统是"眼睛"，实现精准三维感知及语义理解；自研马赫模型是"大脑"，负责理解与决策；全线控主动底盘系统和能源系统是"手脚"，将决策转化为物理世界的精准行动；自研星环OS是"神经系统"，为AI原生而生，实现"感知-决策-执行"全链路深度融合。

安全方面，理想将密钥保护、设备身份、可信启动链和关键权限管控全部前置到芯片设计中，通过全栈自研软件实现统一调度，构建覆盖全链路的纵深防御体系。

四、50.98万是技术溢价还是品牌冒险？

L9 Livis的售价定格在50.98万元，比老款L9贵了约5万元。

这个定价策略耐人寻味。在问界M9（参数丨图片）、蔚来ES8、宝马X5的夹击下，理想选择用"AI能力"作为溢价的支撑点：自研芯片、线控底盘、AI眼镜、VLA智驾——每一项都是成本，每一项也都是故事。

但消费者是否买账？

中国高端电动车市场的竞争，已经从"配置竞赛"转向"体验叙事"。问界M9卖得好，不是因为某一项技术参数领先，而是华为品牌的信任背书和智能座舱的体验口碑。理想的挑战在于，它的"机器人"叙事足够新颖，但尚未经过市场验证。AI眼镜1999元的定价看似亲民，但它解决的是真痛点还是伪需求，需要用户用钱包投票。

更具可验证性的是理想给出的OTA成长里程碑，7月的主题是"智驾效率整体提升30%"，将协助用户通过限宽墩、限高杆等复杂场景，出行导游相关Agent技能正式上线，同时新增车友对讲机、两天一度电的哨兵模式、便捷换胎等功能。

9月的主题是"像人一样倒车"，实现窄路会车、倒车让行等全场景自主倒车能力，主动悬架处理复杂路面，操控智能地锁和车库门开关，Agent可连接电脑和手机，新增超级CarPlay。

12月的主题是"安全和效率超越人类"，新增误触方向盘主动防护、紧急躲避补偿、听从交警指挥、Face ID识别切换账号等能力，端到端反应速度达到0.2秒，比人快56%。

这个时间表比此前模糊的"2028年L4落地"更有说服力。它把"超越人类"拆解为可验证、可感知的具体功能，每一个节点都是一次用户信任的积累或消耗。50.98万的定价，本质上是在问用户：你愿意为"具身智能"这个概念，提前支付多少溢价？

五、第二次定义权之战

这不是理想第一次争夺定义权，四年前的2022年，第一代理想L9上市。彼时中国新能源车市场还没有"全尺寸豪华SUV"这个品类，BBA的燃油车牢牢占据50万以上市场，新势力们大多在30万以下区间厮杀。理想L9以"500万以内最好SUV"的争议性口号登场，用"冰箱彩电大沙发"重新定义了家庭用车的价值标准——不是品牌历史，不是机械素质，而是"照顾车里的每一个人"。

那是一场成功的定义权之战。理想凭借对"家庭出行场景"的精准卡位，吃到了巨大的市场红利：L9一度月销过万，理想从一家边缘新势力跃升为年销数十万辆的主流品牌。但定义权的红利有保质期，当问界M9带着华为的智能座舱和智驾系统入场，当腾势、极氪纷纷推出六座SUV，"家庭豪华"这个标签不再为理想独占。L9的销量从巅峰回落，理想的毛利率承压，市场开始质疑：理想的护城河到底是什么？

Livis Day给出了答案——理想要争夺的，是下一个十年的定义权。

问题在于，这一次的对手比四年前强大得多，在那之前，它必须证明：马赫M100不是PPT芯片，VLA模型不是黑箱赌博，Mind-Pro的推理效率优势能转化为用户体验，50万的L9 Livis不是智商税。这场押注的代价，是每年60亿的AI研发投入，和一家公司未来能走多远。他赌的不是某一款车的销量，是整个行业对"汽车"二字的重新定义。

理想的"机器人"叙事:一场关于定义权的押注

联系信息