理想的"机器人"叙事:一场关于定义权的押注

智观行业
6月16日发布

网易汽车6月16日报道 6月15日的Livis Day发布会上,理想汽车CEO李想花了大量时间解释一件事:理想不是"不务正业"。

面对外界对其AI布局的质疑,他给出了一个完整的产品定义:"真正的具身智能汽车,是一辆能够保护人类安全、独立完成任务、比人类更高效的汽车。"紧接着,他补上了更具情感张力的注脚——"过去十年,我们创造了一个移动的家。第二个十年,我们会给车和家,赋予生命。"

这句话值得拆解,在"造车"和"做AI"之间,理想试图开辟第三条道路:汽车即AI最好的载体,一个产品,四重角色。

一、四重角色

理想对"具身智能汽车"的定义,比我此前想象的更具层次感。它首先是一辆电动车,拥有身体、能移动、真正参与用户生活。然后是一位职业司机,理解道路与风险,随时待命安全可靠地完成出行任务。同时是一台AI计算机,处理复杂信息并完成任务。最终是一位生活助手,了解用户习惯、管理信息、处理事务,成为长期信赖的伙伴。

这个定义的高明之处,在于它把汽车从一个交通工具属性的机械产物重新定义为"智能体"。传统智能汽车的本质是"功能驱动",服务于特定场景,对安全的定义也是"功能安全"。而理想的具身智能汽车,追求的是"独立完成任务"的自主性。但自主性的前提是交互。

理想在发布会上展示了全新一代座舱交互体验。全球首发的高通8797 Elite旗舰芯片,具备504K CPU任务处理能力、8.1T GPU高精渲染、320TOPS NPU端侧AI算力,硬件性能"全面超越主流手机"。配合行业首个90Hz高刷新率全景屏,自研底层系统实现极致触控响应。

有人会觉得汽车上对屏幕这么下功夫有必要吗?但恰恰在智能汽车时代,屏幕是除了方向盘之外最频繁的交互界面,理想要在细节里筑起新的护城河,如果你体验过,就会喜欢上这种丝滑带来的“爽感”。

"克制与直白"是理想的交互设计理念:让用户看一眼就懂,点一下就响应。超宽全景屏在单人场景下将驾驶员显示区域拓展至上一代双联屏的1.5倍;双人场景下,驻车观影时显示面积增加1.7倍。声音体验上,9.3.6无瑕星环剧院音响峰值功率5440W,行业首创前后排双音区布局,可同时播放全景声。


这些配置看似是"堆料",实则服务于一个核心目标:让车成为"家"的延伸。

十年来,理想坚持"照顾车里的每一个人"——为副驾提供独立娱乐空间,为二排打造亲朋共享体验,为第三排创造真正好用的出行感受。这种产品哲学,是理想敢于谈"赋予生命"的底气。

二、双引擎大脑

具身智能的大脑,由语言智能与机器智能深度融合构成,理想在构建完整的是"认知+行动"体系,语言智能由自研马赫Mind-Pro与马赫Mind-Edge承载,负责语言与逻辑思考,听懂指令、推演行动方案。


马赫Mind-Pro依托独创的混合强化学习并行训练体系,实现Token平均消耗降低38%、工具调用冗余轮次减少47%,TPS(每秒Token生成量)峰值达到208 token/s,推理效率是主流Agent模型的两倍以上。在权威基准测试中稳居行业第一梯队,Agent专项评测中综合性能超越多款主流大模型。

马赫Mind-Edge则是行业领先的端侧原生具身智能体,基于车载芯片和车辆硬件原生设计,采用多模态流式时序建模,具备全天候主动感知、人车交互、自主控车能力,全部在车端本地完成,低延迟、高可靠、高隐私性。


机器智能由自研马赫VLA承载,负责三维视觉感知与躯体动作控制,看清物理世界、精准执行操作。在效率层面,马赫VLA综合响应速度达到0.28秒,相比普通人类驾驶员0.45秒的平均反应速度快约40%,接近顶级F1车手0.25秒的人类生理极限。在120km/h行驶速度下,这意味着提前6米完成刹停。

能力层面,马赫VLA实现了真正的能力涌现:可自主完成倒车让路、识别交警手势指挥、应对低矮不规则障碍物、穿越无车道线的城中村雨夜窄路等过去难以靠规则实现的场景。


背后是算力、数据、模型规模和架构的同时跃升。双马赫M100提供2560TOPS算力;模仿学习数据量增加50%,强化学习数据量增加15倍;行泊一体模型参数量增加10倍,TPS增大15倍;原生多模态MoE混合专家大模型取代传统模块化模型;3D ViT行业首次上车,让智驾系统从"看见"进化为"看懂";训练范式升级为模仿学习和强化学习混合训练,强化学习数据规模提升15倍,训练算力增加5倍。

三季度,理想将为搭载Orin和Thor芯片的AD Max用户推送全新马赫VLA模型。四季度,马赫VLA模型能力将对齐全球顶尖水平。

三、马赫M100的架构革命

支撑这一切的底层硬件,是理想自研的马赫M100芯片。

面对AI推理算力需求快速增长、算力供给放缓的行业挑战,理想选择从计算基础架构层面重新出发。传统指令驱动的冯·诺依曼架构,在面对AI大规模并行计算时存在效率瓶颈。而AI计算天然适合由数据驱动计算发生。基于这一判断,理想设计了全新的数据流架构芯片。


从2022年正式立项起,历经三年半打磨,马赫M100于2026年5月实现量产上车,成为全球首款量产的动态数据流AI芯片。随着马赫M100部署,理想已实现芯片、编译器、操作系统、AI算法及域控制器的全栈自研。

理想汽车CTO谢炎在发布会上的表态颇具历史纵深感:"冯·诺依曼架构用七十年推动了通用计算的辉煌。今天,我们以马赫M100为起点,希望用数据流架构,接过历史的这一棒,继续推动AI计算再辉煌七十年!"

在马赫M100基础上,理想构建了完整的具身智能系统:芯片是"心脏",提供算力支撑;全车感知系统是"眼睛",实现精准三维感知及语义理解;自研马赫模型是"大脑",负责理解与决策;全线控主动底盘系统和能源系统是"手脚",将决策转化为物理世界的精准行动;自研星环OS是"神经系统",为AI原生而生,实现"感知-决策-执行"全链路深度融合。

安全方面,理想将密钥保护、设备身份、可信启动链和关键权限管控全部前置到芯片设计中,通过全栈自研软件实现统一调度,构建覆盖全链路的纵深防御体系。

四、50.98万是技术溢价还是品牌冒险?

L9 Livis的售价定格在50.98万元,比老款L9贵了约5万元。

这个定价策略耐人寻味。在问界M9参数图片)、蔚来ES8宝马X5的夹击下,理想选择用"AI能力"作为溢价的支撑点:自研芯片、线控底盘、AI眼镜、VLA智驾——每一项都是成本,每一项也都是故事。

但消费者是否买账?

中国高端电动车市场的竞争,已经从"配置竞赛"转向"体验叙事"。问界M9卖得好,不是因为某一项技术参数领先,而是华为品牌的信任背书和智能座舱的体验口碑。理想的挑战在于,它的"机器人"叙事足够新颖,但尚未经过市场验证。AI眼镜1999元的定价看似亲民,但它解决的是真痛点还是伪需求,需要用户用钱包投票。


更具可验证性的是理想给出的OTA成长里程碑,7月的主题是"智驾效率整体提升30%",将协助用户通过限宽墩、限高杆等复杂场景,出行导游相关Agent技能正式上线,同时新增车友对讲机、两天一度电的哨兵模式、便捷换胎等功能。

9月的主题是"像人一样倒车",实现窄路会车、倒车让行等全场景自主倒车能力,主动悬架处理复杂路面,操控智能地锁和车库门开关,Agent可连接电脑和手机,新增超级CarPlay。

12月的主题是"安全和效率超越人类",新增误触方向盘主动防护、紧急躲避补偿、听从交警指挥、Face ID识别切换账号等能力,端到端反应速度达到0.2秒,比人快56%。

这个时间表比此前模糊的"2028年L4落地"更有说服力。它把"超越人类"拆解为可验证、可感知的具体功能,每一个节点都是一次用户信任的积累或消耗。50.98万的定价,本质上是在问用户:你愿意为"具身智能"这个概念,提前支付多少溢价?

五、第二次定义权之战

这不是理想第一次争夺定义权,四年前的2022年,第一代理想L9上市。彼时中国新能源车市场还没有"全尺寸豪华SUV"这个品类,BBA的燃油车牢牢占据50万以上市场,新势力们大多在30万以下区间厮杀。理想L9以"500万以内最好SUV"的争议性口号登场,用"冰箱彩电大沙发"重新定义了家庭用车的价值标准——不是品牌历史,不是机械素质,而是"照顾车里的每一个人"。

那是一场成功的定义权之战。理想凭借对"家庭出行场景"的精准卡位,吃到了巨大的市场红利:L9一度月销过万,理想从一家边缘新势力跃升为年销数十万辆的主流品牌。但定义权的红利有保质期,当问界M9带着华为的智能座舱和智驾系统入场,当腾势、极氪纷纷推出六座SUV,"家庭豪华"这个标签不再为理想独占。L9的销量从巅峰回落,理想的毛利率承压,市场开始质疑:理想的护城河到底是什么?

Livis Day给出了答案——理想要争夺的,是下一个十年的定义权。

问题在于,这一次的对手比四年前强大得多,在那之前,它必须证明:马赫M100不是PPT芯片,VLA模型不是黑箱赌博,Mind-Pro的推理效率优势能转化为用户体验,50万的L9 Livis不是智商税。这场押注的代价,是每年60亿的AI研发投入,和一家公司未来能走多远。他赌的不是某一款车的销量,是整个行业对"汽车"二字的重新定义。

联系信息


邮箱:xiaosea2@163.com

电话:15733175200

企查查:15733175200

天眼查:15733175200

黄页88:15733175200

顺企网:15733175200

阿里巴巴:15733175200

网址:https://zizun.niushi.cc

© 版权声明
THE END
喜欢就支持一下吧
点赞 0 分享 收藏
评论
所有页面的评论已关闭