找到
23389
篇与
智观行业
相关的结果
- 第 999 页
-
尤尔曼德:勒沃库森队内并不缺乏领袖球员,将组建一个队长团队 直播吧9月12日讯 北京时间明天凌晨,勒沃库森将在德甲第3轮比赛中主场对阵法兰克福,勒沃库森新帅尤尔曼德出席赛前发布会,接受了媒体的采访。队内球员的情况马丁-泰里耶、贝洛西安、霍夫曼都需要一点时间才能回归,其他人状态良好。门将位置是否会轮换?让我们看看情况,我认为这绝对会是很好的队内竞争,门将位置上轮换会更难一些,但竞争肯定存在。关于队长人选我们将组建一个非常强大的队长团队,我们需要更多队长,需要强大的领导力,并将从内部培养这种能力。哪些球员会是领袖?我认为球队中确实有一些强有力的领袖,例如门将弗莱肯,巴代也是一名经验丰富的球员,还有帕拉西奥斯,安德里希、格里马尔多、希克也为勒沃库森效力了很久。恐怕我还遗漏了一些球员,但我觉得我们有很多有潜力和领导能力的球员。塔普索巴也是如此,他是一名经验丰富的球员。所以我认为我们队内拥有经验和领导力。对我来说,领导力不是一个人或教练带来的,这关乎团队合作,所以我认为我们在场内场外都有丰富的经验和出色的领导力。巴斯克斯能否踢满90分钟?是的,我们拭目以待。巴斯克斯,我刚才忘了提到他,他的经验丰富,是一名杰出的球员。我们将观察接下来几周的情况。显然他需要调整身体状态,但他已经准备好了,看起来状态不错。 -
用AI伪造商品毁损图恶意退款 涉嫌违法! 网购是大家现在习以为常的一种购物方式。在网购时,如果碰到有质量问题的产品,拍一张照片再申请售后是很方便的事。但是最近一些电商从业者反映,有些买家发来的“包装破损”“食品发霉”的照片,乍一看挺像那么回事,实际上根本不是真实拍摄图片,而是用AI技术伪造出来的。伪造图片目的也非常简单,就是想靠假图片骗取退款。面对这种情况,不少商家确实很头疼。那么用AI伪造图片骗取退款是否涉嫌违法?又该怎样防范和治理? 徐先生在多个电商平台经营水果生意,上个月,他在某平台上收到了一个“仅退款”申请,买家声称收到的哈密瓜已变质损坏。买家发图的同时,平台还同步发来了一条信息,提醒他这张图片已在平台发送多次。徐先生判断,这张图片里不自然的裂纹和斑点,应该是AI工具合成。之后他就拒绝了对方的“仅退款”申请。买家不服申请仲裁,最终也被平台驳回。徐先生:平台让我们举证,然后我们就提供了开箱视频,包括快递收到之后的图片。快递小哥也说了,签收的时候是没有任何问题的。 经营化妆品生意的李女士这段时间也被伪造售后图困扰。她告诉记者,按照规定,化妆品这类商品拆封后将不支持7天无理由退货,有些买家动起了歪心思,伪造过敏图片,借着“过敏包退”条款申请退货。李女士:会有客户钻空子,他随便AI一个图片说自己过敏,然后平台就会把这个责任就归到商家。商家不但损失产品,也损失运费。记者调查发现,这类“AI售后图”的制作并不复杂,买家通常先对快递实物拍照,再通过生成式AI工具对照片进行“局部改造”——将原本完好的商品,添加上破损、腐烂或变形的视觉效果,以此向商家申请退款。在社交平台上,不少商家和客服晒出各式各样的疑似“AI售后图”,这些图片里的“问题痕迹”往往透着不自然。当商家质疑照片真实性,要求再拍几张照片的时候,新发来的照片还可能会暴露更明显的破绽。 那么,买家利用AI伪造图片骗取退款是否涉嫌违法?中国法学会消费者权益保护法研究会副秘书长陈音江:我们肯定支持消费者依法维权,但是我们坚决反对打着维权的名义,去恶意索赔。通过AI来伪造一些图片证据去退款,是一种民事上的欺诈行为,确实会面临比较严重的法律风险。针对这类行为,专家建议商家也应主动防范,在对照片真实性有疑虑的情况下可以要求买家从不同角度多拍几张照片。通过对比不同照片中的关键信息,往往能发现AI造假的破绽,还可以要求买家提供视频。中国法学会消费者权益保护法研究会副秘书长 陈音江:通过AI图片识别工具,就能够检测出图片是不是经过技术合成,平台也可以建立“黑名单”制度,更好地规范这种行为。 -
腾讯辟谣“OpenAl前员工姚顺雨上亿薪资入职腾讯” IT之家 9 月 12 日消息,腾讯官方公众号“鹅厂黑板报”今天一早发布一条辟谣信息,“前 OpenAl 姚顺雨上亿薪资入职腾讯”的报道被打上“谣言”标签。 IT之家查询获悉,姚顺雨本科毕业于清华大学姚班,获普林斯顿大学计算机科学博士学位,2024 年加入 OpenAI 并参与智能体产品 operator 与 deep research 开发 。其研究聚焦语言智能体与现实世界交互,提出 ReAct 方法首创“推理 — 行动”结合的智能体范式,被学术界与工业界广泛采纳。姚顺雨博士期间提出思维树(Tree of Thoughts)框架改进决策模型,构建 CoALA 模块化认知架构。2025 年 5 月,他以 27 岁年龄成为《麻省理工科技评论》TR35 中国区最年轻入选者。 -
iPhone Air 能否被掰弯?苹果现场演示 日前,苹果营销主管 Greg Joswiak 和硬件工程主管 John Ternus 节目中展示 iPhone Air 耐用性。iPhone Air 厚度仅 5.6 毫米,售价 7999 元起,采用五级钛合金一体成型机身,去除了传统接缝与连接点,减少结构弱点。屏幕使用更坚固的 Ceramic Shield 2,并具备 IP68 级防水防尘性能。 Greg Joswiak 将手机抛向对面并邀请对方尝试弯折。结果显示手机轻微弯曲后迅速恢复毫发无损。高管解释该手机在受力时允许有限度弹性形变并立即回弹。这种设计理念源自 2008 年 MacBook Air 一体成型工艺,制造难度更高但能显著提升手感和强度。针对电池安全性苹果为 iPhone Air 锂电池加装金属外壳让电池也成为机身结构一部分能抵御弯折时潜在风险。高管表示 iPhone Air 可承受日常口袋压力、跌落及偶尔过度弯曲测试。 -
阿里开源新架构Qwen3-Next,模型训练成本降9成 每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用全新的高稀疏MoE架构,并对经典Transformer核心组件进行了重构,创新采用线性注意力和自研门控注意力结合的混合注意力机制,实现了模型训练和推理的双重性价比突破。基于这一新架构,阿里通义“打样”了Qwen3-Next-80B-A3B系列模型,开源指令(Instruct)和推理(Thinking)两大模型版本。新模型总参数80B仅激活3B,性能可媲美千问3旗舰版235B模型,模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,并可支持百万Tokens(文本处理的最小单位)超长上下文。 -
尤勒曼:巴斯克斯看起来状态不错;我具备应对一切情况的经验 北京时间9月13日,德甲第3轮,勒沃库森将对阵法兰克福。赛前,勒沃库森新任主教练尤勒曼出席了发布会。对于阵容,他透露部分球员仍在恢复,但整体情况良好,在队长和领导力问题上,他更强调团队合作和多核心模式,而非依赖单一领袖。同时,他也对埃里克森加盟沃尔夫斯堡表示喜悦。 以下是发布会内容 谈及在本场比赛前他只带队进行了两堂训练课 尤勒曼表示:“我在执教丹麦国家队时已经学到了很多,我们必须非常精准地分配球员的出场时间。现在在这里情况也是一样的。我清楚自己在做什么,也相信我具备应对一切的正确经验。”谈及球队的伤病情况尤勒曼表示:“泰里耶还需要一点恢复时间。贝洛西安同样需要时间。霍夫曼也还得再恢复一阵子。其他人都可以出场。”关于是否会在门将位置进行轮换尤勒曼表示:“我们拭目以待,我认为这确实是一个良性的竞争。不过门将这个位置轮换的难度要比其他位置大一些,但竞争是一定存在的。”关于队长人选和球队中的领导力尤勒曼表示:“我们会组建一个队长团队,一个非常强大的队长小组。我们确实需要更多的队长,需要强大的领导力,并且会从队内去培养这一切。我认为球队里确实有一些非常有经验的领袖人物。从门将弗莱肯开始,巴代是经验丰富的球员,帕拉西奥斯在这里,安德里希、格里马尔多、希克在这里效力已久。我担心没能一一提到所有人,但我相信队里有很多球员具备潜力和领导力。塔普索巴同样是一名有经验的球员。所以我认为我们既有经验,也有领导力。对我来说,领导力不仅仅是某一个人,也不是教练一个人去扮演‘大人物’的角色——领导力更多的是团队合作。因此我认为我们在场上和场下都具备出色的经验和领导力。”关于巴斯克斯是否能踢满90分钟尤勒曼表示:“是的,我们拭目以待。巴斯克斯——我刚才漏掉了他,他同样是有经验的优秀球员。接下来的几周我们会看到具体情况。当然,他需要逐渐恢复状态,但他已经做好准备,看起来状态不错。” 谈及埃里克森加盟沃尔夫斯堡 尤勒曼表示:“我非常高兴他找到了一个好俱乐部,并且我们又能看到他在球场上踢球了——那里才是他应该在的地方。埃里克森是一位伟大的人和一个非常特别的球员。任何和埃里克森踢过球的人都会说,他是他们合作过的最好的球员之一。他热爱足球,我很喜欢看他踢球。”不过,尤勒曼也笑着补充道,若未来在德甲与埃里克森交手:“我们必须确保他届时不会踢出最好的状态。”尤勒曼在执教丹麦国家队(2020-2024)期间曾与埃里克森共事。他亲历了2021年欧洲杯上埃里克森心脏骤停的那一幕,并凭借富有同理心的处理方式赢得了广泛的尊重和好感。 -
穆图:尤文更全面,国米更模式化,巴雷拉和法乔利最像我 阿德里安-穆图在备受期待的意大利国家德比前,谈到了尤文图斯和国际米兰之间的差异。 谈尤文图斯 我认为尤文图斯现在相比一年前在进攻端有了更多的选择。他们可以更换球员和打法,但并不因此失去效率。 您喜欢国际米兰的进攻线吗? 国际米兰依然是一台运转良好的机器,但可能稍微更依赖一些已经成型的组合。 如果让您总结一下这两支球队呢? 我会说尤文图斯更加全面,而国际米兰则显得更加模式化。 每队选一名球员:谁最像阿德里安-穆图? 我选两个不同位置的球员。先从国际米兰说起,我会说是巴雷拉。他充满斗志、节奏感强、活力十足。 那尤文图斯呢? 关于尤文图斯,我想说的是前尤文球员法乔利:他有视野和足球智慧。再说一次,我们的角色不同。 齐沃看起来准备好带领国际米兰了吗? 他在青年队时展现出了重要的潜力,后来去了帕尔马。这一步跨度非常大。 需要多长时间才能适应? 他肯定能够为国际米兰做好准备,但这需要一个过程。无论如何,我对他充满信心。 -
牛弹琴:墨方对中国下手向美献投名状 中国须高度警惕 (原标题:这个新动向,中国须高度警惕) 墨西哥跳进了美国挖下的坑里 该来的迟早会来。 坦率地说,这也完全在意料之中——一个大国,在各种犹豫后,最终还是一闭眼一跺脚,跳进了美国挖下的坑里。但因为涉及中国,我们必须高度警惕了。 这个大国,就是墨西哥! 虽然美国总是对墨西哥各种大棒挥舞,言辞侮辱,甚至武力威胁。但1亿多的人口,近两百万平方公里的土地,墨西哥绝对算是一个大国。 按照媒体的报道,墨西哥拟大幅调整关税,对中国等国汽车、钢铁、纺织品征最高50%进口关税。 你没看错,最高50%! 这一方案,已经提交墨西哥国会,涵盖大约1400种产品的关税清单,影响520亿美元的进口。 更要注意,与墨西哥有贸易协定的国家,比如美国、加拿大、欧洲等,不受影响;受伤的是谁?中国、韩国、泰国、印度、印尼、俄罗斯、土耳其…… 方案肯定会轻松通过,因为墨西哥执政党在参众两院都占据多数。 当然,全世界都知道,墨西哥此时出台这个政策,主要针对的,就是中国。 美国总统特朗普和墨西哥总统辛鲍姆 我看到,美联社的报道就说,墨西哥一直受到特朗普政府的压力,要求限制中国进口,“一些美国人声称,中国利用墨西哥作为进入美国市场的后门”。 墨西哥金融集团Banco Base的首席经济学家西勒(Gabriela Siller)在社交媒体上更坦言,墨西哥对“无贸易协定国家”加税,本质上有两个核心目的,“一是增加财政收入,二是讨好特朗普。” 西勒评价,“这是一项典型的特朗普式保护主义措施,其意图似乎是构建一个对抗中国的共同阵营。眼下,美墨加贸易协定即将迎来审议(2026年),出现这样的举措并不意外。” 确实并不意外。 墨西哥政府,最终不可能扛住来自北方的压力。 当然,墨西哥官方的说法,这是在“保护战略性领域的本国产业、以本土生产替代亚洲进口商品”,以及“改善墨西哥贸易平衡”。 但对正进军墨西哥的中国企业,尤其是汽车企业,无疑是当头一棒。 中国是墨西哥全球第二大贸易伙伴,墨西哥是中国在拉美的第二大贸易伙伴。数据显示,2024年,中墨贸易总额达1094.26亿美元。 中方对墨主要出口汽车、电子元件、厨房用品、机动车零部件等,自墨主要进口石油原油、电气设备、医疗仪器等产品。 具体到汽车,2025年上半年,中国汽车出口有三大目的地,墨西哥、阿联酋、俄罗斯,墨西哥排第一。 如果50%关税,汽车还怎么卖? 特朗普斗牛漫画图 中国应该也早有预料。 早在8月28日,外交部发言人郭嘉昆就明确表态,互利共赢是中墨经贸合作的本质特征,中方坚决反对在他人胁迫下,以各种名目对华设限,损害中方正当权益。相信有关国家将坚持独立自主,妥善处理相关问题。 但显然,墨西哥让中方很失望。 我看到,9月11日,商务部也明确表态:我们注意到有关报道,将密切关注墨方提税动向,并对有关最终措施进行认真评估。 商务部发言人还说,在当前背景下,墨方任何的单边加税举动,即便是在世贸规则框架内,都会被认为是对单边霸凌主义的绥靖与妥协。中墨互为重要的经贸伙伴,我们不愿看到双方经贸合作因此受到影响,希望墨方慎之又慎,三思后行。 八个字:慎之又慎,三思后行。 毕竟,墨方的绥靖和妥协,还未最终落地;中方的表态,很理性很克制。 但我总觉得,面对这种新动向,我们不能总是希望和劝导,必须高度警惕,做好必要的坚决的反击。 特朗普边境墙漫画图 怎么办? 三点粗浅看法吧。 第一,该反制就反制,别客气。 来而不往非礼也。 既然墨西哥这样不仁,那也别怪中国不义。 毕竟,贸易是相互的,墨西哥发展的任务还很重,发展离不开制造,离不开技术,离不开管理,在这方面,中方真可以起到巨大的促进作用。 但偏偏,在美国压力下,墨西哥做了最糟糕的选择。 那就对不起了。中国企业,还继续不继续去墨西哥?关键商品和技术,墨西哥你还需要不需要?墨西哥你这样的营商环境,哪个国家企业还敢来? 墨西哥,必然会付出巨大代价。 当然,我们的斗争策略,肯定是有理有利有节。既然是博弈,那咱们就好好玩玩。 第二,更要警惕破窗效应。 什么意思? 很简单,墨西哥向美国献上投名状,如果中方没有坚决反制,其他国家会不会竞相效仿? 肯定会的。 我们已经看到了不少征兆。 这也是美国最期盼的结果。甚至不久前还鼓捣欧盟,你们相对中国和印度制裁,加征100%关税,我们美国然后跟上…… 中方也早有准备,之前就再三警告有关国家:中方坚决反对任何一方以牺牲中方利益为代价达成交易,换取所谓关税减免。如果出现这种情况,中方绝不接受,将坚决予以反制,维护自身正当权益。 对美国的霸权霸凌,中国都毫无示弱。 其他人的蠢蠢欲动,中国更不会手软。 必须立下规矩:谁敢拿中国利益做交易,必遭对等反制。 不信,大家看看加拿大就知道了。跳得很高,摔得也不轻。 打得一拳开,免得百拳来。强权之下从无真正的公平,唯有坚定的反击才能赢得尊重。 美国霸权霸凌漫画图 第三,更为墨西哥掬一把泪。 这个世界,哪个国家被美国坑得最惨? 墨西哥敢说第二,没有一个国家敢说第一。 别忘了,墨西哥三分之二的领土,都被美国攫取。 想一想,如果今天加州还属于墨西哥,德克萨斯还属于墨西哥,墨西哥还是今天的墨西哥吗? 历史无法假设,墨西哥欲哭无泪。 即便发展到今天,美国对墨西哥依然说骂就骂,说打就打,协议说撕毁就撕毁,制裁说制裁就制裁,有时,更是怎么侮辱怎么来。墨西哥湾都叫美国湾了。 可怜的墨西哥,还不得不各种委曲求全,现在更想对东方大国下手,向美国献上新的投名状。 哀其不幸,怒其不争。 美国会满意吗? 永远不会满意,割肉的刀子,只会越割越狠。 霸权从来不知道满足,妥协只会更助长贪婪。 别忘了,中国古人的警告:今日割五城,明日割十城,然后得一夕安寝。起视四境,而秦兵又至矣……“以地事秦,犹抱薪救火,薪不尽,火不灭。” 更别忘了,墨西哥那句著名的谚语:墨西哥最大的悲哀,就是离上帝太远,离美国太近。 来源:牛弹琴 -
OpenAI新架构出炉!微软与"看门人"各拿30% 9月12日消息,周四,OpenAI宣布其非营利母公司将继续保持对公司的监管权,并持有估值超过1000亿美元的股权。这一重大决策为OpenAI明确了未来的发展方向。 据知情人士透露,在这种新架构下,微软和OpenAI非营利主体将分别获得价值约相当于OpenAI总值30%的初始股权,剩余部分则由员工和其他投资者持有。 OpenAI方面表示,这种安排将使其非营利组织成为“全球资源最丰富的慈善机构之一”,同时也能确保公司持续募集到发展所需的资本。 今年5月,在来自公民领袖和离职员工们的压力下,OpenAI曾宣布即使其转型为公益公司(Public Benefit Corporation, PBC),其非营利主体仍将保留控制权。OpenAI于2015年以非营利研究实验室的形式成立,如今已成为全球增长最快的商业实体之一。 OpenAI董事长布雷特·泰勒(Bret Taylor)在声明中强调:“OpenAI以非营利组织起步,如今依然如此,并将持续保持这一性质,即由非营利母体掌握引导公司未来的权力。这一架构重申了OpenAI的核心使命始终是确保通用人工智能(AGI)造福全人类,而公益公司的章程和治理体系也明确规定,安全决策必须始终以此使命为准则”。 目前,OpenAI正与加州和特拉华州的总检察长密切协作,以完善公司架构,并致力于通过学习与快速行动来确保其工具的安全性和普惠性,同时推动安全标准成为全行业的优先事项。 OpenAI与微软:合作关系新篇章 在公布这一重磅架构调整的同时,OpenAI也在其与主要合作伙伴微软的关系上取得了关乎其未来发展路径的进展。 同样在周四,OpenAI宣布已与微软签署了一份不具法律约束力的合作谅解备忘录,为双方下一阶段的合作勾勒出了蓝图。此举被视为两家公司之间紧张关系的缓和,也为OpenAI转型为包含营利实体的架构扫清了道路。 微软自2019年起便开始支持OpenAI,总计投资已超过130亿美元,这项投资甚至比ChatGPT聊天机器人的问世早了整整三年。微软不仅将其技术深度集成至多项产品中,更通过其作为独家云服务供应商的地位及获取最新技术的权限,对这家初创企业形成了强力制约。 OpenAI与微软在联合声明中表示,双方正积极推动最终协议条款的敲定,并基于共同的安全承诺,将持续为全球用户提供最优质的人工智能工具。 有分析认为,此次签约标志着整个夏季艰难谈判的终结,期间双方矛盾一度激化,据《华尔街日报》报道,甚至有传言称OpenAI曾考虑通过反垄断监管机构解除合约。 由于新协议的具体条款尚未公开,外界尚不清楚双方在几个核心争议点上的博弈结果。据此前报道,争议焦点主要包括:OpenAI方面希望获得微软的许可,从而能够通过其他云服务商销售其AI产品;而微软则力求维持其对OpenAI知识产权的独家访问权,即便后者的系统未来达到了“通用人工智能”(AGI)这一高级能力水平。 天价算力成本与财务压力 对于OpenAI自身而言,其面临的最大挑战之一便是惊人的算力成本,这直接影响着其运营模式与未来发展。 尽管OpenAI的ChatGPT业务在推出三年后已接近10亿用户,并有望在今年实现100亿美元的订阅收入,但投资者以5000亿美元的估值买入其股份时,正承担着与其算力成本同样前所未有的风险。 根据OpenAI的最新预测,即使到2030年实现2000亿美元的惊人收入,其研发成本仍将占总收入的45%(约900亿美元),远高于亚马逊、微软等科技巨头10%至20%的水平。这不仅反映了AI领域人才争夺的白热化,也凸显了其保持对谷歌、Meta等竞争对手领先地位的迫切需求。 更严峻的是,ChatGPT等应用的推理计算成本在2030年预计仍将消耗收入的25%(约500亿美元)。目前仅有Snap等极少数企业将如此高比例的收入用于云计算支出,据Snap首席执行官称,这也导致其毛利率“显著低于竞争对手”。 总体而言,OpenAI预计仅2030年一年,其一半的收入(1000亿美元)将用于租赁服务器来训练和运行其模型。而在2025年至2029年间,OpenAI还计划再投入2500亿美元租赁云服务器,这意味着六年总计高达3500亿美元的支出。 这对甲骨文(据称2027至2032年间仅从OpenAI就能获得3000亿美元收入)、微软、CoreWeave和谷歌云等云服务商而言无疑是巨大利好。没有任何其他主要企业像OpenAI这样,将四分之三的收入用于计算资源和技术人才支出。这还不包括OpenAI预计2026至2030年间因其将控制的数据中心服务器所产生的另外1000亿美元亏损。 OpenAI也意识到,若能高效管理足够数量的自有服务器,避免持续向云服务商支付高额费用,则有望逐步实现成本节约。虽然OpenAI选择这条路径合乎逻辑,但这注定是一项长期工程,需要投资者保持耐心。 法律挑战与社会责任 除了财务上的巨大压力,OpenAI在商业和法律层面也面临着多重挑战,同时也未忘记其作为非营利组织背景的社会责任。 此次与微软的协议对OpenAI而言是一次阶段性胜利,因为它在向州监管机构正式提交方案前,需要先获得微软的批准。此外,OpenAI曾告知风投投资者,如果不能在年底前完成重组,其或将面临190亿美元融资落空的风险。 此外,这家初创公司正与联合创始人埃隆·马斯克(Elon Musk)陷入激烈的法律纠纷,马斯克试图阻止OpenAI向营利性企业转型,同时通过自己创建的xAI公司在生成式人工智能市场展开竞争。 在承担社会责任方面,OpenAI也积极行动。其非营利母公司将启动一项5000万美元资助计划的首轮申请,该计划旨在支持其他非营利组织和社区机构在人工智能普及、经济机遇和社区创新领域的发展。 微软的AI战略:自研与合作并行 尽管与OpenAI的关系有所缓和,但作为全球最大的软件公司,微软自身也在积极调整其人工智能战略,以应对快速变化的市场格局和对未来自主权的考量。目前,微软主要依赖OpenAI的大语言模型驱动其产品,但随着双方相继推出竞争性产品并寻求新合作伙伴,两家公司之间的关系已显现出紧张迹象。 在此背景下,微软消费者AI业务负责人穆斯塔法·苏莱曼(Mustafa Suleyman)在周四举行的全员会议上宣布,微软计划扩展其物理基础设施,用于训练自有的人工智能模型,旨在与OpenAI、Anthropic等公司直接展开竞争。 苏莱曼强调,对于微软这种规模的企业而言,在必要时自主掌握人工智能能力至关重要。他指出,公司正在采取多轨并行策略:既深化与OpenAI的合作关系,也与其他模型开发商建立合作,同时大力发展自研模型。 值得一提的是,微软已在上个月发布了在苏莱曼领导下开发的首个大语言模型,该模型基于15,000颗英伟达H100芯片进行训练。苏莱曼特别指出,Meta、谷歌以及马斯克旗下xAI所采用的尖端模型训练集群,其规模比微软大6至10倍,这从侧面反映了微软模型在研发上的效率优势。 微软首席执行官萨提亚·纳德拉(Satya Nadella)也补充称,微软计划采用多模型策略来应对所有产品需求,允许客户选择偏好的AI模型,《The Information》近期甚至报道称,微软计划在某些产品中采用Anthropic的模型。(小小) -
报告:一体化数据库是中小银行应对国产升级与AI规模化落地的“最优解” 银行业务系统正迈入与AI全面融合的时代。在2025Inclusion·外滩大会上发布的《面向AI时代的中小银行数据库研究与展望》报告提出,一体化数据库是中小银行应对国产升级与AI规模化落地的“最优解”,它将多种功能和特性集成于一体,为银行提供更为全面、高效、可靠的数据库解决方案,以更低成本满足中小银行数字化转型中的复杂需求。这份由中国银行保险报联合OceanBase海扬数据库,与19家银行机构编委单位发布的《报告》调研发现,中国银行业数据库国产升级进程在金融业处于领先地位。超50%的银行核心系统已采用分布式数据库,预计未来三年渗透率将突破90%。对于众多中小银行来说,推进核心系统国产升级与AI规模化应用时,仍面临三大痛点:关键业务系统的高并发承载压力、实时数据分析能力不足、AI应用落地门槛过高。加之技术人才短缺与预算限制,中小银行亟需高性价比、低门槛的解决方案。中国金融传媒特聘高级专家、中国银行业协会原首席信息官高峰在报告解读中指出,政策引导、技术驱动与市场需求三力合一,把银行业推进国产升级“深水区”。城商行步伐明显快于农商行,核心系统“选分布式、用一体化”已是行业共识。他强调,当下,金融业正面临着国产升级加速推进与AI全面迸发的双重浪潮,一体化数据库作为承载金融业务与数据智能的核心底座,战略地位愈发凸显。OceanBase CEO杨冰表示,在AI时代,金融业务正从TB级迈向PB/EB级,业务场景从单一TP或AP转向“实时交易+实时分析+AI推理”融合,并提出降本增效、架构简化及数据安全等要求。一体化数据库将“单机与分布式、TP与AP、多模数据与AI能力”深度整合,恰好契合这一痛点,成为当前最优选。如何解决众多中小银行的个性化需求?杨冰在接受采访时表示,中小银行本身业务虽然是不一样的,但是抽象成底下对数据库的要求,我们已经做了一次抽象,就是关键业务负载、实时分析、AI,在这三个方向上,可以用不同的形态解决,或者说都放到一个库里面去解决。《报告》总结了数据库未来四大趋势:一体化数据库成核心方向;AI与数据库深度协同推动智能化管理与多模融合;数据库将突破算力瓶颈进化为“算力引擎”;未来5-10年将诞生2-3家具备国际竞争力的中国数据库厂商登上世界舞台。“2025年,全球及我国数据库企业数量有所收敛。截至2025年6月,我国数据库企业数量为103家。预计未来数据库企业数量将缩减到个位数。随着中国国力及科技实力显著提升,OceanBase 海扬数据库等国产数据库厂商将在性能、生态与品牌三大维度形成国际竞争力,代表中国数据库产业站上世界主舞台。”《报告》指出。“也许现在对我们来说,需要全球最顶尖科技人才的投入和资源投入,但是却得不到相应的回报。没关系,我把它当作长期的投入。因为国家给了最好的时间窗口和机会,让我能够具备全球顶尖的竞争力,场景对于打磨一个科技产品最重要,这是第一趴我们在做,我们继续做。我们的出路在做这些竞争力的同时卷出去,世界那么大,我觉得可能要到全球去卷。”杨冰在接受采访时指出,打铁还需自身硬,既然要成为全球化的企业也要具备全球化的竞争能力。 -
从“经验依赖”到“数据驱动”,AI+消费让上海传统商场变客流地为客留地 上海正在加快打造具有国际影响力的人工智能高地,如今,大商场的柜台边,小菜场的摊位前,传统实体商业正在悄悄装上AI的“智慧翅膀”,让他们由昔日的“经验依赖”向“数据驱动”转变,传统实体商业也由此从“客流地”变为“客留地”。人工智能时代的“数豆子”神器1915年,南京路上,两位身着对襟短衫的男子,一位站路南,另一位站路北,过一行人,他们放一粒豆子。经过一连数天的测算,他们得出结论:路南人流比路北多。最后,上海永安公司决定开在南京路的南面。百年以后,作为零售行业“老兵”,百联股份引入“AI精准客流分析系统”,并在百联西郊购物中心、百联又一城等多个商业空间试点,堪称人工智能时代的“数豆子”神器。“AI精准客流分析系统”的原理是以室内实景3D地图为基底,通过激光雷达、惯性导航、相机等多传感器融合技术,实现厘米级精度的空间重建。“在不采集人脸等生物识别信息,确保个人隐私不受侵犯的前提下,我们把每位进店顾客包括衣着、步态、携带物品在内的200多个个性化特征采集下来,通过大数据分析,判断出他们的年龄、性别等。”百联西郊购物中心相关负责人介绍。 系统赋予每一位到店的顾客一个专属IP。依靠这套精准分析系统,商场摸准了客群的“画像”:顾客平均年龄35.3岁,51岁以上老年人占比超15%,独行客群占比最大、家庭客群次之。于是,他们明确了更为精准的运营策略,即“既要守牢服务周边社区居民的基本盘,也要开拓Z世代年轻人的消费空间”。以近期入驻百联西郊购物中心的5000平方米超大生鲜超市——品上生活为例,门前那座下沉式舞台原本是常规的营销空间,如今,它靠客流数据实现了“分时段精准运营”:上午银发群体集中,便安排家庭餐饮体验活动;工作日下午及周末,小太阳家庭客群增多,就主推儿童育乐业态宣传。“以前搞活动靠‘拍脑袋’,参与度时高时低,现在按数据来,每场活动人气都很旺,还能对超市和周边其他店铺进行导流。”商场运营人员表示。不仅如此,这套“AI精准客流分析系统”还赋予每一位进店顾客一个专属IP,从而记录下他进入购物中心后的运动轨迹,最终能为每家租户形成一个包括过店率、进店率、深逛率等数据在内的“数据驾驶舱”。百联西郊购物中心内有家著名金店,品牌响当当、楼层位置也过得硬,但品牌方因为业绩不佳,萌生不再续约的念头。购物中心方面用“AI精准客流分析系统”对其复盘后发现,路过这家金店的顾客并不少,但到店率和深逛率都要明显落后于同一楼面的另一家金店。“搭脉”下来,商场建议这家金店在门前摆放显著的促销广告,同时增加促销人员在门口的生意招徕,还要适当增加潮流金饰品的SKU(商品品类)。调整3个月后,金店的深逛率提高了166%,月销售额提高了146%。另据记者获悉,在上海大型商场中,利用AI技术实现精准获客的新一代“数豆子”神器,还有百联青浦奥特莱斯和浦东的比斯特购物村引入的AI智能客服。比斯特购物村把AI智能客服搜集到的顾客提问整理后,建成客户反馈分析模型和意图识别模型,从而进一步优化营销方案,并据此来吸引顾客到店、深逛。百联青浦奥特莱斯还形成VR地图推送给顾客,成为不见面的“导购员”。“物”脸识别助力菜场升级改造如果说百联西郊购物中心的“数豆子”神器,展现的是AI如何为大型商场的转型注入新动能,那么为民办实事项目——标准化菜市场升级改造过程中,AI技术的赋能,又给人们提供了一个“人工智能+消费”的“民生样本”。近日,记者步入焕然一新的静安区宁家·黄山市集,只见每个摊位上的传统电子秤均已被“AI智能识别电子秤”所取代,商户无需再对照价目表核对单价,只要将青菜、萝卜、水果等菜品放上秤台,系统便能自动“物”脸识别菜品名称、匹配单价,实时算出重量与总价,数据同步显示在屏幕上,顾客一目了然。 AI智能识别电子秤。(上观资料照片)今年以来,上海提前完成包括黄山市集在内80家标准化菜市场的升级改造,不仅在硬件设施上焕然一新,植入以“AI智能识别电子秤”为数字底座的“数据大脑”,更是升级改造过程中的“标配”——哪种菜品卖得最好、哪个时段客流最集中、当日营收多少,“AI智能识别电子秤”上形成的一笔笔交易最终归集成“买菜大数据”,可以帮助商户及时调整进货。之前凭经验进货常出现“有的菜不够卖、有的菜剩一堆”,现在根据销售数据按需采购,损耗减少了,营收效率也提上去了。记者了解到,不仅是标准化菜市场,盒马、联华超市等商超企业也广泛使用AI视觉秤技术,盒马自主研发的AI视觉秤技术,能够准确识别1000种以上的蔬菜、水果、干货、零食等,识别时间不超过0.8秒。目前,盒马已将这项专利技术向大润发、三江等企业共享。国务院日前印发《关于深入实施“人工智能+”行动的意见》,将“人工智能+消费”列入六大重点领域之一。市商务委表示,下一步,上海将围绕“促进人工智能消费终端进千家万户、人工智能商业终端进千商万店”,积极推动人工智能新品首发首秀首展,拓展“人工智能+服务”消费场景,打造人工智能特色商圈,赋能实体商业数字化转型,让“人工智能+消费”成为引领上海消费市场能级提升、加快建设国际消费中心城市的全新动力。原标题:《从“经验依赖”到“数据驱动”,AI+消费让上海传统商场变客流地为客留地》题图来源:上观题图 图片编辑:苏唯来源:作者:解放日报 吴卫群 -
“真金白银”支持产业蓬勃发展,普陀聚力打造“AI+数字广告”发展高地 随着数字经济蓬勃发展,广告产业也正经历着深刻的数智化转型。近日,2025年上海国际广告节在普陀区开幕。会上正式发布了《上海市支持人工智能赋能广告业创新发展的若干措施》,以12条“真金白银”的举措,推动AI在全市广告业的广泛应用,支持徐汇区、普陀区加快推动“AI+数字广告”创新集聚发展,助推上海打造人工智能与数字广告发展“双高地”。这一政策的推出,无疑为普陀区在数字广告细分赛道,特别是“AI+数字广告”领域的深耕发展提供新一轮精准助力。 据悉,此次新政的资金补贴力度创历史新高。比如,《若干措施》提出,支持“AI+数字广告”智能体研发。鼓励自然语言模型、视觉模型、多模态模型等基础模型在广告业创新应用,加大广告业全链路智能体研发力度,对具备自主创新能力、实现行业应用且获得市场认可的项目,按照上海市服务业发展引导相关专项资金管理要求,市、区两级给予最高不超过1200万元支持。同时,支持数字广告新技术新业态创新,对研发费用占营收达一定比重的数字广告企业,鼓励有条件的区按照企业研发费用投入的10%-50%,给予最高不超过500万元支持。“规模空前的资金支持,是企业能实实在在获益的政策,能引导企业进一步加码AI投入、扩大研发规模。”普陀区企业利欧集团数字科技有限公司CEO郑晓东表示,当前企业正加快构建由“利欧智能体”驱动的AI营销人机协同系统,旨在大幅提升广告产业的效能,“比如原本我们有1000人,有了智能体就可能具备3000个人的能力,未来甚至到达6000人的能力。”在本次广告节上,利欧数字的“AI广告一体化平台-AI创意工厂”入选“上海市数字广告业高质量发展十大创新案例”,成为区域AI技术应用实践的优秀代表。该平台通过多智能体系统,实现从需求洞察、内容生成到审核优化的全流程智能化,目前已在汽车、电商、金融等多行业中得到广泛应用。数据显示,端到端智能体可实现分钟级单图生成,创意产能提升3倍,内容可用率超90%,生产成本下降70%,直观体现了AI技术对广告业数字化转型的实际推动作用。普陀区是上海市数字广告产业的重要集聚区。在政策支持方面,普陀区早已布局在先。近年来出台了《普陀区加快发展数字广告产业实施意见》等一系列关于数字广告产业的政策,为数字广告行业发展营造了良好的生态环境。今年1-7月,普陀区广告业营收同比增长10.7%,呈现出良好的增长态势。区市场监管局副局长陈燕介绍:“我们将充分发挥区级层面政策落地能力强、配套好的优势,深入贯彻落实好《若干措施》,尤其是重点考虑政策的精准度和兑现率。” 同时,以打造上海国际数字广告园为契机,进一步优化数字广告产业生态,提升专业化服务。她透露,为进一步推动AI技术与广告创意深度融合,近期,普陀区还将举办“AI赋能广告新生”等系列活动。在生态集聚方面,普陀区亦成绩显著。作为中心城区首个数字广告园区,坐落于真如副中心核心区的上海国际数字广告园已经吸引了近180家数字广告及相关企业入驻,覆盖新媒体平台、MCN机构、整合营销等全产业链环节,2024年全年营收近150亿元。“我觉得数广园提供了一个非常好的平台,一方面促进了行业间的交流发展,另一方面给到我们企业很多政策、金融等方面的支持。”蔚蓝云创MCN内容中心副总经理文琼表示,AI赋能对企业来说创意会更多,制作成本也会变得更低,“希望未来可以涌现出越来越多的符合中国语言体系的国产图生视频类目的AI产品。”真如副中心公司党委书记、董事长杜春文表示:“我们以打造产业要素集聚地、龙头企业入驻地、知名奖项举办地、专业人才涵养地为目标,期望为数字广告产业提供富有活力的产业生态。”目前园区已吸引剧星传媒、元隆雅图等头部企业入驻,并配套3D数字化体验厅、共享会议空间等设施,为企业提供全方位服务。随着“The One Show奖获奖作品展示中心”落地上海国际数字广告园,以及上海国际广告节、国际MCN大会、长三角文博会等品牌活动的持续举办,普陀区数字广告产业的知名度和影响力正在不断提升。未来,普陀区将以沿沪宁产业创新带为战略通道,持续优化营商环境和创新生态,积极促进科技创新和数字广告产业双向赋能,进一步强化其在“AI+数字广告”领域的集聚效应和辐射能力,为上海建设“国际数字广告之都”贡献更多普陀实践。原标题:《“真金白银”支持产业蓬勃发展,普陀聚力打造“AI+数字广告”发展高地》栏目编辑:顾莹颖 文字编辑:赵菊玲来源:作者:陶钦忆 -
苹果 AirPods 实时翻译功能首发未覆盖欧盟 iPhone 用户 IT之家 9 月 12 日消息,科技媒体 MacRumors 昨日(9 月 11 日)发布博文,报道称苹果计划于 9 月 15 日发布的 iOS 26 稳定版中,为 AirPods 系列耳机推出实时翻译(Live Translation)功能,但首发并未覆盖欧洲数百万用户。IT之家注:实时翻译依赖 Apple Intelligence,可以将听到的声音翻译为其他语言。该功能最早亮相于 AirPods Pro 3 发布会,并将向支持主动降噪的 AirPods 4 和 AirPods Pro 2 推送。用户只需佩戴兼容耳机,就能进行免手持的跨语言交流,与未佩戴 AirPods 的对话者交谈时,iPhone 会横屏显示实时字幕,并以对方偏好的语言呈现翻译内容。若对话双方均佩戴支持实时翻译的 AirPods,系统还会自动降低对方原声的音量,帮助用户聚焦于翻译音频,同时保持自然交流体验。该功能需 AirPods 安装最新固件并配合运行 iOS 26 或更高版本的 Apple Intelligence 功能,iPhone 15 Pro 及更新机型均可支持。 不过苹果在其功能可用性网页上表示,如果用户身处欧盟,且其 Apple 账户所在地区也位于欧盟,则“Apple Intelligence:AirPods 实时翻译”将无法使用。苹果并未说明限制的原因,但法律和监管压力似乎是最合理的解释。欧盟《人工智能法案》(AI Act)及《通用数据保护条例》(GDPR)目前对语音处理和翻译服务设有严格合规标准,涵盖隐私保护、用户同意、数据流动与使用权等方面,监管机构可能需要先审核该功能的运行机制,而苹果也希望确保系统完全符合法规后,再向欧盟账户全面开放。首批支持的语言包括英语(英、美)、法语、德语、葡萄牙语(巴西)及西班牙语,苹果计划于年内新增意大利语、日语、韩语及简体中文。 -
前8月北京市查处违反中央八项规定精神问题842起 新京报讯 据清风北京消息,日前,北京市纪委监委公布今年1月至8月查处违反中央八项规定精神问题统计指标表。截至8月31日,累计查处违反中央八项规定精神问题842起,批评教育帮助和处理857人,其中局级19人、处级180人、科级及以下658人。 在被批评教育帮助和处理的857人中,给予党纪政务处分的668人,其中局级13人、处级113人、科级及以下542人。查处问题类型包括两大类,即形式主义、官僚主义问题和享乐主义、奢靡之风问题。其中,形式主义、官僚主义问题方面,查处问题主要集中于“在履职尽责、服务经济社会发展和生态环境保护方面不担当、不作为、乱作为、假作为,严重影响高质量发展”,批评教育帮助和处理194人。享乐主义、奢靡之风问题方面,查处问题主要集中于“违规收送礼金和其他礼品”“违规接受管理和服务对象等宴请”“违规发放津补贴或福利”等方面,批评教育帮助和处理人数分别为312人、145人、37人。今年8月,本市查处违反中央八项规定精神问题127起,批评教育帮助和处理127人,其中局级8人、处级19人、科级及以下100人;给予党纪政务处分99人,其中局级4人、处级16人、科级及以下79人。查处问题主要集中于 “违规收送礼金和其他礼品”“违规接受管理和服务对象等宴请”“在履职尽责、服务经济社会发展和生态环境保护方面不担当、不作为、乱作为、假作为,严重影响高质量发展”等方面。编辑 刘佳妮 -
50、60岁的女人,穿“裤子”要选松不选紧,不仅舒适还藏肉 岁月在50、60岁女人身上沉淀出温润从容的气质,咱们的穿衣打扮也该顺应身体与心境的变化。比起紧绷的裤装带来的束缚感,宽松款裤子更像是为这个年纪量身定制的温柔选择。它既能包容岁月赋予的身体曲线,又能让每一步行走都自在舒展,在舒适与美感之间找到完美平衡,特别适合上年纪的女人。 1,为什么流行裤子穿松不穿紧人到中年,身体悄悄发生着变化,腰腹可能不如年轻时紧致,腿型也可能因为年纪增长有些许变化。这时候穿宽松的裤子,首先是舒服,不会像紧身裤那样勒得慌,坐久了也不觉得肚子憋得难受,行动起来也利索,不管是做家务还是出门散步,都自在得很。 再者,宽松裤子确实藏肉,能把那些不太满意的小赘肉和肌肉悄悄遮住,不用总担心坐下时裤子紧绷显尴尬。而且中年女性的穿搭,讲究的是从容大气,宽松裤型自带这种沉稳大气感,配件简单的衬衫或者针织衫就很有味道,不会显得刻意,又透着点随性的优雅。 2,宽松裤子的挑选技巧✓有垂感的面料选对宽松裤装,还需掌握几个实用技巧。面料上,优先选择垂坠感强的材质,比如重磅真丝、弹力西装料,这类面料能让裤型保持挺括,避免软塌面料带来的臃肿感;而灯芯绒、毛呢等面料适合秋冬,自带的肌理感能增加造型层次。 ✓九分高腰最显腿长长度方面,中年女性也更适合长裤,特别是九分裤,可谓是显高神器,露出的脚踝能打破沉闷,搭配平底鞋也不拖沓,反而更显精致。全长阔腿裤也不错,但需注意裤脚离地 1-2 厘米,避免拖在地面沾灰,细节设计上也不可掉以轻心哦,一定要挑选高腰的处理,才能够拉高比例,显腿长。 ✓裤型大一号购买时,裤腿也可以尝试 “大一码法则”,大家可以在试穿合身的基础上选择稍大一号,能保证活动空间,又能预留出内搭秋裤的余地,从秋天到冬天都能穿,提高裤子的实用性和利用率,正好满足了中年女性的搭配需求,你说妙不妙? 3,宽松长裤的搭配50、60岁女人的穿搭不必追求潮流,而是要找到适合自己的节奏,宽松裤装带来的松弛感,恰好能衬托出这个年纪独有的韵味。想要避免宽松裤显得臃肿,上半身的搭配尤为关键。可以选择修身的衬衫,将衣角随意塞进裤腰,用利落的线条平衡裤装的宽松感,整个人的比例得到优化,气质也能不经意间有所提升哦。 颜色上,基础的黑白灰、卡其色永远不会出错,上衣和裤子最好是同色系或者是相近的色彩,避免产生违和感。此时,鞋子的选择也很重要,乐福鞋、平底帆布鞋能增加干练感,舒适自在又得体,日常搭配真不必追求恨天高,中年女人驾驭起来太难,舒适度也不高,还不如选一些轻便的平底鞋搭配阔腿裤呢。 50、60岁岁的女人选择宽松裤装,不是向年龄妥协,而是懂得与自己和解,不再用紧身衣束缚身体,不再用外界的标准定义美,而是在舒适中找到自信,在自在中展现魅力。当裤摆随着步伐轻轻摆动,那份由内而外的松弛感,才是五十岁女人最美的姿态! -
深夜,中国资产爆发,阿里巴巴涨超8% 记者丨吴斌编辑丨李莹亮 和佳 金珊周四(9月11日),美国三大股指全线收涨,道指涨1.36%,标普500指数涨0.85%,纳指涨0.72%,均创历史新高。 消息面上,美国劳工统计局公布的数据显示,美国8月消费者价格指数(CPI)环比增长0.4%,经季节性调整前同比增长2.9%。当月,剔除波动较大的食品和能源价格后,核心CPI环比增长0.3%,经季节性调整前同比增长3.1%。整体而言,美国8月CPI基本符合预期。 美国通胀上行压力仍存尽管总体通胀数据与经济学家的预期相符,但在细节上能看到存在一些价格压力。除了汽车维修和机票外,8月水果和蔬菜的价格环比上涨1.6%,汽车燃料价格上涨1.8%,烟草价格也上涨了1.0%。此外,8月家庭食品价格上涨0.6%,是近三年来的最大涨幅,美国如今是一个食品净进口国,因此该品类可能受到了关税较大影响。中泰证券研究所政策团队首席分析师杨畅对21世纪经济报道记者表示,考虑到美国新版“对等关税”自8月7日开始实施,市场与美联储都更关注关税稳定后的通胀效应。关税影响或尚未完全释放,后续叠加企业库存持续消耗,价格传导仍将持续,商品通胀存在继续抬头的可能性。() 中概股大涨当日,大型科技股涨多跌少,个股方面,特斯拉涨超6%。消息面上,特斯拉Model Y L新订单交付时间排至11月份,10月产能已全部售罄,市场对其需求强劲的预期推动股价上涨。 芯片股方面,费城半导体指数涨0.63%,刷新历史新高, 拉姆研究 涨超7%, 美光科技 涨逾7%, 应用材料 涨超4%。中概股多数上涨,纳斯达克中国金龙指数涨2.89%,三倍做多富时中国ETF涨超7%,两倍做多沪深300ETF涨约7%。 个股方面,阿里巴巴涨8%创近4年新高,蔚来涨超6%,百度、京东涨超3%。 摩根士丹利在最新报告中表示,美国投资者对中国市场的关注度已升至2021年以来的最高水平。法国里昂商学院管理实践教授李徽徽近日对21世纪经济报道记者分析称,这轮中国资产反弹由外因、内因和微观三支柱相互强化。其一,美元走弱与美联储进入降息“前夜”,使非美资产的贴现率和风险溢价同步下行,资金回流新兴市场,利好以ADR为主的中概股;其二,中国政策组合转向“稳预期、稳现金流、稳资本回报”:监管鼓励分红回购,央企与大型平台公司加大股东回报,修复了长期折价的公司治理溢价,今年迄今中国企业回购激增可见端倪;其三,龙头盈利质地边际改善,尤其部分出海与平台经济公司二季报超预期,对冲了内需疲弱,构成基本面底座。短期来看,李徽徽判断纳斯达克中国金龙指数或进入“台阶式上移+高波动”阶段:在美元偏弱与第一次降息落地的背景下,仍有冲击8500至9000点的概率,但回撤将更频繁,主要由于期权平仓与事件扰动。中期能否走出第二段行情的关键不在于资金面,而在于基本面、宏观和微观层面。利差层面,关注美联储降息节奏与美元路径;利得层面,关注龙头企业盈利的可持续性,包括平台、电商出海、AI应用兑现等;制度层面,关注分红回购与资本市场改革的“长流水”,而非一次性冲击。渣打中国财富方案部首席投资策略师王昕杰预计,未来仍将有更多的催化剂进一步提升中国资产的价值,目前海外资金配置中国的比例仍然较低,未来买入中国的趋势也将持续。随着“美国例外论”的叙事继续收敛,全球投资者对中国资产配置的共识增加;过度储蓄可能发生潜在变化。(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)SFC出品丨21财经客户端 21世纪经济报道编辑丨金珊21君荐读 -
十年磨一剑,芝麻信用「开门」 「核心提示」 信用正在成为重塑商业规则的重要力量。 作者 |陈法善刘杨五毛钱买一条好评,花钱请探店人打卡,给“大V”封口费压差评——本地生活赛道的评价乱象,让商家陷入“不刷单没流量,刷单又烧钱”的困境。开餐馆、理发店本就是小本生意,却要为虚假评价买单。正如电商呼唤“让天下没有难做的生意”,本地生活同样需要一套真实可信的评价体系。9月10日,芝麻信用宣布战略升级商业信用服务体系,扩大本地生活场景接入,正式面向高德地图开放产品能力,双方共同打造全新线下信用服务体系。在新上线的“高德扫街榜”中,经用户授权后,芝麻信用将作为用户评价分的重要校准因子影响商家的综合评分,从而让商家评分更真实、可信。这也标志着,十年磨一剑的芝麻信用正式“开门”。1、线下探店打卡规则变天?现代人的餐前仪式,不再是洗手,而是刷点评。这堪称一种“赛博卜卦”,算一算此行是“惊喜”还是“惊吓”。这种评价体系,虽然为消费者提供了参考,但也存在局限性:刷单、职业探店人盲目推荐、被竞争对手恶意差评等乱象层出不穷。商家为了维护评分,需要额外花不少成本。轻则送用户饮料“买”评价,或者花钱打点“大V”,看似流量大,但实际转化寥寥。重则还得给职业差评师“封口费”,哪怕是竞争对手“0成本”的恶意差评,都需要花很大代价去应对。这些现象表明,这套以“数量取胜”的评价机制,往往无法真实反映商家的服务质量。在高德推出的“高德扫街榜”评分机制里:只有真实到店的人,才能参与打分;信用越高的用户,则对商家综合评分的影响越大。 信用等级高的的人,其评分往往更贴近真实体验,毕竟,谁会用多年积累的信用分去换取一次虚假评价的“蝇头小利”?这恰好成为“高德扫街榜”筛选优质评价的天然滤网,让店铺的评分更真实、可信。同时,“机器人”刷单、注册小号刷分营造的虚假繁荣也将被刺破。商家得以回归产品和服务本身,专心做好每一单生意,真正用品质赢得口碑。高德地图和芝麻信用的合作,因此被业内人士精准概括为:身体力行+言而有信。这是一种信用社会的基本价值观,也将爆发出巨大的行业影响力,有望改变众多行业规则。2、为何拉着芝麻信用给它撑腰?高德在这次发布会上官宣跟芝麻信用的合作,最直接的是借助芝麻信用的商业信用评估体系,校准商家评分真实性,优化消费体验;更长远的,是双方共同来构建线下服务信用体系。这里为什么要拉上芝麻信用来“撑腰”?不少普通消费者可能会误以为芝麻信用只是单纯的评分,殊不知,芝麻信用“十年磨一剑”,早已在商业信用体系建立了难以复制的生态壁垒。从2015年正式推出至今,芝麻信用作为独立第三方商业信用评估机构,积累了超7亿用户。用户规模之庞大,覆盖了租赁、购物、商旅出行、本地生活等众多商业场景,用户通过个人芝麻分,就能享受到免押、先享、先试等各种便利的服务。这也意味着,芝麻信用构建起了覆盖广、渗透高、高粘性的商业信用生态网络,目前已成为国内最成熟的商业信用体系。不仅仅让“守信”的用户能享受到更多优质服务和便利,商家也通过接入芝麻信用,不断降低商业交易中的摩擦和信用成本,降低经营风险,实现获客增收。这次和高德地图的合作,同时也扩大了芝麻信用在本地生活场景的接入,是服务价值和能力的全新外延。就像电商发展初期,买卖双方都信任中间方支付宝,生意就简单多了。现在,芝麻信用助力构建本地生活的“信任基础”,买卖双方的不信任感减弱,衣食住行的小本生意也就盘活了。 或许很快,商家在做推广时,不是只盯着达人的流量,而是更看重“信用为王”。信用分高的顾客成为新的店铺KOL,他们一句真心推荐,胜过千万虚假好评。当“信用探店”成为行业新标准,整个本地生活服务也将回归品质本身。3、信用基建,还能开启哪些可能?从合作信息释出后的大众反馈来说,可以说击中了大家的痛点和需求,对于高德地图的这次选择,不少用户高芝麻信用分用户表现出了十足的欢迎。这也意味着,他们的高信用账户又有了更多使用的场景。在社交平台上,已有用户开始“晒分”:“珍藏多年的802信用分,终于有用武之地啦”“25岁800多分,同龄人最高”。信用分正在成为人们的“个人信用名片”,在虚拟网络世界共同构建安全感。芝麻信用产品负责人萧沐洋表示,未来将进一步加大更多场景的产品开放力度,欢迎更多平台和商家接入,共同为用户带来更真实、可信的服务评价体系。除了餐饮消费、生活服务、公共服务等地场景之外,随着商业信用被市场和大众更广泛的认可,相信它的影响力也日益凸显。以二手市场为例,现在很多3C数码翻新机、高仿商品等问题抑制了交易活跃度,两个高信用用户的交易,则能大大减少货不对板、被调包的风险,让闲置物品流转更加顺畅。高信用还可能真的“当饭吃”,变成人们工作面试时的加分项。也有可能是,保险购买时的优惠券,消费分期时的绿色通道……这些,既是对“言而有信”的人价值的肯定,也是以信用为纽带,推动数字服务生态往更诚信、可靠的方向发展。 -
临近机器人GPT-3时刻,具身智能开源模型的加速演进 (点击收听本期音频) 采访|泓君图文|王梓沁、孙泽平编辑|朱婕作为人工智能和机器人交叉的前沿领域,具身智能是当今科技领域最具潜力和前景的方向之一。其中,机器人/具身大模型扮演着“中枢大脑”的角色,使机器人能够在复杂多变的环境中实现自主学习和持续进化。因此,大模型的研发已成为推动机器人产业——尤其是通用型机器人突破发展的关键环节。9月8日,中国的具身智能公司自变量机器人开源了他们的具身模型WALL-OSS,紧接着的9月9日,美国的具身智能公司Physical Intelligence(简称PI、π)也开源了他们的π₀.₅模型。中美两家公司几乎同时开源了自己的模型,这并非偶然。2025年,具身大模型的开源生态正在进入百花齐放的发展阶段。这一态势让人联想到过去几年里以ChatGPT为代表的语言大模型演进路径:从2018年开源社区初步兴起,到2020年5月ChatGPT-3引发全球瞩目,语言大模型用了三年时间走向成熟。那么,机器人大模型距离属于它的“GPT-3时刻”还有多远?本期《硅谷101》,主播泓君邀请了自变量机器人的CTO王昊,以及Physical Intelligence的研究员柯丽一鸣(Kay Ke),她是π₀、π₀.₅论文作者,一起来聊聊今年机器人模型领域重要的突破、当前还面临着哪些挑战、对比下中美的机器人发展路径有何区别,以及还需要多久才能在全场景落地。 欢迎关注《硅谷101视频号》的音频栏目直接收听本期播客。如 果 你喜欢我们的 节目,更推 荐大家使用 音频客户端来收听,《硅谷101 》已覆盖各大 主流音频 平台(渠道见文末),欢迎订阅!以下是这次对话内容的精选:01行业突破与泛化能力泓君:你们认为整个2025年,机器人的模型领域最重要的突破是什么?柯丽一鸣:我搞机器人大概有七八年了,我觉得机器人大模型的红火,也是在最近两三年才开始集中爆发。我自己刚开始的研究中,没有用到很多大模型这些东西,更多是做一些小而精的任务。当时我就发现:一套东西在一个场景下能解决特定的问题,虽然做出来效果不错,但是很难便宜、便捷地复制到新的问题上去。所以在我探索大模型的途中,最大的一个惊喜发现就是,验证了模型的通用性,这样就可以开始做一些泛化、性能提升上的探索,这时才能开始讨论机器人大模型的可能性。在机器人领域,我觉得现在比起两三年前,对大模型这一种技术路线的信仰要浓厚得多。王昊:今年有一个非常明显的现象,那就是在应用上呈现出了指数效应。这背后的驱动力,其实也是来源于通用机器人基础模型的发展和进步。在2023年以前,我们很多人会专注在单个任务上,把它做到极致;但现在我们有了统一的基础模型之后,就能够同时学习并执行成百上千种不同的任务,其实也就意味着:我们的优化目标变了,重心放在了提升整个模型在所有任务上的平均成功率。这也是指数效应发展的基础,我们现在可以开始去做复杂的长程任务(Long-Horizon Task,包含一系列连续步骤、需要机器人进行多步推理、规划并执行,最终才能完成的复杂任务),这是一个非常令人惊喜的现象。泓君:我总结大家刚刚的关键词,一个是整个机器人模型泛化的探索,还有一个是复杂的长任务。请帮我们举一些例子来说明下,比如有哪些任务机器人以前做不到,到了2025年就能做到了?或者以前机器人只能局限在某个场景的特定任务,现在可以迁移到其他的场景了? 图片来源:Physical Intelligence柯丽一鸣:2024年的时候,PI(Physical Intelligence,美国具身智能公司)发布了π₀,当时就是想要推动泛化能力。其中最有代表性的一个例子就是叠衣服的任务。这个任务其实在机器人界做了十几到二十年,有很多人都在研究。大家一般认为让AI下围棋很难,因为围棋的复杂度很高嘛,每一把棋局都不一样,其实在我们日常生活中,叠衣服这些看上去对人来说很简单的小任务,它具体的复杂度也很高。比如衣服上面可能有两个折、有三个折,或者某个折的角度不一样,对机器人来说可能都是一个新的情况,它需要把这么多不同的情况解决。同时叠衣服有很多不同的步骤,要先叠什么再叠什么,有这样的序列性,这种复杂的细分的情况和序列性,使得叠衣服这个任务在以前是比较难解决的。到了2025年,我们也开始探索了不少泛化的方向,比如说把π₀.₅模型放到一个移动机器人里,再把这个移动机器人放到不同的、没有见过的家里,这些都不在模型的数据集里面,模型可能不知道会怎么反应,然后我们观察它会怎么做。在这个过程中我们发现,要做到泛化性还是比较有希望的,虽然机器人的表现不是很完美,但它好像展现出了一点像人类的特性,比如拿东西,换到别的家场景里还是能拿。 泓君:它拿的是哪一类的东西?在我的理解中,衣服是软的布,但如果拿起一个杯子、一个碗,是不是就不太一样? 柯丽一鸣:是的,其实这一类问题在机器人内部术语就叫抓取问题,因为它要结合物体具体的形状、摆放的位置,甚至你靠近过去的时候的角度来考量。所以抓取问题是既简单又不简单的一个问题,比如你要抓一个水杯,就算是完全一样的水杯,在两个不同环境中,也是一种泛化的体现,需要的策略会不一样。甚至以后我告诉机器人要拿杯子,它不管去了一个新的家、拿了一个完全不一样的杯子,都要能完成,彻底的泛化结果就需要这样层层递进的测试。 图片来源:Physical Intelligence泓君:所以π₀.₅相比π₀,它的进化表现在哪?你刚刚提到了让它去一个新的家,它依然能够适应这种环境,这是一点。但比如说它做的任务是不是有一些局限性的?它的任务的可迁移性如何?哪些任务还不可迁移?它的规律是什么?请跟大家简单地解释一下。 柯丽一鸣:当我们在开始推进π₀.₅的时候,我们强调的点就是泛化,这时会强迫自己去收集一些不同的数据。但这个“不同”的数据的“不同”,其实没有那么好定义,因此我们决定把机器人放到外面不同的房子里去测试。而在这个过程中我们又发现,不知道要收多少个不同的房子的数据才算到头了,我们得一边收集、一边检验,同时心里也会怀疑:今天收集了3个房子的数据,是不是就有帮助了?如果我们收集了30个都没有帮助,是不是就意味着这条路走不通?但还好我们收集到了很多的不同的数据以后,最后训练出来的模型在验证时,确实发现它有比较强的泛化能力。也就是说π₀.₅在一些新的环境中的表现比以前更好了。当然并不是任意新环境都很好,目前还存在一些局限性,但大家还在慢慢地在感受和探索,未来落地时在性能上还有很多提升空间。 泓君:你们觉得机器人模型在研发过程中,泛化问题最难的环节是什么?比如是因为数据量比较小,还是算法的问题? 王昊:难点之一是物理世界中长尾效应的鲁棒性(robustness的音译,指事物可以抵御外部应力和影响并维持原有状态的自身性质),比如因为环境、光照产生了一些视觉误差。虽然可以通过用更好的传感器、更强的算力、更好的生成模型帮你做数据合成、数据增强,来缓解这些长尾效应,但真正的难点就是,现实时间有太多种可能性了,我们没法预测到所有可能的corner case(边角案例)。 图片来源:自变量机器人所以这些情况就没法让机器去提前学习,比如机器人执行任务的时候,桌布上可能有个小的褶皱、杯子可能放置不稳、可能有一个透明物体反光刚好干扰了相机等等情况。人类可以凭直觉和丰富的经验去瞬间适应这些微小的物理变化,但由于算法非常依赖于数据驱动,AI大模型面临这些新的挑战时,不一定能做好。 另一个难点就是在长程任务上,很多微小的物理扰动会造成的各种微小误差,它会像滚雪球一样被放大,尾部的误差到最后,可能就直接导致了任务的失败。所以我们要解决的就是,怎么让模型解决这些没法在数据里包含的各种corner case,这个事的核心是要去构建一个能够理解物理常识、能够有物理直觉的模型基础,让模型能有空间的理解能力、推理能力。所以这个问题的核心就是,我们要把机器人真实的数据、人类的视频数据等等都合在一起,让数据的规模更大、来源更丰富、质量更高、更多样,让机器人从这个学习过程中能够理解物理规律。但是这些和真实世界交互的高保真数据又是目前比较稀缺的,要得到这些数据并不意味着疯狂地在现实世界去采就行了,这件事情远比想象地更复杂,它不止是数据量的问题,还是数据工程、数据管线的问题,比如如何降低我们的数据采集成本。 柯丽一鸣:我也觉得难点挺多的,并不是只有一两个难点。王昊刚才说的长尾问题我觉得是难点之一。而从研究的角度来看,我认为是测试机器人模型的表现如何是很难的。大家经常看到新闻里说,哪家公司开放了新的大语言模型,它在某个榜单上面变成了第一名。而在机器人界,过去数十年来,一直没有办法在真机世界中做出这么一个榜单。没有办法非常客观、公正、可重复地告诉你:在什么情况下,模型A比模型B的表现是要好的。 做这个榜单的难点就是一个模型,它可能在某些地方表现好、其他地方表现不好,你要包含多少种不同的情况呢?如果要有一些corner case的话,那可就无穷无尽了。同时如果你想做一个真机的榜单,还要考虑这些真机维护、细节、对于模型的表现会不会造成影响等等情况。因此到现在,机器人整个业界在发表论文的时候,很多时候都是依靠自己,既作为作者、又作为一个测评官,“我现在开发了一套算法,我们觉得它在这个任务上比之前的一些方法要好一些”。缺乏统一的评价机制使得具身智能领域的发展缓慢了一些,因为你真的很难去分辨模型A、模型B到底哪个好。理想的情况是评分高的模型表现非常明显的好,而真实世界是菜鸡互啄。你说在模型上做了一些数据、算法上的改动,那你怎么验证?据我所知的话,业界里肯定有不少人在探索用模拟器,或者说一个第三方的、像打擂台一样的评测标准,我觉得这也是大家在这个难题上开始进行的一些探索。 图片来源:央视网泓君:之前我看中国有机器人运动会,还有首届的机器人的展会,机器人有表现出很多的能力,比如说踢足球、赛跑,还有做一些具体的任务,怎么样去评判一个机器人,它的技术是好还是不好?从这些Demo上能看出来吗? 王昊:我觉得是比较困难的。这也是我们具身领域大家感到的一个难点和一个痛点。很难有一个统一的评测标准,可以让大家没有那么高成本、且比较公平地去评测模型。最好的评测就是要到现实世界去评测,但是我们又很难搭建一个公平的决斗场,所以这个是比较困难的地方但我觉得还是有些办法可以去评测的。比如说我们有一批开源模型,大家可以在自己的机器人本体上,去看不同的模型在学习相同的任务的时候所需要的数据量,它所展现出来的泛化能力、推理能力,是可以去评测的。那另外对于不同的机器人的公司,那可能合理且公平的是:我们把它的机器人应用到具体的场景里面,去看不同模型的表现怎么样。因为在真实世界运用时,它所展现出来这种多样性、泛化性或者环境是非常随机的,所以它是最能体现你模型能力的。02 数据挑战与硬件瓶颈泓君:刚刚说到难点,Kay提到了第一点,还有两点是什么? 柯丽一鸣:第二个难点刚才王昊也提到了,就是数据的质量和数量,就算在2025年的今天,还是鱼和熊掌不可兼得的事情。如果你想要数据质量非常高,是需要精心地去设计、勤勤恳恳地去清洗的,就比如大语言模型训练,也是对数据的质量很敏感。我们做机器人的数据都是自己收集的,然后再做清洗,每个细节都要到位。而一旦要对细节有追求,追求更高数量就有些难度。所以问题变成了我们是需要又多、又好、又快的数据,才能让我们的模型更好。第三个难点的话,就是真机的维护。做机器人、尤其现在还在奋斗做真机机器人的同行们,一定是对这个行业很热爱的,但真机机器人硬件的维护,我觉得是很劝退的,尤其是很多新人,当我看到他们开始研究机器人的时候,会发现没有一个比较好的、上手就能用的机器人。这可能不像一些纯软件的行业,你可以下载些代码就直接跑机器人,到现在依然没有一个大家都非常认可、都愿意拥抱的一个硬件平台,甚至这个硬件应该长什么样,其实业界到现在也还是在争论、在探索。我觉得这些客观条件使得我们的研究和领域有了一些门槛吧。 开源机器人数据集,图片来源:Open X-Embodiment泓君:对,说到这个让我想起来,我有时候跟机器人的研究员们一起聚会,大家问白天在干嘛,那就是一天啥都没干,专门在修手,因为手不太稳定。 柯丽一鸣:是的,我刚开始读博的时候不是搞机器人,是搞理论机器学习的。当时还很年轻,就觉得:哎呀,整个机器人的项目怎么会用这么长时间呢?等我自己做的时候就发现,天天都在拧螺丝。 泓君:我觉得数据确实是挺重要的一块的,我也知道王昊你们自变量机器人的模型,是有数万小时的多模态数据积累的。Kay你刚刚提到了π的模型,你说需要采集这种高质量的数据,然后要自己去收集、自己去做数据的清洗。 柯丽一鸣:稍微纠正一下,我觉得不光是π的模型想要大量高质量的数据,这可能是行业的共识,因为大语言模型的成功, 所以大家对数据的质量是比较敏感的。 泓君:你们的数据是你们自己采集的,还是第三方公司做的?柯丽一鸣:我们有很多自己采集的数据。 泓君:行业里面会有一些专门的第三方公司去提供数据吗? 柯丽一鸣:我倒是认识一些朋友,他们自己创业就是为机器人提供一些真机数据,但是这不是我们现阶段研究的重点。 泓君:你觉得多少的数据可以构成一个优秀的大模型。 柯丽一鸣:在这点上我有个暴论,也很好奇大家怎么看。我之前就经常和朋友聊天说,一个人的一生假设是100年的话,那我们很粗略地算就是100万个小时,现在我在公开信息里,好像没有看到有人做100万小时的数据集。 所以我会觉得,什么时候我们能够收到100万小时,等同于一个人一生的物理经验的数据,可能才能开始后面的探索。之后如果真的能把机器人广泛地部署在真实世界中的话,那也许收100万小时的数据,也就是几天的时间。这也是来自于和一些做语言、图像、音频生成的朋友的吐槽,因为他们动手就很豪气的:我今天要做这个任务,给我来400万小时的数据,明天就要收集,后天就要清洗,我就说,咱做了多少年机器人,好像都没这个400万这个量呢。 图片来源:Physical Intelligence泓君:为什么你的判断是100万小时?以前我们在说,人成为一个领域的顶级的学者专家,有个1万小时定律。包括我观察我家宝宝学吃饭的过程也是,她在非常小的时候,拿着勺子把饭喂到嘴边都是喂不准的,但她每天练习这个事情就慢慢学会了。但为什么机器人要训练出这样的灵活度,就需要比人大得多的数据量? 柯丽一鸣:我有一些很粗糙的想法,我们PI自己在做研究的时候,有个重心叫做跨本体迁移,就是希望在不同形状、不同类别的机器人上收集的数据,能适用到别的机器人上,让它更快地学会一个任务。人类能做到这点可能和基因、躯体有一些关系,毕竟人类有一个非常好用的感知器,就是眼睛,现在也没有哪个相机敢对标人眼,还有我们的关节,这些物理的、天生的东西,我觉得是人行动力的基石。我个人比较相信,可以用一些算法上的优势,去盖过硬件上的不足。但罗马不是一天建成的,咱也不能指望机器人马上就能像宝宝一样学得这么快。机器人如果要快速学习新任务的话,它之前还是得有非常多的积累。刚才王昊也提到、并且我在PI也看到的一点就是:某个机器人上收的一些任务数据,是可以帮助其他任务做得更好的,让新的任务也许就不用那么多数据。 王昊:其实和人比的话,我觉得对机器人来讲还是太不公平,核心就是因为人其实有“预训练”的。整个生物界在大规模的进化过程中,有两个非常核心的点:一是在进化过程中,人积累了很多先前验证的东西,比如跟世界交互的认知,关于物理世界的应对的策略,这些其实都写到了基因里;另一方面,人其实在不停地进化自己的硬件,整个生物界都是这样,大家能不用“智能”解决的东西,就尽量用“硬件”解决,所以很多生物体都会进化出一些结构,比如说大肠杆菌,它就不用长眼睛,只要对有化学、温度敏感的一些感知,就可以去适应周围的环境。我们现在正在做事,就是帮助机器人做它的预训练模型,虽然看起来要覆盖人类进化的几亿年的时间,但其实也不太一样。第一是因为机器人是可以进行大规模复制的,不同机器人之间可以共享它们的经验,我们就可以快速构建机器人的预训练模型,让它能够具备对物理世界的感知、理解能力。当然这个过程也是让机器人越来越熟悉自己的身体,就像刚才Kay说的“跨本体泛化”,我们就是让不同的机器人(模型),适应不同的身体,并且让它能够互相感知到身体的不一样,这个很重要。其次在人的学习里面,所谓1万小时理论还是有很多不一样。人并不是一定时间内专门去学这一个任务,学完了再学下一个新任务。你开始教宝宝去做某件事情的时候,比如说拿一个东西,他可能精确度也不够、抓不准,所以就把这个东西扔到一边就不管了,去玩别的玩玩具、搭积木什么的,而过一个月之后你会发现,拿东西这个任务他在并没有花多少时间学习,但是他已经会了,这也体现了人在后天和环境交互过程中学习,其实也是一个多任务并行的学习。它可以从不同任务中学习到这种底层的、共同的物理结构,这种共同物理结构就会帮助它学习新任务时,减少它所需的数据量。所以现在我们训练机器人时也是这么做的,我们用尽可能多样的数据、覆盖各种能力的任务,去构建这个大的数据体系、构建机器人能力,它也许在学习新的任务的时候,需要的数据量就会大大减少。所以刚才说机器人需要百万小时数据,核心就是解决两个问题,第一是覆盖过去人类长时间进化这个预训练的过程,我们需要通过多样的数据,去帮助机器人构建这种基础能力。第二就是在学习新任务的时候,我们也要利用它在旧任务学习中,形成的这种通用能力,让他能够泛化到新能力上。所以在数据上、时间长度上不能完全类比人类,但我觉得这个学习历程和背后所反映的规律可能是一致的。 图片来源:自变量机器人-已开源的具身智能基础模型WALL-OSS泓君:我很好奇大家在真实世界里面采集到的数据量有多大?训练一个具身模型时,数据会占多少成本?或者说数据有多贵? 柯丽一鸣:在π₀的时候,我们做了一个比较简单的统计:π₀使用的数据,比谷歌研究院收集的所有数据加还要多,即使π₀发表的时候,PI还是一个很年轻的初创企业。我觉得其实这是说明了两件事:第一就是那个时间点采集的数据量确实是非常大,而且之后一直有往里面增加数据,而数据的成本、数据的量是在实时变化的。在谷歌研究院在开始探索的时候,要花很大的功夫才收到这些数据,但后来渐渐的有了经验,PI或者其他公司再收就会越来越简单,成本应该也是能够得到控制和降低的。 泓君:那你们现在合成数据用的多吗?我知道业界很多都会用合成的数据,前几周谷歌发布了Genie 3世界模型,我听到了两派不同的观点:有一派认为的Genie 3对机器人有非常大的帮助,因为这种世界模型的数据是有用的,但是另一派就会觉得这个数据质量还是不够好。 图片来源:Google柯丽一鸣:我觉得可以分成两个问题,一个是我们之前做了什么,另一个是对整个领域来说什么东西很有用。π₀.₅应该有一篇后续的论文,探讨了我们对π₀.₅训练中的一些考量,其中有提到过,我们在π₀.₅的时候,引入了一些网络数据,我不知道严格意义上这算不算合成数据,但确实是希望通过引入一些外界各种各样的知识,去给它一种通用和通感,而不是直接告诉机器人应该什么动作。而合成数据对于领域有什么作用,我觉得没有一个很清晰的定论。现在有些人觉得,如果能够大批次的生成成本低廉、有可控性、而且对机器人有用的的数据,那会是很好的,但现在比较大的困难就是怎么弄出这些数据、怎么样证明它有用,这还是比较前沿的研究问题。 王昊:现在头部的机器人公司的数据量,因为有真实物理世界限制,大家可能都集中在几万到几十万这个范围内。但这个和训练像GPT-4这样级别的语言模型去比,数据量还是少很多。我们除了用最重要的现实世界真实数据、机器人上的数据,其实也会用一些其他方面的数据,但是每一类型的数据肯定都是有自己的问题的。 机器人的真实的数据是比较贵的,受限于机器人的硬件场地、操作员的收集速度等等因素,所以大家有了很多改进方法,不仅可以依靠真实机器人本体,也可以做一些低成本的本体,甚至不用做完整的本体,只有一些穿戴式的传感器设备,都是可以去采集的。其实我们也用了很多生成模型去做合成数据,但合成数据主要是缓解一些视觉和现实的分布差异问题,它很难去生成带有物理交互过程的数据,这种数据还是得来于现实世界的采集。 还有一类数据,就是人类的视频数据。这个规模非常非常大,多样性也很多,成本相对来讲也比较低,我们也帮很多公司在做这方面的探索。但要靠这些数据帮机器人做动作级的生成还是很困难的,现在具身模型从视频数据里学到的,还是在动作意图上,我们从人类的视频里,让模型学到了一些高级的语义理解、一些任务规划。但是这种规划是通过视频,而不是语言的方式机器去学习的。包括像Genie 3,我觉得它是非常好的一个工作方式,它就是从互联网、从游戏环境里面得到了大量高质量的数据,所以通过视频生成的方式,可以做一些动作控制,是未来是一个很好的方向。虽然这个环境相比于现实有些简化,但它仍然可以作为训练的环境,去帮你去做这种交互。 所以在数据上我们还有工作要做,我想每家公司在数据的投入占比可能都不太一样,这也取于整个公司的综合的实力,比如运营能力、硬件的水平,对数据的使用规划不一样,会让你的数据成本也不一样。中国和美国相比,可能硬件成本、人力成本是比较大的差异。就算在同一个地区,运营能力、数据过滤、清洗、任务生成分发、不同的场景里面的数据采集能力、场景的快速搭建以及恢复的能力,这都会影响数据成本。 泓君:所以你们公司的数据成本类比于其他机器人公司,大概是在什么水平? 王昊:这个很难在不同公司之间进行比较,因为大家对数据质量、多样性的要求可能不一样。但是对于我们公司来讲,数据肯定是在整个研发成本里占相当大的比例了。 图片来源:自变量机器人泓君:在今年的9月8日,你们WALL-OSS的开源模型是正好上线了,请你给大家简单地介绍一下,你们的这个开源模型是什么?以及它的行业特点是什么? 王昊:我们是持续地发扬开源精神,也吸收了很多经验,所以是用了大概几万小时的真实世界的数据,训练了一个具身的基础模型。我们是在一个统一的框架下面,让它可以既可以去做思维链、也可以做动作的生成。我们基于已经训练好的基础的视觉语言模型去做扩展,让它具备比较强的视觉理解、空间推理、多语言的指令遵循能力,同时它的动作的生成精度也比较高。这是我们观察到的,目前具身的开源模型上还比较欠缺的一些能力,我们也希望这次开源能够对具身智能行业有比较好的补充,让大家可以更好地用我们的基础模型,去做一些长程任务、解决一些复杂任务。要解决这些长程任务,就需要更好的语言遵循、更好的空间以及因果的推理,也希望我们这种端到端的推理、规划加动作的执行模型,可以发挥作用,被社区用起来。 泓君:所以你们模型主打的点是什么?我觉得行业里面做模型玩家们,方向都还挺不一样的,比如有些是专注在精细的操作上的,像谷歌就很擅长于折纸的这些动作,像PI是希望有更强的泛化能力。如果用一句话去总结你们的优势,你觉得你们在机器人领域最关注的点是什么? 王昊:我们最关注的点是机器人的泛化和它的长程任务的解决能力。解决长程任务就意味着,它一定得有比较强的泛化能力,因为解决任何一个长序列的任务,它背后面临的都是变化的场景,这个任务可能遇到各种失败情况、各种没见过的操作对象,所以都需要它有很强的泛化。 泓君:比如那些长而复杂的问题,请大家举一个例子。 图片来源:自变量机器人-已开源的具身智能基础模型WALL-OSS王昊:其实我们在现实中把机器人用到任何一个场景,都是长而复杂的。比如我要完整地把一个餐桌收拾好,它就是一个长而复杂的任务,因为你要操作对象的种类很多:你可能有硬的东西的操作,比如说餐具;也有一些液体需要去操作,比如把食物残渣、流体倒到固定的地方;你还可能有很多不规则物体的处理,比如说垃圾、残留物;有很多柔性的东西需要去处理,比如说擦桌子,折叠毛巾等等;可能需要把不同的东西放在不同的位置、还要比较小心地去处理可能洒出来或者其他的情况。所以在收拾餐桌这个任务中,它执行起来并没有固定的顺序,说先做什么、后做什么,都是在一个长程任务里面,把各种子任务给穿插起来。人其实很难划分每个任务的边界是什么,这种任务就得靠模型端到端自主去决策、实时去规划,把整个任务完全做完的。 泓君:那在你们实验室里面,评测机器人任务做得如何时,实际训练是什么样的场景? 王昊:我们实际训练虽然也包含了其他的一些场景,但还是以家庭的场景为主,因为家庭场景其实基本上已经包含了具身智能需要解决的所有任务。像收拾整个餐桌、布置餐具、收拾整个卫生间、收拾房间,这些都是我们的训练任务,我们也实实在在地看到,机器人在处理这些长序列的闭环任务时,体现出来了操作能力、泛化能力的进步,这点确实让我们的信心大增。我们也希望能借助自变量的开源模型,让大家看到现在的基础模型,在解决长程任务这种泛化场景的时候所体现出来的能力。03 模型架构与技术路径 泓君我注意到不管是PI还是自变量,都是在做开源模型,为什么大家想做开源?开源对整个生态的好处是什么? 柯丽一鸣我觉得能和业界、社区分享一下模型,并且能够帮助到大家很快地上手,可能也是在变相地降低机器人模型研究的一个入门门槛吧。其实在公司内部,开源也是一种(研发的)过程,就是从决定要开源,然后抽调大家把刚刚发表的研究去重构代码,然后做测试,再和社区的一些开发者沟通看能不能跑得起来。这是一项不简单的工作,但是真的看到我们的模型,在一些我们自己都没想到的机器人上面跑起来了、别人能用我们的模型做很多不同的实验,还是很开心的,现在大家都很乐意去开源,我觉得是很好的氛围。 图片来源:X.com泓君:我看得出来你很热爱机器人。 王昊:我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。一般的高校、或者一些小型的企业,他们可能没有能力去做基础模型,但是如果能够使用这些基础开源模型,他们就可以去做应用,把它用到各个方向,丰富整个生态,这也是一个非常重要的事情。AI 的研究我觉得跟大模型之前有很大不一样。过去,我们可以看到AI和大模型的研究是非常离散的,在真正形成一个社区之前,可能做研究的只有两、三个人,大家疯狂地研究一个算法,更多是以论文发表作为第一要务,目的是占据技术的主动权。但有了社区和整个开源体系之后,大家更在乎的是,怎么在一个工程化的体系下,把这个工程基础打好,让这个社区更加繁荣?个人是通过什么方式给社区做贡献?大家的荣誉反而来自于这样的事情。这样也就会促使开源模型的技术不停地发展。所以我觉得开源是一个非常好的事情,既可以从中学习到新的东西,也可以看到你的东西可能对别人帮助。泓君:大家觉得现在模型公司在判断一个模型好坏的核心因素是什么?现在大家不仅在拼各自采集的数据质量,同时在模型层可能有非常多不一样的技术路径,比如说是不是用高频控制的方式,是不是用 system 2+system 1的两个system的架构?大家可以聊一下模型层上不同的技术路径,以及你们看好的方式? 图片来源:自变量机器人-开源具身智能基础模型WALL-OSS王昊:从自变量机器人公司的角度来讲,我们是非常相信,数据驱动的端到端的模型搭建的方式的,我们开源了WALL-OSS模型,也是基于这样架构去构建的。不管有多少模态、不管你是语言、视觉还是动作,它们都应该在同一个空间下被表征、被对齐,分层对它们来讲就是一个非常不利的因素,所以我们应该尽可能避免人类的分层带来信息的损失。但是从另外一方面来讲,你都端到端训练了,那模型可以做得很大,可以做到几百亿、千亿的矩阵模型,那真正要去使用的时候怎么办?不可能在端侧需要非常高频控制去部署这么大模型,所以在推理的时候,我们反倒觉得模型是可以分开的,可以把更慢的任务过程可以放在云端去处理,更快的任务过程放在物理端侧,再由梯度回传更新整个系统参数,这个过程是非常非常重要的。泓君:我们说其实两层架构的模型,它有一点点类似于人脑的大脑跟小脑,比如说有一层负责理解与规划,还有一层就是负责高频输出的控制,就像大脑去掌管认知跟决策,小脑去掌管运动控制。为什么你们不用这样的一个架构?王昊:我们是一种端到端的训练,很难在模型内部把某些参数完全分成system 2,比如把某些系统分成快系统、直觉系统等,但是我们可以训出一个非常大的端到端模型,它可以具备非常强的具身通用能力,让具身的通用能力既包含理解推理,也包含动作生成。但你实际在部署的时候可以有很多方式,比如把擅长动作部分给蒸馏压缩出来,然后擅长语言推理、视觉推理的部分给它放在云端等等。利用类似的方式部署,在推理过程中做很多优化,但训练的时候它还是一个统一架构。泓君:就是推理跟控制在训练的时候是在一起的。那Kay你们是怎么做的? 图片来源:Physical Intelligence柯丽一鸣:我们现在还是非常开放的一种态度,我们觉得现在机器人大模型还没有达到像GPT-2的时刻,我们希望能够尽快地达到这个地步,但是现有的模型和表现还是有一些差距。数据和数据驱动的算法是我们最看重的东西,但是具体怎么样去设计这个算法?模型的架构如何搭建?甚至硬件系统怎么设计?数据怎么收集的?我觉得一切工作还是为了数据驱动在服务。泓君:所以它到底是把推理跟控制分开做成两个,还是说端到端的解决是完全放在一起?你觉得这个其实反而不是现在最重要的问题,可能这几种路径都可以,我感觉现在整个机器人模型领域大家的技术路径看起来也是没有统一的。柯丽一鸣:我觉得这句话非常有意思,我最近在和一个学弟吃饭的时候还在聊,因为大概从三、四年前开始,我们能感知到整个行业是有变化的,之前学术界会更加的散一些,大家的方向、想法、算法还有关注的问题都非常的不一样,而现在自从 VLA 就视觉语言动作模型出世以后,变得流行起来,而且很多人跟进,反而让我觉得现在越来越多的方面开始趋同化了。泓君:你觉得趋同化表现在哪方面?从哪些各种各样不同的方向变成了同一个方向?这个同指的是什么?柯丽一鸣:其中之一是模仿学习。我是2018年开始做模仿学习的,那个时候行业研究不多,也没有很多真机的研究可以 follow ,在当时会觉得这是一个不那么主流或者大众的一个想法,2018年当时是已经看到了波士顿这个跳,毕竟人形机器人跳即使到现在直接用模仿学习,可能也是一个比较难的挑战。业内的很多人开玩笑的时候就会说, 60 年代咱机器人就把人类送上月球了,机器人就朝着火星去了,这是成功的机器人的方法,它就直接变成火箭学科了,只有我们这些机器人研究者还没搞明白它怎么做成功的,还在这里搞机器人,虽然是玩笑,但也说明这个行业内,有一波又一波的接力探索,就包括 2000 年左右自动驾驶的探索,还有后面这些人形机器人,波士顿动力为首的这些力量。2000 年初,其实还有一个Willow Garage,也是在美国机器人学术界里面比较有名、当时很红火的一家创业公司,当时他们就主推了一个叫PR 2 的机器人,也算是移动、但不是人形机器人的一个老祖宗。所以从之前那个时代看的话,我会觉得大家的研究方向都不一样,有的人做车、有的人做手,这些都是散布在机器人行业里各处的,而现在确实因为大模型的红火,模型的通用性被强调,很多人开始想说能不能把这些东西糅合在一起,这算是一个非常有意思的趋同化的发展吧。 Willow Garage,图片来源:Business Insider泓君:我看到现在业界,从创业方向看的话,大家又有很多的不一样,比如说有足式机器人,下面是一个人形机器人自己走路的;还有轮式机器人,它可能就注重于手部的操作,走路的部分它用轮子滚就可以了。很多公司也在想,我能不能有一个上半身跟下半身都能同时操作的机器人?因为很多机器人它可能要么上半身,要么下半身,但整体上大家可能都想把模型做得更大、功能做得更通用。柯丽一鸣:我觉得“同”说的是,很多原来做在不同形态机型上的人,会用不同方法,现在大家都非常的开放,会说我们要不要试一试视觉语言的这种大模型,你说的这种上半身、下半身的形态,其实 π₀.₅做的就是这个事。泓君:Kay觉得现在整个机器人模型连GPT-2它的水平都不够,王昊你怎么看?王昊:我认为到GPT-2的水平了。用这个类比的话,GPT-1基本上是一个概念验证,通过预训练加数据的方式,可以处理一些任务。但到GPT-2的时候,我们开始验证它规模化的力量,通过大幅的增加模型参数和训练数据,就可以展示出规模化带来的能力提升。可能我们规模再做得更大,就能到GPT-3的水平了,大家就能看到很多能力的涌现了,所以我会觉得现在就是在GPT-2的这个阶段。我们现在基本上已经知道:规模化是唯一的可靠路径了,所以我们要在这个阶段,疯狂地积累数据,提升模型规模,同时搭建支持具身智能的各种基础设施,所以说人形机器人目前是已经处于GPT-2的阶段是比较客观的。 图片来源:自变量机器人-已开源的具身智能基础模型WALL-OSS泓君:那你觉得机器人领域到定义的GPT-3时刻,大概还有多长的一段路要走?王昊:现在在谈我们在机器人领域的GPT-2到GPT-3 ,从语言模型来讲,是有一个不一样的地方。当年在做语言模型时候,大家不知道这条路线是否真的可以走通,中间产生了很多分散式的探索又汇聚的过程。现在我们是明确的知道、而且看到了这种规模化带来的提升,所以对于我们来讲,路径和目标更加明确、更加唯一,所以我预测会在1~2年的时间,我们完全可以达到GPT-3的这个水平。泓君:要1~2年的时间还挺快的。我注意到在美国,我们聊起机器人的话,大家都是想做这种通用机器人,然后再朝一个超大规模的模型做,如果类比于自动驾驶的话,就是美国上来就想做的是L4、L5级的自动驾驶。但是我们看到中国的发展方向,我感觉还是有很多的小而精的创业路线,就好比中国企业在做自动驾驶的时候,首先想到的是能不能在一个园区、一个码头,把这个场景先落地了,做一个非常垂直的小而精的产业。二位怎么看机器人的这两种方式,以及在产业的发展上,最终结果会有什么不一样?哪条路径能跑出来?王昊:我觉得这个得结合中美各自的优势来看这个问题。确实美国的现在路径就是自上而下的不计成本的,他们会优先做一个接近于AGI的超大模型,有这个基础之后,再去想应该怎么去做。这也是因为美国在算力上的优势,最顶级的芯片、最大量的算力集群都在美国,所以路径更加倾向于用无限的算力,去探索能力的边界。但中国其实芯片上确实有一定的限制,所以这也倒逼了中国的企业,研究思考在有限的算力下如何实现更高的效率,但说中国企业现在在走小而精的技术路线,我倒不是很同意这一点。中国其实是拥有全球最大的互联网生态移动应用场景,这个场景优势以及中国在硬件领域拥有非常完善的产业链,这个是美国其实没法比的。其实国内有很多顶尖的研究机构和非常好的创业公司,都是非常深刻地去从第一性原理的角度去思考,非常深刻地去理解Scaling law这件事情,它其实是通往AGI的必经之路。我们坚信必须得有一个强大的、无所不能的基础模型,才有可能把这基础模型用到各种垂直领域,让它得到更加高效的部署,但这个过程不能反过来,必须得有大而通用的基础,才会有小而精的发展。在实现的路径上,其实国内更像是上下结合,双轨并行,一方面尽可能多的去考虑场景,尤其是考虑这种通用泛化的场景可能带给我们什么,同时又去迭代我们自己的通用基础模型的能力,才能更快地让机器人在现实世界获得更好的反馈,帮助大家实现商业闭环以及开始形成数据飞轮。 图片来源:自变量机器人泓君:所以你个人也是想做通用的模型的?王昊:对,我们一定会去做通用的模型,这个是很重要的。柯丽一鸣:我觉得现在两边各自的生态环境有很多的历史因素。一方面国内经济高速发展,经验足够,很多创业的成功,都是因为公司活下来了、公司商业化能够做好,就促使了国内创业的人会从解决问题、解决用户的需求来出发,因此会有很多人去深耕垂直领域。之前我还在网上看到什么中国的除草机器人“暴杀”这个欧美家庭,看到它以后,我觉得我都要给我朋友去安利,我觉得中国企业是很擅长做这样一个商业化的一个事情。同时,中国制造业摆在那里,机器人确实是有很大的硬件需求,在国内针对商业需求做硬件这个优势,现阶段来看,就没有谁能够比得过国内。因此国内现在的生态里,很多人的创业都是一边保证着商业的成功,一边做一些其他探索。之前我说自己毕业的这一年比较幸运,因为如果早两年毕业(可能我就做不下去了),当时有很多(早毕业的)朋友,他们机器人研究做得很优秀,可是都转行了,都转去做大语言模型、做强化学习。做机器人能让你锻炼到技术,但并不是做机器人本身,与其说美国很多公司一直都在做大而通用的模型,而不如说是这个时代恰巧让我们在2024年前后,涌现了一批相信这个道路的人。这个恰巧的因素也是归功于OpenAI把大语言模型这件事做通了,给整个行业的一个反思和震撼。直到现在,我在加入PI的时候,和他们聊天讨论要不要去做,我就在问:你们做人型机器人行吗?你们要做人型的话是不是要烧很多钱?道路怎么走?商业化怎么走?这公司怎么活下来呀?从商业化的角度上来说,其实并不是那么明朗的一件事情,所以我才会感叹这些公司真的是凤毛麟角,能够有这么一个时机成立,能够有人去相信他也许能把事情做成。而在这样的公司出现之前,其实美国的工业界是有很多机器学习的应用公司的,其中可能比较有名,也和我们公司渊源颇长的一个公司,就是Covariant Robotics,这个是伯克利的一位非常有名的教授所创立的,这些个人的创业的经历启发到了后面的人。因为在外界看来, Covariant就是因为深耕了一个商业的点,所以它商业做成了,但是它通用就没有做得那么好。我们公司最大的目标是想要做通用、想要做数据驱动,所以我们是很小心地避免做一些短期的商业项目,有这么一个历史因素,导致了现在的公司生态是这样。 图片来源:Covariant Robotics泓君:我理解Covariant其实更多的是做灵巧手,而不是在研究模型。柯丽一鸣:这件事情有点好笑,因为他们公司刚刚起步的时候,创始人Peter Abbeel作为机器学习机器人的一个领军人物,也表达过他们想把机器学习的机器人做到现实生活里,做到通用,当然可能是因为他们在物流上面做的太成功了,大家就记得他们的另一种模样了。泓君:所以他们内部也是在研究通用的解决方案跟模型层的解决方案?柯丽一鸣:我相信他们在早期的时候应该是有这种探索的,因为当年他们开始做的时候,确实没有人知道机器学习、机器人的应用能做成什么样的,所以他们肯定是做了一些探索的,现在的很多企业和研究者就是受到他们的经验的启发,选择走了现在的路。04 商业化与落地前景泓君:我看大家在研究机器人的时候,都希望机器人能够帮大家做一些家务,比如说叠床单、叠衣服,把碗塞进洗碗机,大家觉得未来真的能有个这样的家用机器人帮我们做家务吗?你们觉得还需要多久才能拥有这样的通用型机器人?王昊:做家务看似简单,但我觉得可以作为一个完美的机器人的图灵测试了。因为这个过程包含了具身智能机器人领域所有的精细动作,比如切菜,要有精细的力道控制;一些易碎东西处理时,要有非常丰富的感知;也有一些长程规划,比如得看菜谱去做菜、看说明书去使用某个电器、以及各种意外情况的处理等等,基本上已经包含了机器人的所有挑战。要完全实现到这个程度,还是得分步走。我觉得在两、三年以内,我们可以在半结构化的环境里面,让机器人做一些简单的事,比如仅限于厨房内,帮你做一些简单的菜、洗碗等等,这些我觉得还行,但说如果要在完全开放的厨房里面、所有的事情能做到,我觉得还需要五年左右的时间。 图片来源:自变量机器人泓君:五年左右,实现机器人在厨房里面做饭、洗碗?王昊:对,我觉得是有可能去实现的。但那时还是有很多情况需要大家容忍,比如虽然机器人在各种任务上的成功率都比较高了,但也并不是100%,还是存在失误的可能,所以如果我们允许机器人可以和人协作、获得人类的帮助,我觉得5年是可以进入到家庭里面的。我现在是比较乐观的,因为我觉得机器人领域的发展走在正确的道路上,有了Scaling law这样快速发展的规律,这在整个人类的历史演进中,我都觉得很幸运的事情,因为有一条看起来很明确路径,可以告诉我们怎么做:你只要投入算力和数据、迭代模型的架构、提升机器的能力,那就能肉眼可见地看到机器人的提升。所以虽然现在有很多问题,让我们觉得很困难,但放在5年后再去看,都是可以被解决的,而且模型一定可以跨越到一个阈值、进入到新的阶段,所以我预测5年这个时间是非常合理的。另外关于5年这个时间点,其实也需要审慎一点,因为机器人不像纯软件那样可以轻资产快速迭代,机器人还是受限于物理世界的物理定律,硬件得发展,还要全方位突破数据、算法、供应链、商业模式等等因素,才有可能真正做到那个地步。泓君:我觉得是一个蛮大胆的预测。柯丽一鸣:我觉得5~10年落地应该是可以的。现在的模型能力和算法显然还没有达到“我们只要商业化它就能做出产品”的这个地步,但行业的迭代速度确实非常快,再加上大家有这么多的热情和投入,我相信在两、三年里,甚至可能每一年,都会有新的很大的变化。另外,我们具身智能行业其实和自动驾驶、甚至火箭升天这些传统的机器人行业有些不一样的地方。我们可能更像扫地机器人,就是最早的扫地机器人其实不完美,需要用户明白它能做什么、不能做什么,这就是一个比较好的商业化典范。以这个为目标的话,我保守估计是需要5~10年做出这样的产品,它可能偶尔会出错,但是它犯的错是在用户的范围里的,这样也能成为一个可以帮到用户的产品。我有个问题很好奇,有的机器人公司是以“产业化”为目标的,想要做一些商业化应用的东西,这些公司该如何兼顾商业化与研发? 图片来源:自变量机器人王昊:我觉得这个问题挺好的。因为作为创业公司,从第一天我们就在思考,怎么做既能仰望星空,也能脚踏实地?由于现实的因素,不可能达到AGI再去思考商业化,我们现在的策略就是,尽可能在我们通用模型的基础上,让它进入一些场景里做一些事情,这个场景必须和最终想实现的通用场景是比较接近的、它是可以去泛化的,所以我们尽可能的不去碰那些比较封闭的场景。像一些公共服务、养老服务的场景就非常好,这样场景和通用机器人的最终应用场景有一些类似的地方,能涉及一些复杂的任务,比如和人的接触,也涉及到没有那么复杂的,比如只是打扫卫生、拿东西、处理食材等等。从这个角度来看,这些就是好的场景,因为和最终的目标接近,你可以在这些场景里,不断地迭代、检验通用模型的能力,也可以获得非常宝贵的数据反馈。但要保持这个选择初心,很重要的一点是:得有很强的商业化路径的定力。另外一个比较重要的点,是公司的组织能力。因为一个公司的组织能力、组织结构,决定了这个公司的上限,我觉得公司一定要以通用模型、以基础模型作为目标,达到一个完全没有壁垒、高效协同的一个组织,才可能促使你在中间迈出的每一步都不会走错,最终能使你达到终极目标。泓君:所以你是比较注重训练的场景是否能有商业化应用的,而不是一个在封闭化场景里面就能实现的一个需求。刚刚说的家用机器人帮我们做饭、洗衣、叠被子,这样的使用场景能不能让机器人有足够销量,去养活一个机器人公司?王昊:我觉得是很有希望的。因为现在整个机器人的产业的规模还没有起来,所以等规模起来后,硬件成本还有非常大的降低空间。随着模型水平的提升、加上硬件成本降低,几年后的价格,会让用户的接受度更高。其次从这个功能角度来讲,如果我们可以帮普通用户去做很多事,大家会非常乐意接受这样的产品。现在大家难以接受机器人,是因为机器人似乎只能跳跳舞、做一些情绪价值的陪伴,好像没有其他功能,以前机器人没机会向普通用户展示各种应用,但未来我觉得是有很多展示机会的,这个想象的空间是很大的。【音频收听渠道】公众号:硅谷101收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客|哔哩哔哩海外用户:Apple Podcast|Spotify|TuneIn|Amazon Music联系我们:podcast@sv101.net