找到
852
篇与
互联网
相关的结果
- 第 14 页
-
Lovart陈冕:Sora证明巨头无边界,AI创业得提前描绘未来丨晚点聊 “事实证明,不焦虑的人做不好 AI 应用。” 文丨程曼祺“明年可能是 to C 应用的元年。”9 月 28 日,Lovart 创始人陈冕告诉我们。第二天,“元年” 被加速——OpenAI 发布 Sora app,几天后超越 ChatGPT 和 Gemini,登上美区 App Store 下载总榜第一。Sora app 打开了消费类 AI 超级应用的可能性。过去 2 年多里,从聊天机器人到 AI 搜索、深度研究、再到智能体,数轮增长最快的 AI 应用都集中在生产端。今年 5 月开始内测、7 月正式开放上线的 Lovart 也是一个服务设计生产场景的垂类 Agent。截至目前,Lovart 获得了约 20 万日活用户,年化预估收入超越 3000 万美元。但陈冕仍觉得这不够快。在 Sora app 发布前,他已在思考接下来的 to C 机会: 模型成本在不断降低,这让 to C 更可行。to P(生产者)产品也让更多人能创作 AI 内容了——那最终内容消费是否也会发生变化? 只是,Sora 让一切又加速了。 我们确实要考虑如何更快 go big。因为在这个时代,每一个巨头都比想象中更厉害,更没有边界。 配合新野心,山姆·奥特曼(Sam Altman)已在疯狂铺设算力和能源设施。9 月底,OpenAI 宣布与英伟达合作新数据中心,总耗电量将达 10 吉瓦(GW),超过夏日高峰时的纽约市。此外还有总计 17 吉瓦的其他项目正在推进。本篇访谈的第一部分发生在 Sora 发布后,产品经理出身的陈冕分享了他对 Sora 的体验和观察: 我意识到这是一个社交产品,它可能比 “AI 抖音” 还要大。 访谈第二部分,我们复盘了 4 个月来 Lovart 的实践;以及 2023 年以来,陈冕摸索的 AI 应用创业破局之路: AI 应用怎么做增长?就是提前描绘未来,然后等它发生。 垂直应用公司本质在做两件事:特殊的交互,和特殊的上下文。 因为频繁换工作,陈冕过去被认为没有耐性,而这次开始创业后,他经历过公司濒临倒闭,也在最困难时拒绝过收购意向。一些投资人和同行评价他很有韧性。 现在的韧性来自信念,信念又来自认知。我不是为了创业而创业,是为了赢而创业。 山还在、我们也能到达,那为什么不能努力往那儿走呢? Sora app 发布:“每一个巨头都比想象中更厉害,更没有边界”“我想到了 to C 是下一个机会,但没想到就猝不及防地在这个假期突然发生了。”晚点:我们上次聊刚好是 Sora app 发布前夕,现在 Sora 出现,行业又有了大变化。陈冕:对,变化总会比你想象的时间更早一点。几天前,我说明年是消费类 AI to C 应用的元年,这个判断没变;但没想到,关键的 timing 就猝不及防地在这个假期发生了。我之前判断巨头的速度不会那么快,但显然错了。OpenAI 比想象中更激进,它不只追求 AGI,也追求最牛的产品。晚点:Sora app 上线后,你从凌晨 3 点开始连玩了 4 小时,你看到了什么?陈冕:我真的被惊到了。这种感觉我至今只体验过 3 次,前两次是抖音和 ChatGPT,第三次就是 Sora app。我意识到这是一个社交产品,它可能比 “AI 抖音” 还要大。晚点:怎么在使用中获得这种感知的?陈冕:一开始我本来对 Sora 没有预期,因为它上线很突然。我使用的第一感受是顺滑,很快就完成了前几个作品。比如我让 ChatGPT 写了一个 “无间道” 天台对决的脚本,然后用 Sora 的 cameo(出境秀)功能让我和 Sam Altman “合拍”,那是我第一次打开声音——Sora 2 是一个音画同出的模型——当时我就感觉,新世界的大门被打开了!编者注:cameo 的玩法是,用户在 Sora 界面里拍摄自己的面部(类似人脸识别步骤),念数字,生成 AI 形象和音色,然后选择授权范围。这样你自己或被授权的其他人就可以在生成视频时让你 “出镜” 合拍。Sam Altman 向所有用户开放了 cameo,所以它一度刷屏 Sora。这条视频有镜头语言,有叙事;音画同步很好,音色很像我本人;人物一致性也很好。而且这一切不需要抽卡,一次就能成功。更重要的是社交——最开始除了和 Sam 合拍,我不知道干嘛,因为其他人我都不认识;所以我就给同事分享邀请码,拉大家一起玩;这时我惊觉,这不就是社交吗?这是一个特别大的 aha moment。邀请更多人后,我再去刷信息流,又体验了 Sora 的另一个关键机制——Remix(重新创作)。Remix 核心解决的是共创。这是我自己思考过的问题,就是怎么更简单地让用户接力共创,这是激发更多 AI 内容的关键。Sora 在 Remix 上做了滑动交互,很顺滑。我认为最优秀的交互不会超出点击和滑动,其它都太复杂了。总体来说,Sora 的关键链路都设计得很好,完成度挺高。晚点:比 Sora app 早 4 天,Meta 也在 “Meta AI”app 里上线了 AI 短视频功能 Vibes,但几乎没什么声量。陈冕:单纯的 AI 生成短视频产品早就有了,这次的核心还是社交。OpenAI 自己也说,如果没有 cameo,就不会有这款产品。晚点:你觉得 Sora 的模型有甩开其它公司吗?Google Veo3 此前已能实现音画同出。陈冕:妙就妙在,它在模型能力最适合的时候,做了它最适合的产品形态。晚点:一家中等体量的 AI 创业公司有可能率先做出 cameo 这样的新交互,从而引爆市场吗?陈冕:首先,Sora 不只是产品创新,它的模型也是 SOTA(State of the Art,业界最优)水平。只有掌握顶尖模型,同时它的文化、组织还能孕育产品创新的公司才能做出 Sora。第二,如果一家中型公司真做出了 Sora,我觉得也能火,但接下来会面临巨大挑战。首先是人脸信息的隐私、监管问题,其次是成本,Sora 已到了苹果总榜第三,却一分钱没收,视频生成是很贵的。更现实的是,一旦它火了,巨头马上会跟进。巨头有流量、有资金,中小公司根本扛不住。所以 AI 社交这注定是巨头战场。晚点:你认为 Sora 未来可能是个多大的产品?陈冕:它有可能是一个虚拟世界的微信。未来人类的社交可能分成两个世界——“虚假的真实” 和 “真实的虚假”。哪种对人更有吸引力还未可知,很可能两个世界会同时存在,争夺我们的时间。如果把它看作社交产品,这可能是一个数十亿级用户的机会。晚点:这会怎么影响 AI 领域大小公司的动作?陈冕:这是一场所有模型巨头都输不起的仗。无论你认为 Sora 成为超级应用的概率是 10% 还是 20%,错过的代价都太高,而赢下的意义又太大。所以想抓住这个时代最顶尖超级应用的公司,和现在已拥有超级应用的巨头,都不会放过这个机会。晚点:社交有网络效应,有先发优势和时间窗,你认为留给其他人的时间还有多久?陈冕:可能就 3 到 6 个月。晚点:Sora 对创业公司的影响是什么?陈冕:好的一面是,Sora 会给 AI to C 带来资本涌入和注意力,所有创业公司都可以好好思考一下 to C。但同时,我们确实要考虑如何更快 go big。因为在这个时代,每一个巨头都比想象中更厉害,更没有边界。晚点:你把 OpenAI 算作巨头,它其实既有巨头级的资源;又有一个新公司的锐气和饥渴——团队扁平,同时尚未获得一个能带来稳定利润的业务。陈冕:这就是为什么要尽快 go big,资本正在以史无前例的速度聚集。人类历史上从未有 OpenAI 这样,在推出第一个主力产品后,短短几年内估值就超过 5000 亿美元的公司。一切都在被加速,市场极度乐观,能投的都在往这个方向砸钱。晚点:这种乐观中有什么风险吗?陈冕:增长速度的错配。因为太乐观,人们对无法被加速的事也抱有过高期待,当预期落空,就会沮丧和怀疑。典型的就是建设算力和能源设施都需要时间。在基础设施更完备前,Super App 短期的成本会很高。如果应用发展和算力建设周期有较大错配,甚至可能带来短暂的泡沫破裂。而且算力越紧张,资源越会向头部集中。我们非常希望基建和能源设施能更快完善,不要被物理底层卡住。晚点:除了算力和能源基建,你还看到了什么无法被加速的事?陈冕:人心。用户习惯的改变需要时间。再往下,真实与虚拟的边界会越来越模糊,我们怎么接受?能多快接受?当然新事物都是在争议中前行的,人心不会变得那么快,但也一直在变。“不是服务所有人,而是服务有创作欲的人”20 万活跃用户、3000 万美元年化预估收入。晚点:5 月 Lovart 刚开始内测后,你就去了旧金山。当时你提到,要在未来几个月努力做到 “几千万 ARR”,现在实现得怎么样了?陈冕:Lovart 目前的年化预估收入已超过 3000 万美元。截止 9 月底,我们日活用户到了 15 万到 20 万,在 7 月 beta(内测)结束前,每天是 1 万到 2 万,beta 放开后迅速到了 8 万到 10 万;Nano Banana 后,Lovart 更好用了,用户又上了一个台阶,到了约 20 万。所以我们不是先爆、再微跌,而是一步一个台阶往上涨。这是我挺开心的一点。晚点:这些用户是怎么分布的?陈冕:1/3 在美国,美国也是 Lovart 目前用户数量和收入最多的市场。晚点:3000 万美元的预测年度订阅收入能覆盖服务成本吗?陈冕:不行,现在的 Agent 都不行,因为 API 很贵,而且我们有一定免费额度,免费到付费的转化需要时间。但我对 Agent 的长期商业模式毫不困惑,token 一定会更便宜,就和电与上网流量一样,都是早期贵,普及后会很便宜。订阅至少会是一个基础的商业模式,未来还可能发展出按思考时间收费的方式。晚点:Lovart 团队去北美后,为什么还没有接受全球化机构的投资?陈冕:我们未来肯定会考虑全球化资金,但 5 月 Lovart 上线那会儿,我们刚敲定融资。当时去北美的更优先级工作是搭建团队和离全球用户更近。晚点:直接接触美国用户后,看到了什么?陈冕:在湾区,我最常被问的问题是,我的热情和愿景是什么?很多人会问我们,这个产品它到底是给所有人用的,还是给专业人士?现在答案更清楚了:因为我做这家公司的愿景,就是希望把创作能力平权,释放更多人的想象力。AI 时代,能做、想做设计的广义设计师和创作者的数量在变多。所以我们现在的定位是:“for everyone who wants to create”,不是服务所有人,而是服务所有有创作欲的人。对非专业人士,Lovart 像一个 AI 创作工作室,能帮你把创意落地。一个典型场景是北美的一些中小商家,比如咖啡店主,他想做自己的全套视觉物料,包含 logo、包装、菜单等等,如果去找设计师来做会很贵,现在 AI 可以让它更普惠。我们也在美国接触了很多专业设计师,他们追求自我表达,不会用 AI 直接出结果,而是更多把 Lovart 当作灵感助手,让它出底稿,自己再完善。所以不论是专业设计师、半专业创作者还是普通用户,只要有创作需求,都能用 Lovart 来做设计。“AI 应用公司怎么做增长?提前描绘未来,然后等它发生”“垂直应用公司本质在做两件事:特殊的交互,和特殊的上下文”晚点:2023 年创业之初,你曾把 AI 应用的创业机会划分为 5 个方向:生产端是 Office 和 Adobe,消费端是搜索、社交和泛娱乐。这个判断现在有更新吗?陈冕:目前没有超出这个框架。现在所有大体量的 To C 和 To P(生产者)产品,基本都是 Office 类的生产工具和 Adobe 类的视觉创作工具。Coding 可以看作是新时代的 Office 。编程语言是 LLM(大语言模型)的原生语言。处理文字、信息、代码,都是 LLM 的内生能力。但所有这类应用创业都面临一个挑战:如何与大模型厂商拉开差异?另一类是 “Adobe 系”,围绕多模态模型展开。它离大模型的主轴有一定距离,既能利用大模型的能力,但又能在自己的场景下做出差异化。所以最开始我们选择从这个角度来切入。晚点:这种距离还成立吗?OpenAI、Google 等核心模型公司都在更多投入多模态。陈冕:有距离,不是指巨头不做多模态。再往下,追求 AGI 也会经过多模态和世界模型等环节。但模型巨头的最主轴仍是语言,是构建 “通用智能”,是造一个高智商的通用人。我们作为垂类产品,则是在通用人的基础上,造一个设计师或创作者,它需要更多行业经验和数据。应用公司的生存空间,正是在于你既能用好这个 “通用人” 的能力,又不要去做一个通用人就能做好的事。晚点:这个思路怎么体现在你们的产品设计上?陈冕:垂类应用公司本质是在用产品表达两件事:一是这个行业里的特殊工作方式,它决定了人机交互方式和产品界面;二是一个行业中要积累的经验和数据,它决定了怎么给 context(上下文)。比如为什么我们要做 ChatCanvas 功能?就是因为在交互上,你和设计师沟通时,绝不会只对着他的脸说话,而是必须对着一个桌面或画布,上面摆满图片等素材。设计的沟通离不开视觉对齐。如果你和一个人说话时只需要看他的脸,这就是 Chatbot 要处理的通用场景;如果你必须对着视觉素材,那就是 ChatCanvas 的场景。晚点:ChatCanvas 这种交互方式好像挺自然的。为什么 Lovart 之前没人做出来?陈冕:因为在模型能力到之前,大多数人不会做这个事。今年有几个密集进化:GPT-4o 更新 Image-1(4o 系列的文生图模型),在指令跟随、一致性、文字生成能力上都大幅提升,然后是 Google 的 Nano Banana,包括字节的 Seeddream 4.0,能力持续上台阶。这些变化太快了,所以大部分人还没来得及做。晚点:而你们提前预判了模型的提升,提前做了准备?陈冕:对。AI 应用公司怎么做增长?其实就是提前描绘未来,然后等它发生。应用公司自己不掌握模型创新,所以要预判它的演化,先设计出模型到下一阶段后可能出现的交互方式,等模型 ready 的那一刻,你就疯狂 show 出来。Lovart 本身就是这样一个提前构建,原定五一上线,上线前 GPT-4o 发布了 Image-1,我们特别开心,等 Nano Banana 出来后,就更开心了。晚点:具体来说,你们要在产品、工程上做什么,才能接住不断提升的模型能力?陈冕:第一是密切跟进模型迭代。还是以 ChatCanvas 为例,我们最早设计这个交互时,连 GPT-Image-1 都还没发。这时的模型理解不了复杂的多轮指令、一致性差、编辑能力弱,很难实现 “指哪儿改哪儿” 的体验。但如果你密切跟踪模型迭代,和模型团队交流,就会发现他们正集中攻克这些问题。一些红极一时的做法,比如 ControlNet,反而在模型提升后就不常用了。(编者注:ControlNet 是是一种神经网络结构,通过添加额外条件来控制扩散模型的图像生成过程。)第二,我们有一个明确假设——模型在变强,但短期是更像人,还没超越人。所以 Lovart 的设计哲学就是 “还原人与人的沟通”。我们怎么和真人设计师沟通,就怎么和 Agent 来沟通,以此评判交互是否合理。我赌 ASI(超级人工智能)还没那么快到来。晚点:ChatCanvas 等交互创新之外,你们也在 Lovart 里更新了视频生成能力,设计群体有这个需求吗?陈冕:做视频的人大部分都会做图,因为视频往往是从分镜稿开始的。所以一个做图的公司大概率会延伸到视频,因为你很多用户的下游场景就是视频。晚点:做 3D 也是这个逻辑?陈冕:3D 不太一样。短期内,我们的重点还是图和视频。因为现在的主流设备主要展示平面视觉内容,3D 内容的消费还没起来,生产需求也就没那么多。晚点:除了这些已经上线的功能,你还看到了哪些未被满足的需求?陈冕:设计师还需要更多 context。比如要为《晚点》做一套品牌设计,就需要理解《晚点》的历史、调性、受众、过往视觉风格和你们的喜好。我们把设计的 context 抽象成两类:- Reference(参考):包括私有和公共两种。私有 reference 是品牌过往的风格素材;公共 reference 是流行趋势,比如宫崎骏或多巴胺风格。- Preference(偏好):来自长期合作中对客户审美的积累,比如有人喜欢极简,有人偏爱插画。AI 设计师要通过多轮交互发掘并记住这些偏好。本质上,未来的 AI 设计师要能持续吸收、学习这些上下文,最终给出更满足你需求的产出。晚点:“给设计更多 context”,落到产品上是什么样的?陈冕:我们正在做一个 context 模块:通过多轮对话补齐上下文,沉淀长期的素材库,记住用户偏好。首先是在 prompt 过程中,我们做了一个小模型,它会追问用户,补充更多 context,比如品牌历史、过去的物料等等,我们也支持直接甩个链接,理解其中的多模态信息,比如通过官网理解风格。以上过程做的多了之后,就会慢慢沉淀一个用户自己的素材库,在未来调用中,Lovart 就可以从 reference 和 preference 库上调相关风格,和用户确认、快速达成共识。晚点:大模型现在对审美和风格的判断能到什么水平?陈冕:肯定没有人那么好,但在很多场景已经够用。比如它看到《晚点》的风格,不会觉得这是娱乐媒体。多模态模型的理解和识别能力都在快速变强,这还是在 “提前准备,提前描绘未来”。晚点:怎么能做到持续提前描绘未来呢?或者说怎么提高成功率?陈冕:核心就两点,离用户更近,离技术更近。真正的难点是取舍:你见到用户后,一定会发现一些需求,模型还满足不了,那这个点你做不做?要不要用传统方式做?比如我们做全球化市场时发现,现在除了英文和中文,图像模型在生成其他语种时的效果都不好。那一个很有意义的讨论就是,应该用哪种方式加文字?- 用模型直接生成文字:美学风格更一致,但现在容易翻车,可控性不好。- 用传统方式,拖一个文本框加文字:好用、可控,但美学不一致,更大的风险是,如果模型很快迭代了,这些 “补丁” 可能就白做了。这类问题没有简单答案。从用户体验角度,如果模型短期内解决不了一个刚需,那用别的方式顶上可能是对的。但如果模型马上有大进展,又可能摧毁掉过去的努力。晚点:你自己离技术更近的方法是什么?你创业前的工作经验更多是在产品和商业化上。陈冕:最有效的方法是技术同学读论文,再讲给我听。我常用 “人” 的比喻来理解大模型:pre-train(预训练)像培养 “合格的人”,post-train(后训练)是给他 “入行经验”,reasoning(推理)是 “思考与决策”,RL 是人在实践中学习。所以,作为一个产品经理,我的优势是在并没有那么懂技术的情况下,能用产品思维快速提炼、类比,把技术能力落到产品上。晚点:5 月聊时,你曾担心,多模态生成领域的闭源模型会甩开开源模型,这不利于应用创业公司。现在这件事在持续发生,Veo3、Nano Banana、Sora 2 等陆续出现。你现在怎么看这个问题?陈冕:现在不担心了。开源、闭源,本质影响两件事:- 一是成本。开源成本更低、更可控,但即使用闭源模型,token 价格也必然越来越低;- 二是要不要做后训练。闭源没法做后训练,但后来我们发现,即便不做后训练,我们在上下文工程还有很多可以做的,AI 应用公司在工程侧、产品侧的空间已经足够复杂了。晚点:你有在意的竞争对手吗?陈冕:细到 “创作型 Agent” 这个品类,除了我们,其他还偏小。总体来说,这个领域有潜力的公司有 3 类。一是 2023 年那批做多模态生成的,如 Krea、Higgsfield、Freepik 等,他们都可能往 Agent 转型,Midjourney 不一定,它更偏模型。然后是 Adobe、Canva 这类垂直行业巨头,但这类新产品一定要到一定收入体量,比如年收入超过 1 亿美元,才对他们有意义。三是核心模型公司,我认为它们短期内会更专注通用 Agent 和 coding 等能力。我觉得现在处在一个新变化的孕育期。To P 创业窗口期已接近关闭,你现在听到的产品都是竞争后的结果。我更看好下一波 to C(消费者)应用的机会。晚点:所以你们何时会做 to C?陈冕:肯定会做。我觉得明年会出现有意思的公司,可能是 to C 元年。图像和视频模型的成本都在不断降低,Veo3 前段时间开始打 5 折,Nano Banana 也比 GPT-Image-1 便宜很多,确定性的成本下探会让 to C 更可行。然后是 to P 过去的发展,让更多人都能创作 AI 内容了。那最终内容消费是否也会发生变化?(编者注:以上访谈发生在 Sora app 发布之前。Sora app 其实就是一个生成式 AI 从生产端产品到消费端产品的变化。)“事实证明,不焦虑的人做不好 AI 应用”“往往在你觉得短期有点儿高估它(技术进展)时,过两天你又发现低估了它。”晚点:Lovart 5 月内测的目标之一,就是要做第一个上线的垂类 Agent。这之后你们一直保持很快的更新节奏。这种紧迫来自哪儿?陈冕:一切都在被加速,timing 在 AI 时代更重要了。过去抓住一个成功业务形态,可以吃 10 年,现在也许只能活两年。每一波新产品和新体验的构建窗口期都很有限,不能快速做出产品、获取用户,这一波就错过了。但下一波也不远,错过也别太着急,要提前想下一波。所以一个公司现在想持续成功,就不能像移动互联网那样抓住一个 PMF 后就慢下来。你想想,如果 Manus 没有在第一个产品后做出 Manus,我们没有很快做出 Lovart,公司状况会完全不同。人们的情绪也不断在 “不过如此” 和 “FOMO(害怕错过)要死” 间来回摇摆。既怕技术不发展了,又怕技术发展太快。整个情绪、业务、产品、融资和经营节奏,都面临很大挑战。但这也是好事,说明技术真的发展很快。往往在你觉得短期高估它时,过两天你又发现低估了它。晚点:从 2023 年创业以来,你们错过了什么比较重要的时间窗口吗?陈冕:几乎没错过重大的。一共是这样几波,一是 23 年创业时,现在我也没后悔,我们没有一上来就做全球市场。因为当时 Midjourney、Stable Diffusion、Leonardo 等文生图应用都出来了,抢 “全球版图” 已晚,我们在中国市场跑得最快。第二波就是 Agent,我们做了 Lovart。第三波抓得准不准?就看我们 to C 做得怎样。晚点:没错过重大窗口的原因是什么?陈冕:我很焦虑,团队也很焦虑。但如果真想做好 AI 创业,你需要和焦虑共处。核心是要搭建一个高频迭代的组织:能不断理解新技术;能明确快速变化中,一些事没办法做得很深,所以必须选择杠杆最大的事,优先做。晚点:这可能会带来频繁的方向和团队调整,还有混乱,你觉得这是个问题吗?陈冕:确实有人抱怨今天这样、明天那样,但这在现在不能避免,除非技术放缓。一定有一些人更喜欢优化确定性的事物。但现在常常是没来得及优化,技术又变了,这对心态和组织是个考验。晚点:核心团队里,你很焦虑,其他人呢?陈冕:没有人是淡定的。从 reasoning、强化学习到 Agent 潮,再到大家发现做上下文工程有很多空间,一共就半年多。你想自己慢慢搞,就很有可能跟不上。事实证明,不焦虑,做不了 AI 应用。晚点:近期你最焦虑的事是什么?陈冕:最近我们在做的 context 模块,我认为方向是对的,但是不是我们还不够快?晚点:实际上 context 模块什么时候会上线?陈冕:应该在 10 月底。“过去他们说我没耐性,现在他们说我有韧性”晚点:你们公司在 23 年底到 24 年初曾濒临倒闭,最后还是挺过来了。一些投资人和同行认为你已经被验证的特质之一是韧性。陈冕:这事儿好好玩,我没创业时换过很多次工作,大家觉得我没耐性。创业后,对我的评价是有韧性。我创业这次确实更有韧性了,但我不是个盲目坚持的人。过去频繁跳槽,是因为认知不够,那十年逐渐积累很多样本后,现在的韧性来自信念,信念又来自认知。我有几条大假设:AI 是不是还在快速发展?AI 是不是会取代所有虚构内容的创作?如果是,我们没理由不继续。晚点:最困难时,你们获得过收购邀约,团队里有人想接受,但你拒绝了。你当时是怎么想的?陈冕:先澄清一下,那不是完整的收购邀约,是有几个收购意向,我都挡掉了。和团队沟通前,我已经决定拒绝。回头看,我可以有更好的沟通方式,这也是我作为 CEO 的成长:如果自己相信,就要把信念坚定传递给团队,我没想过卖。这也不是一个感性决策,而是一个理性判断:我不是为了创业而创业,是为了赢而创业。当时我认为,山还在、我们也能到达,那为什么不能努力往那儿走呢?晚点:你什么时候发现创业比你最开始想象的更残酷?陈冕:我到现在都不觉得创业很残酷。它焦虑、痛苦,但同时很快乐、很爽。有人说过:当你做一件你热爱、也很痛苦却又很爽的事,那可能就是你的 “天命”。这有点像极限运动,它确实危险。但在过程中,你不能总想着危险,否则就真挂了,你得专注解决眼前每一件事。它也有点像魂类游戏:小怪两刀把你放倒,BOSS 更是一刀秒,可一旦摸到那条 “正确路径”,也能战胜原本强大的对手。挫败感拉满、正反馈也拉满。我觉得这是创业的魅力,是我热爱这件事的原因。晚点:你的投资人之一,明势合伙人夏令说你是 “遇强则强” 的创始人。陈冕:是有点这样,我们遇到过 3 次比较大的挑战:- 第一次是找第一个产品的 PMF,我觉得我先看到了 PMF,后来被验证,我很快乐。- 第二次是差点倒闭。我觉得这怎么会倒闭?不会的!然后没倒闭,更加快乐。- 第三次是怎么做出 Lovart——在明确知道上一代产品不是未来时,怎么尽快做出下一代产品,怎么用想象力描绘未来,而且我们居然第一个做到了,更加快乐。每一次都是最焦虑、最痛苦的时候;但每一次跨越,我的成就感都越来越大。当然再往下,你可能还会承受更大的痛苦。但痛苦和快乐是并生的。晚点:你害怕自己身上的什么特性吗?陈冕:害怕自己迭代速度不够快。至于要不要焦虑这件事,其实需要取舍。如果技术发展放缓,我们要沉下心做精细化,稳一点;如果仍在加速,就必须拥抱新东西,用极致的焦虑逼自己保持高敏感、快吸收、快决策。晚点:你说焦虑需要 “取舍”,但一般认为焦虑是一种情绪,挺难被控制。难道你有一个开关,可以去打开和关闭焦虑吗?陈冕:我可以用一些方式屏蔽它。比如你应该接收多少外部信息?至少在目前,我觉得还是要保持高频信息接触。以及我要在冷静下来时,去处理情绪,我觉得这个我是可以控制的。晚点:你好像是在用底层的理性控制上层的感性表达?陈冕:对。一些人会觉得我超级感性,能量很高、非常嗨。但本质上我是个感性的理性者。因为 AI 真的没法计划,我越来越依赖各种信息给我的 feeling,以及灵感涌现。但做决策还是理性,比如团队上也是,迭代很快,合适的人留下,不合适的及时调整。晚点:我看到你最近的 “感性” 一面,是分享了 TI14 Dota 2 的比赛结局,Extreme 战队输了,你说:“青春总有遗憾”。陈冕:对,他们跨越六年、输了三次。每次都是在 2 比 2 时输掉最后一局。我是一个 Dota 老玩家,所以有些感伤。这也是一种投射,他们也是为了自己的喜欢的事在努力奋斗,有非常多波澜起伏,也有非常多遗憾。但是如果不去做,就没有青春。青春就是奋斗的过程。晚点:你现在还能感觉到青春在心中涌动吗?陈冕:现在就是我的青春。过去在学校、在各家公司的工作,都是为了现在。这是我真正第一次自由的、全情的、疯狂的想做成一件事情。题图来源:Lovart -
难以复现类人的灵活双手,特斯拉二代人形机器人被曝暂停量产 特斯拉人形机器人因“缺手”而被迫搁置量产计划。当地时间10月8日,有外媒爆料称,由于特斯拉第二代人形机器人Optimus的手部和前臂设计遭遇了严重技术难题,无法实现类人的灵活操作,特斯拉不得不暂停生产,公司也因此积压了大量无手机器人身体。特斯拉CEO埃隆·马斯克在年初提出,今年Optimus的生产目标为最少5000台。但员工称这一目标过于乐观,工程团队始终无法在Optimus上复现类似于人类手掌的灵活度,在多轮改进后仍未能突破。据报道,该公司此前就已经将Optimus今年量产5000台的计划下调到了2000台。值得指出的是,外媒提到,手部灵活性问题并非特斯拉独有,而是行业普遍面临的技术挑战。在当地时间3月20日的特斯拉全员大会上,马斯克透露,Optimus机器人将在今年进入试生产阶段,今年计划生产5000台Optimus机器人,公司已经为其订购1万-1.2万台组件,但爬产需要过程;特斯拉的目标是在2026年生产5万台Optimus机器人,并于2026年下半年开始对外销售。然而Optimus的量产进展并不顺利。外媒报道称,特斯拉员工在今年夏季报告了机器人手部出现功能问题:即使生产下线,实际可用性也会受到制约。马斯克在上个月的一场播客节目中也承认,Optimus的手部及前臂是人形机器人最具挑战性的问题。尽管手部研发受阻,特斯拉以及马斯克本人似乎均对该项目保持乐观态度。目前,9月30日,特斯拉官方账号发文称,特斯拉正在努力扩大人形机器人的规模,计划2025年底推出第三代人形机器人,并在2026年开始量产。马斯克预计2030年前将年产100万台。日前,马斯克还在社交平台发布一段视频:人形机器人Optimus与人类工作人员“过招”练功夫,动作包括推掌、格挡、转身反击等连贯招式,甚至能实时识别对方出招意图并做出应对。在特斯拉发布的“宏图计划”第四篇章中,公司明确将把重点转向人工智能和机器人技术。马斯克也强调,未来Optimus机器人将贡献特斯拉的八成市值。特斯拉向SEC递交的的马斯克“天价薪酬”提案文件显示,10年内累计交付100万台人形机器人也是马斯克获得最终激励的必要条件之一。特斯拉方面日前宣布,公司第三季度财报将于北京时间10月23日发布,2025年特斯拉股东大会则将于北京时间11月7日召开。届时公司将进一步披露其在人工智能、人形机器人等领域的进展。 -
AI玩具,再造一个泡泡玛特? 定焦One(dingjiaoone)原创作者 | 王璐编辑 | 魏佳2025年最时髦的遛娃神器,AI玩具必须拥有姓名。国庆假期回老家的小小发现,家里小朋友们的玩具库里突然多了一类新玩意。它们不仅外形呆萌可爱,还搭载了AI功能,能和小朋友对话、讲睡前故事,还拥有记忆力,总之,不再是只会唱歌的老古董。AI玩具赛道火于去年,但当时大部分产品的AI功能主要来源于外置挂件,且智能化程度不高,一度被质疑为蹭热度的套壳产品。而今年,随着热门IP的加入,AI玩具的命运被彻底改写。最具代表性的事件,是成立仅4年多的创业公司跃然创新不久前完成一轮2亿元的融资,刷新了大众对AI玩具前景的认知。该公司的打法是,将知名IP与AI玩具深度绑定,其CEO更是公开表示“想成为AI时代的泡泡玛特”,如今他们已经手握奥特曼、小猪佩奇、奶龙等IP的授权。吃到IP红利的不止这一家AI玩具公司。有从业者向「定焦One」讲述,他们今年将战略聚焦到IP上以后,寻求合作的客户增加了不少。投资机构的态度也印证了这一趋势,一位专注于AI玩具赛道的海外美元基金投资人表示,拥有IP的AI玩具意味着更低的获客成本、更快的市场接受度。无论是资本动作还是从业者反馈,都在传递一个信号,“AI玩具+IP”的组合,可能是下一波现象级风口。AI时代的泡泡玛特,会在这一轮浪潮中诞生吗?答案或许没有那么简单。 搭上IP,AI玩具起飞 想要了解加IP的AI玩具的市场现状,得先了解AI玩具的分类及主要代表公司的生存状态。“AI+玩具”属于一个大且热的AI硬件赛道,广义上包含AI+机器人、AI+宠物和AI+玩具三大类,但由于AI机器人的技术难度和研发成本与其他两类不在同一量级,且AI+宠物和AI+玩具两者的界限比较模糊,所以目前从业者提到“AI玩具”,大多指的是AI+宠物和AI+玩具两类。两者既有联系又存在一定区别。核心区别在于面向用户不同。AI宠物主打情感陪伴,主要模拟和人互动、给人情绪反馈等真实的宠物行为,目标用户主要为成年人。它们不止是宠物形状,还包括不会流利的自然语言但能发出声音的玩具。AI玩具则除了陪伴外,还支持语音对话、娱乐教育等功能。在外观形象上,AI玩具也更丰富,有些还结合了经典IP,因此用户范围更广,既包括儿童,也有成年人。这两大方向均已出现代表性公司,比如萌友智能(Ropet)、珞博智能(芙崽)、贝陪科技(可豆陪陪)、跃然创新(BubblePal、CocoMate系列)等。目前国内融资金额最高的AI玩具公司为跃然创新,产品偏重潮玩逻辑,由于手握小猪佩奇、奥特曼、奶龙等知名大热IP的授权,此标签也在一定程度上拉高了市场对该公司的估值。 之所以今年AI玩具+IP这一组合受到资本市场欢迎,在从业者看来,是开发端和用户端的合力促成。首先,想要开发IP方向AI玩具的参与者众多,不仅有专注做AI玩具的创业公司,还包括手握各种IP的老牌公司。AI潮玩公司爱无止境科技联合创始人兼产品负责人Alton表示,年初DeepSeek的大火,让很多IP厂商看到了推理大模型的能力,认为大模型具备了改造IP和硬件的能力,因此今年很多IP厂商主动找到他们合作,希望AI能让自己手中的IP实现两大业务突破:一是让静态的IP“动”起来;二是让AI再次提升IP的知名度。其次,经历了去年一年的尝试,很多从业者发现AI玩具并不是一门好做的生意,而IP的加入,可以降低开发团队的试错成本和用户购买门槛。爱无止境科技联合创始人小蟹介绍,他们在创业前期走了一些弯路,今年选择聚焦IP以后,寻求合作的客户立刻增多了。Alton也认为,AI玩具本质还是一款玩具,一个令用户熟知的IP,能在最短时间内提升用户购买意愿。Alton在亲身经历中感受到,如果创业团队自己设计AI玩具形象,试错成本很大,但和IP方合作能少花很多冤枉钱。“有IP意味着产品已经有了一波受众,用户画像比较清晰,开发好的AI玩具可以定点投放到喜欢这一IP的用户中。”他表示。某海外美元基金投资人梨酱一直专注AI玩具赛道,她也发现,面对一个搭载着高知名度IP的AI玩具和一个零受众基础AI玩具,开发团队对两者的产品设计思路完全不一样,有IP的产品优势在于,不用依靠丰富的功能就能吸引不少用户,用户会将对IP的喜爱直接转嫁到相关AI产品上,获客成本更低。另外,有IP的AI玩具价格溢价更高,例如跃然创新之前的产品BubblePal价格为399元,现在CocoMate奥特曼联名产品涨到了799元。不过,AI玩具的定价并非全部由IP决定。比如萌友智能的非IP向的AI玩具Ropet售价高达299美元,卖点在于“能认主、会撒娇”等情感陪伴特点,在年轻女性群体中颇受欢迎。总之,AI玩具这一赛道参与者众多,凭借较低的开发成本,“AI玩具+IP”的组合迅速走红。从业者一致认为,在产品上市初期,IP知名度的重要性要远高于产品功能。 技术门槛不高,关键在于像不像 有了IP加持,如今的AI玩具好像又找到了一个不错的产品发展路线,但如何真正让AI玩具“成为”某个特定IP的模样,却比想象中困难。Alton坦言,他们在开发IP向的AI玩具时,最难的不是模型调用,而是如何还原IP的“原汁原味”。要做到这一点,至少需要做好三方面的核心训练。第一关是让芯片“吃透”IP的故事。可以简单理解为,让玩具里的芯片了解IP的所有故事。具体来说,开发团队需对接入开源的大模型进行微调,之后根据它反馈的训练效果,不断调整投入语料,确认不会出现OOC(out of character)现象,即不能让角色说出不符合自身设定的话。比如当用户提问“小猪佩奇的弟弟是谁”,AI玩具应回答“小猪佩奇的弟弟是乔治”,而不是“我是乔治”。需要注意的是,投入语料的量也有讲究,不是越多越好,有时给得太多反而会干扰模型的理解效果,所以得反复测试调整。Alton表示,这一过程,一般要花费一个小创业团队一到两周的时间。第二关是还原IP“声音”。开发团队需要先找到IP在原版动画、影视或者其他媒介里的原始配音,且得覆盖不同情绪:比如平静说话的语气、难过时的声调、开心时的语气、生气时的状态等。把这些声音素材收集好后,再放进模型里训练,最后装到AI玩具里。“这一关对语料的要求更高,声音得‘干净’,不能有杂音;情绪得‘够浓’,如果素材太平淡,玩具说话就会像机器人一样,没有一点儿感情。”他说。Alton表示,现在市面上的大部分开源模型,只要选对语料、用对训练方法,再花足够多的时间,都能顺利通过以上两关,但里面隐含的难点是,如何选取训练语料和调试,需要开发团队对IP有深度理解,包含IP起源、发展历程、核心价值观及目标受众等复杂而琐碎的内容。为了保证还原的准确度,Alton和团队通常会选择与很懂这一IP的成员进行合作,“只有这样才能保证最后训练出来的音色、故事更加接近IP本身。”他表示。第三关是解决“反应速度”和“功能复杂度”的问题。依托IP的AI玩具大多针对成年人设计,而非主要面向儿童,因此用户对它的要求更高,比如回复速度要快,不能说句话等半天;应对的场景需要更多,比如能在户外使用,这就需要加强降噪技术,做到在吵闹环境中准确识别用户指令。此外,不同IP合作方的需求也不一样。有的IP厂商只需要开发团队制造一个能发声的语音芯片;有的不仅要芯片,还得配套小程序软件;有的还想要给玩具加些能活动的小部件,从而让角色的手和头轻微动一动。随着IP厂商要求的增加,AI玩具的开发门槛不断提高。不过,在Alton看来,对比其它AI硬件,AI玩具的整体技术门槛不算高,从开发周期上就能看出。“如果和IP方沟通顺利,最快一个月能做出一款IP向的AI玩具,慢的话大概为一个半月到两个月。其中,外观设计占两到三周,剩下的时间主要用来准备语料、调整细节。”Alton表示,目前AI玩具最重要的技术点在于要“像IP”,也就是前两关。 图源 / 豆瓣《泰迪熊Ted》官方剧照 整体来看,AI玩具的技术门槛不算高,毛利却不低。前瞻研究产业院数据显示,AI玩具行业基础款比如BubblePal,毛利率在50%-65%,售价在1300元-3000元的Ropet,毛利率在70%-85%,个别高端产品毛利率甚至可以超过90%。从业者透露,AI玩具最主要的硬件成本为含有芯片的语音盒子,语言盒子需要根据客户需求进行选择,价格在50-200元之间。至于IP授权费用,并不像大众想象中那般高昂,费用的高低主要取决于IP本身的知名度和双方的合作方式。一般来说,开发方需要向IP持有方支付一定的授权费,产品上市售卖后双方再按照一定比例进行分成,但实际合作方式灵活多样。一位从业者表示,部分知名度较低的IP甚至无需支付授权费即可合作。 想在AI行业复制“泡泡玛特”,没那么简单 虽然AI玩具带着“AI”的光环,如今又叠加了IP这一大卖点,资本市场一度热情高涨,但当这些产品真正摆上货架直面消费者时,整体市场表现并不理想。有媒体报道,AI毛绒玩具的电商退货率高达30%-40%,不仅销售端数据反馈一般,投资人也并非全都持看好态度。他们更倾向于将跃然创新2亿融资的亮眼成绩,归功于吃到了产品上市早的先机。它属于个案,无法代表行业的平均水平。残酷的事实是,一些投资人已经对AI玩具的热情明显降温。梨酱表示,这一行业至今都没出现一款年销量上百万的爆款AI玩具,足以见得市场的冷清。从业者之所以看好AI玩具,在于它能赋予硬件感情,给予IP新价值,“好玩”和“情感陪伴”的属性还能让AI玩具在商业上拥有独特优势,不会像纯工具类AI产品一样,陷入技术比拼和成本内卷的死循环。但理论上商业价值很高的AI玩具,落地难度远超想象。如今市面上大多数AI玩具在用户体验上都达不到理想中的状态,最明显的是,不管是否带IP,AI玩具几乎都难以实现自然流畅的实时语音对话。比如我们在日常沟通时,一方可以在另一方没有说完时进行打断,或者做出及时回答,但大部分AI玩具做不到。梨酱表示,这主要是技术架构所限,常见的AI玩具实现语音交互的技术栈是三段式:把用户说的语音转写成文字从而接收,然后通过大语言模型返出文字回答,最后把文字回答转换成声音传递给用户。“海外的realtime voice agent可以解决实时语音交互问题,但目前没有被广泛普及,且API费用也不低,大部分AI玩具公司并没有采用。”梨酱表示,她在一年内看了十多个AI玩具项目,涵盖各种产品路线,但目前只投了一家。她也买了很多AI玩具,并没有找到一款值得让自己长期留在身边的产品。「定焦One」也购买过一款面向儿童的AI玩具,问题同样不少。除了无法进行自然地实时对话外,还无法准确识别用户声音,需要重复多次才能听清指令。此外,它不支持5G网络,需切换成2.4G才能启动设备。 某AI玩具产品,切换成2.4G网络才能联网升级 虽然它具备部分创新功能,比如到了家长设定的睡眠时间,该玩具会自动播放舒缓音乐哄小朋友睡觉;还能每天监测小朋友的心情,如果小朋友随口说句“不太开心”,当天晚上家长便会收到小程序的温馨提醒,可这些功能无法撑起它的较为昂贵的价格。目前AI玩具普遍采用“基础价+会员费”模式,基础价是指产品的费用,大多在399元左右,贵的能卖到上万元,会员费相当于调用大模型的软件费用,每年几十元不等,整体比普通玩具贵很多,已经让不少用户望而却步。更让消费者犹豫的是,很多AI玩具虽然号称“7天无理由退货”,但部分厂家也增加了条件,如联网激活后不支持无理由退货,这无形中抬高了用户的尝试门槛。“如今AI玩具用户接受度低,获客比较困难,卖货基本靠投流,这已经成为行业共识。”梨酱表示,虽然有IP加持的AI玩具获客相对容易,但IP只是“加分项”,不是“决定项”。IP能保证起步销量不会太难看,但能否留住用户,主要取决于产品本身的智能化程度。在她看来,目前还没有一家公司真正把“AI玩具+IP”做到极致,该类产品仍处于早期阶段。她会持续保持关注,期待投出一个爆款AI玩具。泡泡玛特式的神话,或许还要再等等。*题图来源于豆瓣《泰迪熊Ted》官方剧照。 -
Figure发布“穿衣服”的家庭机器人,竞争对手公开呛声 当地时间10月9日,美国人形机器人Figure AI正式发布旗下第三代人形机器人Figure 03。在上个月刚刚完成10亿美元C轮融资的Figure,已经凭借390亿美元(约2700亿元人民币)的投后估值成为了目前全球范围内估值最高的人形机器人企业。相较于前两代人形机器人,Figure 03在外形、结构设计、能源管理等方面都有显著的区别。Figure的新产品发布之后,有竞争对手公开“阴阳”,暗示其有模仿之嫌;有同行则好奇新产品的商业价值究竟有多少,并在犹豫是否要采取相似的构型。当这位估值处在前列的头部企业挥动翅膀,行业中已经悄然泛起涟漪。 不用插拔充电,人形机器人开始“穿衣服”外观上,Figure 03和前两代机器人最大的不同是,Figure 03穿上了衣服。根据Figure发布的视频,新一代的产品被灰色织物覆盖,隐藏了内部的电缆和机械架构。视频中,Figure 03展现了五套左右的不同“穿搭”,相比前两代机器人更具“活人感”一些。根据Figure透露,这款机器人为日常使用设计,外部包裹的柔软织物可以清洗,不需要工具就可以拆卸或更换。此外,Figure 03的质量也比前一代机器人减轻9%,体积也有所减少,“这使得该机器人能够在家庭空间中移动更加灵活”。 记者注意到,在Figure 03向前走的时候,脚背处出现了一处褶皱。这意味着Figure 03在足部的设计上可能更加“仿人类”了一些,加入了脚趾和足弓的设计。在Figure 03脚部后侧的位置,有“inductive charging(无线充电)”的字样。这意味着相比此前的挂墙充电方案,Figure的第三代机器人采用了足底无线充电的方案,机器人可以“站着充电”。 “Figure目前的思路很明确,就是不断迭代自己的通用身体,然后挑能够快速落地的场景去验证。”一位国内头部具身智能企业的高管Helen(化名)告诉记者,相比前两代,这一代面向家庭等C端消费者场景的元素更多了,“Figure也想要C端+B端两条腿走路”。从更像人的外表,到更便捷的充电模式,Figure 表示,包括无线充电、减重等设计的改进,都是为了使机器人在家庭环境中更加安全和便捷。Figure强调:“公司对家用市场的关注,丝毫不削弱Figure 03在商用市场的潜力,通过解决家庭环境的多变性和难处理性,Figure正在开发一款能够胜任各类工作的通用性产品。”Helen说,视触觉结合的灵巧手方案或许是Figure在平衡成本和商业化后的“权宜之计”,“国内的供应链状况还是有所不同,但据我所知,已经有一些企业在犹豫是否要跟进了”。竞争对手呛声,暗示Figure抄袭?Figure 03的预告视频发布之后,竞争对手们就很快“坐不住”了。挪威机器人企业1X Technologies的创始人Bernt Bornich转发了Brett Adcock的推送,并表示:“模仿仍是最真诚的奉承,品味难以伪造”。在Bernt Bornich转发的内容中,织物布料覆盖住了机器人的机械外表,和1XTechnologies在去年8月份推出的机器人Neo思路有些相似。 Neo是一款体重只有30公斤左右的人形机器人,和其他机械感十足的机器人不同,主打家庭场景的Neo浑身被柔软的织物包裹。据称,Neo的外表使用了3D打印的尼龙针织材质,这种设计主要用来避免机器人外露的机械结构对用户造成夹伤风险。不过,根据双方在视频中披露的情况,除了织物包裹机械结构这一点之外,1X和Figure在机械结构及零部件设计、能源管理模式等多个方面还是有较大不同。来自国内的竞争对手们也对这一次Figure 03的发布抱有极高的关注度。一位北京机器人企业的联合创始人告诉第一财经记者,他下午一直在刷新Brett Adcock的社交媒体账号。“Figure这次把相机放在了掌心根部,是和其他家不一样的尝试。”第一财经记者注意到,国内的机器人企业,如灵初智能、原力无限等都已经开始尝试将摄像机装至机器人的手部,但大多都装在腕部的位置。“装在腕部是为了看到更多的手指操作和物品位置细节,能够帮助操作。”上述机器人企业联合创始人告诉记者,把相机装在掌心根部,更多是看物品抓没抓住,“但这种形式未来可能被触觉传感器替代”。供应链的发展,或许是决定未来竞争的关键因素。记者注意到,Figure发布新品的同时也公布了自身供应链的改进情况。Figure透露,为了提升量产速度,团队改用注塑、压铸、金属注塑、冲压等工具和工艺,“这使我们节省了数千小时的制造时间,以往用数控机床上需要一周以上时间的零件,现在可以通过复杂的钢模,在20秒内制造完成”。 -
谷歌前 CEO 施密特示警:AI 模型极容易被黑客利用 IT之家 10 月 10 日消息,据美国 CNBC 9 日报道,谷歌前 CEO 埃里克・施密特发出严肃警告:AI 存在不可忽视的危险,而且极易被黑客利用。他表示:“AI 可能出现扩散问题吗?绝对可能。”这种风险包括技术落入不法分子手中,进而被滥用或改作他用。“有证据显示,无论是封闭还是开源的模型,都可能被黑客攻击并移除安全防护。在训练过程中,AI 学到很多技能,其中最糟糕的情况是,它可能学会如何杀人。” 施密特补充道:“所有主要公司都确保这些模型无法回答此类问题。做法正确,每家公司都是出于正确理由执行这一措施。尽管如此,这些模型仍有被逆向工程的可能,还有很多类似风险存在。”AI 系统容易受到攻击,常见手段包括提示注入和越狱。据IT之家了解,所谓“提示注入攻击”即黑客在用户输入或网页、文档等外部数据中隐藏恶意指令,以欺骗 AI 执行不该执行的操作,例如泄露私人数据或运行有害命令。越狱则是操控 AI 的回答,使其绕过安全规则生成受限制或危险内容。施密特表示,目前尚无完善的“非扩散机制”来控制 AI 带来的风险。尽管警告严峻,施密特对 AI 总体保持乐观,他认为这项技术的价值远未被充分认识。“在亨利・基辛格去世前,我与他合著了两本书,我们认为,一种并非完全属于我们、但在一定程度受控的外来智能出现,对人类意义重大,因为人类习惯处于食物链顶端。到目前为止,这一观点正在验证 —— 这些系统的能力将远超人类随时间的成长。”他补充道:“GPT 系列最终带来了 ChatGPT 热潮,两个月吸引一亿用户,异常惊人。这显示了 AI 的力量。我认为 AI 被低估,而非被高估,我期待在五到十年内证明自己是对的。” -
“美国宇树”发布Figure 03:擅长打扫屋子、洗衣服和送包裹 当一个机器人能打扫房间、叠好衣物并使用洗碗机时,人类的家政工作可以交给机器人了?“美国宇树”、人形机器人公司——Figure AI发布了其最新产品Figure 03。10月9日,该公司发布的一段视频展示了Figure 03执行一系列家庭任务,包括从餐桌上收拾盘子、擦拭杂物、折叠衬衫,甚至与宠物狗互动。 视频中,它能小心翼翼地从桌上拿起盘子,用一只手清扫桌面碎屑,另一只手在下方接住。 在处理餐具时,它会缓慢地冲洗盘子,然后准确放入洗碗机。 它甚至能完成叠衬衫、洗衣服、收拾玩具、拿快递这类相对复杂的任务,尽管姿势在人类看来有些“笨拙”和“半蹲式”,但这可能是算法为其规划的最佳路径。 为了安全,Figure 03在家中的移动速度被设定在较慢的每小时2.6英里。它能自动离开无线充电板开始工作,单次充电可支持约5小时的运行。 而Figure 03这些能力的实现,得益于其硬件的重大升级,尤其是集成了触觉传感器和摄像头的全新灵巧手设计。这一进展也使Figure 03登上了《时代》杂志2025年最佳发明榜单的封面,引发了市场对家庭机器人革命的广泛讨论。但《时代》杂志也指出,该机器人发布时并不会为家庭使用做好准备。目前,Figure AI尚未公布Figure 03的上市时间或定价,分析认为其早期应用场景更可能是在工厂而非家庭。感知回形针——灵巧手与AI视觉系统成关键突破 Figure 03最引人注目的升级之一在于其全新的手部系统。重新设计的双手配备了触觉传感器,使其指尖能够感知最轻微的压力,从而安全地处理易碎或不规则形状的物体。公司新闻稿表示,Figure 03手指更柔软、更具顺应性,接触面积更大,能稳定抓取各种形状与大小的物体。公司指出,每个指尖能感知仅3克压力,以区分“稳定握持”与“即将滑落”的状态,从而实现精细的操作控制。这样灵敏度足以感知一枚回形针放置在手指上的重量。视频中,机器人一手清扫桌面上的碎屑,另一手在下方承接的动作,正是这一能力的体现。此外,每只手掌都新增了摄像头,即使在主摄像头被遮挡时(如伸入橱柜)也能正常工作。这些视觉数据与公司自研的“Helix”视觉-语言-行为AI系统相结合,帮助机器人在复杂环境中实时调整动作。Figure 03的快速发展离不开生成式AI的推动。根据公司资料,该机器人集成了OpenAI的模型和英伟达的机器人技术栈,这使其不仅能理解口头指令,还能通过观察人类的行为来学习新任务。这种由AI驱动的学习能力,是其能够迅速掌握叠衣服、洗碗等复杂技能的核心。专为多场景优化的硬件升级 为了更好地融入家庭环境,Figure 03在设计上进行了大量优化。据公司介绍,机器人机身几乎完全被柔软的针织物和纺织面料覆盖,关节处填充了泡沫,以防止夹伤或意外撞击。 相较于前代产品,其整体质量减轻了9%,占用空间更小,使其能更灵活地在狭窄区域移动。 此外,新的电池安全保护和无线感应充电功能(通过脚部的线圈与充电板连接),也提升了其在室内环境下的安全性与便利性。而在工业应用方面,Figure 03同样进行了全面重新设计。其执行器运行速度更快、力量更强,能够满足仓库或装配线上重复性或高速运动的需求。Figure专用制造工厂——BotQ,年产1.2万台 今年早些时候,公开报道称,总部位于美国加州的 Figure公司宣布正在开发一座全新的高产量BotQ人形机器人制造工厂。该工厂由Figure公司自主设计,专门用于大规模生产人形机器人。该工厂通过内部生产关键部件和最终产品来控制质量,并利用内部开发的制造执行系统(MES)进行数字化集成,每个子组件和最终成品都在该生产线上完成,并具备完全的可追溯性,确保了质量、可重复性和持续改进。BotQ目标是初期每年生产12000台机器人,未来四年内累计产量达到10万台。商业化路径:工厂先行,家庭或尚远 尽管Figure 03展示了进入家庭的巨大潜力,但其商业化前景仍不明朗。Figure AI没有提供任何关于家庭交付的时间表或具体价格,外界普遍预计其售价将高达数万美元。因此,市场猜测,该机器人更有可能首先在工业领域实现部署。目前,人形机器人赛道竞争激烈,除了Figure AI,还包括特斯拉的Optimus、波士顿动力的Atlas以及中国的宇树G1等。正如Figure AI去年所承认的,整个行业“面临着高风险和极低的成功机会”。短期来看,成本、安全性和技术成熟度仍是阻碍人形机器人进入千家万户的主要障碍。但从长远看,随着技术不断迭代,Figure 03这样的家庭机器人助手,或许将成为未来几代人的生活常态。 -
OpenAI拉上巨头豪赌AI基建,奥尔特曼称“机会一生一次” 近一个月以来OpenAI的动作令人眼花缭乱,尤其在AI基础设施领域的巨额合作为业界所瞩目。通过预支未来,OpenAI用数千亿美元的交易将甲骨文、英伟达、AMD等巨头紧紧绑在一起,形成AI“闭环经济”,这样的闭环让市场开始担忧AI领域的真实风险与回报。就在这一节点,OpenAI CEO萨姆·奥尔特曼(Sam Altman)在与科技自媒体Stratechery的万字访谈中回应提到,基础设施领域的巨额投资是公司层面的一次战略豪赌,机会一生一次。他同时强调,AI市场不会形成“赢家通吃”的局面,OpenAI面临众多实力强劲的竞争对手。 据外媒预估,OpenAI今年的合作交易总价值规模约万亿美元。9月中旬,OpenAI与甲骨文(Oracle)签署了约3000亿美元的合同,一周后英伟达宣布注资千亿美元帮助OpenAI部署AI数据中心。刚刚过去这一周,OpenAI先是和三星电子、SK 海力士达成合作,随后又与AMD宣布达成价值数百亿美元的合作协议。一系列密集的合作搅动资本市场,甲骨文、AMD股价相继狂飙,此前甲骨文股价一日飙升36%,创下自1992年以来的最大单日涨幅,而AMD在双方宣布合作后,已连续三个交易日上涨,累计涨幅达43%。针对这些合作交易,奥尔特曼回应称,OpenAI的核心使命是构建功能强大的AI系统,要达成这一目标,需在基础设施建设、产品开发及基础研究等领域投入海量资源并持续付出努力,而基础设施是他目前投入时间最多的领域。“我们将在基础设施领域进行巨额投入,并做出公司层面的战略赌注,我们坚信当前正是推进这一计划的成熟时机。”奥尔特曼表示,这些决策是否正确,最终将通过实践来检验,但他对OpenAI 团队未来的发展方向有乐观的预期,这也是他敢于巨额投入的核心原因。奥尔特曼访谈中提到的观点或许可以成为这场赌注的理由之一,“这对我们所有人来说都是一生一次的机会,我们会抓住这个机会。”毕竟,OpenAI已经在这场技术革命到来前站在了最好的位置上。他也试图对外界释放冷静信号,“OpenAI并没有看起来那么疯狂,再过几个月一切都会明朗起来”,奥尔特曼透露,在完成一系列新交易、并解释清楚发展方向和原因后,外界可能也会说这太雄心勃勃、太冒险,但至少为什么要做这些事情会变得更合理。但问题是,最终谁来承担这些巨额成本?奥尔特曼的回复是:希望OpenAI未来的收入能够支付这笔费用。不过与此同时,这些参与的公司也大概率会承担一些债务,他表示OpenAI“会提供融资方面的帮助”。这一乐观设想有不少质疑的声音。摩根士丹利在一份最新报告中指出,“这些长期、巨额的资本支出承诺,完全押注于AI需求的持续性,一旦需求放缓,将面临巨大风险。”分析认为,AI生态系统正呈现出日益增强的“循环性”,合作虽然有助于加速数据中心的建设和锁定产能,但也让外界难以看清其真实的商业逻辑。例如,供应商的资金支持可能让客户获得了超出其自身现金流所能支撑的购买力,夸大了市场需求。决定这场资本赌注走向的OpenAI,目前仍在巨额亏损。此前OpenAI向股东披露的财务信息显示,公司2025年上半年实现营收约43亿美元,亏损135亿美元。公司预计2025年全年营收有望达到130亿美元,但现金消耗也将同步增至85亿美元。OpenAI预测要到2029年才能实现盈利。付费订阅是OpenAI的核心支柱。此前人工智能调研机构FutureSearch的报告显示,OpenAI约84%的收入来自ChatGPT付费用户,面向开发者的API接口收入占比仅约15%。但从DevDay2025开发者大会的动作来看,OpenAI正在努力扩大其业务,试图成为 AI 领域的“Windows”,一旦这样的生态打造成功,OpenAI也能拥有更多的商业化机会。对于OpenAI的变现路径,奥尔特曼在这次访谈中提到,有机会探索创新性广告机制,但目前尚未形成最终的广告方案框架。看向未来,奥尔特曼指出,OpenAI面临着众多规模庞大、资金充足且技术实力强劲的竞争对手。因此,这一领域绝不会发展成赢者通吃的市场,即便在消费领域同样。AI技术的本质决定了它会像晶体管一样,渗透到每一款消费产品和每一个企业解决方案中。当下,OpenAI已经将一众科技巨头请上同一张牌桌。这场预支未来的万亿赌局,会引领下一代技术革命,还是酿成新一轮资本泡沫?静待时间给出答案。 -
OpenAI、哈佛大学报告称,ChatGPT月活用户已达7亿 IT之家 10 月 10 日消息,据《商业内幕》今日报道,自推出以来,ChatGPT 的月活跃用户数量迅速飙升,最近的数据更是创下令人惊叹的纪录。OpenAI、杜克大学和哈佛大学研究人员在上个月发表的论文指出,ChatGPT 7 月份的月活跃用户达到 7 亿,占全球成年人口约 10%。目前这一数字可能已经更高。OpenAI CEO 奥尔特曼在当地时间周一的年度 DevDay 活动上表示,ChatGPT 每周活跃用户已增至 8 亿。论文显示,截至 7 月,ChatGPT 每天处理超过 25 亿条消息,相当于每秒约 2.9 万次查询。研究人员指出:对于一项新技术而言,这种全球普及速度前所未有。ChatGPT 的迅猛增长显示其在人工智能和大语言模型领域的领先地位。自 2023 年 11 月奥尔特曼在公司首次开发者大会宣布平台拥有 1 亿活跃用户以来,其每周活跃用户已增长 700%。ChatGPT 的用户规模也远超其他同类聊天机器人。IT之家从报道中获悉,xAI 的 Grok 拥有 6500 万月活跃用户,Claude 和 Perplexity AI 各自也有 3000 万月活跃用户。 -
Coinbase与万事达竞购“稳定币科技公司”BVNK,“25亿美元”标价将成稳定币领域最大并购案 加密货币交易所Coinbase与支付巨头万事达正就收购伦敦稳定币金融科技公司BVNK展开激烈竞购,这笔可能高达25亿美元的交易将成为稳定币领域迄今最大规模并购案。10月9日,据媒体援引知情人士消息,Coinbase与万事达均已就收购BVNK进行深度谈判。据报道,潜在收购价格区间在15亿至25亿美元之间,尽管谈判尚未最终敲定,但Coinbase目前在竞购中处于领先地位。BVNK是一家总部位于伦敦的金融科技公司,专注于构建稳定币支付基础设施,为企业提供基于区块链的数字支付解决方案。重塑数字支付竞争格局这笔潜在收购突显了Coinbase和万事达等不同背景的金融巨头都在寻求通过稳定币技术扩展业务版图。相比SWIFT等传统交易系统,稳定币支付能够实现即时结算并大幅降低交易费用。对于Coinbase而言,收购BVNK将进一步强化其在加密支付生态系统中的地位;而对万事达来说,此举则代表向区块链支付技术的重要战略转型。分析认为,无论最终花落谁家,这场竞购战都预示着稳定币基础设施将成为下一阶段金融科技竞争的核心战场,影响未来数字支付系统的发展方向。而如果BVNK交易最终达成,将超越Stripe收购稳定币初创公司Bridge的11亿美元交易,成为稳定币相关领域的最大并购案。 -
宇树机器人 Unitree R1 入选《时代》 2025 最佳机器人发明榜单 IT之家 10 月 10 日消息,《时代》杂志昨日(10 月 9 日)公布了 2025 年度最佳发明榜单,在机器人类目下,宇树旗下的双足人形机器人 Unitree R1 成功入选。 IT之家翻译官方评价如下: 从无人机到自动驾驶汽车,如今的大多数机器人并非科幻小说中想象的类人机器人,但中国宇树机器人公司(Unitree Robotics)的 R1 机器人却是个例外。 这款双足可编程机器人于今年 7 月上市,起售价仅为 3.99 万元,主要面向测试人工智能和机器人项目的研究人员、教育工作者和软件开发者。 它重量仅为 55 磅(约 23 公斤),内置人工智能,支持语音识别和图像处理,并拥有 26 个关节(人类大约有 300 个关节),能够以拳击、跑步甚至侧手翻等复杂动作惊艳观众。 自 2000 年以来,《时代》杂志每年都会评选出全球最具影响力的发明、产品与创意,今年的榜单规模扩大至 300 项,涵盖了机器人、人工智能、健康等多个前沿领域。在机器人分类下,除了 Unitree R1 之外,同时上榜的还有 Figure 03(家用机器人)、EufyMake E1 UV 打印机(家用 3D 打印)、HoverAir X1 ProMax(你的私人摄影师)。 -
当微软“AI信仰”撞上数据中心物理边界:AI大浪潮之下的“算力饥荒”愈演愈烈 智通财经APP获悉,美国科技巨头微软公司(MSFT.US)的数据中心供应紧缺危机大概率将比该公司管理层此前所预期时间持续更久,凸显出这家云计算与办公生产力软件巨头在竭尽全力布局AI以及满足持续井喷式扩张的全球大客户们云计算服务与AI算力需求方面所面临的重大困难。微软数据中心供应与产能严重紧缺可能延续至2026年,超出管理层此前所预判的“截至2025年底”,叠加近日最新统计数据显示出包括OpenAI在内的全球AI初创公司疯狂吸金1927亿美元创历史纪录,很大程度上意味着波及全球范围的AI“烧钱大战”仍然如火如荼,这也凸显出全球AI算力产业链“超级牛市轨迹”远未完结。缺乏长期且持续可供出租给客户的高性能AI服务器集群以及传统云计算服务器一直是北美地区的云计算巨头们所担心的问题,微软、亚马逊和谷歌自2023年ChatGPT风靡全球以来都描述了类似的限制问题。亚马逊AWS管理层在今年早些时候明确表示“需求高于供给”,主要约束在核心电力设备、AI芯片以及上电进度;谷歌则把2025年AI CapEx(AI资本支出)上调至约850亿美元,并指引2026相关支出年还会更高,核心将投向AI算力基础设施领域。微软则始终致力于平衡其数据中心群体的庞大客户算力需求。然而,微软内部的最新预测数据显示,美国多处核心Azure云计算平台州覆盖区域(比如北弗吉尼亚、得州等)限制新Azure订阅至2026年上半年,覆盖基于高性能AI GPU的服务器以及基于数据中心CPU的两类服务器集群资源。当前微软的数据中心急剧供应紧缺不仅影响运行英伟达高性能AI GPU的AI工作负载服务器集群,也波及以中央处理器(CPU)为主的传统云计算服务数据中心。而作为微软当前最为重要(没有之一)的业绩增长引擎,Azure云计算服务平台在2025财年可谓创收超过750亿美元,其云计算平台的业务扩张速度已超越主要竞争对手亚马逊AWS和谷歌云。在数据中心供应与产能急剧紧缺的同时,包括微软、亚马逊以及谷歌在内的全球科技巨头们所主导的数据中心扩张浪潮——集中于AI基础设施投资与建设浪潮,仍然处于极度加速扩张进程之中,推动整个AI算力产业链仍处于全球景气度最高的产业链,这也是为何近期英伟达、AMD、台积电以及博通、美光科技、SK海力士等AI算力产业链领军者股价屡创历史新高。微软最新预测显示,数据中心供应紧缺或将持续到2026年有媒体援引知情人士透露的消息报道称,微软在美国的许多大型数据中心区域正在遭遇物理空间或物理服务器集群严重短缺。要求匿名讨论内部数据预测的知情人士表示,包括北弗吉尼亚州和得克萨斯州等关键服务器场枢纽在内的一些核心地区,对Azure云计算服务的新订阅将被限制至明年上半年。这可谓比该公司管理层此前给出的时间框架更长。当时在7月,微软首席财务官艾米·胡德(Amy Hood)曾表示,当前的数据中心产能约束将持续到2025年底。知情人士称,数据中心供应与产能不足影响了微软用于云端人工智能训练/推理项目的高性能AI GPU服务器算力集群以及长期以来作为传统云计算服务主力芯片的数据中心中央处理器(CPU)所主导的数据中心传统算力。 Azure是微软当前最为重要的增长引擎——该云业务在2025财年营收规模超过750亿美元。其云计算业务扩张速度甚至已大幅超过其最大竞争对手亚马逊公司(Amazon.com Inc.)以及Alphabet Inc.旗下的谷歌云平台(Google)。如上图所显示的那样,微软Azure云计算平台在AI时代的业绩增长持续跑赢大型竞争对手亚马逊以及谷歌。近年来,高性能AI服务器集群供不应求一直是云服务提供商反复出现的担忧。在过去六次季度业绩电话会议上,微软管理层都曾表示无法满足所有客户的传统云计算与AI算力需求。亚马逊和谷歌也描述了类似的限制。一位微软发言人曾公开表示,美国大多数Azure服务和区域“拥有可用产能,使得已部署工作负载的现有数据中心客户能够有序扩张”。该发言人称,遇到意外的需求激增情况时,该公司将引入“供给与产能保护方法”,以在其数据中心集群中平衡客户需求。Azure客户们往往会基于物理距离和可用软件来选择数据中心区域。根据内部指引,当首选设施缺乏空间时,微软销售人员会引导客户转向其他拥有额外数据中心产能的区域。据熟悉该工作的人员表示,但这些变通做法会增加工作负载的复杂性,并延长数据流在服务器场与客户之间传输所需的时间。据Hexaware Technologies全球云与合作伙伴关系负责人阿普尔瓦·卡达基亚(Apurva Kadakia)称,在某些情况下,遇到Azure容量问题的客户会把业务转移到其他地方。他表示,有些客户会在短时间内接入多个Azure区域,或仅将关键工作负载迁移到云端,直至有更多产能可用。“我们的团队会定期与大型客户进行合作,围绕需求峰值(如假期)进行规划,引导他们选择最合适的云计算区域和产品,”微软发言人表示。“在个别客户面临成本或数据流传输延迟上升的异常情况下,微软将补偿其额外开支。”数据中心产能持续紧缺,全球AI算力产业链继续狂飙?微软近年来一直在进行历史性的大规模建设,以使更大规模数据中心上线——在过去一年里新增了超过2吉瓦的数据中心产能,大致相当于胡佛水坝的发电量。“自从ChatGPT和GPT-4正式推出以来,几乎不可能以足够快的速度建设数据中心产能,”微软首席技术官凯文·斯科特(Kevin Scott)在10月上旬的一次采访中表示。他所指的是微软最大客户之一OpenAI持续更新迭代的热门AI聊天机器人及其背后的AI大语言模型。“即便是我们最雄心勃勃的预测,也经常被证明是远远不够的。”AI大浪潮之下的无比强烈云端AI算力需求可谓持续推动对于大量新数据中心的需求。但微软也在其传统云计算基础设施方面面临极度紧缺,这些基础设施支撑着互联网上的大多数应用和网站。据熟悉微软运营情况的知情人士称,对于这些基于数据中心CPU的传统云计算工作负载,OpenAI也是微软最大客户之一。微软还使用大量云计算资源来托管其自身的工作负载和应用程序,例如Office系列办公套件。据知情人士称,一些微软员工已被告知在受影响地区关闭新的内部项目以节省产能。从最初规划到服务器集群正式启动,数据中心的确认正式上线可能需要数年时间。知情人士表示,在当前全球AI算力基础设施建设如火如荼的进程中,从半导体本身到变压器等供电基础设施在内的若干关键组件都需要较长的交付周期。知情人士称,对于希望在产能紧张的Azure区域获得额外云计算或AI算力产能的关键客户,微软可能将破例提供支持。微软在北美地区以外的供应情况则相对乐观,例如,微软的许多欧洲云计算核心区域可以不受限制地接纳新的客户进行云计算服务订阅。在7月的业绩电话会议上,微软财务主管胡德表示,持续的供应与产能短缺是由于全球持续井喷式扩张的AI算力所主导的数据中心需求不断增加所致。她在7月的电话会上表示:“我的天哪,其实我在1月份就谈过这个问题,并表示我认为到了6月我们在供需方面的状况会更好。而现在我希望到了12月会更好一些。”近期全球DRAM和NAND系列的高性能存储产品价格大涨,以及前不久远超市场预期的4550亿美元的合同储备的全球云计算巨头甲骨文,以及全球AI ASIC芯片“超级霸主”博通在近期公布的强劲业绩与未来展望大幅强化了AI GPU、ASIC以及HBM、数据中心SSD存储系统、液冷系统、核心电力设备等AI算力基础设施板块的“长期牛市叙事”。生成式AI应用与AI智能体所主导的推理端带来的AI算力需求堪称“星辰大海”,有望推动人工智能算力基础设施市场持续呈现出指数级别增长,“AI推理系统”也是黄仁勋认为英伟达未来营收的最大规模来源。正是在英伟达、Meta、谷歌、甲骨文、台积电以及博通等大型科技巨头以及AI算力产业链领军者史诗级股价涨势与今年以来持续强劲的业绩带领之下,一股史无前例的AI投资热潮席卷美股市场以及全球股票市场,带动标普500指数以及全球股指基准股指——MSCI全球指数自4月以来大幅上攻,近日更是不断创下历史新高。在华尔街金融巨鳄花旗、Loop Capital以及Wedbush看来,以AI算力硬件为核心的全球人工智能基础设施投资浪潮远远未完结,现在仅仅处于开端,在前所未有的“AI算力需求风暴”推动之下,这一轮AI投资浪潮规模有望高达2万亿至3万亿美元。英伟达CEO黄仁勋更是预测称,2030年之前,AI基础设施支出将达到3万亿至4万亿美元,其项目规模和范围将给英伟达带来重大的长期增长机遇。 花旗资深分析师们近日大幅上调对于包括微软、谷歌、亚马逊、Meta以及SAP在内的全球最大规模科技巨头们的AI基础设施支出预测,将2026年的AI基础设施支出预测从4200亿美元上调至4900亿美元。同时,花旗预计到2029年的科技巨头们累计AI基础设施开支预测也将从2.3万亿美元提升至2.8万亿美元。此外,根据该研究报告的测算,全球范围对于AI算力的需求到2030年将新增55吉瓦的电力容量,预计将转化为高达2.8万亿美元的增量级别AI算力相关支出规模,其中美国市场将占1.4万亿美元。 -
大疆成“双11”急先锋 千元级降价促销引发消费维权风波 国庆假期刚结束,今年“双11”促销已登场。10月8日,“大疆预告降价已购买消费者退货维权”上了微博热搜。据悉,大疆近日在淘宝、京东等官方店铺预告了多款产品从10月9日开始降价。此次降价,大疆很多产品降幅达千元,这引发了已高价入手的消费者不满甚至维权。消费者草莓(化名)表示,“我是9月29日买的,10月3日才收到货,要么退货退款,要么退补差价。”幸运的是经过一番波折,草莓如愿以偿获补差价。不过有些消费者还在与商家沟通。10月9日,大疆公司向新京报贝壳财经记者表示,本次价格调整是大疆为“双11”推出的常规促销安排,将不断优化相关的服务与沟通机制。随着,越来越多企业入局无人机领域,大疆或将面临增长压力。不过,降价促销也引发消费纠纷。北京市康达律师事务所律师韩骁表示,大疆的降价行为本质上是行使法定定价自主权的商业决策,符合法律对企业经营行为的基本要求。韩骁提到,若有消费者能举证证明在购买前咨询客服近期是否会降价,客服作出无降价计划、不参与促销活动等明确承诺,而后续短期内即大幅降价,以致消费者高价购买,商家或构成价格欺诈。有消费者刚买就降价七百元甚至千元,大疆千元级降价促销意欲何为近日,大疆在淘宝、京东等平台官方店铺预告了多款产品从10月9日开始降价。新京报贝壳财经记者查询大疆天猫官方旗舰店发现,多款产品降价,涉及无人机、云台相机、运动相机等。其中,Mini 3 优选迷你航拍机直降1500元,Mini 4 PRO航拍无人机直降1478元;运动相机Action 4最高降价1129元;户外电源Power 1000 V2直降900元等。其大幅降价也引起了近期购买大疆产品的消费者不满。宋女士介绍,“9月26日下单,10月3日订单成交,大疆运动相机Osmo Action 5 Pro ,3298元入手,刚买几天就降了1050元。”“刚买pocket3就刷到了降价的消息,找客服就说不能退,如果降价一二百,我也就不说什么了,可是足足降价七百。”梅女士对此表示不能接受。对此,大疆方面对新京报贝壳财经记者表示,本次价格调整是大疆为“双11”推出的常规促销安排。为帮助消费者提前了解价格信息、更好地规划购买决策,公司通过相关渠道对此次调整进行了预告说明。产业分析师梁振鹏认为,大疆商品国庆节后降价,主要由于“双11”将至,许多企业在10月份开始预热“双11”的促销活动。此外,入局无人机业务的企业越来越多,市场竞争日渐加剧,大疆要维持原有企业的市场份额,必须要采取价格战的策略,进行降价竞争,此举也是迫于市场压力。值得注意的是,不少消费者反映,在电商平台购买的相关大疆产品一般都能顺利退货,但一些在线下购买的消费者退货进展却并不顺利,因为线下渠道没有“价保”。这也成为这次事件一大争议焦点。业内人士蒋浩(化名)告诉新京报贝壳财经记者,由于线上平台与线下经销商渠道在运营模式、成本结构等方面存在的客观差异,品牌方要实行完全统一的退换货与价保策略,有现实难度。这一问题在消费电子及其他零售行业中也普遍存在。大疆今后应该要与各渠道伙伴协同,根据不同平台和渠道特点,不断优化用户售后体验。“我们注意到由此引发的关注与讨论,也高度重视每一位用户的反馈。目前我们正通过各个渠道积极沟通,为用户提供清晰指引与必要支持。我们充分理解用户的心情,也将持续倾听各方声音,不断优化相关的服务与沟通机制,致力于为用户提供更好的体验。”大疆方面对上述争议解释道。消费者如何维权?大疆是否如实告知消费者是关键新京报贝壳财经记者注意到,有些消费者成功退货退款,或补差价,有些消费者还在与商家沟通。韩骁表示,从大疆产品属性来看,其运动相机、无人机、云台等产品不属于《价格法》第十八条规定的如公用事业、稀缺资源类商品等需要政府指导价或政府定价的范畴,完全属于市场调节价领域,因此从权利基础来看,大疆的降价行为本质上是行使法定定价自主权的商业决策,符合法律对企业经营行为的基本要求。“但需注意,《价格法》对定价自主权的保护并非绝对,而是设置了明确的边界,该法第十四条同时规定,经营者不得操纵市场价格,不得利用虚假的或者使人误解的价格手段,诱骗消费者与其进行交易等。”韩骁提到,这意味着,若有消费者能举证证明在购买前咨询客服近期是否会降价,客服作出无降价计划、不参与促销活动等明确承诺,而后续短期内即大幅降价,则该承诺构成使人误解的价格信息,消费者基于对经营者专业信息的信任,作出了高价购买的决策,而大疆隐瞒了已制定的降价计划,实质是以虚假信息诱导交易,此时的降价行为已不属于合法的自主经营,反而可能构成价格欺诈,违反《价格法》的禁止性规定。反之,若大疆未作出任何价格承诺,仅基于清理库存、新品预热等市场策略自主降价,则完全符合法律对经营行为的要求,属于正当商业决策。韩骁指出,具体到大疆案例中,若消费者在购买时未主动咨询降价问题,大疆也未作出任何价格承诺,仅因后续市场波动降价,此时消费者主张权益被侵犯缺乏法律依据,因为商事交易中价格波动风险是双方应当预见的正常现象,法律未规定商品购买后不得降价,消费者需自行承担该风险,此种情况下降价行为不侵犯任何权益。梁振鹏认为,突袭式降价可能带来一些长期影响。积极方面包括提升市场份额,增强品牌渗透率,并加速行业整合。但潜在风险包括部分老用户可能对品牌忠诚度产生疑虑,未来对价格调整更加敏感。此外,这可能会影响用户对新品价格的预期,从而对高端产品线的定价策略形成挑战。韩骁建议,企业在调价前后需履行如下核心保障义务,以平衡经营自主权与消费者权益:首先是信息披露义务,大疆若已制定明确的降价计划,在消费者咨询时应如实告知近期可能有促销活动,建议关注,而非刻意隐瞒;即使未制定计划,也可在店铺公告中提示价格可能因活动调整,购买前可咨询客服,保障消费者的知情权。其次是承诺履行义务,若设置保价服务,需明确保价期限、补差价条件,根据《民法典》规定,承诺一旦作出即构成合同义务,违反则需承担违约责任。最后是纠纷处置义务,考虑到消费者对短期大幅降价的心理落差,即使无法律强制要求,企业也应基于公平原则建立协商通道,例如对降价前15-30天内购买的消费者,可提供部分差价补偿或赠送配件等方案,这既是对消费者权益的保护,也能减少纠纷对企业声誉的影响。新京报贝壳财经记者 陈维城编辑 岳彩周校对 杨许丽 -
微软揭露黑客针对大学员工进行攻击,旨在修改薪资单 IT之家 10 月 10 日消息,微软发文,透露自 2025 年 3 月以来,一个被追踪为“Storm-2657”的网络犯罪团伙在美国针对大学员工发起钓鱼邮件,试图盗取薪资。目前已知有三所大学共有 11 个账号被成功入侵,黑客利用相应账号向 25 所大学近 6000 个邮箱发送更多钓鱼邮件。微软威胁情报部门发现,这些攻击主要瞄准 Workday 账号(IT之家注:一个人力管理平台),黑客旨在调低用户 Workday 账号里的电子薪资单(Pay Stub),将多出来的差价钱悄悄转给指定账号,更有甚者直接操控账号将每月薪资全数转给指定账号。微软强调,相应黑客利用精密的社会工程手段,专挑缺乏 MFA 多重认证的账号下手,针对不同用户“定制”不同钓鱼邮件,包含“校内出现传染性疾病”到“教师不当行为”等,或者伪造人力资源部门文件,分享薪酬和福利信息,诱使收件人点击钓鱼链接。据介绍,在受害者点击钓鱼邮件的连接后,Storm-2657 即可窃取用户邮箱里的验证码,从而访问受害者的 Exchange Online 邮箱。在成功入侵后,黑客将设置收件箱规则删除 Workday 提醒邮件,以隐藏各类操作。微软补充称,“在入侵邮箱账户和修改 Workday 薪资设置后,黑客会继续利用新获取的账户继续向组织内部及其他大学发送钓鱼邮件。”部分情况下,黑客还将自己的手机号注册为受害账户的多重认证设备,以建立持久的访问,从而可以在自身设备上批准进一步的恶意操作,逃避检测。 -
60亿美元就能“击溃”比特币? 最新研究显示,比特币面临的"51%攻击"威胁被市场严重低估,攻击者仅需约60亿美元就能摧毁比特币。10月9日,杜克大学金融学教授Campbell Harvey在最新研究中警告,尽管比特币和黄金都被视为"货币贬值交易"的宠儿,但比特币面临的风险远超黄金。攻击者可通过购买价值46亿美元的硬件设备、投入13.4亿美元建设数据中心,再加上每周约1.3亿美元的电力成本,在一周内完成对比特币网络的控制。 (隔夜比特币反弹失败,较日高一度下挫约3.3%) 通过衍生品市场做空比特币,攻击者可在比特币价格暴跌时获得巨额利润,足以覆盖攻击成本。Harvey强调: 你可以用60亿美元摧毁比特币的价值,虽然这种攻击听起来过于技术性,但可信度很高。 美国比特币公司总裁Matt Prusak认为这种担忧被夸大,积累和部署挖矿设备需要数年时间,而且做空需要巨额抵押品,交易所也可能暂停可疑交易。51%攻击:比特币的根本性威胁51%攻击是指单一方控制区块链网络超过一半算力的情况。一旦成功,攻击者就能篡改账本、伪造交易,甚至进行"双花攻击"——即同一数字代币被重复使用。相比之下,黄金不存在类似的系统性风险。此外,当前比特币衍生品市场的繁荣为51%攻击提供了经济激励。Harvey的论文指出,交易者可建立空头头寸,用不到日均交易量10%的资金获得巨额利润,足以覆盖攻击成本。这种利润机制使得攻击的经济可行性大幅提升,特别是考虑到攻击成本仅占比特币网络总价值的0.26%,远低于许多投资者的预期。Harvey强调: 攻击成本低廉是比特币未来可行性和安全性的严重问题。 Harvey进一步指出,这类攻击很可能在海外进行,因为许多地区缺乏有效的市场操纵防范措施。业界对攻击风险存在分歧尽管Harvey提出严重警告,但业界对此存在不同观点。Prusak认为经济可行性不足以支撑51%攻击理论,他指出: 积累和部署足够的挖矿设备需要数年时间,这在现实中并不可行。 Prusak还强调,做空比特币需要巨额抵押品,而且如果交易所怀疑存在操纵行为,可能暂停交易,使攻击者无法兑现收益。此前其他区块链确实曾遭受51%攻击并幸存下来。比特币分叉币Bitcoin Gold和以太坊经典都曾受到攻击,但它们是规模较小的区块链,矿工支持度较低,更容易受到操纵。 -
“AI模特”穿上“AI衣服”做“AI直播带货”!网购服装还有什么是真的? 当你在电商平台上被一位面容完美、身材比例无可挑剔的模特穿着的连衣裙所吸引;当你看到卖家秀里清一色的“氛围感”大片;当你进入直播间,听着主播用流利的话术展示服装细节时,你可能从未怀疑过眼前这一切的真实性。人工智能技术正以前所未有的速度和规模重塑线上服装行业的展示方式。从静态的模特图、平铺图,到动态的上身视频、直播间,一条完整的虚拟形象生产产业链已然形成。技术本身无罪,但在缺乏显性标识的管理真空下,一场关于“真实”的信任危机正在悄然滋生。精美的卖家秀实为“AI”生成“这条裙子的卖家秀简直是杂志大片,我当时毫不犹豫就下单了。”市民刘女士向记者讲述了她最近一次糟心的购物经历。收到实物后,她大跌眼镜:“颜色偏差巨大,面料是廉价的化纤,版型更是完全不对,穿在身上松松垮垮。最离谱的是,模特衣服上的刺绣细节,实物上根本不存在!”刘女士的遭遇是当前网购乱象的一个缩影。她的困惑在于,为何图片与实物的差距能如此之大?答案很可能就藏在她所欣赏的“杂志大片”本身——它们或许并非出自摄影师之手,而是由AI生成。更值得警惕的是,巨大的市场需求之下,一个专门为卖家提供AI服务的产业已然成形。 根据提供的商品图和可供换装的模特图,商家可以迅速制作出“上身效果图”。在购物平台上以“AI模特换装”为关键词搜索,出现了大量提供“一键生成模特上身图”、“低成本AI代出图”服务的商家。记者假扮服装卖家,联系了这些专门为服装商家制作AI效果图的服务商。对方要求很简单:只需提供产品平铺图和一张可供“换装”的模特图。在记者提供素材后,对方很快就生成了一张上身效果图,模特“穿上”记者提供的服装后,姿态自然,线条褶皱效果和谐,足以以假乱真。一位从事服装电商运营的王先生(化名)向记者透露了行业转向AI的深层原因:“我们早就不用真人模特拍外景了,一天拍摄费几千上万,还要化妆、场地、后期,成本太高,效率太低。真人模特一天拍几十套衣服顶天了,但AI一天能出图上千套,还能任意切换欧美、亚洲模特,背景要巴黎街头还是夏威夷海滩,随便选。”据他估算,采用AI技术后,店铺的视觉内容制作成本下降了超过90%。 在提供商品图、选择平台上的模特和场景后,LinkFox AI即可生成新的服装宣传图。这种技术的低门槛和高效率,使得像LinkFox这样的AI电商设计平台迅速兴起。记者亲身体验发现,只需上传一张商品图,选择预设的模特和背景,平台便能迅速生成多张不同姿势、不同场景的高清效果图。但是,这种“便利”的背后,是对商品真实性的极大牺牲。AI在生成过程中,会“脑补”细节、优化质感,甚至添加实物根本不存在的设计,正如刘小姐遭遇的“幽灵刺绣”一样。 客服会不断强调衣服是“实拍图”,但是避免直接回答“上身图是否是实拍”的问题。当记者以顾客身份进入一家大量使用此类技术的店铺,询问客服能否提供“真人试穿效果图”时,客服的回答避实就虚,始终强调“咱家图都是实拍的”,却又用“实物与图片之间可能存在微小色差”为自己留足后路。这种话术,已成为行业内心照不宣的标准应对。“AI主播”展示动态上身效果直播时,服装的动态上身效果总是可信的吧?如果说静态图片的造假尚可让消费者通过仔细甄别细节发现端倪,那么动态的、可互动的AI直播间,则编织了一个更具沉浸感和迷惑性的虚假世界。 购物平台上出现大量“AI服装主播”。“我看直播就是为了看真实效果,如果连直播都是假的,那还有什么可信的?”经常通过直播购物的冯女士表达了她的愤慨。她曾在一个AI主播的直播间下单了一件西装,“主播穿着版型笔挺,走动时很有型。但我收到后,面料软塌塌的,根本撑不起来。我才反应过来,那个主播连走路和转身的动作都是AI生成的!”记者在调查中发现,多个购物平台悄然出现了大量“AI服装主播”。这些主播形象完美,能够24小时不间断地“辛勤工作”,以流利的话术介绍商品信息,甚至能精准地回应评论区的简单互动,如“欢迎新进直播间的宝宝”、“喜欢这款的可以扣1”。如今,这些足以以假乱真的AI主播,同样已经形成一条高度技术化的制作产业链。 很多博主在社交平台上分享真人出镜拍摄用以采集AI数据人信息的经历。搭建一个AI直播间技术上门槛并不高。第一步是创造出一个数字人作为主播。目前主流的方式有两种:一种是高端定制,通过邀请真人模特在专业绿幕影棚中进行全方位、多角度的影像和语音数据采集,从而“克隆”出一个与原型高度一致的数字化身,这个数字人可以被任意更换服装和背景;另一种则是更经济、更常见的模板化生成,商家只需从“模型库”中选择一个心仪的外形、性别和声音,然后通过文本或语音输入,驱动数字人进行直播,这种方式成本极低,可以实现“千人千面”,即同一个技术后台可以为成千上万个店铺生成不同面貌的AI主播。下一步就是为创造出的数字人“注入灵魂”。运营人员会提前准备好详尽的直播脚本,包括产品介绍、促销话术等。这些文本通过语音合成技术转换成自然流畅的语音,并精准地驱动数字人的口型与面部表情。为了营造真实的互动感,技术方会预设一个庞大的关键词问答库,给观众造成“实时互动”的错觉。当直播间评论区出现“多久送达”、“什么材质”等高频问题时,系统能自动识别并触发数字人播报预设答案,而对于无法回答的复杂问题,则用“详情请咨询客服”等万能话术巧妙规避。然而,这种技术滥用的代价是直播购物最可贵的“实时真实性”荡然无存,AI主播无法应要求真实展示面料的细微纹理,也无法模拟肢体活动时服装的真实褶皱。更令人担忧的是,当前的管理规则未能跟上技术步伐,对于何为AI直播间、必须如何标识、由谁监督等问题,均缺乏清晰界定。这种监管的滞后,使得本该提升效率的工具,反而可能成为误导消费者的陷阱。消费者在不知情的情况下,基于对“真人实时展示”的信任进行消费决策,其知情权与选择权在无形中受到了侵害。如何穿透“完美假象”守住真实?当AI生成的“完美假象”渗透到静态图片和直播间,整个线上服装购物的诚信体系正面临严峻挑战。当务之急,是尽快确立产业链中各主体的权责划分,并建立与之匹配的规则体系,让技术在阳光下运行。对此,广东卓建律师事务所袁柯娜律师给出了她的看法:“AI产品与虚拟主播本身不能承担法律责任,其性质更接近于工具或媒介,真正的责任主体始终是背后的实际操控者或运营管理机构。”袁律师特别强调,无论技术如何包装,法律责任最终必然追溯至真人或实体机构,如相关AI产品背后的品牌方运营主体、MCN机构或者是直播营销人员等等。若AI工具生成了违法内容,技术服务商也可能承担连带责任。技术的革新不应以牺牲商业诚信为代价。当AI技术能够创造出近乎完美的视觉呈现时,我们更需要健全的法律规则和有效的监管措施来守住消费信任的底线。2025年9月1日起施行的《人工智能生成合成内容标识办法》明确规定,利用AI技术生成的图片、视频、虚拟场景等内容必须添加显著标识,为AI生成的营销内容贴上清晰的“身份证”。据此,电商平台也必须承担起主体责任,将标识要求落地为可执行的前置审核规则,并对违规者进行有效约束。同时,监管部门也需出台针对电商领域的细化指引,并将AI虚拟营销的合规性纳入常态监管。原标题:《“AI模特”穿上“AI衣服”做“AI直播带货”!网购服装还有什么是真的?》栏目主编:毛锦伟来源:作者:解放日报 宋端仪 -
消息称谷歌 Play 订阅“支付出错率”达 28.2% 为苹果两倍 IT之家 10 月 10 日消息,全球订阅制应用市场正高速增长,为开发者带来可观收入。不过根据分析公司 RevenueCat 报告,谷歌 Play 商店 App 订阅渠道的“支付出错率”几乎是苹果 App Store 的两倍。在所有取消的订阅中,有高达 28.2% 是由于“账单错误支付失败”导致的,而苹果 App Store 的这一比例仅为 15.1%。虽然“用户自愿取消”仍是用户选择放弃订阅的首要理由,但在海外安卓阵营中,“账单错误支付失败”已成为第二大退订理由。RevenueCat 数据显示,这种现象加剧了安卓平台的商业困境。长期以来,苹果 App Store 在“下载转付费”转化率上一直领先于 Google Play。而安卓开发者不仅转化率更低,如今还要面对更高的支付失败风险 —— 这让用户在体验应用之前,就先经历了一次挫败。除了支付出错率外,报告还揭示了全球订阅制应用市场面临的普遍挑战 —— 用户早期流失问题依然严重。近 30% 的年度订阅用户在首月就取消订阅并选择退款,这说明开发者必须在用户选择订阅后尽快让他们看到产品价值,否则极易失去用户。报告同时指出,82% 的免费试用都发生在应用安装当天,这意味着开发者通常只有“一次机会”让用户转为付费,如何在用户初次打开应用时“立即抓住用户的心”,可谓留存的关键。 -
揭秘AI直播带货:完美模特,虚假互动,以及注定不合身的衣服 近日,不少消费者在社交媒体上发文吐槽,自己在直播间买的衣服实物与展示效果天差地别。他们后知后觉地意识到,问题出在那位形象完美、永不疲倦的主播身上——因为屏幕前口若悬河的她,其实一个AI数字人主播。这背后,是一条成熟的产业链。商家只需选择一个虚拟形象,输入商品信息和营销话术,就能打造一个24小时在线的AI直播间。虽然成本极低、效率极高,但牺牲了直播购物最可贵的“实时真实感”,也导致消费者在不知情的情况下,基于对“真人实时展示”的信任进行消费决策,知情权与选择权在无形中受到了侵害。令人担忧的是,目前对AI直播间的监管几乎处于真空状态,对于何为AI直播间、必须如何标识、由谁监督等问题,均缺乏清晰界定。当务之急,是尽快确立产业链中各主体的权责划分,并建立与之匹配的规则体系,让技术在阳光下运行。原标题:《民声现场 | 揭秘AI直播带货:完美模特,虚假互动以及注定不合身的衣服》栏目主编:毛锦伟来源:作者:解放日报 宋端仪