找到
495
篇与
互联网
相关的结果
- 第 11 页
-
苹果图乐园将添新引擎:接入更多模型,打造 AI 生图“聚合器” IT之家 9 月 23 日消息,科技媒体 9to5Mac 今天(9 月 23 日)发布博文,报道称在 macOS Tahoe 26.1、iPadOS 26.1 和 iOS 26.1 首个 Beta 开发者测试版中,通过挖掘代码发现苹果将为图乐园(Image Playground)引入了新的框架支持,加入“估算延迟”和提供商标识等功能,为接入更多第三方模型铺路。IT之家注:图乐园(Image Playground)是苹果推出的 AI 图片生成应用,可通过文字提示生成插画。在 macOS Tahoe 26.1、iPadOS 26.1 和 iOS 26.1 首个 Beta 开发者测试版中,苹果更新了图乐园的底层框架。这款应用原本仅依托苹果自研模型生成插画,随后在今年引入 OpenAI 的 ChatGPT,提供更多图像风格和直接模型调用。而在最新测试版代码中,苹果为图乐园新增“估算延迟”(estimated latency)指标和提供商标志,用于评估不同模型的性能。目前苹果尚未公布具体的新增模型,但该媒体认为谷歌 Gemini 2.5 Flash Image(又称 Nano Banana)是热门候选。该模型因逼真还原人物特征的能力而走红,并推动谷歌 Gemini 应用在多个国家登顶 App Store。在未来版本中,用户或将体验更高质量、更丰富风格的 AI 图片生成。
-
1000亿美元!英伟达宣布投资OpenAI 9月23日消息,周一,芯片巨头英伟达与人工智能公司OpenAI联合宣布达成一项里程碑式的合作。根据协议,英伟达计划向OpenAI投资高达1000亿美元,共同建设超大规模的人工智能数据中心。这一合作旨在为OpenAI下一代模型的训练与运行提供强大的算力支持,也标志着全球AI基础设施竞赛进入了新的阶段。 千亿美元打造10吉瓦算力集群 根据双方签署的意向书,此次合作的核心目标是为OpenAI部署总容量至少为10吉瓦的英伟达计算系统。这一电力规模相当于四座胡佛水坝的发电总量,足以满足超过800万户美国家庭的用电需求。 英伟达创始人兼首席执行官黄仁勋坦言,这是一个“史无前例、庞大且复杂的工程项目”。他在接受采访时表示:“这是第一个10吉瓦项目,听起来当然像是一项巨大的工程。但毫无疑问,AI对各行各业的变革性影响毋庸置疑。” 这项合作将采用分阶段的实施策略。根据目前的安排,待双方在未来数周内敲定最终采购协议后,英伟达将先行投入100亿美元作为首期投资。硬件交付计划于2026年底启动,而第一阶段的中期目标是,在2026年下半年,利用英伟达尚未正式发布的下一代“Vera Rubin”平台,完成首批1吉瓦算力的上线部署。 据悉,Vera Rubin平台的性能预计将达到当前Grace Blackwell平台的两倍以上,后者搭载的GB300组合芯片已被业界公认为目前最强大的AI芯片。 根据黄仁勋8月在财报电话会上的披露,建设1吉瓦的数据中心需投入500亿到600亿美元,其中约350亿美元用于采购英伟达的芯片系统。以此为基准进行推算,整个10吉瓦项目的总投资规模可能将超过5000亿美元。 为了对冲此次巨额投资可能面临的风险,双方设计了渐进式的投资机制:英伟达将根据每吉瓦容量的实际部署情况分批注资,以确保OpenAI能够维持其当前的增长速度,从而保障投资回报。 在资金运作上,这笔交易采用了在AI领域颇为常见但又引发关注的“循环”安排。协议生效后,英伟达将开始认购OpenAI的无投票权股份,而OpenAI则可以使用这笔注资,反过来向英伟达采购其赖以生存的先进芯片。这种模式使得英伟达能够巧妙地将其庞大的资产负债表上的现金储备,直接转化为财报上的新收入,形成一个看似完美的商业闭环。 强强联合:战略共赢与行业重塑 对处于人工智能浪潮核心的英伟达和OpenAI而言,此次合作远超普通的商业交易,是一次深度的战略协同。这种强强联合将为双方带来多重战略价值。 对英伟达而言,此次合作具有三重意义:首先,通过股权投资全球最具影响力的AI公司,既能获得财务回报,更锁定了长期稳定的高端芯片采购需求。正如Requisite资本管理公司执行合伙人布林·托金顿(Bryn Talkington)所指出的那样,这构成了一个“完美闭环”:英伟-达向OpenAI投入巨资,而OpenAI又将这笔资金回流至英伟达购买产品。 其次,这次合作将进一步巩固英伟达在AI基础设施竞赛中的绝对领先地位。通过将最顶尖的硬件能力与最前沿的软件创新紧密结合,英伟达正在构筑一道让竞争对手难以逾越的护城河。 最后,合作消息公布后,资本市场迅速给出了积极反馈,英伟达股价应声上涨近4%,市值攀升至近4.5万亿美元,进一步巩固了其全球市值的龙头地位。 对OpenAI来说,此项合作有效解决了其发展的关键瓶颈。一方面,千亿美元级的资金支持确保了先进芯片的稳定供应,为模型迭代提供了算力保障。另一方面,作为非上市公司,与产业龙头深度绑定将显著提升其信用评级,降低融资成本。这种协同效应为其推进“星际之门”等超大规模项目创造了有利条件。 OpenAI首席执行官山姆·奥特曼(Sam Altman)在公告中指出:“万物始于算力。计算基础设施将成为未来经济的基石,我们将借助与英伟达共建的设施,既创造AI新突破,又实现技术的大规模普惠。” 行业巨震:竞争格局的深度变革 英伟达与OpenAI的“超级联盟”,或将深刻重塑整个科技行业的生态格局。 首先,这一合作向世界释放出一个明确信号:未来AI领域的竞争已不再局限于模型算法的单点突破,而是演变为覆盖数据中心、能源保障与供应链管理的系统性、资本密集型竞赛。此举势必在全球范围内掀起新一轮大规模AI数据中心建设热潮。 科技领袖如马克·扎克伯格(Mark Zuckerberg)、埃隆·马斯克(Elon Musk)等人也持相同观点,他们认为,巨额资金的投入与强大的算力支撑,将把人工智能模型推向一个全新的“超智能”时代。 其次,两家巨头的深度合作也引发了竞争对手的普遍忧虑。他们担心这种强强联合将改变行业的经济激励结构,从而削弱市场竞争。反垄断律师安德烈·巴洛(Andre Barlow)指出,该合作可能将英伟达在芯片领域的垄断优势与OpenAI在软件方面的领先地位捆绑在一起,进而显著增加AMD等芯片厂商,以及Cohere、Mistral、Perplexity、CoreWeave和Scale AI等其他AI模型开发商的竞争压力。 再次,从更深层次来看,这项合作是对人工智能持续进化、最终实现超越人类智能的一场豪赌。它预见了一个AI产品普及率急剧上升的未来,届时社会结构将因对计算能力的深度依赖而发生根本性转变。正如奥特曼所言:“这个‘超级大脑’所创造出的成果将会超乎想象,甚至可能超出我们目前的理解范围。” 然而,这一乐观愿景并非没有争议。部分持怀疑态度的人士认为,AI模型的发展可能已触及瓶颈。事实上,过去一年中,不少顶尖AI公司即便投入巨额资金,仍难以实现模型性能的显著提升。 例如,Meta在今年早些时候推迟了其旗舰AI模型的发布。面对技术挑战,扎克伯格不惜重金组建了一支价值数十亿美元的AI团队,从多家公司招募顶尖研发人才。而OpenAI发布的GPT-5模型,尽管最初被宣传为具备“博士级专家”能力,却引发了用户的广泛争议,甚至促使部分投资者重新审视他们对AI热潮的基本判断。 市场声音:狂热与观望并存 对于此次重磅合作,市场与分析师呈现出了复杂而多元的反应。 投资者用真金白银表达了对英伟达与OpenAI合作前景的看好,英伟达股价的飙升便是最直接的证明。此前,甲骨文与OpenAI达成的3000亿美元合作协议,曾推动甲骨文的市值增长约三分之一,逼近1万亿美元大关。这些案例共同表明,OpenAI已被投资者视为本轮人工智能热潮中不可或缺的核心力量。 分析师普遍认为,此举对英伟达具有积极意义,既有助于OpenAI实现其宏大的算力目标,也确保了英伟达能够深度参与这一进程。然而,他们也指出了潜在的风险与值得关注的问题。 首先便是对资金循环模式的讨论。伯恩斯坦分析师斯泰西·拉斯贡(Stacy Rasgon)等市场观察人士对此类合作安排表示关注,质疑其产生的销售额在多大程度上反映了真实的市场需求,而非仅是资本在少数巨头之间的内部循环。 其次则是对AI发展前景的审慎态度。尽管英伟达和OpenAI的高层均宣称这仅是全球AI建设的开端,但AI技术实际落地的时间表与用户采纳速度仍存在较大不确定性。奥特曼本人上月也曾公开表示,投资者对AI的热情“过度高涨”,并预测部分初创公司及投资者将“面临失败”。 尽管存在争议与不确定性,英伟-达与OpenAI的此次合作无疑已在全球AI发展史上留下了浓重的一笔。这不仅是一项商业协议,更是对未来世界形态的一次大胆构想与实践。随着合作细节在未来几周内最终敲定,全球目光将聚焦于这对“软硬结合”的超级联盟,看它们如何引领人类社会步入一个由超大规模计算驱动的新智能时代。 此外,这场豪赌的背后逻辑也值得深思。构建大规模GPU集群(常被称为“AI工厂”)的竞赛已全面拉开帷幕,英伟达在这一领域无疑占据领先地位。凭借GPU销售激增所带来的充沛现金流,这家芯片巨头正积极寻找能够持续产生回报、维持其业务良性循环的投资机会。在这种背景下,还有什么比投资于自家的大客户更好的选择呢? 与此同时,无论在用户规模还是财务表现方面,OpenAI的增长速度均远超AI领域绝大多数竞争对手。截至2025年中期,其年化收入已飙升至100亿至130亿美元,较2024年的37亿美元实现了跨越式增长。(小小)
-
一切始于算力!英伟达将投资OpenAI千亿美元,两家联手建10GW数据中心 为了更大算力,奥特曼和黄仁勋再度联手。当地时间9月22日,OpenAI宣布与英伟达签署意向书并达成战略合作,OpenAI将能够使用英伟达系统(意味着数百万台GPU)构建和部署至少10GW(千兆瓦)的AI数据中心,用于训练和运行下一代模型。据介绍,OpenAI将成为英伟达AI工厂增长计划的首选算力和网络战略合作伙伴,确保英伟达系统总是能够面向OpenAI模型和基础架构软件实现最先、最好的优化效果。不仅如此,英伟达还计划逐步向OpenAI投资1000亿美元。根据分阶段投资计划,当部署第一个GW算力时,英伟达将投资10%。英伟达对OpenAI的股权投资并不赋予其控制权,OpenAI的非营利性母公司将保留多数治理控制权。OpenAI CEO山姆·奥特曼(Sam Altman)表示:“一切都始于算力,算力基础设施将成为未来经济的基础。”英伟达创始人兼CEO黄仁勋表示,从第一台DGX超级计算机到ChatGPT的突破,英伟达和OpenAI已经互相推动、共同发展了十年,此次投资和基础设施合作伙伴关系标志着下一次飞跃,推动下一个智能时代。据介绍,第一个GW算力目标将在2026年下半年使用英伟达Vera Rubin平台投入运营。英伟达和OpenAI将在未来几周确定此次战略合作新阶段的细节。 4月,黄仁勋向OpenAI交付了全球首台DGX H200。目前,每周约有7亿人在使用ChatGPT,奥特曼近期也多次表示,OpenAI需要更大规模的GPU来扩展业务,算力的短缺导致有更好的模型却没法提供。据外媒报道,得益于ChatGPT的强劲增长,OpenAI大幅上调了到2029年的预期现金消耗至1150亿美元,较先前预期的500亿美元激增了800亿美元。为控制激增的成本,OpenAI寻求开发自有数据中心服务器芯片及设施来支持其技术。7月,OpenAI深化与甲骨文公司的合作,基于“星际之门”计划新增功耗4.5GW的数据中心,结合德州阿比林市在建的首个“星际之门”基地,将使OpenAI开发中的AI数据中心总容量突破5GW,可支持超200万枚芯片运行。此处值得一提的是,在此前公布的一季度财报中,甲骨文预测其收入将在未来三年内翻一番。其剩余履约义务(RPO,已签订合同但尚未确认的收入)在三个月内增长了超过两倍,达到4550亿美元,同时还有数十亿美元的交易正在洽谈中。9月,OpenAI被曝计划与美国半导体公司博通合作,于明年生产其首款人工智能芯片,并且OpenAI计划内部使用该芯片而非向客户销售。同时,据知情人士透露,OpenAI还计划在印度建设功耗超过1GW的人工智能数据中心,并与潜在合作伙伴进行了初期洽谈,预计本月晚些时候访印的奥特曼或在行程中披露更多细节。OpenAI还同时在AI硬件领域发力。据外媒报道,“果链”公司立讯精密已获得至少一款OpenAI设备的组装合同。此外,OpenAI还与深度参与AirPods等苹果产品的歌尔股份接洽,希望为其未来产品供应扬声器模块等组件。OpenAI曾在今年1月向美国专利商标局提交了新的商标申请,涉及人形机器人、XR、智能手表、可穿戴设备等硬件设备。此前,OpenAI还宣布以65亿美元的价格收购苹果前设计总监乔尼·艾维(Jony Ive)的AI硬件公司,并为公司建立一个专注于开发AI驱动设备的部门。据知情人士透露,OpenAI计划的产品包括类似无显示屏智能音箱,以及眼镜、数字录音笔和可穿戴胸针等产品,首批设备或将在2026年末或2027年初发布。
-
花生大模型:AI识黑马 营销破圈高转化 茉莉数科集团“CES内容营销体系”+AI赋能应用系统蓝图。林敏(Monica)茉莉数科集团创始人兼CEO 在中国品牌全球化进入新阶段的当下,人工智能正成为企业营销变革的核心驱动力。茉莉数科集团(下称“茉莉数科”)创始人兼CEO林敏(Monica),作为粤港澳大湾区杰出青年企业家,正带领团队通过自研AI工具矩阵,为品牌提供从社交媒体整合营销到内容电商转化的全链路解决方案,助力宝洁、欧莱雅、安踏等国内外知名品牌实现智能升级。“在网络零售这个快速发展的市场中,AI技术正在成为决定胜负的关键因素。”Monica深刻意识到这一新趋势,并率先开启了AI技术投入和战略转型。 灵积引擎构建“内容银行”,让爆款更加科学“在营销场景下,AI到底赋予了它哪些高效的驱动和增长?我们认为,这种变革主要体现在四大核心领域:洞察与成效、组织与流程、内容与创意、媒体与传播。”基于这一判断,茉莉数科构建了覆盖三大营销场景的自研AI产品体系:面向社媒整合营销的“红数据”平台、专注于内容管理中台的“灵积引擎”,以及直播电商管理系统“豹播”。这三款产品共同形成了“以内容为原点、成交为终点"的完整营销闭环。AI如何为品牌创造真实价值,最直观的就是用数据“说话”。在直播电商领域,茉莉数科为某全球大型家电品牌打造了规模化直播管理中台。该品牌在抖音平台拥有约300个直播间,未来计划扩展至1000+。“豹播系统通过数据聚合、业务流程打通、多岗位智能排班和五大资产智能留存四大场景,帮助客户实现了管理效率与营销效果的双重提升”,Monica介绍道。在社交媒体营销方面,“红数据”平台展现出独特价值。该平台收录的达人数量超过平台官方百倍,并能通过AI识别黑马潜力达人。Monica分享了一个成功案例:“我们为某国际奶粉品牌找到了一批具有母婴属性但标签为运动健身类的达人,实现了资源与内容双破圈,显著提升了销售转化ROI。”内容创作环节同样因AI而变革。茉莉数科服务的某世界知名麦片品牌拥有超百万条内容素材,通过“灵积引擎”构建的“内容银行”,这些素材被高效复用和二次创作,最终打造出超百条爆款视频,推动该品牌短视频年度销售业绩提升7倍。 智能营销1+3+X智能营销体系升级2025年3月,茉莉数科集团自研的“花生大模型”通过国家算法备案,并于4月通过大模型备案。花生大模型作为行业垂直AI模型,比通用大模型更聚焦于内容电商整合营销领域的真实业务场景。茉莉数科打造集合多AI Agent的MIT(My intelligent Team)平台实现企业数智化运营体系升级,可以在不改变企业原有主流程的基础上,通过在业务全流程的关键节点全面接入AI工具,围绕策略制定、资源精选、执行提优、运营提效等核心业务节点,正逐步形成多AI Agent能力矩阵。“与此同时,我们针对原有成熟的大数据应用系统进行AI升级,围绕‘社媒、内容电商和内容资产’三大领域自研了三大智能中台,分别是红数据媒介运营中台、LegoMind智能内容中台和豹播直播电商运营中台,它们对应融合了媒介智能+KOX运营、内容创作与管理,以及直播电商运营的场景。”Monica介绍道。未来,茉莉数科集团将为品牌客户提供MIT AI Agent平台,三大内容电商中台、和多AI Agent的1+3+X的整合智能营销服务。 出海范式AI技术成网络零售市场胜负关键随着2023年我国网络零售市场总额达15.42万亿,社交电商与直播电商市场规模总和已超过8.3万展的市场中,AI技术正在成为决定胜负的关键因素。放眼东南亚内容电商快速的发展,茉莉数科近年来积极在新加坡、马来西亚等国家布局业务。“东南亚市场的快速增长得益于中国优秀的供应链基础”,Monica分析道,“智能科技类产品正成为出海东南亚市场的主力军。”作为广州本土企业,Monica深切体会到这座千年商都的独特优势。“广州拥有务实的文化和丰富的商贸底蕴,在东南亚市场,许多领先的电商品牌都来自广州。”相比其他城市,广州在数字创意产业方面兼具优势与挑战。“广州的优势在于扎实的产业基础和丰富的商贸经验,而在创意人才聚集方面还有提升空间。但我们相信,在这样的营商环境下,广州能够孕育出更多引领未来商业的优秀企业。”Monica说道。未来几年,茉莉数科希望打造出海渠道和模式的新范式,既帮助中国品牌走向海外,也助力国际优质品牌进入中国。“我们将继续深化AI技术在跨境营销中的应用,为全球品牌提供更智能的营销解决方案。”Monica表示,“茉莉数科将继续深化AI技术在营销领域的应用,通过智能化的工具和服务,帮助品牌在激烈的市场竞争中获得先机。我们相信,在AI的驱动下,营销行业将迎来更加高效和精准的新时代。” π谈琶洲在广州政府全方位的支持下,海珠琶洲形成了良好的产业集 群,为大湾区的优秀人才和商贸基础提供了理想的发展环境。采写:南都·琶洲π记者 钟丽婷图片:受访者提供
-
知行交通大模型:打破传统交通“数据孤岛” 佳都科技知行交通大模型全场景交通管理展示。王凯佳都科技首席AI科学家,佳都科技中央研究院院长,负责佳都知行交通大模型、交通佳鸿操作系统研发工作 近日,佳都科技首席AI科学家王凯接受南都·琶洲π专访,系统阐释了佳都在大模型时代的AI战略布局、技术突破与落地实践。在大模型技术席卷全球的浪潮中,垂直行业如何真正将其转化为生产力,成为关键命题。作为深耕“AI+交通”领域多年的领军企业,佳都科技正通过自主研发的“知行交通大模型”,推动交通系统从“智能”迈向“智慧”,并将其深度应用于广州第十五届全运会等重大场景,展现出大模型在复杂城市治理中的巨大潜力。 “专业大脑”已推出智慧交通模型大幅提升高峰期通行效率对计算机科学与技术的热爱,驱动王凯在行业前沿不断深耕。作为清华—加州理工联合培养博士,王凯以第一作者身份在A类国际期刊及顶级学术会议上发表论文十余篇。在博士毕业前,他已受邀前往十多个国家和地区进行学术报告与科研交流,活跃在科技创新的最前沿。“智慧交通不仅要知道‘正在发生什么’,更要预测‘将会发生什么’,并主动做出决策。”王凯指出,“智能交通”侧重于感知与自动响应,如信号灯调节、异常事件识别等;而“智慧交通”则强调预测、决策与自我优化能力。为实现这一目标,佳都科技推出了交通行业的“知行大模型”。它不是对通用大模型的简单增强,而是深度融合佳都20余年的交通行业数据与知识沉淀的“专业大脑”。这一大模型具备多模态理解能力,可处理文本、图像、视频等多类数据,实现对交通业务的深度理解、推理与总结,从而在智能客服、运营管控、运维管理等场景中发挥核心作用。对普通市民而言,智慧交通的提升是具体可感的。比如通过扫码、刷脸快速进出地铁站,闸机常开门模式大幅提升高峰期通行效率;智能客服:大模型驱动的客服系统可处理大部分票务咨询,减少排队等待;车驾管服务:如广州交警上线的“车管业务指南电子书”,市民可随时查询业务流程、办理要求,实现“一查便知、一站办理”。“更重要的是,大模型正在打破传统交通中数据孤岛的困境。当地铁、公交、道路交通数据、舆情数据实现联动分析,系统能基于实时客流、天气、事件等信息动态优化交通组织与运力调度,从而减少拥堵,提升整体出行体验。”王凯说道。 适配场景广州近50个试点路口信号灯全天候自适应调节面对大模型带来的技术革命,佳都科技迅速调整AI战略,提出“大模型+操作系统”双引擎发展路径。一方面,佳都持续迭代“知行交通大模型”,目前已从V1.0演进至V2.0,在车站客服、设备运维、视频分析、客流预测等场景广泛应用,并从技术验证阶段进入规模落地阶段。另一方面,2025年5月,佳都发布基于开源鸿蒙的交通行业操作系统——“交通佳鸿”,将大模型能力下沉至设备与平台底层,依托开源生态,打造更高效、更开放的3.0版本交通大模型基础设施。“行业大模型必须与行业系统深度融合,从‘用模型’走向‘做生态’。”王凯说,佳都遇到的挑战不仅来自模型本身,更来自如何将其适配到千差万别的实际场景中。如,基于预训练的视觉大模型底座,可显著降低研发新算法对数据量的依赖:“传统算法需1万个样本进行训练,而我们基于大模型底座仅需400个样本即可完成定制,算法迭代周期从1个月缩短到3天,准确率可达95%。”此外,通过对国产算力的优化和算法效率的提升,佳都提供灵活的边缘部署与云边协同方案,可根据客户实际算力与成本约束“量体裁衣”,在端侧实现大模型的高效推理与AI应用的实时响应。王凯提到信控智能体、运维智能体等已落地的大模型应用案例。信控智能体以交通信号控制平台为基础载体,借助AI技术构建“路口-路段-区域”三级智慧交通管控体系,通过全天候自适应调节,让信号灯更具“聪明”,有效提升道路通行效能。“当前,广州市五个主城区近50个试点路口已实现信控智能体24小时自适应控制,AI赋能下的交通治理成效显著:珠江新城重点区域拥堵指数高峰期平均下降约6.5%,为城市核心区域交通缓堵提供了技术范本。” 创新成果参与广州数字交通指挥系统建设备战十五运会交通管理“大考”9月8日,2025国际机场博览会暨第十届中国机场服务大会正式开幕。此次活动上,佳都科技展示了各项创新成果落地,包括IDPS城市交通大脑、数字路口解决方案等。这些成果与智慧空轨形成“互补、共通、联动”,既能为机场周边、陆侧交通疏导、数字化及智能化建设提供解决方案,也为未来赋能智慧机场整体化发展提供了可复制、通用的基础样本。面对即将到来的第十五届全运会,佳都科技承建了广州数字交通指挥系统的建设。该系统接入28类交通数据资源,融合AI大模型、大数据、三维实景、AR等技术,构建“全域感知–智能研判–精准管控–高效处置”闭环能力。该系统不仅服务于全运会,更将为广州城市交通管理提供长效助力,推动交通治理效能持续提升。王凯说,佳都科技的目标始终是让技术真正服务于人。“大模型不是炫技的工具,而是推动交通系统实现从‘感知反应’到‘预测决策’的关键跃迁。我们希望通过大模型与操作系统的结合,打造一个更高效、更开放、更智能的交通生态。” π谈琶洲做大模型是一个“扎堆”的事情,就像北京做大模型要去海淀区。如今的琶洲也逐渐形成了产业聚集的氛围,这里既有活力四射的互联网企业,也具备交流与合作的天然优势。采写:南都·琶洲π记者 钟丽婷图片:受访者提供
-
人工智能大模型在琶洲百花齐放 人工智能技术发展的成果,正以大模型的形式对外展示着魅力。在一些广为人知的通用大模型面世之后,越来越多的垂类大模型正在悄然生长,小而美。 当我们深入到大模型行业前沿观察时,会明显感受到,垂类大模型正如雨后春笋般涌现出来。在部分领域,它们已经实现了数据积累、技术落地和商业变现。这实际上在预示着我们今后的生活将向何种方向演进。 广州海珠拥有国内首个人工智能大模型应用示范区。2024年3月,广州市出台《广州市支持海珠区建设人工智能大模型应用示范区实施方案》,全力推动海珠区打造国内领先的人工智能大模型应用示范区。随后,一系列围绕着大模型发展的政务服务和产业政策相继落地,培育壮大了本地大模型企业,也吸引了不少外地企业进驻。 真金白银的产业奖补和贴近企业业务需要的备案服务,让来到海珠的大模型企业感受到实实在在的支持,也让更多的大模型企业观察到海珠发展大模型产业的信心决心。 这些努力换来了积极的发展成效,琶洲的大模型正百花齐放。最新数据显示,截至今年9月初,海珠全区已培育大模型备案项目27个,居全省首位;算法备案项148个,居全市首位;落地行业大模型项目169个。短短一年多的时间,海珠区的大模型产业已经初具规模,成为了产业高地。大模型企业用脚投票,选择了海珠琶洲,也展示着海珠琶洲的实力和潜力。 本期《琶洲π》专访了在海珠琶洲已经完成备案的人工智能大模型的相关负责人,邀请他们揭秘大模型背后的技术原理,带你走进人工智能技术的最新应用场景。我们将他们的人物故事和大模型的产品结合起来,讲给你听。 从这些文字中,你将感受到那些充满热情和勇气的创业者和研发者,在如此充满未知和希望的时刻,是如何站上时代风口,又是如何思考的。 用AI理解和制作商业视频;消化课堂内容,给出提升教学效果建议;配合视频监控,实现24小时安全巡检;引导同学进行好作文的创作……这些AI大模型,有的掌握独家数据库,有的抓住细分应用场景,先人一步地将技术转化为先进生产力。 π
-
Qwen重磅发布:首个端到端全模态AI模型Qwen3-Omni登场 阿里杀疯了,Qwen团队刚刚接连发布了两款重要模型:Qwen3-Omni,业界首个原生端到端全模态AI模型;以及Qwen-Image-Edit-2509,对标谷歌nano banana 图像编辑工具,根据预告,明天还有“大的”要发布Qwen3-Omni:真正的一体化AI Qwen3-Omni的问世,旨在解决长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。它是一款真正意义上的全能选手,在同一个模型中无缝统一了文本、图像、音频和视频的处理能力 web端体验: https://chat.qwen.ai/?models=qwen3-omni-flash 抱抱脸上这个体验demo,可以直接去这里体验https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo 核心亮点:性能卓越:在36项音频及音视频基准测试中,Qwen3-Omni在其中22项上达到了业界顶尖水平(SOTA) 全球化的语言能力:模型能力覆盖广泛,支持119种语言的文本处理、19种语言的语音输入以及10种语言的语音输出极致高效:延迟仅为211毫秒,并能轻松理解长达30分钟的音频内容高度可控:支持通过系统提示词(System Prompts)进行完全自定义,满足个性化需求功能强大:内置工具调用(Tool Calling)功能,可与其他应用和服务轻松集成。开源字幕模型:同时开源了一个低幻觉的Captioner(字幕生成)模型,为音视频内容处理提供了可靠工具开源为了推动技术发展和应用创新,Qwen团队已开源了 Qwen3-Omni-30B-A3B-Instruct、 Qwen3-Omni-30B-A3B-Thinking Qwen3-Omni-30B-A3B-Captioner等多个版本,旨在赋能全球开发者,探索从指令遵循到创意任务等多样化的应用场景https://huggingface.co/Qwen/Qwen3-Omni-30B-A3B-InstructQwen-Image-Edit-2509 这是Qwen-Image升级版本,和字节前几天发布的即梦4.0图像模型一样主要是一致性上巨大提升多图编辑,无缝融合,现在,可以将“人物+产品”或“人物+场景”等多张图片拖入编辑,保持一致性同时进行推理 单图编辑,高度一致:人脸保真:无论变换姿势、滤镜还是风格,人物的面部特征始终保持一致产品保真:在广告、海报等应用中,产品能维持其核心特征,确保品牌识别度文字编辑:支持对图像中的文字进行全面修改,包括内容、字体、颜色,甚至材质纹理内置ControlNet,精准控制 深度、边缘、关键点……Qwen-Image-Edit-2509内置了强大的ControlNet功能,让用户可以即插即用,实现对图像生成的精准控制 qwen的发布博客里有详细清晰的示例,大家可以去看看: https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&from=research.latest-advancements-list
-
英伟达砸1000亿美元助OpenAI建10GW数据中心 英伟达为科技企业的人工智能(AI)基础设施建设狂潮又添了一把火。美东时间9月22日周一,英伟达与OpenAI宣布,签署意向书确立达成战略合作,OpenAI将借此利用英伟达的系统打造和部署至少10千兆瓦(GW)的AI数据中心,使用数百万块英伟达的图形处理器(GPU)训练和部署OpenAI的下一代AI模型。为支持上述里程碑式的战略伙伴关系,英伟达计划对OpenAI投资最高1000亿美元。这是英伟达迄今为止做出的最大手笔投资承诺。这笔投资将随着每1GW系统的部署逐步到位,首个1GW容量的英伟达系统计划于2026年下半年上线,采用英伟达Vera Rubin平台。投资OpenAI大规模部署数据中心的消息公布后,周一盘初曾跌1.1%的英伟达股价迅速转涨并在美股午盘之初拉升,午盘涨幅曾扩大到4%以上,刷新日高时涨4.5%,收涨逾3.9%,创收盘历史新高,盘后小幅回落。 “巨大”项目 10GW相当于多达500万GPU英伟达CEO黄仁勋称与OpenAI的合作规模巨大,它凸显了英伟达与OpenAI之间的紧密联系。黄仁勋周一对媒体透露,10GW的容量相当于400万至500万块GPU。这等于英伟达今年全年的总出货量,“是去年的两倍”。他说: "这是一个巨大的项目"。 黄仁勋此前在财报电话会议上说,建设1GW数据中心容量的成本在500亿至600亿美元之间,其中约350亿美元用于采购英伟达芯片和系统。按此计算,10GW项目的总投资规模将达到数千亿美元。OpenAI目前拥有超过7亿的周活跃用户,其ChatGPT服务需要密集的计算能力支撑。OpenAI的CEO Sam Altman上周日在社交媒体表示,OpenAI将在未来几周推出一些新的计算密集型产品,由于相关成本较高,部分功能初期仅向Pro订阅用户开放。双方高管表态积极Huang在与Altman和OpenAI总裁Greg Brockman的联合采访中表示: "英伟达和OpenAI相互推动了十年,从第一台DGX超级计算机到ChatGPT的突破。这项投资和基础设施合作伙伴关系标志着下一个飞跃——部署10GW(算力)来推动下一个智能时代。" Altman在声明中强调:"计算基础设施将成为未来经济的基础,我们将利用与英伟达共同建设的基础设施来创造新的AI突破,并大规模赋能个人和企业。"他还表示,“在接下来的几个月里,各位应该对我们抱有很大的期望”。OpenAI必须在三个方面表现出色:进行出色的AI研究、制造人们想要使用的产品,以及解决前所未有的基础设施挑战。Brockman表示:"我们从OpenAI早期就与英伟达密切合作,利用他们的平台创建了数亿人每天使用的AI系统。我们很兴奋能与英伟达部署10GW的计算能力,推进智能前沿并将这项技术的好处扩展到每个人。"战略意义与市场影响这笔投资对英伟达而言具有重要战略意义。Requisite Capital Management管理合伙人Bryn Talkington向媒体表示:"英伟达向OpenAI投资1000亿美元,然后OpenAI再把钱交还给英伟达,这对黄仁勋来说将是非常良性的循环。"该合作有助于英伟达确保其设备在AI系统建设中保持核心地位,特别是在OpenAI正涉足硬件领域包括自研芯片的背景下。保持OpenAI作为主要客户,可能帮助英伟达在行业考虑竞争对手组件时巩固其市场地位。黄仁勋表示,本周一公布的投资是"对已宣布和签约的所有项目的补充",暗示这超出了公司此前向华尔街披露的财务预期范围。新泽西理工学院数据科学研究所所长David Bader评论称,此次宣布合作的时间表明,英伟达“在地理位置(供应链)和战略层面(AI价值链)进行多元化布局”,“这更像是基础设施建设,而非投机行为。” Bader还说: “此次合作表明,AI基础设施已发展成为一个成熟的资产类别。我们正目睹AI技术栈垂直整合的趋势——从芯片到训练再到部署。英伟达不再仅仅是硬件供应商,而是成为其所推动的AI经济生态系统中的重要合作伙伴。” Altman称英伟达和微软是最重要合作伙伴这项合作体现了英伟达近期积极的投资扩张策略。上周,英伟达宣布对英特尔投资50亿美元,并宣布两家公司将在AI处理器方面合作。英伟达还向英国数据中心初创公司Nscale投资近7亿美元。上周媒体报道称,英伟达还花费超过9亿美元,聘请AI初创公司Enfabrica的CEO Rochan Sankar及其他员工,并授权该公司的技术。对OpenAI而言,这项合作补充了其与微软、甲骨文、软银和Stargate项目合作伙伴的深度基础设施建设工作。在最近的二级市场交易中,投资者对OpenAI的估值达到5000亿美元,微软、软银和Thrive Capital等都是其投资者。Altman在媒体采访中将英伟达和微软都称为OpenAI的“被动”投资者和“最重要的合作伙伴”。本周一英伟达和OpenAI的公告未透露1000亿美元投资的时间表等细节。两家公司表示,期待在未来几周内敲定这一新阶段战略合作伙伴关系的细节。
-
DeepSeek发了“终极版”! 智东西 作者 陈骏达 编辑 李水青 DeepSeek又更新了!智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。 DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。 而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminushttps://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了 今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。 ▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。 ▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。 ▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。 二、小球弹跳效果惊艳,还能快速交叉搜索信息 除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。 这一模型打造的动画效果也不错,轨迹和碰撞都比较自然: 在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。 结语:DeepSeek-V3.1,迎来终极版? DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。 也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
-
网红"蓝战非"称年入至少9位数:你们不知道顶流多赚钱 近日,博主“蓝战非”自曝收入引发热议,其称“你们是真的不知道抖音顶流有多赚钱,你说我要是全身心商业化,那我一年天文数字,九位数都小看我了。”第三方数据显示,“蓝战非”一平台粉丝数量达2478.8万,近30天涨粉超61万,商业化水平显示其1-20s、21-60s、60s以上视频广告报价均150万。此外据企查查信息显示,“蓝战非”名下关联7家企业,2家存续,其名下多家企业于今年注销,包括天津市滨海新区云账户蓝战非文化传媒工作室、长沙仓鼠文化传媒有限公司等。9月22日,话题“蓝战非自曝收入”登上微博热搜榜单。22日中午,“蓝战非”发文称:“好久没玩微博了,这句话我是很久之前讲的,现在空降热搜第一,我这都要被网暴吗?” “蓝战非”发文截图第三方数据显示,“蓝战非”某视频平台粉丝量达2478.8万,近30日涨粉超61万,商业化水平显示其1S-20S、21S-60S、60S以上视频广告报价均为150万。 “蓝战非”某视频平台粉丝量达2478.8万此外,记者从天眼查了解到,“蓝战非”名下关联7家企业,仅2家为存续状态,其余5家企业已注销。经营风险信息显示,今年7月,长沙蓝北文化传媒有限公司因未依照规定的期限公示年度报告,被长沙市雨花区市场监督管理局列入经营异常名录。 “蓝战非”名下关联企业据悉,“蓝战非”,1992年8月17日出生于广东云浮罗定,曾为熊猫直播、斗鱼直播平台游戏主播。现为游戏主播、旅游博主。“蓝战非”曾是ACE战队队长,英雄联盟S1-S3国服王者,擅长中单。2014年退役后,于斗鱼开启直播。2018年,“蓝战非”在熊猫TV《绝地求生》直播走红,订阅超200万,人气峰值达300万;7月,在抖音首发的短视频《兄弟,鼻涕擦干净再和我开黑》获37.1万点赞(截至2025年1月16日)。2019年1月1日,“蓝战非”转至斗鱼TV直播。2023年,他环游中国多地,游历湘西、张家界、拉萨等地。2024年8月2日,“蓝战非”宣布继续环球旅行,首站为纽约;11月27日,“蓝战非”发布视频记录南极之旅,获得了超过800万点赞。 “蓝战非”社媒截图记者查询发现,仅抖音平台,“蓝战非”拥有2479万粉丝,获赞超1.5亿;其近期发布的多条旅游视频,点赞均突破百万。来源:百姓关注综合九派新闻、大河报、封面新闻、当事人社交账号
-
国网泌阳县供电公司:“AI助手”应用 工作更便捷 大象新闻记者 周文德 司赵琦 通讯员 梁震9月17日,国网泌阳县供电公司数据中心人员到运维检修部输电班了解国网AI助手在工作中的实际应用情况。 在数据中心人员持续推广指导下,AI助手逐渐运用到日常工作中。9月15日,运维检修部人员对10千伏漫街线象曹分支进行线路清障工作,现场工作结束后,需要把工单及现场工作情况照片发送至内网存档。由于是手机拍照,照片在外网,以前都是回到单位后再用U盘在内、外网来回拷贝完成,很麻烦。现在大家逐渐学会了用AI助手的“拍一拍”功能,打开AI助手将照片上传,不需要借助优盘和外网电脑,即可直接发送至内网邮箱,随时随地发送,AI助手在工作中的作用是实实在在的。下一步,国网泌阳县供电公司数据中心将继续推广AI助手应用,并结合各部门的工作属性,为他们做更加细致的实操教学,让员工感受到数字化应用给工作带来的便利。
-
亚马逊开建AGI实验室,一号位也是华人 Jay 发自 凹非寺 量子位 | 公众号 QbitAI 靠电商和云计算席卷全球的亚马逊,正在借这一波Gen AI浪潮,续写新的故事——过去,它的AI战略定位是做基础平台,用户可以通过Amazon Bedrock获得全栈式服务。但大家可能不知道,去年9月,它在旧金山成立了自己的AI实验室,Amazon AGI SF Lab(以下简称亚马逊AGI实验室)。这标志着亚马逊的重大转型:从基础设施,转向更具雄心的AGI研发。而且,这个实验室的一号位还是名华人。大佬叫David Luan,已有15年的AI相关工作经验。他是OpenAI的早期员工,曾做到工程副总裁,参与过GPT-2、GPT-3、CLIP和DALL·E等多个重要项目的研发。论资历,Luan绝对算市场中的老炮。 实验室怎么来的? 亚马逊之所以决定成立一家AGI实验室,主要是受AGI时代这柄双刃剑影响。一方面,如果Agent成了新的交互形态,人们不再亲自上网购物,那亚马逊依托于电商生态的广告和佣金业务,显然岌岌可危。但硬币的另一面是机会。作为数字化的鼻祖,亚马逊掌握着海量且极具价值的用户行为数据:用户的浏览路径、他们对促销、评论和页面布局的敏感度,以及不同群体之间的相似性。如果能把这座数据金矿挖掘到位,亚马逊完全有能力打造一个真正实用的模型,摘下那颗低垂的Agent果实。正是在这样的背景下,2024年6月,亚马逊反向收购雇佣了Adept AI。 △亚马逊内部邮件 “反向收购雇佣”指大科技公司不实际收购热门AI初创公司,而是争取初创公司的技术授权,吸纳其核心团队加入,但初创公司本身仍作为独立个体存在。这桩收购无疑是个大事件。收购完成后,亚马逊当即将重任交到时任Adept AI CEO的David Luan手中,并以他为首成立了亚马逊AGI实验室。量子位一通深挖,发现这个实验室真的是高手云集——首先,实验室的一号位,华人David Luan,毕业于耶鲁大学应用数学与政治科学专业。6岁时,Luan跟随家人从中国搬到了美国。从小,他就对计算机抱有浓厚兴趣,并且行动力惊人。8岁起,Luan就开始在伍斯特州立大学修读夜校项目,5年苦读后,终于拿到了学校颁发的计算机科学证书。 而且Luan的AI职业起点相当早:2011年,Luan就创办了一家深度学习公司,专注于视频分类技术。这项成果后来被奥巴马政府用于改进执法记录仪。此后,为了追逐AI最前沿,Luan开始在多家知名AI企业之间辗转。2018年,他加入OpenAI。当时,OpenAI团队规模还不到四十人。不久,他升任工程副总裁,他的任务不是写论文,而是将GPT-2、GPT-3等研究成果变成工程产品。 △GPT-2论文 2020年,Luan转至Google Brain,担任大语言模型项目的总技术负责人,聚焦于融合研究与工程的大型项目。但1年后,他就离开了谷歌。原因是他认为谷歌很多精力都分配在了广告和搜索相关的业务上,很难从零开始开展新的研究路线。而且大公司组织架构分散,难以集中发力。 当时在谷歌,每个人有限定的资源credit,要跑一个庞大训练任务,你得说服19、20个同事把这些资源让给你。 离开谷歌后,他开始凭借自身专业的AI知识为公司提供咨询服务。直到2022年,他才再次出山,和两位Transformer作者(Ashish Vaswani和Niki Parmar)联合成立了Adept AI。再后来,就是加盟亚马逊了。从上述经历不难看出,Luan的实战经验可谓相当厚实。聊完Luan,我们再来看看亚马逊AGI实验室的其他人——亚马逊AGI实验室的二把手是加州大学伯克利分校教授Pieter Abbeel。 Abbeel是强化学习和机器人学领域的专家,带领团队在Deep Q-Learning、模仿学习、自我博弈等方向上都做出过奠基性贡献。谷歌学术显示,他的论文被引量超过了21万。 加入亚马逊之前,他是一家专注于仓储和物流场景下的机器人拣货初创公司(Covariant.ai)的联合创始人。这个场景,正好击中了亚马逊的业务核心。2024年8月,也就是Adept被收购不久后,亚马逊同样通过“反向收购雇佣”的方式,将Covariant纳入麾下,Abbeel随之以研究员身份正式加入亚马逊AGI实验室。此外,当时跟着Luan一起搬家到亚马逊的,还有四名Adept AI的联合创始人。第一位是Erich Elsen。Erich在斯坦福机械工程系拿下博士学位,是GPU计算的专家。他曾在DeepMind担任资深研究员,参与撰写了包括多篇高被引论文,代表作包括Chinchilla定律、稀疏矩阵GPU内核。加入亚马逊AGI实验室后,Erich负责多模态代理和强化学习基础设施。 负责产品的是Kelsey Szot。她拥有斯坦福数理与管科双学位背景,曾在麦肯锡做咨询顾问、在谷歌负责大型模型生产基础设施。2022年,她联合创立Adept AI,主导了ACT-1与Fuyu-8B等模型的产品化。 最后还有Maxwell Nye和Augustus Odena这对好哥们(他俩就连在简历里也不忘提对方的名字)。 △Augustus Odena(左图)和Maxwell Nye(右图) 这对黄金搭档曾在谷歌共事,参与提出了Scratchpad,这一方法如今被视为现代AI推理系统的基石。不过,他俩在加入亚马逊不久后便选择离开了。两次反向收购雇佣、大量招揽顶尖人才……可以说,为了组建这个AGI实验室,亚马逊下了不少力气。 让David Luan当一号位,凭什么? 亚马逊AGI实验室人才济济,David Luan到底有怎样的过人之处,才成为了亚马逊这支秘密队伍的领头羊?之前我们已经提到,Luan自2011年便开始创业,除了先后加入微软、OpenAI、Google外,他还是一位连续创业者。但要知道,Luan的优势不仅体现在专业能力,还在于他的战略眼光。早在2022年——ChatGPT问世之前,入局AI创业的Luan就有一套自己的想法:想办法让AI干活。 我们创办Adept AI时,就发现大模型真挺擅长说话的,但没什么行动力。 因此,他将目光投向了Agentic AI,并成立了当时的第一家Agent公司——Adept AI。2022年9月,Adept AI发布了首个Agent模型,ACT-1。这个模型能够通过自然语言指令执行屏幕任务,如在浏览器中导航、填写表格和操作软件。当然,在今天看来这些能力好像已经并不新鲜。但朋友们啊,ACT-1是三年前的产物!别说如今爆火的Agent了,就连ChatGPT都还没影子呢。 Luan认为,计算机应该去适应人类,而不是让人类去适应计算机。因此,Adept也一直采取着这种以人为中心的方法论。成立不到一年,Adept AI便完成了超4亿美元的融资,一举成为当年融资最成功的AI初创公司之一。加入亚马逊,给AI搭“健身房”说起来,Adept干得风生水起,核心团队为啥后来要接受被并?主要有两点原因:首先,亚马逊坐拥全球最顶尖的算力基础设施之一,这是小公司无论如何都难以企及的。而对于AI行业来说,算力正是决定模型进步快慢的发动机。因此,想要前往智能的前沿,必须搭乘拥有发动机够猛的“跑车”。其次,亚马逊还能提供稀缺的真实数据。经过这么多年的挖掘,互联网上的高质量数据已经快要枯竭了,大模型发展因此开始减速。事到如今,人类在日常工作中的实际操作数据成为了高质量的稀缺训练数据。AI大神Andrej Karpathy对此曾做过一个类比: 想象你要训练一个打网球的智能体,你肯定不能让它99%的时间都在看YouTube网球视频,只用1%的时间真正上场打球。 在Luan看来,亚马逊业务范围极广,“几乎每个500强企业在现实里开展的核心业务,都能在亚马逊内部找到类似的事情”。这些能产生大量真实数据的内部环境,是Agent的最佳训练场所。 还有一个最关键的原因,那就是Luan不甘心只是做一个提供AI销售服务的小公司。 在我的整个职业生涯中,我只想构建最智能、最有用的人工智能。 因此,2024年,Adept AI与亚马逊达成反向收购雇佣,Luan带着团队里最核心的技术人员一起加入了亚马逊AGI实验室。今年年初,亚马逊AGI实验室发布首个产品——Amazon Nova Act,一个基于亚马逊内部最强自研AI Amazon Nova延伸出来的Agent模型。 它继承了Adept AI的技术遗产(ACT-1、Fuyu模型等),又结合亚马逊的AWS基础设施,在多步骤复杂任务上表现出色。根据亚马逊官方披露,Nova Act在Agent的公开基准测试ScreeSpot和Ground UI上取得了不错成绩。并且在ScreeSpot界面元素定位上的表现格外优异,准确率接近94% 亚马逊AGI实验室透露,这里面的秘诀在于强化学习。 我们在亚马逊AGI实验室做的是大规模自我博弈。十几年前,DeepMind靠这种方式击败了人类。 亚马逊AGI实验室没有靠人力去给每一个操作编码,据Luan所说,他们为AI搭建了一间“健身房”。在这间健身房里,随处可见各种常用的“健身器材”,比如ERP、CAD、电子病历系统、会计软件等。AI可以利用这些工具,通过强化学习自己摸索出正确的使用方式。没想到,人工智能也需要健身了。(手动狗头)看来,加入亚马逊AGI实验室后的Luan仍然谨记实用主义的信仰,一心只为打造最有用的AGI。 One More Thing 最后,八卦时间~Adept AI最初的3名核心发起人,一位是David Luan,还有两位都是Transformer八子之一。一位是Niki Parmar,另一位是Ashish Vaswani。不过,Vaswani不到一年就离开了。 △从左到右:Niki Parmar, Ashish Vaswani, David Luan 据彭博社爆料,Vaswani离开的原因是与Adept AI的某位联合创始人意见不合。已知:Vaswani离开Adept AI时,Parmar跟着一起离开了,两人后来又联合成立了Essential AI。求:和Vaswani意见不合的,会是谁呢?参考链接: [1]https://www.theverge.com/decoder-podcast-with-nilay-patel/761830/amazon-david-luan-agi-lab-adept-ai-interview [2]https://www.youtube.com/watch?v=AU9Fdgs0ZaI [3]https://labs.amazon.science/blog/amazon-opens-new-ai-lab-in-san-francisco-focused-on-long-term-research-bets [4]https://www.wired.com/story/amazon-ai-agents-nova-web-browsing/ [5]https://www.linkedin.com/in/jluan/details/experience/ [6]https://x.com/jluan/status/1267097243204476932 [7]https://www.latent.space/p/adept [8]https://labs.amazon.science/blog/nova-act
-
在拼多多单月卖出5000吨莱阳梨,95后新农人为何“收编”果园? 金秋九月,山东烟台莱阳的空气中弥漫着秋月梨特有的香甜,在拼多多直播间内,95后新农人付佳奇和团队小伙伴们开启了“不间断直播”模式,这是他们在拼多多创业的第5年,今年的目标是月销8000吨秋月梨。与其他商家不同,付佳奇在拼多多的爆单是从直播开始的,那年中秋,他面对镜头选货、打包、贴单,靠着“所见即所得”的真诚打法,将店铺的日销量从20箱做到了1万箱,用最朴实的方式闯出了一条逆袭之路。为什么他的果子能物美价廉?为什么他的店铺能轻松爆单?这背后藏着的是商家“品质先行,价值取胜”策略的成功,更是平台重构竞争逻辑的直观利好。一场“笨拙”直播引发的爆单奇迹付佳奇与电商的结缘始于学生时代,电子商务专业出身的他,在大学里时便熟练掌握了PS、后台优化、店铺运营等工作,并对当时热门的几个电商平台了如指掌。2019年,为爱奔赴的付佳奇来到了女友的家乡烟台,开启了他做农特产电商的创业之路。烟台坐拥北纬37度黄金海岸,年均降水量和日照时长都非常适宜苹果生长,连续16年稳坐中国果业第一品牌的宝座;而莱阳素有“中国梨乡”的美誉,不仅有着400年的贡梨种植历史和文化积淀,更在秋月梨产业发展中走在全国前列。一直以来,当地销售苹果和梨的主要渠道是出口或者线下大型商超,但2020年受外部环境影响,苹果和梨的出口量大幅下降,大批量的果子成了滞销产品。为了拓展销路,早有电商经验的付佳奇说服公司尝试开设线上店铺,而面对一众较成熟的电商平台,他将初战场定在了拼多多,“要想在线上卖好苹果和梨,拼多多的生态是最合适不过的。”付佳奇判断。 ▲付佳奇正向拼多多直播间的消费者展示秋月梨的分拣流程。最初的创业模式和当时主流的货架电商一样,付佳奇按部就班地上架产品、优化页面,一天大约卖出20来箱,属于不温不火的存在。转机出现在他发现拼多多后台那个不起眼的入口——多多直播,虽然对直播带货懵懂无知,但电商人的直觉告诉他,这是个机会。于是他跑去观摩学习其他人的直播,但很快就对千篇一律的“自卖自夸”式售卖方式产生审美疲劳,就在这时,一个大胆的念头冒了出来:既然是直播,何不把最真实的打包发货过程直接“晒”给消费者看?他将手机的镜头架到了农户的果园里、公司的仓库里,用户一下单,他就立刻当着镜头,亲手挑选苹果或梨,仔细打包、封箱、贴单……每一步都清晰可见,没有任何剪辑和修饰。这份近乎“笨拙”的真诚,却在拼多多这个注重真实和信用的平台上产生了奇效。开通直播以后,付佳奇公司店铺里的订单量从最初的零星几单,悄然攀升到几十单、上百单……一年后的中秋,直播间和店铺里的秋月梨总日销量达到了1万多箱,几十位包装工人从早上7点一直打包到晚上11点。突如其来的爆单,让付佳奇公司的店铺从此在拼多多上声名鹊起,据他介绍,单“烟台栖霞果蔬基地”这一个店铺累计销量就超过160万单,“去年秋天,公司秋月梨最高月销量是5000吨,我们今年的目标是8000吨。”一次品质为“矛”打响的产业带突围付佳奇没有想到,爆单的喜悦才刚刚过去,他和团队就迎来了更严峻的挑战:全国各地的电商卖家蜂拥而起,市场竞争瞬间白热化。付佳奇认为,若随波逐流,最终损害的是产品口碑和消费者的信任,更违背了老板“做长久的事”的初衷。如何在竞争中破局?他和团队将答案押在了“极致品质”上。秋月梨好吃的重要标准之一就是甜度,付佳奇介绍,秋月梨的甜度一般在13—16度左右,受品种影响,甜度最高可达17—18度。“我们收上来的每一颗梨都是要用专业的仪器测甜度的,工作人员会给果子拍摄100多张X光片检测是否有碰伤、病虫害以及着色度,糖度达到标准才会装箱,不合格的会直接淘汰掉,而很多其他商家是没有这些步骤的。” ▲9月是秋月梨丰收季,新鲜下树的秋月梨正经过分拣、打包发往全国各地。正是因为对品质的严把关,付佳奇公司拼多多店铺的复购率高达36%左右,超过了98%的同行。而为了与新客户快速建立信任,付佳奇和团队想出了一个“疯狂”的营销策略:前期先亏本卖,用两块的价格卖三块的品质,等到成功引流之后,再上调价格保证利润。“我们在第一轮售卖时会明确告诉消费者这是尝鲜价,后期肯定会涨价,为的就是想让大家都尝尝高品质秋月梨的滋味,这样即便后期再涨价也不会引起消费者的反感。”付佳奇对此非常坦诚,这样一来,口碑和复购率不但慢慢积累起来,价格也会公开地、透明地调整到合理区间。“来拼多多的人,购物目的非常明确,其实大家介意的并不是价格的上涨,而是商家的诚信。”付佳奇深知这一点。事实上,平台本身的特性也为这套策略提供了坚实的支撑。首先,低运营成本是关键。“拼多多的推广费用在主流电商平台中算是低的,运营门槛也是相对较低的,很好上手。” 付佳奇表示,这样一来,就极大地减轻了他们前期“引流”的压力和整体运营成本,让团队能将更多资源和精力放在产品品控、供应链管理和客户服务这些真正创造价值的地方,而不是无休止的流量购买中。其次,拼多多近年来还相继落地了“千亿扶持”“百亿减免”“新质商家百亿扶持计划”等一系列惠商计划,针对新质商家推出从产品、营销、运营到供应链的全链路扶持政策,通过重构平台竞争格局,让更多商家走出同质化竞争,凭借真实力赢得市场。一轮果园“收编”引发的产业升级如今,随着平台店铺销量的节节攀升,付佳奇也将目光从眼前的销售数据,投向了更广袤的梨园深处。一直以来,当地都是以分散的个体农户种植为主,这种方式虽然灵活,但管理粗放、标准不一,抗风险能力较差,尤其是随着村里人口老龄化越来越严重,很多果农都种不动了。“这两年行情不好,果子卖不动的情况下,很多果农都把果树砍了,导致种植面积逐年减少。”付佳奇讲述,还有一些果农会陷入“越不挣钱越不舍得投入,越不投入品质越差,品质越差越不挣钱”的恶性循环中。 ▲付佳奇公司自营的700亩优质果园,他正将公司的种植标准向农户们推广。这些现象深深触动着付佳奇,他意识到,仅仅收购果子只能解决一时的销售问题,要保证长期稳定的高品质货源,推动产业可持续发展,帮助果农走出困境,需要更深层次的介入。于是,他和公司开始尝试将产业链向上游延伸,启动了一项更具雄心的计划:将分散的农户果园进行“收编”,实施统一的高标准管理。“收编”的核心是标准化与规模化,目的是实现源头上的品质可控和稳定产出,从而让有限的土地产出更高的价值。付佳奇以公司自营的700亩优质果园为例介绍:“我们种的话投入的成本肯定会更高,比如我们的果园都是禁用除草剂,人工除草,再比如我们的种植技术和机械化设备肯定更好,种出来的果子口感也会更好,卖的价格也就更高。”而这一转变对于被“收编”的果农而言,则意味着角色的重塑与收益的提升,他们从过去“靠天吃饭”、独自承担市场风险和种植辛劳的个体户,转变为拥有多重收益保障的参与者。依托4月启动的“千亿扶持”,今年丰收节期间,拼多多上线“多多丰收馆”,加码农产品扶持。付佳奇以自己团队为例算了一笔账,今年丰收节期间,仓库新增的临时工人能达到两三百人,日工资高达300—400元/天,月入过万并不是件难事。此外,通过土地流转或入股,那些有地的农民还能获得稳定的租金或分红,这些都是实实在在的增收机会。农村大地,处处是商机。如今,越来越多像付佳奇这样的“95后”电商新农人正成为乡村振兴的实践者,他们和拼多多的故事,以及那份关于品质、责任和产业未来的实践,还在继续书写着更醇厚、更持久的甜蜜篇章。(大众新闻·风口财经记者 吕华)
-
一周AI大事:马斯克打响AI价格战 一、重磅工具:便宜到离谱的顶尖大脑——Grok 4 Fast让高性能AI打起“价格战” 新闻:马斯克麾下人工智能企业xAI发布Grok 4 Fast。这款快速高效、低成本的高性能AI模型“突破了性价比的边界”。Grok 4 Fast的多项基准测试得分接近业界顶尖水平,在Artificial Analysis智能指数中综合得分为60,与Gemini 2.5 Pro旗鼓相当,但略逊于GPT-5。该模型经端到端训练,支持工具调用,在智能体浏览基准测试中表现出色,适用于各类智能体应用场景。 Grok 4 Fast不仅拥有接近顶尖的推理能力,还兼具速度、效率和低成本。其 API定价极具竞争力,每百万输入token仅需0.2美元,每百万输出token仅为0.5美元。Grok 4 Fast的token使用效率显著优于同类产品,完成AA智能指数测试仅消耗6100万token,远低于 Gemini 2.5 Pro的9300万和Grok 4的1.2亿。 以极低成本获得Gemini 2.5 Pro级别的AI模型无疑具有颠覆性意义。这使得Grok 4 Fast 成为智能体 AI 应用领域一款重要、有趣且极具吸引力的 AI 模型。 锐评:顶尖性能平民价,马斯克玩AI像造火箭——主打“便宜又能打”。 二、AI 技术与产品发布:从写代码到戴眼镜,AI新品“连环轰炸”科技圈 1. 新闻:OpenAI发布GPT-5-Codex。这款基于GPT-5微调、专为智能体编程优化的模型已集成到 OpenAI的Codex编程智能体中。相较于初代Codex,GPT-5-Codex在长周期软件任务中展现出更优的规划与工具调用性能。其发布文档中包含数小时的问题解决案例及系统错误处理机制详解。用户实测证实,GPT-5-Codex在智能体编程方面性能有显著提升,运行速度比以往更快,生成的代码也更智能,但仍存在延迟与特性偏差。经此升级,Codex正成为Claude Code的有力竞争者。 锐评:以后写代码可能真就是动动嘴的事儿。 2. 新闻:本年度Meta Connect大会聚焦全新智能眼镜。Meta发布Ray-Ban Meta Display智能眼镜,其镜片内置了显示屏,可显示消息、翻译和Meta AI的输出;配套的肌电腕带 Meta Neural Band可辅助操作。Meta还推出了第二代 Ray-Ban Meta 眼镜和Oakley Meta Vanguard运动性能AI眼镜。但公司CEO扎克伯格现场演示时的翻车事件反而获得了更多关注。 锐评:产品再牛,也顶不住老板现场翻车带来的泼天流量。 3. 新闻:阿里巴巴通义实验室开源了智能体网页研究AI模型Tongyi-DeepResearch-30B-A3B,其在多项信息检索类基准测试中(如 GAIA 70%,HLE 32.9%)可匹敌OpenAI Deep Research。通义实验室发布的技术文档详细介绍了合成数据训练流程、策略智能体强化学习及ReAct深度模式研究流程,模型权重已发布于Hugging Face。 锐评:技术开源才是硬道理,你强任你强,代码随便给你看。 4. 新闻:Mistral发布Magistral Medium 1.2 (magistral-medium-2509) 和 Magistral Small 1.2 (magistral-small-2509)。其中,Magistral-Small-1.2是一款采用Apache-2.0协议的240亿参数推理模型,新增了视觉支持、长上下文处理以及推理轨迹追溯功能,专精数理科学与编码任务。这款模型在 AIME、GPQA 和 LiveCodeBench 等基准测试中得分均有所提升,现已经上线Hugging Face。 锐评:法国“幻觉哥”闷声干大事,专攻数理化,这是要培养AI界的“理科学霸”。 5. 新闻:Perceptron AI 推出Isaac 0.1。这是一款拥有20亿参数的开放权重“感知语言”模型,具备空间智能与和物理世界交互的能力。官方宣称Isaac 0.1在视觉问答(Visual QA)任务中表现卓越,特别是视觉感知方面可媲美参数量远大于它的模型。Isaac 0.1现已登陆 Hugging Face。 锐评:2B参数玩转空间感知,袖珍身材却想和巨头比“大”。 6. 新闻:Reve推出全新一体化图像创作编辑平台“The New Reve”,融合了四大功能:文生图与混合生成、支持拖拽操作的对象级编辑、创意助手及第三方插件API。The New Reve支持可编辑上传、自然语言编辑和直接操控功能。Reve官方博客详述了产品功能和发展路线图。作为集媒体生成器、迭代编辑器和智能体控制台于一身的平台,此次产品发布开创了AI原生媒体创作界面的新范式。 锐评:P图软件迎来终极对手。 7. 新闻:谷歌宣布Chrome浏览器AI功能重大升级,详细介绍了内置Gemini助手等新功能。用户只需点击Gemini图标即可跨标签页启动复杂信息总结、参考文献检索、回复内容起草以及网页服务集成等功能。谷歌表示:“我们正构建以AI为核心的浏览器,利用页面内容与标签上下文帮助用户更快、更方便、更安全地完成任务。”Gemini in Chrome率先向美国英语用户开放,后续将拓展至更多地区与语言。这标志着谷歌正式加入AI浏览器竞争的行列。 锐评:谷歌终于想明白,AI主场还得是浏览器。 8. 新闻:Zoom推出跨应用AI更新,包含统一笔记记录和AI虚拟形象功能。其最新的升级版AI助手新增了跨会议应用的笔记捕获、AI辅助日程安排、高仿真用户虚拟形象等工作流自动化功能,旨在与其它垂直领域的AI生产力应用展开竞争。 锐评:AI智能体让开会不耽误摸鱼。 9. 新闻:Notion发布集成智能体的Notion 3.0重大更新,将AI智能体置于旗下工具集的核心位置。Notion 3.0的文档和生产力应用升级让AI智能体可以处理人类可操作的所有Notion 信息和工作流。官方称,“可以将智能体视为可处理完整工作流并访问全部信息的超级用户”,后续Notion 3.0将支持智能体个性化定制功能。 锐评:从笔记本升级成用户“贴身小助理”。 10. 新闻:OpenAI为ChatGPT新增“思考时间”控制功能,允许用户在使用 GPT-5时调整响应速度和推理深度。这些控件简单易用,推出该功能主要是因为用户反馈模型的默认思考时间对于简单任务而言有些过度。这一功能率先向网页版Plus和Pro用户开放,移动端版本也即将上线。 锐评:快有快的道理,慢有慢的深度。 11. 新闻:亚马逊为Marketplace卖家推出全天候在线的AI智能体。此次“卖家助手”更新新增了智能体能力,可以代管商品列表、客户支持和其他后台任务,而不仅仅是回答问题。 锐评:24小时不打烊,睡觉不耽误赚钱。 12. 新闻:可灵AI推出全新数字人功能,通过一张角色图片加一段文字或音频,即可生成1080p/48FPS、最长1分钟的数字人视频。据介绍,该数字人依托多模态理解与视频生成模型的深度融合,实现口型精准同步与情绪动作的精细控制,支持多类角色及中英日韩多语种,结合会员优惠最低价仅0.12元/秒,大幅降低了行业门槛,广泛适用于广告、电商、教育等场景,目前产品公测正陆续开放中。 锐评:白菜价就能实现“明星代言”自由。 三、AI研究资讯:数学难题成模型眼中小儿科,AI科研加速刷新人类认知边界 1. 新闻:独立研究员杰里米·伯曼(Jeremy Berman)和埃里克·庞(Eric Pang)在ARC-AGI 基准测试中取得新突破。其论文详述了如何采用结构化自然语言推理替代代码生成,利用Grok-4和多智能体协同实现ARC v1基准测试79.6%的成绩,并在ARC v2基准测试中创造了29.4%的新纪录(此前最高为25%)。 锐评:高手在民间。 2. 新闻:OpenAI和Google DeepMind的 AI 模型在2025年国际大学生程序设计竞赛(ICPC)全球总决赛中创下历史最佳战绩。OpenAI的AI系统获得满分,解出全部12道题,击败所有参赛的人类队伍。而DeepMind 的Gemini 2.5 Deep Think则解出10道题,其中包括一个没有任何人类选手解出的难题。这一消息最核心的意义在于,实现这一里程碑式成就的是通用 AI 推理模型。 锐评:AI不仅要抢饭碗,还要砸奖杯 3. 新闻:DeepMind发现流体动力学领域百年历史方程的新解,是AI加速科学发现的最新例证。该研究采用物理信息神经网络(PINNs)等AI方法,通过物理定律约束求解流体运动的偏微分方程,不仅发现了新的解族,还与传统求解器进行了对标。DeepMind表示,“这一突破代表了深度数学洞察与前沿人工智能技术相结合的数学研究新范式。” 锐评:以前靠天才灵感,现在靠“暴力”计算。 4. 新闻:由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上国际权威期刊《自然(Nature)》的封面。这篇DeepSeek-R1论文首次公开了仅靠强化学习便能激发大模型推理能力的重要研究成果,为全球AI研究者带来了启发;这一模型还成为全球最受欢迎的开源推理模型,在Hugging Face上的下载量超1090万次。《自然》在社论中高度评价道:几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。《自然》认为,在AI行业中,未经证实的说法和炒作已经“司空见惯”,而DeepSeek所做的一切,都是“迈向透明度和可重复性的可喜一步”。 锐评:中国AI用硬核科研成果告诉世界:我们不光会用,更会创造。 四、AI 商业与政策:巨头豪掷千亿,资本与监管在AI黄金时代赛跑 1. 新闻:Waymo 与丰田达成价值约40亿美元的协议,将新一代AI驾驶系统集成至丰田电动汽车。这项合作据估算价值40亿美元,Waymo Driver AI 平台将于2028年末开始部署到丰田汽车。 锐评:自动驾驶的终局,还得是AI技术公司和传统车企“喜结连理”。 2. 新闻:英伟达斥资50亿美元入股英特尔,并提议与英特尔在AI和计算芯片技术上展开合作,此举推动英特尔股价大涨。此外,英伟达还计划在新加坡投资20亿美元新建AI研发中心,为大语言模型和生成式 AI 开发专用硬件。 锐评:昔日对手牵手,芯片江湖套路深。 3. 新闻:AI机器人初创公司Figure宣布完成C轮融资,获超10亿美元承诺资金,投后估值390亿美元。本轮融资由Parkway Venture Capital领投,布鲁克菲尔德资产管理公司、英伟达、麦格理资本、英特尔资本、Align Ventures、Tamarack Global、LG技术风险投资公司、Salesforce、T-Mobile风险投资公司和高通风投等机构跟投。Figure表示,本轮融资将推动公司AI平台Helix和BotQ制造体系的规模化扩张,推动人形机器人进入家庭和商业运营、建设新一代GPU基础设施以加速训练与仿真,以及启动先进的数据收集计划。 锐评:人形机器人成华尔街新宠,连钢铁侠都要嫉妒。 4. 新闻:AI热潮推动多家美国科技初创企业的估值爆发式增长,以OpenAI领衔的美国“七大科技初创”总估值达1.3万亿美元。根据全球领先私募证券交易市场Forge Global的数据,目前七家估值最高的私营科技公司的总估值已经达到了1.3万亿美元,在过去一年里几乎翻了一番。具体而言,OpenAI在Forge的估值排行榜上位列第一,估值约为3240亿美元;其次是成立4年的Anthropic,估值为1780亿美元;xAI估值则为900亿美元。 锐评:当下AI是风口,不知道飞上天的是不是猪。 5. 新闻:微软宣称要在美国威斯康辛州打造“世界上最强大的人工智能数据中心”。目前该公司正在威斯康辛州的芒特普莱森特建设一处投资约33亿美元的数据中心,并宣布将再拨出40亿美元扩建第二处数据中心。 锐评:砸几十亿只为“喂饱”AI,云计算厂商豪横无下限。 6. 新闻:华为在全联接大会上推介了“SuperPoD Interconnect”网络架构,该架构支持最多1.5万个昇腾AI芯片加速器互联,用于构建大规模AI训练和推理集群。当下中国正大力推动本土AI基础设施建设。 锐评:华为正用自主技术为国产AI铺就一条高速公路。 7. 新闻:OpenAI 宣布对18岁以下用户实施新限制并调整产品。公司CEO萨姆·奥特曼(Sam Altman) 在一篇题为《青少年安全、自由与隐私》的文章中公布了相关措施,表示将预测用户年龄,并据此实施AI交互限制以及强化家长控制等差异化规则,来对未成年用户适用不同的管理办法,包括限制AI互动内容和提供更多家长控制功能。尽管此举受到公众担忧的推动,但奥特曼将其描述为一项主动加强青少年安全的举措。他表示,“我们将青少年安全置于隐私和自由之上;这是一项新兴且强大的技术,我们相信未成年人需要得到有力的保护。” 锐评:AI公司开始被迫“学着做家长”。 8. 新闻:Gartner预测,到2030年,网络安全将转向“先发制人”式的AI网络安全。该预测指出,通常由AI驱动的主动防御能力将占到IT安全支出的一半,取代传统的“检测-响应”工具。这份报告预示着未来五年,预算将向主动模型和智能体安防模式倾斜。 锐评:AI网安要先下手为强,黑客的日子怕是更难过了。 9. 新闻:有报道称OpenAI 可能正在开发智能音箱、眼镜、录音笔和一款胸针式设备。根据供应链消息和潜在的合作动向,该公司正在探索各种专用ChatGPT设备,目标是在2026年末发布产品。 锐评:软件尽头是硬件。 10. 新闻:美国国家经济研究局(NBER)与OpenAI联合发布ChatGPT使用调研报告。该报告基于大规模ChatGPT使用情况的调查分析,描述了以消费者为主导的使用模式:“工作相关的信息量稳定增长,但非工作相关的信息量增长更快,已从总使用量的53%增长到超过70%……‘实践指导’、‘信息检索’和“写作”是三个最常见的主题,合计占所有对话的近80%。”这项研究为 AI 工作场景应用与消费行为提供了新视角。敏锐的AI从业者正挖掘数据寻找创业机会。 锐评:本以为大家用AI搞生产力,结果发现大部分人是用来“摸鱼”和“找乐子”的。 五、AI 观点与评论:AI大辩论中的“末日先知”与“收费站长” 1. 新闻:AI大佬埃利泽·尤德考斯基(Eliezer Yudkowsky)出了一本名为《若有人建造,众人皆亡:为何超人类AI会毁灭人类》的新书,被《纽约时报》称为“AI末日预言家”。其宣扬的AI威胁论远超合理范畴,但在巨变时代贩卖恐惧仍颇有市场。 锐评:科技圈的“狼来了”总有人爱讲,也总有人爱听。 2. 新闻:Cloudflare CEO马修·普林斯(Matthew Prince) 在接受《连线》杂志采访时主张,AI公司应为其数据抓取行为以及给下游造成的危害负责。这篇访谈涵盖了互联网内容溯源、基础设施责任,以及随着AI模型规模扩大并改变互联网运作方式所必需的政策杠杆。 普林斯就互联网的未来提出了三种可能的路径:一是“死亡互联网”:AI 内容淹没人类创作内容;二是“黑镜式互联网”:记者、研究人员和创作者依然存在,但沦为AI巨头的附庸;三是授权模式:AI公司向内容创作者付费。 这番言论为AI时代数据权利与平台责任的持续辩论添薪加火,但普林斯的立场背后存在利益动机:Cloudflare 希望对 AI 智能体的互联网使用进行许可授权,自己则充当中介角色。 锐评:高呼AI抓取要付费,其实更想当“互联网收税官”。(辰辰)
-
发布关键零部件,拿下批量订单,均胜电子抢先布局机器人赛道 当前,汽车与机器人产业迎来深度融合的关键节点。特斯拉、小鹏等头部企业争相入局,多种技术路径相继浮现,“具身智能”万亿赛道前景可期。产业变革之际,均胜电子(600699.SH)正以全新“汽车+机器人Tier1”定位,瞄准机器人端侧算力不足、补能不便、制造成本过高、缺少应用场景等行业痛点,与合作伙伴携手加速机器人行业发展。9月18日,均胜电子正式发布机器人AI头部总成和基于英伟达Jetson Thor芯片的全域控制器,以及新一代机器人能源管理产品,再次彰显技术实力。资本市场也“闻风而动”,均胜电子近期连续三个交易日涨停,股价创下历史新高,最新市值超500亿元。与行业共推机器人AI头部AI头部总成,简单来说就是机器人的头部部分。据均胜具身智能总经理胡爽介绍,机器人的智能可分为移动智能、操作智能、交互智能三大类,头部总成产品便是将AI多模态交互模型能力嵌到其中,实现自然、即时、智能的交互。 均胜电子与智元机器人公司代表现场共同发布了这一“AI总成”。从现场演示来看,均胜电子打造的AI头部总成,高度集成了柔性显示屏、麦克风阵列、深度相机、转动控制等多种功能。该头部总成所搭载的多模态AI交互系统,具备主动语音交互、人脸识别跟随、精准意图识别、实时图像生成等更智能、更自然、更实时的人机交互体验,让机器人“不仅懂你所言,更懂你所感”。并且,该头部总成采用一体化结构设计,在车规级的先进制造技术与工艺加持下,不仅造型流畅美观,也更加轻便、稳固。均胜电子董秘俞朝辉表示,不同机器人公司的头部形态都不一样,现在行业是百花齐放的状态,我们最重要的还是把产品的竞争力打造出来,让客户相信我们的技术在不同形态的机器人上都能应用。今年上半年,均胜电子与智元机器人签约战略合作,围绕包括机器人“大小脑”及关键部件的核心技术攻关、定制化开发、测试验证平台建设等方面开展深度合作,共同开拓国内外市场。海外客户方面,均胜电子已为某头部机器人公司批量交付机器人后脑勺、颈部、肩部、膝盖及手指等部件,同时正在探讨下一代头部显示方案和头部总成供货。基于英伟达Jetson Thor 的“超级大脑”除了机器人外在的头脑,此次发布会,均胜电子还发布了能够控制机器人全身的内在“超级大脑”——基于英伟达Jetson Thor芯片的全域控制器。这款最新的机器人全域控制器,AI算力高达2070 TOPS,是上一代Orin的7.5倍,CPU性能提升3.1倍,整体能效比提升3.5倍,支持机器人端侧百亿级参数大模型实时推理,让机器人大小脑能够高效运行。此外,这款机器人全域控制器更是支持车规级接口与协议,在数据传输可靠性与设备时钟同步精度等方面带来大幅升级,轻松应对高动态、高精度的复杂场景。 胡爽指出,汽车行业与机器人行业天然具有同源性和协同性。基于几十年的技术研发积累,均胜把车规级的标准体系引入机器人行业,能够保证机器人大规模量产时的一致性和稳定性。发布会上,均胜电子还与瑞士具身智能机器人公司RIVR(RIVR Technologies AG)宣布达成战略合作,并为这款全域控制器揭幕。具体来看,RIVR通过将轮足式机器人和人工智能算法相结合,大幅提高物流配送效率和可持续性,解决最后一公里物流配送难题。均胜电子将为RIVR提供定制化机器人域控制器解决方案和机器人能源管理系统解决方案,并依托全球灵活的供应链和生产制造能力,赋能RIVR在北美、欧洲及亚太地区的业务拓展。胡爽坦言,在之前的汽车零部件行业,更多是欧美来主导,国内更多是学习,但在如今的机器人行业,不论零部件还是整机本体,主要是国内在引领,反向输出给到海外的机器人公司。新一代机器人能源管理解决方案如果说“超级大脑”解决了机器人的思考问题,均胜电子发布的新款电池包和充电系统则解决了续航问题。据介绍,新款机器人电池包的能量密度大于280Wh/kg,能够支持最大36A持续放电,而且从电量0充至80%仅需10分钟,循环寿命超过1000次。在电池包形态上,有嵌入式与背包式两种,分别适用于机器狗、轮式人形机器人和双足人形机器人。 均胜电子机器人新一代无线充电系统,则能让机器人充电彻底摆脱人工干预,在多种环境下自动充电。2025年以来,均胜电子机器人能源管理相关产品已经向智元机器人、银河通用等合作伙伴送样。目前,均胜电子机器人关键部件解决方案已基本搭建完毕。此次发布的全新产品与此前的胸腔及底盘总成、传感器套件等机器人解决方案,形成完善的产品矩阵体系,使均胜电子具备系统化支持机器人公司产品的研发与制造能力。 报告显示,2024年中国具身智能市场规模全面突破4800亿元,至2031年有望突破万亿大关。具身智能当前已在柔性制造、交互服务、科研教学等场景实现小规模商业落地,预计3年内还将催生康养陪伴、商业服务等十余个新兴细分市场。谈及业绩贡献,俞朝辉表示,机器人其实刚进入产业元年,前景广阔,但未来要做到多少营收,还要取决于公司的产品创新和行业发展速度。国泰海通证券认为,均胜电子在人形机器人业务上持续推进与国内外头部客户的合作,有望为公司开辟汽车业务以外的第二增长曲线。
-
16个重点行业 800多个应用场景AI大模型加速在中央企业落地 原标题:16个重点行业 800多个应用场景AI大模型加速在中央企业落地据“十四五”期间,国务院国资委组织深入实施中央企业“AI+”专项行动效果初显,在能源、制造、通信等16个重点行业打造了800多个应用场景,积极推动国产大模型在企业的应用和落地。国务院国资委副主任李镇表示,当前人工智能技术加速迭代,深刻改变生产生活方式,重塑全球产业格局。作为长期扎根传统产业领域的中央企业,更要积极拥抱AI、科学运用AI,善于把“激动人心的概念”转化为“产业升级的大脑”,以AI新技术赋能新质生产力发展。据李镇介绍,“十四五”期间,中央企业“AI+”专项行动实施取得一定成效:成立了交通物流、绿色低碳、智慧能源3个行业数据产业共同体,建设行业数据集超过1000个;通信运营商加快向AI基础底座供应商转变,累计投资超百亿元,建成4个“万卡集群”,智算规模比“AI+”行动实施前增长超过2倍;突出产业特色,加快建设自主可控、安全可靠的基础大模型,“九天”“星辰”“元景”等大模型,已在能源电力、工业制造等领域加快应用;发起设立了“焕新社区”,汇聚了244个垂类行业模型、近160个高质量数据集,有效助力人工智能技术普惠应用。(高亢 王希)(人民日报海外版)