找到
847
篇与
互联网
相关的结果
- 第 33 页
-
央媒揭AI造谣利益链:有MCN机构每天发数千条谣言,收入万元以上 不久前,某公众号运营者钟某为蹭“海啸预警”热点,利用AI生成“30万居民撤离上海”“数十万上海市民正排队登车”等耸人听闻的言论。这条假消息被大量阅读、转发,引发恐慌情绪。其后,钟某被警方拘留。AI的广泛应用,为虚假信息的批量生产和病毒式传播提供了“温床”,给社会治理带来挑战。9月15日,《人工智能安全治理框架》2.0版正式发布。中央网信办负责人表示,要强化规范引导,不断完善人工智能安全监管制度和标准规范体系,促进人工智能健康有序发展。利用AI造谣日渐频繁今年3月,福建厦门公安机关发现,网上有信息称:“2025年3月3日,厦门市某化工厂发生一起严重的闪爆事故,造成3人死亡、3人受伤……”公安机关调查发现,这是发布者许某通过网上AI助手软件生成的虚假文章。公安机关对许某予以行政处罚。人工智能时代,利用AI造谣日渐频繁。公安部曾发布多起典型案例。如,湖南公安机关查处编造“民警离职潮”谣言案,江西公安机关查处MCN机构使用人工智能工具造谣案,重庆公安机关查处使用人工智能工具编造“爆炸事故”谣言案,广东公安机关查处编造“广州限制外卖配送”谣言案。相关人员均被绳之以法。清华大学新闻与传播学院新媒体研究中心2024年发布的《揭秘AI谣言:传播路径与治理策略全解析》研究报告指出,2023年以来,伴随AIGC技术的高速发展,一些造谣者不当利用AI工具,使得AI谣言量高速增长。报告指出,在各类AI谣言信息量占比中,经济与企业类谣言和公共安全类谣言占比最多、增速最快,其中餐饮外卖、快递配送等民生行业成为谣言重灾区。记者调查发现,人工智能技术让网络谣言内容更为逼真,常配有伪造的图片、视频甚至所谓“官方回应”,极具迷惑性。中国(深圳)综合开发研究院院长助理、数字经济与全球战略研究所所长曹钟雄等业内人士认为,AI不仅能高效生成虚假信息,而且可以通过过滤、推荐机制,将虚假信息聚合形成“证据链”,给普通用户乃至专业人士造成误导。流量变现驱动商业化黑产不久前,某著名食品公司向安徽省合肥市公安局经开分局报案称,多个网络平台上集中出现大量虚假、带有诱导性的负面文章,恶意攻击公司品牌及产品品质。公安机关立案调查,民警在多个平台发现关于该品牌“二氧化硫残留”“霉变”等内容的文章200余篇,且内容高度雷同。经公安机关核实,上述内容均为虚假信息。信息发布者陈某被行政拘留。陈某交代,今年8月,他在网上看到该公司相关信息后,想到知名企业涉及食品安全问题,容易引发公众关注。为博取流量,他使用AI工具编造内容,生成多篇虚假负面文章,在多个平台集中发布。业内专家指出,传统谣言生产依赖造谣者人工操作。如今,造谣者使用AI工具,只要输入特定关键词或指令,便可快速生成内容逼真、欺骗性强的谣言,从而实现谣言的大规模、高效率生产。去年3月,江西公安机关查处一起MCN机构使用人工智能工具造谣案。经查,王某某经营有5家MCN机构,共运营自媒体账号842个,长期组织公司人员选取热点文章,使用AI工具批量生成不实文章进行吸粉引流。“他平均每天通过AI工具发布4000到7000条信息,最高的一条收入是700元。经初步估算,每天收入在1万元以上。”办案民警说。记者发现,多起AI造谣事件背后,不法者的造谣动机主要源于牟取互联网内容平台给予创作者的奖励,以及为电商平台经营引流等;一些造谣者还可以从广告收入、合同推广、直播带货或其他相关的商业活动中获益。一名长期从事自媒体工作的博主对记者说:“以某大型内容生产平台为例,收益计算公式可以简化为‘有效播放量×互动系数×千次播放单价’。平台会对点击量高、互动性强的原创性内容给予更多收益分成。如果整体权重较高,一篇阅读或播放100万次的稿件,收益可超过1000元。”此外,不正当商业竞争也进一步催生了AI谣言黑色产业链。一位头部消费电子企业法务相关负责人透露,“金主”企业放出任务信号后,公关公司会找来一批自媒体运营者、KOL(关键意见领袖),利用AI技术生成虚假信息,大批量、高频次在社交媒体、网络平台等释放抹黑竞争对手的内容;此后还有营销公司及流量商加入,进一步扩散传播谣言。造谣一张嘴,辟谣跑断腿。不少受访企业表示,辟谣工作给公司带来了繁重的负担,需要耗费大量人力、精力去做解释工作,以消除不利影响。中国政法大学刑事司法学院教授于冲等法律专家指出,目前AI造谣已经形成商业化运作黑色产业链,一些造谣者以吸引流量变现牟取经济利益为目的。相关行业企业在应对AI谣言中面临维权难、舆论修复难等挑战。全链条治理封住AI“黑嘴”近期,公安部组织全国公安机关持续开展打击整治网络谣言工作,及时发现查处借热点舆情事件进行造谣传谣线索,重拳打击编造传播涉企业、涉民生、涉警情等领域网络谣言违法犯罪活动。今年7月,中央网信办在全国范围内启动为期2个月的“清朗·整治‘自媒体’发布不实信息”专项行动,重点整治的突出问题包括“利用人工智能生成合成技术,仿冒他人,或编造社会民生等领域虚假信息,欺骗公众”。面对AI谣言治理中的取证难、定性难、追责难等问题,单一治理手段已力有不逮。多位受访业内人士建议,遏制“AI谣言”需要多方协同发力,构建全链条治理体系。中国社会科学院大学互联网法治研究中心执行主任刘晓春说,新媒体平台应加强对AI造谣和“水军”行为的智能识别机制研究,进一步改革涉及AI内容的流量分发和收益分成机制,最大限度压缩通过AI造谣牟利的空间。专家指出,平台可通过逆向传播,利用相同渠道传播准确信息,抵消谣言影响;鼓励用户积极举报可疑内容,通过设立奖励机制增加参与度;持续研究谣言生成和传播机制,开发有效监测和防治技术等。于冲等建议,司法治理也需要“链条化”思维,针对AI造谣链条的前端发布主体、中端采取的技术手段和末端的后果危害,分别进行评价和判断,进行全链条打击和预防。最高人民法院研究室副主任喻海松等表示,治理涉企AI谣言,仅仅依靠刑法是不够的,要进一步修复社会信任机制,营造自觉抵制谣言的良好环境,同时鼓励AI治理合作,进一步推广AI伦理标准、治理技术和创新国际合作模式。上海市律师协会理事、上海博和汉商律师事务所执行主任王思维说,人工智能目前仍仅是一种技术手段,而非可承担法律责任的独立主体。对AI技术滥用行为的治理,应当坚持防惩并重原则,在确保科技创新积极性、AI技术合法合规使用的情况下,避免过度监管。受访律师提示,无论是个人还是企业,都应该自觉遵守相关法律法规,正确使用AI工具,不造谣、不传谣。一旦利用AI造谣或从事其他违法犯罪活动,将受到法律的严惩。来源:印朋、兰天鸣、鲁畅/新华每日电讯 -
OpenAI Codex彻底火了,4个官方前端提示示例给你 gpt-5-codex彻底火了,很多人已经从Claude code 转向 codex了,只能说用户都是墙头草,只要工具好,一秒切换,毫不犹豫,OpenAI 趁热打铁,官方codex示例和提示词也来了gpt-5-codex在响应式和移动端前端开发方面表现非常好,以下是一些示例和提示词1.像素游戏English:Make a pixel art game where I can walk around and talk to other villagers, and catch wild bugs.中文:做一个像素风游戏,我可以在里面四处走动,和村民们交谈,还能捕捉野生的昆虫 2.工作管理平台English:Give me a work management platform that helps teams organize, track, and manage their projects and tasks. Give me the platform with a kanban board, not the landing page.中文:给我一个工作管理平台,用来帮助团队组织、跟踪和管理项目与任务。我想要的是带有看板的平台本身,而不是它的介绍页 3.根据草图制作网页English:Given this image as inspiration. Build a simple html page joke-site.html here that includes all the assets/javascript and content to implement a showcase version of this webapp. Delightful animations and a responsive design would be great but don't make things too busy.中文:以这张图片为灵感,在这里创建一个名为 joke-site.html 的简单 HTML 页面。页面需要包含所有必要的资源文件(assets)、JavaScript 和内容,用以实现这个网页应用的展示版本。如果能有令人愉悦的动画和响应式设计就更好了,但别把页面弄得太花哨 4.根据线框图转化为应用程序English:"I have this wireframe, can you convert it to a real app for me? Generate HTML / inline CSS code for this website. Include CDN links for Tailwind / Bootstrap etc. Save your output to a file called index.html in the container's current directory."中文:我有一个线框图,你能帮我把它转换成一个真正的应用程序吗?请为这个网站生成 HTML 和内联 CSS(inline CSS)代码,并引入 Tailwind、Bootstrap 等框架的 CDN 链接。然后,将输出结果保存到容器当前目录下一个名为 index.html 的文件中 可以试试以上提示词,看看是否可以复现 -
谷歌Gemini超越ChatGPT,登顶苹果App Store 谷歌一直在努力追赶OpenAI在生成式人工智能领域的领先地位。如今看来,它终于在用户开拓中开始取得进展。本周,谷歌的Gemini应用在苹果App Store免费应用排行榜上夺得第一名,超过了近三年前引爆生成式AI热潮的ChatGPT。 谷歌的Gemini AI模型最近进行了一些更新,吸引了大量新用户。上个月,谷歌推出了升级版的“Flash”AI模型——2.5 Flash Image,其中新增了名为Nano Banana的图像编辑功能。该应用允许用户将多张照片融合在一起,并通过提示生成内容,例如将上传的照片制作成数字人偶。据Gemini应用负责人Josh Woodward上周在社交媒体上的一则帖子透露,这款产品为Gemini应用带来了1300万新用户。用户已向Gemini应用上传了5亿张图片。Woodward在另一条帖子中表示,由于需求过高,他们团队不得不在周末临时设置使用限制。截至7月,也即公司上一次披露数据的时间,谷歌CEO皮查伊在公司第二季度财报中表示,Gemini应用的月活跃用户已超过4.5亿。谷歌在消费级AI领域改善的表现也吸引了投资者的关注。周一,谷歌母公司Alphabet成为市值3万亿美元俱乐部的第四位成员,加入了英伟达、微软和苹果的行列。Alphabet股价今年已上涨33%,相比之下,纳斯达克指数同期上涨 16%。本月早些时候,谷歌还因一项有利的反垄断裁决受益,该裁决允许谷歌保留其Chrome浏览器。 -
日租金从2万元跌至2000元 机器人租赁价格大跳水 图源:视觉中国蓝鲸新闻9月16日讯(记者翟智超)"现在机器人租赁生意不好做,已经没有人租了,年初的热度完全被透支,市场正在回归理性。"深圳华强北一位机器人租赁老板对蓝鲸科技记者的这番感慨,道出了如今机器人租赁市场的现状。时间回溯至年初,宇树机器人登央视春晚的精彩亮相,瞬间将机器人应用热潮推向大众视野。商业演出、景区导览、企业年会乃至婚庆场合迅速成为机器人的"舞台",需求激增直接点燃租赁市场,一度出现"一机难求"的盛况,机器人日租金普遍高达2万至3万元,机器狗的日租价也一度高达数千元。部分投资者甚至加价近15万元抢购设备。然而短短半年,市场便急剧转冷,租金与热度亦同步大幅跳水。蓝鲸科技记者日前实地探访华强北时发现,此前遍布市场的机器人租赁档口大多已撤场,难觅踪影。就在今年4月,记者曾到访华强北机器人租赁中心,当时该区域几乎全是机器人租赁相关的档口。而如今再次前往,发现这里已遍布AI眼镜和AI硬件相关的商铺。 图片来源:蓝鲸科技记者拍摄/图一(4月拍摄)、图二(9月拍摄)据深圳机器人租赁从业人员透露,"高阶版(可跳舞)机器人的日租价已跌至3000元/天,而基础版(挥手、走动等简单功能)甚至低至2000元/天。相比过往的价格高点,跌幅最高达93.33%。值得注意的是,机器人租赁价格滑坡在二手平台体现更加明显。在闲鱼APP上,部分基础版机器人的日租价格可谈到1800元/天,机器狗的日租金更是低至300元/天。从2万元跌落至2000元"今年年初机器人市场需求迎来爆发式增长,但是像宇树这样的头部厂商产能完全跟不上订单的迅猛增加。"租赁商小陈向蓝鲸科技记者透露,"当时供需严重失衡,租赁价格被快速推高。今年四月份,一台机器人的日租金甚至一度涨到两万元,现在回想起来都觉得不可思议。"彼时,高利润很快吸引了大量参与者。据企查查数据,近一年新注册的"机器人"相关企业超过30万家,其中很多是缺乏技术积累的中小团队甚至个人投资者,仅凭几台设备便仓促入局。然而,这段爆发式增长并未持续太久,市场热度迅速降温。目前,多位从业者向蓝鲸科技记者表示,"基础版机器人日租金现已跌至1800—2000元/天,接近成本线,再降就要亏本。"小陈认为,供给过剩是市场遇冷的主要原因。"随着宇树产能提升,市场上可租赁的机器人数量几乎呈几何级增长,加上官方降价,整个价格体系都崩了。"他补充道,"需求端更多是出于新奇,复购率极低。大部分客户只是短期租用来引流,同一创意无法反复使用。目前也仅有展览展示类客户还会持续租用。"此外,机器人自身的能力局限也制约了市场发展。机器人研究员刘刚在接受采访时指出,"目前市面上的商用机器人功能仍比较单一,多数需依赖遥控,只能完成挥手、握手、转头等简单动作,缺乏真正的人机交互能力,难以适应复杂多变的场景需求。"面对新场景,拓展缓慢,小陈表示,"当前机器人的使用仍集中在商业演出和工业场景,但工业客户往往更倾向于直接采购而非租赁。"他表示,无论是面向C端还是B端,机器人仍被"功能单一"的标签所困,未能创造新的价值增长点。另一方面,高昂的运营成本不断挤压利润,许多从业者陷入"叫好不叫座"的困境。小陈算了一笔账:即便在一线城市,以日租2000元计算,扣除设备运输、人员差旅等成本,一天实际仅盈利几百元。"如果放到小县城,租金更低,根本很难赚到钱。"市场下行也加速了行业洗牌。据企业数据,近一年已有超过2.8万家机器人相关企业注销或吊销。小陈透露,行业火爆时,许多新手盲目入场,缺乏技术、没有客户资源,纯粹依赖市场红利生存。"潮水退去,这些人最早出局。现在还能坚持运营的,基本都是那些手握客户资源、具备运营能力的团队。"从业人员多途径开拓新发展空间尽管当前机器人租赁市场呈现收缩态势,不少从业者仍积极寻求突破,通过多种路径开拓新发展空间。在深圳,蓝鲸科技记者走访了解到,一批技术底子较扎实的团队,正在基于实际场景对机器人进行二次开发和功能升级。他们不满足于只提供会做简单动作的"展示型"机器人,而是努力提升其在功能、交互和智能层面的表现,为客户提供真正有用的高附加值解决方案。正如租赁商何涛所说:"我们要让机器人不仅‘能动’,更要‘好用’。"还有一些从业者跳出单纯租赁的思路,转向提供"机器人+内容+运营"的全套服务。不管是商场迎宾、景区导览还是企业活动,他们都能拿出与场景深度结合的定制方案。何涛坦言,"光靠租设备很难赚到钱,现在必须把硬件、软件和内容打包在一起做。虽然更重投入,但客户愿意为效果买单,黏性也明显提高了。"也有人干脆切换赛道。情绪疗愈类毛绒机器人因为价格亲民、交互感强,正在快速打开市场。一位原机器人租赁企业负责人刘峰向蓝鲸科技记者透露,"这类产品看起来不复杂,但销量相当惊人,做得好的公司一年能卖几个亿。跟贵重的人形机器人比,这种更轻巧、更有温度的产品反而更容易商业化。"刘峰也补充道,"目前这类玩具机器人盈利情况确实不错,利润率能做到50%甚至70%,但它仍处于早期阶段。随着更多人进场、技术逐渐普及,利润空间估计会逐渐收缩。"尽管短期内行业面临低潮,仍有一部分人选择坚守。老彭就是其中之一,他依然看好机器人租赁的长期潜力,"机器人毕竟是朝阳产业,不能因为租赁行业回归理性就全盘否定。"据恒州诚思预测,到2031年,全球智能机器人租赁收入规模预计将达到171.2亿元,2025–2031年间的年复合增长率约6.1%。但要真正迎来爆发,技术突破仍是关键。刘刚指出,"人形机器人在特定任务(如跑步、跳舞)中的极限运动能力已经很高,可要想真正融入日常环境,还得在通用场景自主性、运动与操作的精确稳定、人机交互安全等方面实现更大跨越。"(文中何涛、小陈、老彭、刘峰均为化名) -
"支付宝账号解除授权"冲上热搜 有人被"偷"了不少钱 在大数据时代每个人都是数据的提供者和使用者在便利生活的同时也暗含个人信息泄漏风险你知道自己在使用App、小程序时点击“同意授权”后提供了多少个人信息吗?多年来你又随手“授权”了多少第三方机构?在有意无意间开通的免密支付又“偷”走了你多少钱?今天(16日),“支付宝账号解除授权”的话题冲上微博热搜,引起热议。一位网友建议大家打开支付宝,查看“个人信息授权管理”,称有望不到头的“惊喜”,同时呼吁顺便查下“免密支付/自动扣款”。 网友发文截图“最早的2015年,一共171条。”“列表长到不见底……难怪一天到晚被骚扰电话袭击。”“11点半看到热搜,删了快一小时才删完。”很多网友照做后,感慨万千 网友发表评论截图“从2021年开通了优酷视频会员,扣费至今,完全不知道”“我发现我每个月捐20元,连续捐了5年多了……自动扣费”“每3个月被扫描全能王扣86元,连续扣了3年”……还有不少网友查了“免密支付/自动扣款”,瞬间炸锅。有人体验发现,自己不知不觉授权了121项,其中最早的是2015年底授权的“天弘基金”,用于购买余额宝,授权内容包括姓名、手机号及证件号码等敏感信息;最近的是今年8月底授权的“全国住房公积金公共服务”,授权内容为获取姓名、身份证号等身份信息……百余项授权中,部分授权内容是获取昵称和头像,但也有不少会涉及姓名、身份证号、手机号码等敏感信息,甚至很多软件、平台毫无印象,都不知道是干什么用的…… 网友的账号授权项目原以为去年年初才检查过的“免密支付/自动扣款”不会有什么问题,没想到一查,竟然又新增了15个项目签约了“免密支付/自动扣款”服务,包括付款码免密支付、乘车码支付、自动还款、打车软件、定期扣款投资理财、外卖软件、视频会员等,甚至不知何时开通了爱奇艺会员自动续费,7月1日被扣了238元会员年费…… 网友的扣款账单对此消费者可定期检查和管理“账号授权”和“免密支付/自动扣款”查看具体步骤为「打开支付宝」—「我的」—「设置」—「用户保护中心」—「个人信息授权管理」/「免密支付/自动扣款」及时解除不必要的“授权”关闭不需要的“扣费” 支付宝接除授权和关闭扣费的操作界面此外针对“自动扣费”的情况江苏消保委发布过消费提示提醒广大消费者除生活场景中高频率出现的小额公共服务外,对各种会员、出行、游戏等的自动扣款(免密支付),消费者在开通时要多权衡利弊,特别要留意首月(次)优惠后自动续费的约定。同时,定期清理微信支付和支付宝的免密授权、自动续费功能。此外,要养成定期核查账单的良好习惯,把银行、微信、支付宝、电信、水电气等账单逐一查对,看看是否有异常扣费,如果有异常扣费,要分析原因,及时进行处置,以免侵权行为长时间发生,自己还不知情。你开通“自动扣款”功能了吗?来源:支付宝、新浪微博、无锡发布 B48 -
顺丰香港首条无人机航线启航 测试跨海运送医疗物资 来源:中国新闻网中新社香港9月15日电 顺丰速运(香港)有限公司(简称“顺丰香港”)15日宣布,顺丰香港首条无人机航线已启航,来往位于香港岛的数码港和位于离岛区的长洲岛,进行一系列飞行及载物运输测试。 9月15日,顺丰速运(香港)有限公司(简称“顺丰香港”)宣布,顺丰香港首条无人机航线已启航。图为顺丰香港工作人员在装载无人机货物。 (香港特区政府新闻处供图)香港特区行政长官李家超在2024年施政报告中宣布成立发展低空经济工作组,推展“监管沙盒”试点项目是工作组主要工作之一。顺丰香港此前联手集团旗下丰翼科技(深圳)有限公司(简称“丰翼科技”)成功入选低空经济“监管沙盒”首批试点项目。新航线主要以医疗物资配送为场景。在日前举行的试飞活动上,随着香港特区政府运输及物流局局长陈美宝宣布“起飞”,丰翼物流无人机“方舟20”从数码港的无人机起降场起飞,经过全程12公里跨海飞行,仅用时18分钟便将药物运送至位于长洲医院附近的降落点。丰翼科技董事长兼首席执行官冯黎表示,使用物流无人机派送医疗物资可提升时效约六成。目前已成功完成超过40架次的超视距(BVLOS)试验飞行,包括部分载货飞行。无人机飞行表现稳定、通信信号畅顺、营运操作安全和成熟,符合安全营运预期。(完) -
机构:人工智能行业景气度仍有上行空间 河南省人民政府办公厅印发《河南省加快人工智能赋能新型工业化行动方案(2025—2027年)》,到2027年,规模以上工业企业智能应用场景覆盖范围实现从单点突破向综合集成跃升,人工智能产业规模突破1600亿元,建成全国重要的人工智能产业高地和创新应用示范区。东兴证券认为,人工智能行业当前处于政策、技术、需求三维共振阶段,叠加“人工智能+”行动带来自上而下的政策赋能及潜在资金支撑,国产芯片及云计算龙头在业绩上逐步验证、大厂CapEx持续投入推高行业发展确定性。人工智能行业景气度仍有上行空间,其在科技投资领域的主线地位较难撼动。中原证券认为,回顾2025年上半年,DeepSeek通过技术创新引领国产大模型崛起,助力AI应用大规模落地,人工智能创新持续推进,AI眼镜新品陆续发布,比亚迪推动“智驾平权”,全民智驾时代开启,特斯拉计划2025年生产数千台具身智能机器人,2026年计划将产能提升至5万台以上,具身智能机器人进入量产阶段。展望2025年下半年,AI算力需求持续景气,云侧AI算力硬件基础设施仍处于高速成长中,AI眼镜、智能驾驶、具身智能等端侧AI创新百花齐放。 -
华擎推 AI QuickSet WSL,简化 Win 平台部署 Linux AI 应用流程 IT之家 9 月 16 日消息,华擎 ASRock 昨日宣布推出 AI QuickSet 安装小帮手的第二代版本 AI QuickSet WSL,可让用户能更轻易地建立功能完整的 WSL(IT之家注:适用于 Linux 的 Windows 子系统)环境并部署一系列基于 Linux 系统的 AI 应用程序。 华擎表示,在 Windows 上建立合适的 AI 开发环境不仅步骤繁琐过程也相当耗时,而许多尖端的 AI 应用程序主要是在 Linux 环境下开发与运行,这对于想在 Windows 上使用 Linux AI 应用的初学者而言是不小的挑战。AI QuickSet WSL 可自动化整个工作流程,其建立在 AMD ROCm 平台之上并确保 WSL 环境已针对华擎的 AMD Radeon RX 9000 系列显卡完成加速预先配置。该工具应用内置已为 ROCm 进行优化的 PyTorch 等基础框架,此外还有多款可“开箱即用”的 AI 应用工具。 -
智库观点丨张毅:促进全体人民共享人工智能发展红利 ——访安徽省工业和信息化研究院院长张毅 图片来源/新华社 ■中国经济时报记者张娜 国务院日前印发《关于深入实施“人工智能+”行动的意见》(以下简称《意见》),明确提出2035年全面建成智能社会的目标。其中,提出实施“人工智能+”民生福祉行动,强调创造更加智能的工作方式、推行更富成效的学习方式、打造更有品质的美好生活。人工智能(AI)如何深度融入民生领域?安徽省工业和信息化研究院院长张毅在接受中国经济时报记者专访时指出,AI不仅是技术革命,更是提升民生福祉的重要引擎。在医疗、教育、养老等领域,AI通过精准、高效、普惠的服务,破解资源不均、成本高昂等难题。他强调,AI发展必须秉持“科技向善”理念,确保所有人尤其是弱势群体能够公平、有尊严地享受智能红利,真正实现全体人民共享发展成果。AI赋能民生:精准、高效、普惠是关键中国经济时报:《意见》将“人工智能+民生福祉”列为六大重点行动之一。在医疗、教育、养老等民生领域,人工智能如何深度融入民生领域、百姓生活?张毅:人工智能不仅对人类认知边界、劳动能力、决策水平带来极大拓展,同样也承载着人民群众对共享智能时代红利的殷切期望。在医疗上,人工智能辅助诊断系统能整合多源医疗数据以精准识别病灶,三维建模技术可有效支持复杂手术规划,AI药物研发能显著缩短药物开发周期,智能导诊系统可优化就医流程,远程诊疗平台能促进医疗资源均衡配置,急救资源调度系统实现精准响应等。在教育上,人工智能技术正在推动教育体系多维变革,个性化学习系统通过学情分析定制专属方案,VR/AR技术打造沉浸式教学场景,智能语音系统精准提升语言学习效果,教师端AI助手自动完成作业批改、课件制作等基础工作,虚拟实验平台丰富教学资源库。在养老上,智能家居设备实时监测老人生活状态,可穿戴设备进行健康数据动态分析,轨迹监测系统及时预警安全隐患,“AI机器人”创新应用为老年人提供生活协助,个性化健康管理系统依据用户特征定制养护方案。随着人工智能与社会民生各领域各环节广泛深度融合,其正在成为提升民众生活品质、推动社会智能跃升的全新引擎。推进“人工智能+”民生福祉,能以更精准、高效、普惠的方式,直接提升教育、医疗、养老、就业等关键民生领域的服务质量,破解资源不均、成本高昂等传统难题,让优质的社会服务如同水和电一样,更公平地惠及每一个人。中国经济时报:《意见》提出“创造更加智能的工作方式”“推行更富成效的学习方式”。您认为AI将在哪些领域创造新的就业机会?又如何与教育深度融合、赋能教育?张毅:在创造更加智能的工作方式方面,随着人工智能在智能化办公、智慧化管理、数智化决策等工作层面广泛深度应用,AI将进一步重塑人机协同模式与劳动分工结构,推动形成更加高效、多元、灵活的工作新范式。人工智能将逐渐成为每位职场人员的“第二大脑”和“体外肢体”,通过指导多个智能体或机器人,即可高效完成复杂工作任务。与此同时,人工智能已在“人所不能、人所不愿”等劳动力紧缺、环境高危岗位上展现出独特优势,正在有效缓解部分行业领域用工压力。可以预见,AI将在研发、数据科学、人机协调管理及伦理审计等领域创造新岗位。AI通过提供个性化技能培训平台、职业路径规划和人机协作实践环境,帮助劳动者精准定位转型方向、高效习得新技能,并通过模拟实战提升岗位适应力,从而系统性降低职业转型的难度与成本,应对可能的职业转型挑战。在推行更富成效的学习方式方面,“赋能教育”将是AI教育应用的核心。一是技术普惠,降低AI使用门槛。通过开发低成本、离线可用的轻量化AI工具,并严格审核算法公平性,确保不同地域和经济背景的学生都能平等获得优质教育资源,从源头抑制数字鸿沟。二是资源均衡,强化基础设施保障。加强政策供给,完善网络、设备等数字基建,建立开放共享的教育资源库,加强教师AI教学能力培训,使其成为技术高效应用的引导者。三是育人为本,培养自主学习能力。在教学中明确AI的辅助定位,通过设计启发式、协作式学习任务减少对AI的依赖,同时将数字素养教育融入课程,进而保证学生具备独立思考和分辨真伪的能力,实现真正的因材施教。AI发展须以人为本,向善、安全、有序并重中国经济时报:在推动人工智能与民生福祉深度融合过程中,如何处理好“推动应用发展”与“确保安全有序”之间的关系?张毅:人工智能在民生领域的创新应用必须和向善发展同频共振,既要防止误用、滥用或恶用人工智能,确保人工智能在直接面对民众过程中的安全性、可靠性、可控性和公平性,也要积极应对人工智能时代人民群众较为关切的医疗健康、就业影响、教育公平、精神文明建设等重要议题,确保人工智能技术发展始终服务于人民福祉。为防范人工智能在数据隐私、算法歧视及老年群体“智能鸿沟”等方面的风险,应采取综合性措施:通过出台专门人工智能法规,严格规范数据收集与使用,强化敏感信息保护;建立算法备案、审计与问责机制,提升透明性与公平性;同时,推动适老化设计与数字技能普及,鼓励“人机协同”服务模式,并加强伦理审查与公众监督,确保技术发展兼顾创新与安全,保障各类群体的合法权益。《意见》为我们描绘了一个智能技术赋能美好生活的广阔前景。其核心在于秉持“以人为本”的理念,确保人工智能的发展是向善的、普惠的,最终目标是让全体人民共享科技进步的成果,为中国式现代化建设提供有力支撑。实现这一愿景,需要技术创新、制度建设、人文关怀和社会共同努力相结合,稳步迈向智能社会。总 监 制丨王列军车海刚 监 制丨陈 波 王 彧 杨玉洋主 编丨毛晶慧 编 辑丨蒋 帅 -
AI投资,走到哪了? 定焦One(dingjiaoone)原创特约作者 | 高贵萍编辑 | 魏佳AI赛道,从不缺少追梦人。多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅达、蓝驰等投资机构,活跃在AI一线,陪跑创业者。这背后,是一个数万亿规模的庞大产业链,试图重构整个经济生态。如果将AI产业链拆解,可以大致分为三层: 基础层:算力、算法、数据; 技术层:大模型、平台工具、通用技术; 应用层:机器人、移动/穿戴设备、无人机及各行业落地场景。 这三层既环环相扣,又呈现出截然不同的发展机遇与投资逻辑。据烯牛数据统计,今年8月,AI领域共发生投融资事件163起,披露融资总额76.8亿元。与去年同期相比,数量增加66起,但融资金额下降43%。其中,智能机器人赛道投融资数量居首,共33起,紧随其后的是AI医疗、芯片与算力。表面看,投资人出手更频繁,但实际“掏钱”更趋于谨慎。在AI产业链上,有人卖铲子、有人挖金子。那么,谁淘到了真金?谁又只是在陪跑?我们与多位投资人交流后发现:技术层已成为大厂的游戏,投资机构机会寥寥;基础层需要深厚的产业积累与耐心,如今多由国资和人民币基金主导;应用层则被普遍看好,其核心在于对商业本质的洞察。对于投资人来说,仅仅“保持在场”已远远不够:要么跑得足够快,把握窗口;要么扎得足够深,搭建生态。停留在中间地带,反而风险最大。 技术层:大厂的游戏,创投的夹缝 大众印象中的第一波AI热潮,要从2016年AlphaGo战胜李世石讲起。这一事件将AI的热度从产业界推向全民。投资机构对一切搭上“AI”的项目怀有极大热情,之后AI四小龙商汤、旷视、依图、云从逐渐广为人知。第二波AI创投潮源于大模型的爆发。而大模型也是技术层最具代表性的赛道。 2022年11月底,ChatGPT横空出世,上线两月用户破亿。2023年3月,GPT-4推出,速度之快令人惊叹,这也直接引燃了国内大模型的创业热情。不到一年间,国内市场迅速进入“百模大战”。大厂派的百度“文心一言”、腾讯“混元”、阿里“通义千问”等大模型相继发布。创业派自美团联合创始人王慧文下场创立光年之外后,还涌现出百川智能、零一万物、月之暗面、Minimax、阶跃星辰、智谱AI,被称为“AI六小虎”。这些项目一度成为互联网大厂和投资机构追逐的焦点。但也有投资人在早期便预判,大模型更像是一场“大厂的游戏”。原因之一在于投资额巨大且风险较高。零一万物天使轮估值高达10亿美元;月之暗面天使轮融资20亿元,8个月后的A+轮融资超10亿美元。如此规模的投资,除了红杉中国等超头部基金,通常只有腾讯、阿里、美团这样的互联网巨头能够承担。另一原因是,这一投资窗口期非常短暂。部分项目在短短几个月内估值翻倍,机构常常还没来得及完成决策,就已经面临“投不起”的局面。以MiniMax为例,2022年7月Pre-A轮估值5亿美元,2023年6月A轮估值12亿美元,时隔数月后的B轮估值涨至25亿美元。第三个原因更加现实,大模型的回报周期长,变现路径模糊。基金需要考虑退出问题,相比之下,大厂拥有海量数据、雄厚资本和庞大的用户基础,投资大模型对它们来说是生死攸关的必选项——它们都害怕成为“AI时代的诺基亚”,抢占大模型先机,就是握紧通往未来的门票。基于这三点,有的早期机构选择谨慎观望。英诺天使合伙人王晟曾直言,“从OpenAI发布ChatGPT开始,我们就判断,这场战争最终赢的就是大厂。创业者的机会要么是卖给大厂,要么偏向某些垂直领域,这两个都决定了投资价值不会特别大。”如今,国内的通用大模型市场逐渐收敛为“基模五强”:字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek。DeepSeek依托幻方量化的资本优势,走开源与工程优化路线;字节、阿里坚持自研;智谱与阶跃星辰除了获得国资支持之外,前者拿到腾讯、小米、美团、阿里的钱,后者的投资人中也有腾讯身影。有意思的是,在大模型投资份额争夺战中,大厂联手成为投资史上少见的场景。腾讯押注Minimax、智谱、百川智能、阶跃星辰、月之暗面;美团在收购光年之外后,又投资了智谱和月之暗面;阿里投资了月之暗面、Minimax、智谱、百川智能和零一万物。现在,技术层为数不多的留给机构的投资机会,是垂直模型。相比通用大模型,垂直行业模型的商业化路径较为清晰。清智资本创始合伙人张煜表示,“只要真能降本提效、帮客户解决问题,行业模型是能赚到钱的。”据他透露,清智在行业模型赛道投的五六个项目都已产生收入,个别实现了盈利。当通用大模型的故事逐渐让位于垂直模型,属于创投机构的机会才真正显现。 基础层:卖水人赚翻了 如果说大模型的终局是大厂的游戏,那么,把视线拉回更底层的基础层,情况又如何?AI基础层具体包括以下四个方面: 算力:AI芯片/硬件厂商、云计算平台; 数据:数据服务与处理,数据提供商; 模型工具链:AI开发框架,MLOps平台,向量数据库; 安全与合规:AI安全、伦理与合规。 这些听上去“重资产”的赛道,普遍特点是需求确定、技术壁垒高、回报周期长。投资机构选择的是最经典的“卖水逻辑”。在19世纪美国的“淘金热”中,真正挖到金子的人寥寥无几,但卖铲子、卖水的人赚得盆满钵满。AI产业链也很相似:项目能否跑通未知,但基础层的“卖水人”几乎稳赚不赔。以两家代表性的公司为例。2025财年,为众多AI厂商提供算力的英伟达全年营收1305亿美元,净利润728亿美元,毛利率高达75%。在最近公布的2026财年Q2报告中,单季收入467亿美元,净利润264亿美元。被称为“国产AI芯片第一股”的寒武纪也实现业绩爆发,2025年上半年营收28.81亿元,归母净利润10.38亿元,毛利率55.93%。股价在8月底曾短暂超越贵州茅台,成为A股“股王”。 当然,这些头部企业估值高企、资本门槛极高,但投资人仍可以通过布局上下游更细分的环节,如高速互联、光电芯片、先进封装等,分享到产业增长的红利。在投资层面,不同类型机构打法各异:阿里、腾讯这类产业资本,看重的是被投企业能不能和自身业务形成协同。比如阿里陆续投资了寒武纪、地平线、深鉴科技等企业,因为阿里在电商、支付、云计算等业务中涉及大量的AI应用场景,对算力和算法的需求极大。投资基础层不仅能满足自身业务需要,也相当于是对阿里云业务核心优势的巩固和延伸。人民币基金为AI基础层的主流投资机构,它们深耕产业,会基于深入研究进行早期和后期的结合式布局。例如,同创伟业一方面重点布局具备确定性、符合IPO要求、业绩增长稳定,且符合政策导向的成熟项目;另一方面投早、投小,关注AI新技术、新架构和新人才。由江苏高科技投资集团内部混合所有制改革组建而成的毅达资本,在支持关键技术自主可控的同时,寻找AI产业链上关键环节的“必需品”。比如毅达近期投资企业南智芯材,是一家专注大尺寸铌(钽)酸锂材料的企业。毅达看中的是它在AI光电芯片、AR显示和高速通信等领域核心材料的战略价值。毅达资本合伙人周喆介绍,在算力层,毅达重点布局端侧/推理侧AI芯片、服务器CPU(特别是基于Arm和RISC-V架构)以及光互联、散热材料等企业。“沿着市场端需求反推底层技术,提升投资确定性。”这种沿产业链布局的做法,不仅能为被投企业导入产业资源、挤压估值泡沫,更能在交叉验证中捕捉产业拐点,有望获得更高投资回报。整体而言,目前投资人普遍认同基础层投资的两条确定性主线:一是“国产替代与自主可控”,覆盖光电芯片、高速互联、先进封装等领域。二是基础设施完善后,应用层将创造更大价值空间,又会拉动底层算力需求。更贴近终端应用市场、产品可快速迭代并专注于解决具体问题的企业有望快速崛起。聪明的钱,卖水、修路、搭桥。基础层的“卖水逻辑”,为它们提供了更稳健的回报。 应用层:最热闹的竞技场,从具身智能到低空经济 如果说技术层投资成为大厂的游戏,基础层是国资和产业资本的长期布局,那么应用层则是投资人当下真正大施拳脚的方向。不同场景与AI的结合,正在催生一批新机会。最火爆的细分领域是具身智能。8月,梅卡曼德、松延动力、聆动通用、智平方等多家机器人、具身智能公司接连完成新一轮融资。宇树科技、智元机器人也传出上市动向,将资本热情推向高点。 在王晟看来,如今机器人的核心价值已从硬件转向“AI智能”。负责认知决策的“大脑”借力大模型的突破突飞猛进,而负责运动控制、实时响应的“小脑”却因技术路线尚未统一,发展明显滞后。“现有的小脑技术路径,很可能在未来两三年内被完全颠覆。”基于这一判断,英诺投资了自变量机器人(自研机器人本体与模型协同发展)、千诀科技(“软”见长,强调“大脑”的通用性与适配性,支持多种硬件平台),还在核心零部件等产业链关键环节布局,以构建协同生态。他预测,到2026年下半年,市场评价标准将从“讲故事、发Demo”转向商业化落地。无法验证应用场景的公司,将被淘汰。光速光合合伙人蔡伟则认为:具身智能的终局将是“百花齐放”。“因为它要和使用场景甚至长尾场景结合。”举例来看,养老陪护机器人需要轻柔的触感和情感交互能力,而仓库搬运机器人更需要强大的负重和导航能力。这种根本性的需求差异,对机器人的形态、技能、智能水平、可靠性要求和成本都提出了截然不同的要求。低空经济是另一条备受资本关注的赛道。2025年上半年,低空经济赛道共发生融资事件52起,同比增长48.6%,涉及金额17.4亿元。其中无人机板块独占17起,融资金额近9亿元。合肥创新投、招银国际、中科创星、招商局创投等机构活跃出手。尽管多数项目仍处早期阶段,还没有开始商业化,但在低空经济被纳入国家战略新兴产业的政策利好,以及地方试点的推动下,市场预期被大幅拉高。资本押注的正是“先卡位、再兑现”的故事。与此同时,AR行业也正悄然回温。近年来AR领域几经起伏,“年年是元年”的调侃从未停歇。但现在,多个信号表明它正走向成熟。周喆的态度转变颇具代表性。他从曾经的AR怀疑者,如今已成为小米AI眼镜的日常使用者。“骨传导耳机功能解决了我的刚需,拍照和AI互动功能也很有意思,非常期待后续带光波导AR的AI眼镜推出”,这一体验的背后是整个行业的实质性进展。一方面,计算机视觉、语音助手与AI Agent的融合大幅提升了人机交互体验;另一方面,更具说服力的信号来自供应链。据周喆观察,多家海外大厂已开始在中国积极布局产能,这通常被视为辨别行业虚实的关键指标。“下游品牌可以讲述故事、炒作概念,但光子晶体等上游核心元器件的资本开支和产能布局无法造假。”周喆说。 结语 AI投资已步入深水区。热潮未退,但资本正回归理性,从追逐模型参数与宏大叙事,转向关注真实场景和稳定营收。基础层“卖水人”凭借高壁垒和稳定需求,持续享受行业红利;技术层的竞争格局初步稳定,盈利能力成为当下挑战;应用层则呈现出“百花齐放”的多元生态,机器人、无人机等赛道不断诞生新机会。未来,能够穿越周期的,不会是估值虚高的故事大王,而是那些真正理解产业痛点、具备工程化能力与商业化耐心的参与者。AI的终局,不是垄断,而是共生。技术、资本相互支撑,共同推动产业生态向前。*题图及文中配图来源于pexels。 -
每周7亿人都在如何用ChatGPT?OpenAI最全报告来了 首份最全ChatGPT用户研究报告来了!就在刚刚,OpenAI联合哈佛大学经济学家David Deming发表了一篇新论文——标题为《How People Use ChatGPT》,详细论述了ChatGPT从2022年11月上线到2025年7月的被使用情况。 为什么要在这个节点推出报告,或许这也和ChatGPT取得的阶段性成果有关。截至今年7月,ChatGPT的周活跃人数已经超过7亿,每周发送的消息总量达到180亿条。面对这一庞大用户群及消息量,论文通过分析150万次大规模对话核心想了解: 人们都在用ChatGPT干什么? 究竟是谁在用ChatGPT? 如果你也对这些问题感兴趣,不妨接着看——人们用ChatGPT干什么?对于第一个问题,首先需要强调一点:和以往基于问卷调查的方式不同,这一次研究团队主要基于内部对话数据,采用自动化分类器并结合隐私保护方法来分析ChatGPT的实际使用情况,可以说更科学合理了。具体数据集可以分为三类:1、Growth数据集:2022年11月~2025年9月所有消费者计划(Free/Plus/Pro)的消息总量与基础人口统计。2、分类消息样本:2024年5月~2025年6月随机抽取约110万条去标识化消息,用LLM分类器标注用途、主题、交互类型。3、就业数据:约13万用户的职业与教育(来自公开资料),通过数据Clean Room做聚合分析。基于以上数据,论文发现ChatGPT主要被用来完成日常任务。 四分之三的对话侧重于实用指导、信息搜索和写作。其中写作是最常见的工作任务,而编程和自我表达仍然是小众活动。 三大主要使用类型的具体占比如下: 实用指导(28.8%):如个性化健身计划、创意构思、技能教学等; 信息搜索(24.4%):人物/事件信息、食谱、产品咨询等; 写作(23.9%):邮件 / 文档生成、文本编辑、翻译、总结等。 而像计算机编程、社交(如人际关系反思、游戏角色扮演等)这样的需求则相对占比较小。 此外,人们使用ChatGPT的模式也可以分为三类:询问(Asking)、行动(Doing)和表达(Expressing)。结果发现,大约一半的消息(49%)属于“询问”,这是增长最快、用户评价最高的类别,说明人们更倾向于将ChatGPT视作顾问,提供建议和决策参考,而非简单地完成任务。“行动” 类占40%,其中约三分之一与工作相关,包括起草文本、规划或编程。“表达” 类占11%,主要涉及个人的反思、探索和娱乐,而非明确的问题求助或具体任务。 小结一下,目前ChatGPT主要还是担任顾问角色,且最常被用于实用指导、信息检索和写作。重点提醒,为了在研究过程中保护用户隐私,他们核心采取的措施如下:一是在分析用户消息时,没有人能直接查看原始消息内容,而是通过自动化工具对去标识化和隐私信息被删除后的数据进行分析。二是研究团队无法直接访问个人级别的详细信息,并且不会对少于100名用户的群体进行数据汇总。 那么接下来的问题是——都是谁在用ChatGPT?关于使用人群,论文得出的最核心观察是:ChatGPT的性别差距已经大幅缩小。在早期阶段(2022年底-2023年初),大约80%活跃用户为典型男性名字,而到今年,典型女性名字用户占比却实现了反超: 男性名字已下降至48%,女性略超男性,性别使用差距基本消除。 从年龄分布来看,18-25岁用户属于成年用户中使用ChatGPT最多的,贡献了46%的消息量。且年龄越大,工作相关消息占比越高。此外,从用户分布地区的经济水平来看,ChatGPT尤其在中低收入国家增长迅速。截至今年5月,ChatGPT在最低收入国家的使用增长率是最高收入国家的4倍以上。 总之,从用户数据来看,ChatGPT仍在被进一步普及。更多细节欢迎查看完整报告。完整论文: https://www.nber.org/system/files/working_papers/w34255/w34255.pdf -
Snap 发布史上最强 AR 系统:引入 AR 版“抖音”应用 Spotlight IT之家 9 月 16 日消息,科技媒体 9to5Mac 昨日(9 月 15 日)发布博文,报道称 Snap 宣布推出全新 Snap OS 2.0 操作系统,专为其即将上市的 Snap Spectacles 增强现实眼镜设计。Snap 称,新系统将大幅增强眼镜的独立使用体验,无需手机或外部计算模块即可运行完整 AR 应用。 Snap OS 2.0 的核心升级之一是全新网页浏览器,从信息查询延伸到交互娱乐,进一步拓展 AR 眼镜的应用场景。该浏览器不仅加载速度更快,还引入了带有小组件和书签的新主页,并支持 WebXR 技术,为用户提供在浏览器中直接体验沉浸式三维内容的能力。在内容交互方面,Snap OS 2.0 中的另一个新第一方应用程序是 Spotlight,它相当于 Snapchat 手机应用程序的 TikTok 和 Instagram Reels。当前的 Spectacles 硬件视野垂直视野高于水平视野,因此非常适合观看这样的垂直视频。同时,新的 Gallery 镜头模式提供旋转式画廊界面,方便用户浏览、整理并发送或发布通过眼镜拍摄的视频和照片。IT之家附上相关视频演示如下:针对移动使用场景,Snap OS 2.0 增加旅行模式。当用户在飞机、火车或汽车等移动交通工具中使用 Spectacles 时,该模式可让所有 AR 内容保持固定位置,不会因环境移动而漂移,从而保证更稳定的视觉体验。热门 VR 舞蹈节奏游戏《Synth Riders》也将登陆 Spectacles。这意味着用户不仅可在眼镜中浏览网页、观看 3D 内容,还能直接进行体感互动游戏,进一步丰富娱乐体验。Snap 表示,未来还将持续通过系统更新扩展更多功能与应用。 -
当V聚场遇见AI,一场跨界座谈开启杨浦数字生活新篇章 茶余饭后,点开短视频就能学到科学知识;生活有难题,“凡事问AI”已成为市民的日常习惯……随着技术日新月异,AI与互联网内容创作掀起知识大众化浪潮,全社会正在共同见证一场前所未有的人工智能产业革命。近日,在由杨浦区委网信办主办、火山引擎与抖音联合支持的“杨浦V聚场×城市AI工厂——AI产业和内容创作新动能”跨界座谈会上,政府代表、平台企业负责人、内容创作者和AI技术专家齐聚一堂,一起探讨人工智能如何赋能内容创作,为杨浦“城市AI工厂”建设注入新动能。 活动现场,“我在杨浦遇见AI”V聚场·抖音短视频挑战赛正式启动。活动从即日起持续至9月26日,面向广大市民、企业征集短视频作品,号召大家用镜头捕捉杨浦的真实AI应用场景,展现人工智能如何让城市更智慧、生活更便捷。例如:智能停车、AI导购、智慧公交、AI在线服务、智能医疗、数字化办公等。带话题#我在杨浦遇见AI和#V聚场,发布抖音视频,即可参赛。“AI技术已经走向街头巷尾,我们希望让市民们用发现美的眼睛,去发现AI带来的便利和乐趣,感受美好生活。”活动相关负责人表示,“这是一场科技与城市的双向奔赴。”据介绍,挑战赛主办方将根据活动截止当日各作品的播放量、点赞量等相关信息综合评定,获奖者将获得流量券,并获颁“杨浦AI体验官”证书。活动旨在进一步推动AI技术从会场走向生活、融入市民日常,鼓励公众主动记录和分享杨浦的AI故事,增强社会参与感和区域认同感。 当前,杨浦已集聚众多优秀创作者。现场随后开展“人民城市·秀带杨浦”城市体验官颁证环节,“籽岷”“不刷题的吴姥姥”、晏秋秋、“G僧东”“才疏学浅的才浅”等12位创作者代表上台,授予他们“人民城市·秀带杨浦”城市体验官的荣誉称号。在平台代表分享环节,火山引擎公共服务行业解决方案总监徐春芳首先登台。她详细介绍了火山引擎如何开启杨浦“城市AI工厂”建设的探索实践:“我们的愿景是推动AI技术与杨浦数字经济领域深度融合,让AI成为产业升级的‘加速器’和改善民生的‘助推器’,真正实现‘人民城市人民建,人民城市为人民’。”抖音知识负责人顾文豪则从内容传播角度,进行了《抖音,如何成为AI产业最新成果的“放大器”》主题分享。“短视频作为用户生产内容与专业生产内容融合的载体,不仅扩大了知识生产的边界,还开启了知识传播的新入口,”他提到,“我们每个人都是这场知识大众化浪潮的见证者。”在沙龙分享环节,“籽岷”“林亦LYi”等互联网内容创作者和欧坚网络平台事业部总经理葛昱煌围绕“AI赋能内容创作实践”“科技短视频助力杨浦‘内容’出圈”“AI赋能平台新突破”三个话题进行分享。记者还在活动中了解到,开业两个月来,V聚场已吸引21家优质主体入驻,包括“苏星河牛通”“G僧东”等13家头部大V的工作室以及8家MCN机构,磁吸效应已然显现。这里设置了政务服务中心,多个政府部门派驻服务专员坐镇咨询,还不定期举办各类行业交流活动,初步形成了“线下聚集、线上辐射”的良性生态。本场跨界座谈会正是V聚场系列活动的重要组成部分,展现了杨浦区打造数字内容生态圈的决心和实力。“V聚场不仅仅是一个物理空间,更是一个连接政府、平台、企业和创作者的枢纽。”区委网信办相关负责人介绍,“我们希望通过这个平台,降低创作门槛,汇聚优质资源,培育更多能够代表杨浦、展示上海的数字内容创作者,鼓励大家讲好杨浦故事、上海故事、中国故事。”未来,杨浦区将持续聚焦技术融合、生态构建与人才培养三大方向,不断拓展AI在内容创作、商业服务、城市治理等多领域的应用深度,全力构建开放、协同、可持续的“城市AI工厂”,助力上海打造全球数字经济发展高地。原标题:《当V聚场遇见AI,一场跨界座谈开启杨浦数字生活新篇章》栏目编辑:顾莹颖来源:作者:新民晚报 孙云 -
中证报谈芯片:持续突破,国产AI芯片抢夺市场窗口期,产业链加快技术迭代 从阿里宣布未来三年投入3800亿元,到百度昆仑芯斩获中国移动十亿元级大单……在AI算力需求全球爆发的背景下,中国国产AI芯片产业正迎来一个关键的战略机遇期。9月16日,《中国证券报》接连刊发两篇文章,深入分析了中国芯片产业的最新动态。文章认为,国内芯片厂商和光通信产业链正紧抓这一关键“窗口期”,加速技术迭代和市场布局。 国产AI芯片抢占市场窗口期 《中国证券报》援引行业人士观点称,市场对AI芯片的强劲需求,正“推动国内芯片厂商和互联网大厂利用英伟达芯片供应不稳定的窗口期全力抢占市场”。文章指出,Bernstein在7月发布的研报预计,2025年国内AI芯片需求将达到395亿美元,市场的本土化率将从2023年的17%增长至2027年的55%。这一趋势背后,是国内互联网巨头的重金投入和国产芯片厂商的商业化提速。 大厂加码:文章提到,阿里已宣布“未来三年投入3800亿元建设云和AI硬件基础设施”,其首席执行官吴泳铭透露,过去四个季度,公司在AI基础设施及产品研发上已累计投入超1000亿元。同时,百度昆仑芯也宣布中标中国移动十亿元级订单,成为“互联网大厂自研芯片获外部大额订单的重要案例”。 业绩亮眼:需求正直接转化为国产芯片厂商的业绩。文章数据显示,寒武纪上半年营收同比暴增4347.82%,主要由云端产品线贡献;海光信息上半年营收增长45.21%,公司表示“国产高端芯片市场需求持续攀升”。芯原股份也公告称,截至二季度末在手订单达30.25亿元,新签订单中AI算力相关占比约64%。 行业人士表示,目前国内如寒武纪、海光信息等公司“在AI推理芯片上的能力已经不错”,当务之急是抓紧时间提升产能。为此,华虹公司、中芯国际、寒武纪等企业近期正通过并购整合与定向增发等方式,加速扩张。算力需求驱动,产业链加速迭代 AI芯片的爆发式增长,也对上游产业链提出了更高要求。文章中指出,“AI算力需求高速增长,推动核心器件、封装技术快速迭代”,其中光模块成为焦点。文章称,AI产业发展将“直接推动光模块需求激增,1.6T模块成为竞争焦点”。在近日的光电博览会上,立讯技术、爱德泰等厂商已展示了共封装光学(CPO)、1.6T光模块等前沿方案。上银基金权益投研部基金经理惠军表示,“在AI算力集群与超算中心建设的双重推动下,2025年全球光模块市场迎来结构性爆发,预计市场规模达121亿美元。”他预计CPO“加速渗透,预计2026年在AI数据中心的渗透率超20%,成为下一代光互连主流方案”。强劲的需求已反映在相关上市公司的财报中。新易盛上半年净利润同比增长355.68%;中际旭创上半年净利润增长69.40%,公司表示“800G和1.6T产品的需求增长迅速”。挑战与瓶颈:产能与生态建设 尽管前景广阔,但文章也明确指出了产业面临的瓶颈。首先是产能与交付。国盛证券表示,行业挑战已从“‘需求在哪里’转变为‘如何按时交付’”。中际旭创亦在投资者关系活动上坦言,“一些重点原材料的供应偏紧张”。为应对挑战,新易盛、天孚通信等公司正加速其泰国工厂的产能扩充。其次是更为关键的软件生态。文章援引清华大学计算机系教授翟季冬的观点称,国内算力硬件水平已接近甚至超过英伟达同类芯片,但在软件生态上仍有提升空间。他强调:“想要完善软件生态,底层系统中的调度器、内存管理……中层的编程语言、AI编译器、算子库,上层的编程框架……几乎缺一不可。”阿里巴巴集团首席执行官吴泳铭也提到,未来云计算市场集中度将提高,开发者会倾向于选择“具备全方位技术产品组合的厂商”。上海证券的研报分析认为,完善的软件平台是发挥硬件性能、降低用户门槛的关键。文章最后总结,国内头部企业正持续完善AI芯片生态,以进一步提升市场竞争力。 -
一次能独立编程7小时!OpenAI发布GPT-5-Codex 9月16日消息,周一,OpenAI正式推出新一代AI模型GPT-5-Codex,为其智能编程助手Codex注入全新动力。该模型凭借“动态思考”能力,可自主处理复杂的智能体软件工程任务。 作为GPT-5的专项优化版本,GPT-5-Codex针对“智能体编码”场景深度定制,能够持续数小时独立完成复杂的编程任务,其核心能力涵盖调试、大规模代码重构和从零构建项目。这一模型旨在为开发者打造更统一的“虚拟编程伙伴”,并在竞争日益激烈的AI编程市场中直面微软、谷歌等对手的挑战。 从9月15日起,GPT-5-Codex将陆续集成至Codex的全系列产品中,开发者可通过终端、集成开发环境(IDE)、GitHub、网页端或ChatGPT使用该工具。它将成为云端任务和代码审查的默认引擎,同时支持通过Codex命令行接口(CLI)和IDE插件在本地运行。 OpenAI表示,未来将在其应用程序编程接口(API)中增加该模型的选项,方便开发者更便捷地集成到现有应用或开发新应用。目前,所有付费ChatGPT用户,包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者,均可使用该模型。 自OpenAI于4月份推出开源CLI、5月份发布网页版以来,Codex在功能上持续演进。两周前,OpenAI将这些功能整合为与ChatGPT账户联通的统一体验,使开发者能够在本地和云端环境间无缝切换而不丢失上下文。而GPT-5-Codex的推出,则在这一基础上进一步强化了其工程实践能力。 专属定制的智能编程引擎 与通用型GPT-5不同,GPT-5-Codex专为“智能体编码”优化,其本质是让AI智能体担任开发者的协作伙伴,能够独立完成编码、测试和修改等任务,单次持续工作时长可超过7小时。 这听起来与科技网站VentureBeat创始人马特·马歇尔(Matt Marshall)提出的“智能体群”趋势有相似之处,但侧重不同:后者强调多个(3个或更多)具备不同角色的智能体进行协同作业,而GPT-5-Codex则专注于提升单个智能体的深度工作能力。 OpenAI表示,GPT-5-Codex基于真实的工程任务训练,覆盖调试、添加测试、项目搭建和大规模重构等场景,特别在代码审查方面表现突出。它不仅能理解代码库结构,还能推理依赖关系并通过测试验证代码的正确性。 GPT-5-Codex的核心创新在于其“自适应思考”能力,即可根据任务复杂度自主调整推理时间。对于错误修复等简单任务,响应速度较前代提升明显;而面对复杂项目时,它则能持续运行数小时。测试中,该模型曾独立完成了持续超过7小时的重构任务,通过多次迭代最终交付了可用的方案。 OpenAI的Codex产品负责人亚历山大·恩比里科斯(Alexander Embiricos)指出:“GPT-5-Codex可在处理任务5分钟后,自主判断是否需要额外投入1小时继续工作。”这种动态决策能力不依赖于GPT-5的“路由机制”,而是通过模型内生的训练过程实现,使开发者无需手动调整即可处理不同时长的任务。 目前,OpenAI内部已将GPT-5-Codex集成至代码审查流程,每日可发现数百个问题。值得注意的是,在此次发布前,Codex已基于通用GPT-5模型运行约一个月,而此次升级标志着其正式转向专为智能体软件工程打造的模型。 全链路开发生态升级 伴随着新模型的发布,Codex产品线也迎来多项功能增强: · Codex CLI:已围绕智能体工作流全面重构。CLI允许开发者直接附加图像(如线框图或截图)、共享上下文,并通过内置的待办清单跟踪任务进度。它还新增了简化的审批模式、更规范的工具调用与差异(diff)格式展示,以及对更长会话的支持。OpenAI已将CLI开源,这意味着团队可以检查或扩展这一衔接模型与开发环境的工具套件。 · Codex IDE插件:现已支持VS Code、Cursor及类似的编辑器。该插件让开发者能够在编辑器内直接预览本地修改并调用Codex编辑代码,同时在云端与本地环境间切换时保持上下文一致,实现更顺畅的协作。OpenAI表示,该IDE插件已迅速成为最受欢迎的使用方式。 · Codex云端环境:在后台,OpenAI对底层架构进行了优化,使任务完成的平均时间缩短了90%。云端智能体现在能够自动配置环境、按需安装依赖项,并支持UI任务的截图处理。开发者可以将前端任务交给Codex,它会自动启动浏览器、检查进度,并将截图附加到GitHub的拉取请求中。此外,Codex还新增了直接输出截图的功能,开发者无需在本地运行代码即可直观确认结果。 · 代码审查自动化:在GitHub仓库中启用后,Codex会在拉取请求的各个阶段自动进行审查,发现问题并在同一讨论线程中提出修复建议,甚至可以直接应用修改。开发者还可请求专项审查,例如安全漏洞检测。与传统静态分析工具不同,Codex会获取完整的代码库,跨依赖关系进行推理,并在反馈前运行测试。 开发者反馈与内部应用 早期使用者的反馈显示,Codex正在改变开发工作流程。 Duolingo高级软件工程师亚纶·王(Aaron Wang)表示,Codex在后端代码审查中超越了其他工具,能发现兼容性问题和其他工具遗漏的缺陷。 维珍大西洋公司数据与AI副总裁理查德·马斯特斯(Richard Masters)指出,现在只需在拉取请求中留言,Codex几乎能即时生成更新,大幅减少沟通成本。 在Cisco Meraki,技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项,Codex还交付了经过充分测试的高质量代码。 Vanta公司高级人工智能与机器学习工程师凯文·罗伊尔(Kevin Royer)表示,Codex通过在后台处理任务并返回清晰易懂的反馈,有效帮助他保持工作的流畅性。 Ramp公司AI Dev X团队负责人奥斯汀·雷伊(Austin Ray)特别提到,Codex成功发现了一个被其他代码审查工具遗漏的活动错误。 在OpenAI内部,Codex也已成为安全、前端和基础设施等领域团队日常开发中的“编外队员”。过去一个月中,Codex的使用量增长达十倍,体现出其在内外部应用中的依赖度显著提升。 安全机制与定价策略 OpenAI强调,Codex始终运行于沙盒环境中,无论是在云端还是本地部署,默认均禁用网络访问。开发者可根据需要授权特定功能(如网络搜索或外部工具连接),但OpenAI仍建议部署前对Codex的输出结果进行人工审核。 此外,针对生物、化学等敏感领域,OpenAI将GPT-5-Codex归类为“高能力”模型,并已实施相应的保障措施以严格控制潜在风险。其定位并非取代人工代码审查,而是作为额外的质量保障层。 Codex已全面集成于OpenAI的付费订阅服务中,包括ChatGPT Plus(20美元/月)、Pro(200美元/月)、Business(25美元/用户/月)、教育版(Edu)和企业版(Enterprise),但后两个版本尚未公开定价。 各版本的使用限制有所不同:Plus、Edu和Business版本每周提供有限次数的专注编程会话;Pro版本则支持跨多个项目的整周开发;Business版本提供可扩展的额外信用额度;Enterprise版本则为大型团队设计了共享信用池。 战略定位:与Copilot互补 通过GPT-5-Codex,OpenAI将Codex的定位提升为一个智能编程伙伴,远超传统的自动补全或调试工具。它能自适应不同规模的任务需求,自主决策工作时间,并深度集成到开发流程中,为开发者提供跨环境的一致体验。 值得注意的是,OpenAI明确表示Codex不与GitHub Copilot等代码补全工具竞争,而是形成互补关系:开发者可同时使用两者,即Copilot专注于代码级的实时辅助,而Codex致力于更高阶的任务委托和自动化开发。(小小) -
PayPal(PYPL.US)推出个性化链接转账服务 并将加密货币整合至支付流程 智通财经APP获悉,PayPal(PYPL.US)周一宣布推出一项全新的收付款服务,用户可通过生成个性化一次性支付链接,在任何对话场景中分享该链接即可完成资金流转。 声明称,即日起,美国地区用户可通过PayPal创建个性化支付链接。该服务计划于9月下旬拓展至国际市场,首批覆盖英国、意大利等国家。此外,PayPal表示将进一步升级P2P支付体验,加密货币即将直接整合至其应用内的全新P2P支付流程中。这一调整将为美国用户带来便利:用户可直接向PayPal、Venmo(PayPal旗下支付平台),以及全球范围内其他支持加密货币与稳定币的数字钱包,转账比特币、以太坊、PayPal美元稳定币等数字货币。 -
对话卓益得创始人李清都:人形机器人估值没泡沫,百万亿风口刚刚开始 上海理工大学教授、卓益得机器人创始人兼CEO李清都自2025年初开始,具身智能和人形机器人已成为行业焦点,该领域融资总额已超过260亿元,正处于类似于ChatGPT引爆“百模大战”的投资热潮当中。近期,特斯拉CEO埃隆·马斯克(Elon Musk)表示,预计公司今年将生产5000台Optimus人形机器人。他强调,一旦人形机器人实现规模化,未来Optimus“擎天柱”可能占据特斯拉80%的价值。而目前,特斯拉市值高达1.24万亿美元。这对于全球人形机器人行业来说无疑是一枚“强心剂”。据美林证券最新数据显示,全球人形机器人出货量将从去年的2500台,增至2025年的18000台,到2060年,全球人形机器人数量将达到30亿台。另据彭博数据,未来全球量产的人形机器人中,将有超过一半来自中国公司。而大量对标特斯拉Optimus的中国智能机器人中,卓益得机器人(DroidUp)无疑是国内最为低调且具备一定技术实力的通用人形机器人公司。卓益得机器人成立于2021年,前身为深圳市行者机器人技术有限公司,成立于2016年,源于中德有史以来最大AI合作项目,是国内很早进入双足机器人赛道的企业之一,团队在双足动态行走和跨模态学习研究方面拥有超过20年的经验,主要围绕科研教育、商业服务、居家康养等场景提供具身智能机器人解决方案。早在2015年,李清都团队研发的“行者一号”人形机器人,以0.8度电持续行走超134公里,连走两天三夜,打破了康奈尔大学保持的足式机器人行走最远距离吉尼斯纪录,至今未被打破。2024年,卓益得机器人宣布完成1亿元A轮融资。随后,卓益得发布全球首款基于仿生肌腱驱动技术的模块化人形机器人“行者二号”,并在2025年北京亦庄全球首届人形机器人半程马拉松赛获季军,引发关注。今年7月,卓益得发布“行者三号”人形机器人,其身高约1.7m、重约38kg,依托肌腱仿生驱动技术,机身较行业同级轻20%以上,行动灵活且能耗降低50%,动态耦合节能技术则让其动态续航达6小时。2025 inclusion·外滩大会上,笔者见到了上海理工大学教授、卓益得机器人创始人兼CEO李清都,我们谈了很多行业泡沫化、价格战等关键话题。在与笔者独家交流中,李清都反复提及人形机器人的“安全性”。李清都认为,人形机器人量产过程中,首先解决应用场景问题,其次产品必须安全、稳定和可靠。而当下很多全尺寸人形机器人的安全性还未达标,因此,卓益得一直将安全性放在机器人研发首要考量的目标,只有解决好场景和安全问题,才能实现真正意义上的人形机器人量产。量产方面,卓益得主要将核心研发放在上海,而其位于河南郑州的子公司卓益得人形机器人(河南)有限公司,定位是试图解决人形机器人的量产问题。今年小批量的量产规模大概在数百台,明年在2000-5000台左右。谈到人形机器人“泡沫化”话题,李清都表示,从估值角度上来说,人形机器人企业仅估值100亿-200亿,行业还远没到“泡沫化”阶段。未来,人形机器人将与手机、汽车共同驱动百亿级市场,解决平衡性、高效性、智能性、安全性、经济性,实现人形机器人量产和盈利,从而达到机器人ROI(投资回报率)。在李清都看来,如何在下一个5年中生存,是人形机器人行业的关键问题。所以,企业必须找到人形机器人场景,真正帮助客户解决实际问题。未来五年,人形机器人行业会出现比较大的整合和分化,很多企业需要转向垂直和特种赛道。李清都强调,当前,大家都在同一个起跑线上,任何企业都有一个可能会被“颠覆”的机会。未来1-2年内,人形机器人行业会解决“泡沫化”,以及进入家庭场景的技术挑战等。“(国内人形机器人)所有的投入都会取得回报,只不过很多企业最后可能会切换其他赛道。反正我们养了这么大池子鱼,这个鱼最后是否到湖水,其实无所谓。”李清都称,每个行业其实都有一些细分领域,我们随时切进去,都是有机会的。 (图片来源:卓益得双足人形机器人展示)以下是卓益得机器人创始人李清都对话整理: 问:你曾提到,人形机器人降价到数万元并不是一件好事。那么,人形机器人价格应该在哪个价格区间可以达到“平衡点”?李清都:2023年的时候,我和很多机器人行业人士聊天的时候就谈到价格战问题,当时我说国内不要去搞价格战,不要做得像协作机械臂一样。 问:然而最后大家没听劝,打了价格战。李清都(摊手):但是,我也觉得不是他们(企业)的问题,很多人可能被资本裹挟着。所以在我看来,中国(机器人领域)创业其实还是需要有一个好的生态。实际上,我认为人形机器人的价格,应该就像我们笔记本电脑或手机。你看,每年iPhone发布的时候,都是同一个价格,是因为他最后达到一个平衡点,就是能保证商家创新所需要的利润,同时也能营造一个健康的(消费)环境。这样达到平衡之后,我觉得(机器人行业)才算进入一个正式的、健康的业态,所以现在这个业态,在某种程度上可能不是那么健康,或许还在大浪淘沙的过程中。 问:哪个价位?9.9万?20万?李清都:我认为在15万元左右比较平衡。因为马斯克曾经提出3万美元的价格,这是大家心里已经锚定的价格位置,但这只是针对普通大众型(人形)机器人。就像我们汽车,有高端、有低端、有特种应用等场景,价格都不太一样。但是对于普通老百姓来说,无论是用在健康养老,还是迎宾导引,或者巡检安防等,核心还是在于大家在乎它(机器人)创造的价值是否达到预期。我认为,机器人售价在15万元人民币左右,是一个相对来说比较健康的状态。如果价格过低,就像电动汽车一样,这就无法保证设备质量和售后,说不定人买了回去之后,这个企业将来可能就不存在了。 问:当前具身智能机器人赛道非常热闹。有些人认为,人形机器人行业有“泡沫”,但也有人认为这个行业被低估了。那么在你看来,人形机器人行业有“泡沫”吗?李清都:从估值角度上来说,人形机器人还远没到“泡沫”的时候。如果你算一下,现在人形机器人市场大概营收是个什么样规模(水准),未来机器人大概是与手机(数量)、汽车一样的百万亿级市场规模,所以从这个角度来看,估值100亿、200亿的企业根本达不到“泡沫”。但这个过程中,其实里面是有“泡沫”的,因为涌入到这个领域的人越来越多,可能参差不齐,有些人水平一般、没有所谓创新能力,当然,也有很多专业人士和能力较强的机器人创业者。在我看来,人形机器人达到量产和盈利的核心还是技术产品,这是非常硬核的东西,从而让人形机器人在应用场景里面满足ROI(投资回报率),最后通过降本增效,未来1-2年内市场会解决“泡沫化”问题。同时,人形机器人会逐步在某些场景达到一定的规模和水平。 问:2025北京亦庄人形机器人半程马拉松赛上,卓益得机器人的行者二号机器人赛队获得了第三名,最近卓益得也在WAIC展会上发布了行者三号。所以,这些展示、运动是否是人形机器人商业发展和量产交付的一部分?李清都:首先,无论是参加运动会马拉松,还是对外运动展示,这是机器人可靠性和基本能力的验证。所以,在马拉松上,我们一直没有去追求所谓的名次,我们的目标是“不换电跑完全程”。对于我们这样一家做轻量化机器人设计公司来说,无论学术界、产业界,还是投资人,都在质疑这条路径,但我们验证了轻量且智能安全(这一)全新技术路线的可行性,对我们来说目的已经达到了。事实上,我认为,人形机器人落地之前需要做到五个特性:平衡性、高效性、智能性、安全性、经济性。其中,安全性应该作为人形机器人落地的首要条件。其中,人形机器人马拉松验证了机器人的运动、续航等能力。比如,如果人形机器人只有半小时、一小时续航的话,不仅有“焦虑”感,而且可能损害未来机器人规模化落地,也有可能成为未来落地的重要技术瓶颈之一。而机器人能跑马拉松,意味着它的可靠性已经可以了。安全性方面更加重要。卓益得机器人身高1.7m,本身是“轻量化”的,只有30公斤左右的重量,所以在极端情况下,他的安全性底线守住了。剩下就是机器人的干活能力、降低成本实现商业化,这两个问题解决的话,人形机器人的ROI就能满足要求了。总结来说,当前人形机器人主要还是安全性、成本以及商业化落地等能力。 问:关于具身智能,有人称VLA是傻瓜模型,也有人说世界模型不是具身智能技术方向,你更同意哪种观点?李清都:VLA模型比较适合简单、垂直、单一的任务,主要因为它不需要泛化很多问题,不需要理解很多知识,比如叠衣服、产线工作等,都属于VLA模型可以解决的范围。而世界模型,相当于像人一样能真正对世界理解,对于未来有预判。所以,世界模型是未来,VLA是现在,这两者之间不可以长期并行。例如,很多工业场景其实不需要做很多世界模型,因为这对于服务器有更高要求,同时也需要大量成本。但是,VLA只需要单卡或嵌入式,就可以解决算力问题。另外,具身智能的数据也非常重要。从学术角度来看,当前用这些模型和数据做训练、算法迭代,距离解决实际问题还有很长距离。未来,具身智能数据主要有三个采集方向,呈现“倒三角”格局:一是最有价值的高级技能人员数据,包括艺术家、科学家、医生等职位的数据训练;二是仿真和Sim2Real合成数据,这是降低成本的核心手段;三是真机数据,能够帮助人形机器人解决一些边界问题。 问:卓益得的“行者二号”和“行者三号”落地场景有哪些?你们是否有一个量产出货计划?李清都:对于卓益得来说,现阶段修炼内功、场景验证更加重要,稳扎稳打,明年才是我们实现量产规模的阶段。其中,今年“行者二号”已经在多个场景里面布局;而随着7月发布“行者三号”,下半年主要验证“行者三号”的应用能力,主要应用于导览、巡检、工业、医疗等多个落地场景,预计明年实现“行者三号”的量产交付,产能比“行者二号”有更大幅度的提升。卓益得主要将核心研发放在上海,而其位于河南郑州的子公司卓益得人形机器人(河南)有限公司,定位是试图解决人形机器人的量产问题。今年小批量的量产规模大概在数百台,明年在2000-5000台左右。 问:今年以来,春晚机器人引发新一轮具身智能和人形机器人领域爆火,行业也存在所谓“第一梯队”排名,您如何看待这一说法?李清都:首先,我认为,人形机器人没有所谓“第一梯队”,大家都还在一个起跑线上,国内与全球真正规模最大的通用机器人公司相比还有很长的距离。其实,更多的资本机构也许不会对外展示,即使是自己做,也不会公布于众,因此,我们只能看见浮在表面的一层东西。最后,在我看来,机器人企业现在的估值才100亿、200亿,对于真正实现人形规模化来说,那都是百亿、千亿规模,所以从这个角度上来说,大家还在一个起跑线上,任何企业都有一个可能会被“颠覆”的机会。由于人形机器人还有很多真实需求的应用落地,行业的“牌”还没洗到那种(大浪淘沙)程度,未来机器人依然需要解决人类很多生产生活问题。 问:如果泡沫破灭,你认为国内会剩余多少家人形机器人企业?李清都:首先我认为,所有的投入都会有回报,只不过他(企业)可能最后会切换赛道。更高角度看,反正我们养了这么大池子鱼,这个鱼最后是否到“湖水”,其实无所谓。其次,从团队角度看,其实企业要做好自身定位,如果最后发现竞争不过头部的时候,你可以切换垂直场景、特种场景,因为这类场景需要很多人形机器人产品。从整个行业角度看,现在一百多家本体企业还远远不够。AI层面,现在看起来我们很紧缺,但我估计,未来三年、五年之后,(具身智能技术)肯定会过剩。最后,人形机器人落地一定要对物理AI有更多理解,需要解决实际场景问题。从落地角度看,只要做过实物,加上AI能力补充,将来企业在落地上一定有优势。每个行业其实都有一些细分领域,我们随时切进去,都是有机会的。对于卓益得来说,我们的目标是开启人机共生的新纪元,更实际一点来说,先从一些简单的问题上服务好“人”,做好导览、巡检等工作,把这两个场景稳扎稳打“打实”,下一步再获得更多技能,不断深入,在一些比较难的任务中服务更多的专业人士。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达) -
刚刚!阿里发新模型,幻觉率爆降70% 智东西 作者 陈骏达 编辑 李水青 智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。FunAudio-ASR使用了数千万小时的音频数据,融合了大语言模型的语义理解能力,从而提升语音识别的上下文一致性与跨语言切换能力。通义实验室打造了5大类测试集,重点关注语音识别在远场、嘈杂背景等挑战性场景下的表现,并结合开源测试集评估了模型的性能。FunAudio-ASR实现了超越Seed-ASR、KimiAudio-8B等业内知名模型的表现。 同时,FunAudio-ASR在实际落地方面也进行了全面优化,支持低延迟流式识别、跨中英文自然切换以及用户可自定义的热词识别,能够覆盖视频会议、实时字幕、智能终端等多样化应用场景。FunAudio-ASR提供两个版本,满血版由0.7B参数量的编码器和7B参数量的大语言模型组成,追求最高精度;轻量的nano版本由0.2B参数量的编码器和0.6B参数量的大语言模型,平衡效率与精度。目前,FunAudio-ASR已在钉钉的“AI听记”、视频会议、DingTalk A1硬件等多个场景中应用。FunAudio-ASR已上线阿里云百炼平台,API定价为0.00022元/秒,转录一段一小时的音频大约需要8毛钱。这款模型的技术报告已经发布,开发者也可在魔搭社区体验其效果。魔搭社区体验:https://modelscope.cn/studios/iic/FunAudio-ASR阿里云百炼平台:https://help.aliyun.com/zh/model-studio/recording-file-recognition?spm=a2c4g.11186623.help-menu-2400256.d_0_3_1.f43e7432ytYkAa&scm=20140722.H_2880903._.OR_help-T_cn~zh-V_1技术报告:https://github.com/FunAudioLLM/FunAudioLLM.github.io/blob/master/pdf/FunAudio-ASR.pdf一、幻觉、串语种问题获针对性优化,一手体验高噪声环境识别效果 相比于文本大模型,语音大模型的“幻觉”问题尤为突出。这是因为声学特征与文本特征在向量空间上天然存在差异,导致模型在“听”完音频后,容易“脑补”出大量不存在的内容。尽管通过训练,可以将将声学特征对齐到文本特征空间,但声学特征Embedding与真实的文本Embedding仍然存在这一定的差距,这会导致大语言模型在生成文本时发生幻觉的现象。 ▲声学特征Embedding与真实的文本Embedding分布差异(图片来源:https://arxiv.org/pdf/2410.18908)通义实验室发现,给语音大模提供必要的上下文,可以减少文本生产时候的幻觉现象。为此,他们设计了Context增强模块:该模块通过CTC解码器快速生成第一遍解码文本,并将该结果作为上下文信息输入大语言模型,辅助其理解音频内容。由于CTC结构轻量且为非自回归模型,几乎不增加额外推理耗时。例如,对于这段由AI生成、模仿海盗说话风格的音频,FunAudio-ASR做到了一字不差的识别。(待插入)此外,通义实验室还观察到幻觉问题在高噪声场景中更易发生,因此在训练数据中加入了大量仿真数据。为评估模型在高噪声情况下的表现,他们构建了一个包含28条易触发幻觉音频的测试集,经优化后,幻觉率从78.5%下降至10.7%。智东西在实测中体验了FunAudio-ASR在嘈杂场景的识别能力。这段音频是在嘈杂的展会现场录制的。可以听到,模型基本准确识别了片段中男性说话者的声音,但在声音音量骤降后识别错误了。(待插入)同时,这段音频中有两位说话者,FunAudio-ASR在识别两人同时说话的部分时,遗漏了一些信息。与OpenAI Whisper Large V3的识别结果对比,FunAudio-ASR识别出了更多正确的信息。 “串语种”是语音大模型落地中的另一类典型问题,例如,输入音频内容为英文,模型输出却为中文文本。这是因为文本大模型本身具备翻译能力,在声学特征映射不够精确时,模型可能在推理过程中“自动启动”翻译功能,从而影响语音识别的准确性。在FunAudio-ASR的Context增强模块中,CTC解码器经过高质量数据训练,本身发生串语种的概率极低。通过将CTC的第一遍解码结果作为提示词输入给大语言模型,可有效引导模型聚焦于语音识别任务,缓解“翻译”行为的发生。二、支持术语定制化识别,召回率提升明显 在企业运用语音识别模型时,个性化定制是必不可少的技术。所谓定制化,是指在识别过程中对特定词/短语(如人名、地名、品牌、专业术语等)施加额外概率偏好,从而显著提高它们的识别召回率,同时尽量不损伤通用识别准确率。当前行业的主流做法是将用户提供的领域词,直接作为提示词输入大语言模型。该方法虽简单有效,但随着词量增加,干扰也随之上升,导致召回率下降——即“定制化能力衰减”。为缓解这一问题,通义实验室在Context增强结构中引入RAG(检索增强生成)机制,这一机制的运作方式如下:(1)构建知识库:将用户配置的定制词构建成专属RAG库;(2)动态检索:依据CTC第一遍解码结果,从RAG库中抽取相关词汇;(3)精准注入:仅将相关词汇注入大语言模型的提示词中,避免无关信息干扰。该方案在不增加推理复杂度的前提下,将定制化上文数量扩充到上千个以上,并且保持较高的定制化识别效果。为验证模型的定制化效果,通义实验室在微积分学、有机化学、物理学、哲学、人名等5个领域,选取了1000个专业词汇进行测试。FunAudio-ASR在关键词准确率上表现超越了支持同类功能的语音识别模型。 例如,采用FunAudio-ASR模型的钉钉“AI听记”,拥有对互联网、科技、家装、畜牧、汽车等10+领域、200+细分行业术语的识别能力,并支持在企业授权前提下,结合通讯录、日程等上下文信息进行推理优化,进一步提升结果可靠性。 三、预训练使用数千万小时数据,仅用8张A100完成强化学习 技术报告中,通义实验室阐述了FunAudio-ASR的技术细节。这一模型包含四个核心组件:(1)音频编码器(Audio Encoder):提取语音特征,使用多层Transformer Encoder。(2)音频适配器(Audio Adaptor):连接编码器和LLM,使用两层Transformer Encoder。(3)CTC解码器:用于初步识别假设,支持热词定制。(4)基于大语言模型的解码器:结合音频特征和CTC预测生成最终输出。 ▲FunAudio-ASR模型架构预训练阶段,FunAudio-ASR使用了数千万小时的音频数据,包括无标注音频和有标注的音频-文本数据,数据涵盖AI、生物、电商、教育等多个领域。预训练分为自监督预训练和有监督预训练。在自监督阶段,FunAudio-ASR创新地使用Qwen3的权重初始化编码器,加速收敛并提升表示质量。有监督预训练则在编码器-解码器架构(AED)下进行,使编码器能够从大规模标注数据中学习更丰富的声学-语言特征,为后续与大语言模型的整合奠定基础。 ▲FunAudio-ASR预训练管线在此基础上,FunAudio-ASR进入有监督微调(SFT)阶段,该阶段进一步分为五个子阶段,逐步优化不同模块:(1)训练适配器以对齐音频表示与大语言模型的语义空间;(2)优化编码器和适配器;(3)使用LoRA微调大语言模型以防止灾难性遗忘;(4)全参数微调阶段;(5)引入CTC解码器用于后续的热词检索与增强生成(RAG)。整个SFT过程使用了数百万小时的多源数据,包括人工标注语料、伪标注数据、合成语音和噪声增强数据等,确保了模型在多样化场景下的泛化能力。为了进一步提升模型对长音频和上下文信息的理解能力,团队还构建了超过5万小时的上下文增强训练数据。通过提取关键词、合成相关上下文并混合无关语境,模型学会了在保持高识别精度的同时,有效利用对话历史信息,显著提升了在复杂语境下的表现。在强化学习(RL)阶段,团队提出了专为音频-语言模型设计的FunRL框架,支持多模块高效协同训练。 ▲FunRL框架该框架采用GRPO算法,并设计了多目标奖励函数,综合优化识别准确率、关键词召回、幻觉抑制和语言一致性。模型仅使用8张A100显卡,在一天内完成RL训练。RL训练数据涵盖硬样本、长音频、幻觉样本、关键词样本和常规ASR数据,显著提升了模型在困难场景下的鲁棒性和用户体验。最后,FunAudio-ASR还针对实际应用需求进行了全面优化,包括流式识别支持、噪声鲁棒性增强、中英代码切换处理、热词定制和幻觉抑制等。结语:生成式AI赋能新一代ASR系统,或成智能交互重要入口 基于生成式AI的新一代语音识别模型,正在从“能听清”走向“能理解”,并在幻觉抑制、跨语种识别、上下文一致性等关键问题上展现出进展。与传统以声学建模与统计学习为主的语音识别系统相比,这类模型不仅具备更强的语义理解与任务适配能力,还能在复杂噪声、多说话人、跨领域等场景中保持更高的鲁棒性和可控性。可以预见,未来语音识别有望告别单纯的“输入工具”,成为终端智能交互的重要入口。 -
3万亿美元!谷歌迎来新里程碑 受人工智能领域乐观情绪回升及有利反垄断裁决推动,谷歌母公司Alphabet于周一首次实现3万亿美元市值。截至收盘,谷歌上涨4.3%,报251.76美元,总市值近30500亿美元。若计入周一的股价涨幅,谷歌今年以来股价已累计上涨超33%,在所谓的 “七大科技巨头”(Magnificent 7)中表现最佳,且远超标普500指数12.5%的同期涨幅。公司由此加入苹果(Apple)、微软(Microsoft)行列,成为市值突破3万亿美元的科技巨头;而全球市值最高企业是人工智能芯片制造商英伟达(Nvidia),当前市值已达 4.25 万亿美元。谷歌此次市值突破的最新推动力,源自美国法院的一项裁决:该裁决允许公司继续掌控旗下Chrome浏览器与Android移动操作系统。对于长期在搜索及移动生态系统中占据主导地位的Alphabet而言,这一裁决可能标志着关键转折点。尽管裁决要求Alphabet共享部分数据(此举将增强其广告业务竞争对手的实力),但不需要剥离Chrome浏览器或Android系统,仍消除了投资者的一大核心担忧 —— 在投资者眼中,这两款产品是搜索巨头整体业务的关键组成部分。此外,Alphabet云计算部门第二季度营收同比增长近32%,超出市场预期,这也提振了投资者信心。营收增长得益于该公司在自研芯片及Gemini人工智能模型上的投入开始见效。股票交易网络(Stock Trader Network)首席策略师迪克(Dennis Dick)表示:“Alphabet目前仍高度依赖搜索业务,但凭借YouTube、Waymo(自动驾驶业务)以及其他正在研发的功能与产品,投资者开始意识到,这家公司已不再只是一家搜索引擎企业,而是正朝着更多元化的领域拓展。”根据伦敦证券交易所集团(LSEG)汇编的数据,Alphabet 当前预期市盈率约为23倍,略高于其五年平均市盈率(22 倍),但低于 “七大科技巨头” 中的其他企业。 -
颐和园:机器人“入职”零售店 来源:中国新闻网 中新社记者 张祥毅 摄 9月13日,在北京颐和园的一家机器人零售店,机器人向游客交付商品。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,在北京颐和园的一家机器人零售店,机器人向小朋友交付商品。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,位于北京颐和园的一家机器人零售店吸引中外游客。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。 中新社记者 张祥毅 摄 9月13日,位于北京颐和园的一家机器人零售店吸引游客。据了解,该零售店由机器人自主提供接待、点单、支付、取货、交付全流程服务,主营饮料和公园文创产品。