分类互联网下的文章 - 第 30 页 - 智观行业

登录

找到 1120 篇与互联网相关的结果 - 第 30 页

OpenAI 前瞻 ChatGPT 终极形态：迈步“App Store”时代

OpenAI 前瞻 ChatGPT 终极形态：迈步“App Store”时代 IT之家 10 月 7 日消息，科技媒体 The Decoder 昨日（10 月 6 日）发布博文，报道称在 OpenAI 2025 开发者日上，该公司首席执行官山姆・奥尔特曼（Sam Altman）宣布多项重大更新，推动 ChatGPT 从一个聊天工具向集应用与 AI 智能体于一体的综合性平台转型。IT之家援引博文介绍，本次活动时长约 50 分钟，奥尔特曼主要介绍了以下 4 个新开发者工具： Apps SDK（应用软件开发工具包）：一套由 OpenAI 提供的工具，让软件开发者可以像开发手机 App 一样，为 ChatGPT 创建功能丰富的内嵌应用。用户可以直接在聊天中使用这些应用，而无需跳转到其他网站。 AgentKit（智能体开发套件）：OpenAI 推出的另一套工具，专门用于创建“AI 智能体”（AI Agent）。这种智能体可以像一个聪明的助手一样，自主理解用户需求并完成一系列复杂任务，而 AgentKit 提供的可视化界面让这个创建过程变得像搭积木一样简单。 Codex 编程助手正式上线：新版本增强了团队协作能力，增加了 Slack 集成与用于自定义工作流的 SDK。扩展 API：GPT-5 Pro、gpt-realtime-mini 和 Sora 2 现已加入 API。一、Apps SDK：ChatGPT 平台化，原生应用取代插件 OpenAI 在本次活动中推出全新的 Apps SDK（应用软件开发工具包），目标推动 ChatGPT 从一个聊天工具向一个成熟的第三方应用平台转型。开发者利用该 SDK，可以直接在 ChatGPT 内部构建功能丰富的交互式应用，支持全屏模式、用户登录和支付协议。这意味着用户无需离开聊天界面，即可调用 Canva 设计海报、通过 Zillow 查找房产或使用 Spotify 播放音乐。首批上线的应用包括 Booking.com、Canva、Expedia 等，预示着功能更集成、体验更无缝的原生应用将取代过去功能单一的插件。二、AgentKit：可视化工具让人人都能构建 AI 智能体 OpenAI 推出了用于构建自主 AI 智能体的工具套件 AgentKit。其核心是 Agent Builder，一个可视化的拖拽式工具，允许开发者像搭建流程图一样组合工作流，快速创建、部署和优化能够自主执行复杂任务的智能体。在现场演示中，一个推荐会议日程的智能体仅用八分钟便构建完成并发布。该套件还包含用于测试的 Evals 和管理数据接入的 Connector Registry 等组件，并内置了安全护栏，旨在大幅降低 AI 智能体的开发门槛。三、Codex 正式上线，用户数据再创新高在本次活动中，OpenAI 宣布其编程助手 Codex 正式上线（GA）。自 5 月推出云端智能体以来，Codex 的使用量增长了十倍。新版本增强了团队协作能力，增加了 Slack 集成与用于自定义工作流的 SDK。 OpenAI 公布了最新的运营数据：ChatGPT 的周活跃用户已超过 8 亿，平台开发者数量突破 400 万，API 流量更是达到了每分钟 60 亿 Token 的惊人水平。四、API 模型矩阵更新：GPT-5 Pro 与 Sora 2 正式开放 OpenAI 开放了其迄今最先进的语言模型 GPT-5 Pro 的 API 接口，该模型专为处理复杂任务设计，支持文本和图像输入，并拥有高达 40 万 Token 的上下文窗口。同时，备受关注的文生视频模型 Sora 2 也已通过 API 提供。为了满足不同场景的需求，OpenAI 还推出了两款高性价比模型：gpt-realtime-mini，比前代实时 API 便宜约 70%；以及 gpt-image-1-mini，将图像处理成本降低了约 80%，助力开发者以更低成本扩展应用规模。

智观行业 1年前

0 3,065 0

消息称OpenAI与前苹果首席设计师 Jony Ive 合作开发AI设备遇挑战

消息称OpenAI与前苹果首席设计师 Jony Ive 合作开发AI设备遇挑战 IT之家 10 月 7 日消息，据《金融时报》报道，OpenAI 与前苹果首席设计师 Jony Ive 合作开发的全新硬件产品目前面临多项技术挑战。报道称，这款设备由 Jony Ive 旗下设计公司 LoveFrom 主导设计，由 OpenAI 提供技术，定位为一款无屏幕、可掌上携带的智能装置，能够通过音频与视觉输入感知外界，并以语音形式回应用户请求。不过，由于 OpenAI 的算力规模远不及亚马逊或谷歌，目前甚至难以支撑 ChatGPT 的庞大用户群，因此这款硬件在落地时面临计算资源不足的问题。若要实现真正的本地化智能体验，将需要远超当前水平的算力支持。外界有分析认为，这或许正是 OpenAI 于本周与 AMD 达成数十亿美元数据中心合作的主要原因之一。除了算力问题外，团队还在努力让设备的交互更自然、更不过度打扰用户。目前原型机在“何时结束对话”这一点上仍存在困扰，这是 ChatGPT 自身的常见问题之一。开发团队正在尝试调整模型，使设备不会显得过于“逢迎”或对用户言语一味附和。如今，随着生成式 AI 的普及，越来越多厂商希望将 AI 体验从手机与电脑延伸至现实世界。例如去年发布的 Rabbit R1 与 Humane AI Pin 均尝试打造脱离智能手机、以语音为主要交互方式的多模态 AI 设备，但两者最终反响平平（IT之家注：Rabbit R1 近期推出了 2.0 大版本更新，而 Humane 被惠普收购，旗下 AI Pin 停售）。

智观行业 1年前

0 28,848 0

与ChatGPT集成应用引发市场热烈反应 Figma Inc(FIG.US)大涨超7%

与ChatGPT集成应用引发市场热烈反应 Figma Inc(FIG.US)大涨超7% 智通财经APP获悉，设计软件公司Figma Inc(FIG.US)周一股价大涨超7%，原因是OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在旧金山举行的年度DevDay开发者大会上公开展示了Figma与ChatGPT的集成应用。奥尔特曼在大会上介绍，Figma的功能已嵌入ChatGPT，这款聊天机器人目前拥有超过8亿月活用户。他展示了如何通过OpenAI最新推出的“Apps SDK”（软件开发框架），让第三方应用程序直接接入ChatGPT生态系统。“当用户使用ChatGPT时，只需提到某个应用的名字即可直接调用，”奥尔特曼在台上表示。“例如，你可以先在ChatGPT中画出一个产品流程草图，然后说：‘Figma，把这张草图转成可用的图表。’ 接着Figma应用就会接手并完成操作。”Figma产品经理Luke Zhang在博客中补充，用户除了可以在ChatGPT中主动召唤Figma外，聊天助手也会在相关场景中自动推荐使用Figma。这一集成展示引发了市场热烈反应。Figma盘中最高涨幅超16%，投资者对其AI集成潜力高度期待。Figma近年来积极开发基于生成式AI的设计工具，借助包括OpenAI在内的多家技术提供商的模型，用于网页及App设计创作。奥尔特曼还表示，未来接入Apps SDK的应用产品用户可在不离开ChatGPT对话界面的情况下登录使用；设计师在Figma中进行项目开发时，也可以直接调用FigJam工具继续协作讨论。奥尔特曼透露，软件开发者将在2025年晚些时候能够提交第三方应用供OpenAI审核。未来，OpenAI将通过多种方式推动第三方集成应用的商业化。上周，OpenAI刚宣布ChatGPT用户可直接通过聊天界面购买Etsy Inc(ETSY.US)平台上的商品，这标志着其生态系统的商业潜力正快速扩展。

智观行业 1年前

0 53,582 0

OpenAI苹果化：ChatGPT就是iOS ，几分钟造出的Agent要代替App

OpenAI苹果化：ChatGPT就是iOS ，几分钟造出的Agent要代替App 作者｜周一笑邮箱｜ zhouyixiao@pingwest.com当地时间10月6日，OpenAI在旧金山举办DevDay 2025开发者大会。在大会正式开场前5小时，AMD与OpenAI的合作消息公布，OpenAI将在未来数年部署高达6GW（千兆瓦）的AMD Instinct GPU。AMD已向OpenAI发行最高1.6亿股认股权证，行权条件与芯片部署进度及股价里程碑挂钩，如果OpenAI全额行权，可能获得AMD约10%的股权，AMD股价一度暴涨30%。有开发者吐槽“又被资本操作抢戏”，也有人认为这是刻意编排，先讲底层算力，再讲上层工具，恰好符合OpenAI从芯片到模型到应用的一体化叙事。回到这次DevDay上，OpenAI发布了Apps SDK（在ChatGPT内构建应用的完整框架）、AgentKit（快速构建AI Agent的工具套件）、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman开场公布了一组增长数据，开发者数量从2023年的200万增长到400万，翻了一番。ChatGPT的周活跃用户从1亿飙升至8亿，增长了8倍；API每分钟处理的token量从3亿暴涨到60亿，这是20倍的增长。8亿周活意味着超级应用，这个体量已经具备了成为平台的基础设施。DevDay中Apps SDK是最值得关注的重点，它标志着ChatGPT更像一个平台和操作系统了。Altman的判断很直接，AI已经从人们玩耍的东西，变成了人们每天构建的东西。这次DevDay的目标，就是让更多开发者能直接在ChatGPT上构建应用和Agent，并且在这个拥有8亿用户的平台上开发和分发。OpenAI开始苹果化了。1Apps SDK：在ChatGPT内做应用OpenAI曾经尝试过让开发者在ChatGPT上构建应用，那就是2023年推出的GPTs。但GPTs本质上只是Prompt模板，能力有限且生态混乱，已经被OpenAI放弃。去年底Anthropic推出了MCP开放标准，试图为AI应用互操作性提供统一框架，而今天发布的Apps SDK，则是OpenAI基于MCP标准，再次尝试让ChatGPT成为一个应用平台。Apps SDK是一个完整的开发框架，让开发者能在ChatGPT内部构建真正的交互式应用。开发者可以用TypeScript或JavaScript编写后端逻辑，通过MCP接口连接数据、触发操作，并渲染完全交互式的用户界面。这不是简单的API调用，而是在ChatGPT对话框里运行的“小程序”。举几个现场演示的例子就能明白它的能力，Coursera应用可以在对话中嵌入视频播放器，用户边看课程边向ChatGPT提问；Zillow能展示可筛选的交互地图，用户说“找带院子的三居室”，地图实时过滤结果；Canva则能直接根据对话生成海报，并把海报转换成完整的PPT。 OpenAI还推出了应用对话（Talking to Apps）机制。Apps SDK提供了一套API，允许第三方应用将内部上下文实时暴露给ChatGPT。当你在Coursera应用里看到视频第5分钟，ChatGPT知道你正在学什么章节，当你在Zillow地图上点开某套房子，ChatGPT能准确理解你关注的是哪个地址、什么价位。深度集成让对话式交互真正有了实用价值。现场演示中，当演示者说“Spotify，给我周五派对做个歌单”，ChatGPT自动调出Spotify应用，屏幕上显示“使用Spotify生成此答案”的提示，几秒后歌单就出现在对话框里，可以直接点击播放。整个过程流畅自然，就像在iOS上切换App一样。首批合作应用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera，未来几周还会加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天开放预览版，开发者可以在Developer Mode中测试应用。今年晚些时候，OpenAI将开放正式提交通道，并提供应用目录供用户浏览。面向Apps SDK开发者的设计规范配图 Altman还透露了商业化计划，Apps SDK未来将支持新的Agentic Commerce Protocol，允许用户直接在ChatGPT内部即时结账。很多人会问GPTs不是已经失败了吗，Apps SDK会重蹈覆辙吗？GPTs门槛接近零代码，但能力也被局限，回复始终是一条条消息。Apps SDK则是代码为中心。开发者需要在自己的服务器上编写真正的应用代码，实现MCP服务器接口，声明OAuth 2.0登录和交互式UI组件。ChatGPT只是把App嵌入对话流里，真正的逻辑、状态管理和数据存储都在开发者手中。Apps可以弹出富交互组件（地图、表单、视频播放器）、长时间保持session，并可在后台自行拉取和推送数据。换句话说，GPTs是模板，Apps in ChatGPT是完整的小程序。GPTs和GPTStore既不像App Store那样标准化，也不像插件那样通用，多数GPT缺乏区别化价值，用户难以形成持续使用习惯，开发者又难以变现、用户难以发现优质内容，最终生态陷入空转。Apps SDK则完全不同。开发者必须通过实名验证、服务器验证和功能测试才能上架。审核前置，并引入了年龄分级和权限管理，类似App Store的标准。Altman还暗示会有更正式的收入分成方案。在ChatGPT上，一个新的iOS的雏形就这样长了出来。1AgentKit：8分钟造出的AgentApps SDK构建的是ChatGPT的应用生态，而AgentKit则是OpenAI给开发者提供的Agent开发工具箱。Altman的判断是，AI已经从“你提问的系统”进化到“能为你做很多事情的系统”，也就是Agent。但他也坦言，符合定义的Agent成功落地的很少。AgentKit是一个完整的工具套件，包含四个核心组件：Agent Builder，这是一个可视化画布平台，让开发者能像使用Canva一样拖拽设计Agent的逻辑、步骤和工作流。它建立在OpenAI的Responses API之上，支持if-else逻辑节点、循环、用户审批节点、文件搜索和数据转换等模块化组件。开发者可以从预设模板开始（如客服机器人、数据增强、文档对比），也可以从零搭建自定义流程。 ChatKit，一个可嵌入的聊天界面组件。开发者可以把这个界面集成到自己的网站或应用中，带来ChatGPT级别的对话体验，同时保留自己的品牌、工作流和产品特色。它能处理流式响应、管理对话线程、显示模型思考过程，让集成聊天UI的复杂工作变得简单。Connector Registry，一个企业级的连接管理中心。管理员可以通过控制面板统一管理Agent如何连接内部工具和第三方系统，设置权限、监控使用情况，同时保证安全性和合规性。Agent Evals（评估工具），提供性能测量和优化能力。包括逐步追踪评分（Trace Grading，理解Agent的决策步骤）、评估数据集、自动化提示词优化，以及在OpenAI平台上直接对外部模型运行评估的能力。在现场OpenAI工程师Christina Huang8分钟的演示中。她从零开始，用Agent Builder构建了一个名为Ask Froge的DevDay网站Agent。快速地将一个静态的会议网站创建一个智能问答助手，以提升用户体验。她先设置了Agent的基本指令，然后添加了预构建的Guardrails（防护栏）用于PII信息掩码，接着连接了DevDay的日程数据，最后加入了自定义Widget来显示会议时间表。整个过程不到8分钟，Agent就部署到了DevDay官网，观众可以现场访问使用。企业案例中，零售巨头Albertsons用AgentKit构建了帮门店经理分析销量的Agent，当某个品类销量下降（比如冰淇淋），系统会基于季节性趋势、历史数据和外部因素（天气、节假日）给出诊断和建议。营销软件公司HubSpot则用它改进了Breeze AI客服工具，Agent能整合知识库、查找当地治疗方案和保险政策细节，生成更有针对性的回复。Box、Canva和Evernote也已开始使用该平台。Altman说这是我们当初造第一个Agent时希望拥有的工具。降低门槛的逻辑很清晰，让更多人能造Agent，OpenAI才能抢占Agent开发生态的制高点。而这个生态的门槛因为模型能力提升而足够低的时候，app就会被agent们替代。1Codex和模型更新除了应用和Agent，OpenAI还宣布了一系列基础设施更新。Codex正式可用，OpenAI的软件工程Agent Codex结束研究预览，进入通用可用（GA）阶段。Codex现在运行在专门训练的GPT-5-Codex模型上，这个模型在代码重构和代码审查等Agentic编程任务上表现更出色。自8月初以来，Codex的日均消息量增长了10倍，已处理超过40万亿个token。过去两三个月里，开发者社区能明显感觉到Codex很火。一方面，OpenAI用GPT-5-Codex把"AI代码这条垂直赛道往前推了一步，在代码质量和推理能力上形成优势，另一方面，Codex提供了价格透明、场景统一、稳定可预期的开发体验。相比之下，不少开发者抱怨Claude Code存在限流、质量波动等问题，甚至有人已经把主要精力转到Codex上。这次正式发布，是OpenAI在代码生成领域持续发力的一步。OpenAI展示了内部数据，工程师在使用Codex后，每周完成的Pull Request数量提升了70%，几乎所有OpenAI的PR都经过Codex审查。Codex还新增了三个企业功能：Slack集成（可以直接在团队频道里让Codex写代码或回答问题）、Codex SDK（让开发者在自己的工作流中嵌入Codex能力）、以及管理工具（包括环境控制、监控和分析仪表板）。模型和API更新方面，GPT-5 Pro API向所有开发者开放，这是OpenAI目前最智能的模型，专为需要高精度和深度推理的场景设计，如金融建模、法律文件分析和医疗诊断，定价为每百万输入token 15美元、每百万输出token 120美元。 OpenAI刚刚发布全新的Sora 2模型及同名Sora App，应用上线后迅速走红，Sora 2、Sora 2 Pro API也进入预览阶段，这个新一代视频生成模型在可控性上有巨大飞跃，能根据详细指令生成风格化、构图精良的视频，还能配上丰富的声音景观、环境音频和同步音效。Sora 2 输出每秒 0.1 美元，Pro 输出每秒0.3 美元。 GPT-Realtime-Mini则是一个更小、更便宜的语音模型，比之前的高级语音模型便宜70%，但音质和表达力保持一致。OpenAI认为语音将成为人们与AI互动的主要方式之一，更经济的模型能让语音应用更快普及。1平台化的野心这次DevDay最重要的信号是，ChatGPT不再只是一个Chatbot，而是正在成为一个完整的应用平台。Apps SDK让开发者能触达8亿用户，AgentKit降低了Agent开发门槛，Codex提升了软件开发效率。OpenAI正在构建一个从应用分发、开发工具到基础设施的完整生态。从现场演示来看，这些Agent更像是对话式的App，它们依然需要后端逻辑、数据管理和UI交互，只是把入口从图标点击变成了自然语言对话。这是交互方式的革命，但软件开发的本质没有改变，你还是需要懂业务、懂技术、懂用户需求。苹果推出App Store时，没人想到十年后会有几百万个App。OpenAI推出了Apps SDK，现在的问题不是Agent是否会替代App，而是开发者们是否真的会来，在ChatGPT上“Build something new”。点个“爱心”，再走吧

智观行业 1年前

0 35,897 0

“双11”再破历史纪录，今年或将迎来十年最大转型风口

“双11”再破历史纪录，今年或将迎来十年最大转型风口国庆出游的花呗还没还上，“双11”又要掏空你的钱包了。今年“双11”比往年来得更早，京东宣布将于10月9日晚8点现货开卖，这意味着今年“双11”促销周期比去年又多了5天，成为史上最长“双11”。17岁的“双11”看似创新乏力，消费者厌倦情绪渐浓。但今年的亮点在于出海和即时零售悄然布局，试图在海外和外卖市场创造第二第三个“双11”。再破抢跑纪录今年“双11”，京东出乎意料早早抢跑，比去年提前5天，创下历史最早纪录。抖音则将“双11”与中秋促销合并，商家报名中秋促销，即可在10月9日一键直通“双11”。占据主场优势的天猫和淘宝，反而是最晚的，直到10月15日才开启预售，与去年保持一致。从首次仅一天的促销期，到如今长达一个多月，“双11”通过不断延长促销周期来争夺流量，确实锁定了更多用户消费。去年“双11”战报显示，京东参与用户同比增长超两成，天猫成交总额也增长明显，参与用户规模创新高，这些成绩也反映出超长“双11”仍是有效的促销策略。去年 “双11” ，物流企业腾仓扩容、增强运力，迎接购物高峰。新华社发（曹建雄摄）“平台延长周期的本质，是通过时间维度的扩张，应对流量效率下降的现实挑战。”中国电子商会网络直播与短视频专业委员会执行副秘书长张宇晨表示，除了提前锁定消费之外，“双11”延长周期还具有分摊流量压力和缓解物流峰值的优势。目前，电商平台获客成本同比上涨35%，中小商家流量成本逐年上升，分阶段运营“双11”能在同等流量基础上，有效提升用户触达频次。超长“双11”也能缓解物流负荷，减少尖峰成本，缓解用户对物流服务的不满。复杂规则仍不少消费者普遍诟病的“规则复杂”“奥数级促销”等问题，今年“双11”也在持续改善中。张宇晨援引调研数据称，43%的消费者认为活动规则复杂，促销周期过长导致决策疲劳，而平台推出的“动态比价”“多波次现货”等促销手段，也加剧了用户的选择焦虑。因此，一件直降、无需凑单等，成了不少平台主打的促销策略。不过记者发现，各大平台简化的促销规则却不尽相同。比如，天猫依然坚持“预售”模式。根据活动规则，天猫“双11”分为预售和现货两个阶段，而预售期又分为预售预热、预售定金支付、预售尾款支付三个阶段，而现货期则分为现货预热和现货售卖两个阶段。为此，淘天相关人士解释，“双11”通常涉及大量的高客单价商品，消费者需要更长的决策周期。天猫“双11”预售依旧复杂。京东却省去预售环节，坚持“现货开卖”，声称为消费者提供“无需等待”的消费体验。但保留了满300元减50元“跨店满减”，优惠支持叠加官方直降、单品促销、单品多件直降、东券、京券以及满赠促销，但不支持与普通总价促销（满减、满折等）叠加。由此可见，天猫和京东等平台在“双11”促销中，各有各的复杂玩法，消费者要想拿到全网低价依旧不简单。转型风口初现今年“双11”目前处于前期蓄力阶段，很多规则细节仍未公布，但是记者却明显感觉到出海和即时两大趋势，“双11”或许将迎来近十年来最大的转型风口。记者从淘天了解到，今年“双11”将首次全面出海，淘宝将在海外市场投入10亿元营销补贴，助力10万商家达成“双11”海外成交翻倍目标。淘宝出海总经理叶剑秋介绍，今年“双11”同步在全球20个国家和地区启动，在境外的12个站点将支持跨境包邮、包退服务，中国香港、中国澳门将实现“0门槛包邮”。有趣的是，海外“双11”也沿用了“新用户1元秒杀”和“游戏赚金币”等国内电商的传统玩法。淘宝面向非中文用户推出互动游戏Taobao Wonderland，用户每天打卡签到可领金豆，金豆可用于购物抵现，最高可抵扣订单金额的50%。16个国家和地区的新用户“双11”期间首次下单，还将享受“1元秒杀”的优惠。拼多多旗下Temu美国站也将在10月9日启动预热，统一设置八折与八五折两档优惠，与美国传统大促“黑色星期五”和“网络星期一”直接硬碰硬竞争。除了海外市场，即时零售也可能成为“双11”潜力股。今年“618”期间，淘宝闪购与美团等凭借即时零售的优势打了一场奇袭战，名创优品将国内4500家门店接入淘宝闪购，拿下居家出行类目成交额第一。在最新财报会上，阿里电商事业群CEO蒋凡表示，闪购显著带动淘宝用户规模和活跃度，未来平台也会积极引入天猫品牌线下门店加入淘宝闪购。记者从接近相关平台的人士获悉，今年“双11”预计有数千家天猫品牌入驻淘宝闪购。有观点猜测，打通天猫和淘宝闪购后，用户在实体品牌的天猫旗舰店下单，可选择快递发货或外卖配送，这对“双11”来说无疑是一个利好。原标题：《“双11”再破历史纪录，今年或将迎来十年最大转型风口》栏目主编：李晔题图来源：上观题图来源：作者：解放日报查睿

智观行业 1年前

0 21,378 0

顿悟不是玄学！港科大清华等联手：撕开推理黑箱，RL让AI像人思考

顿悟不是玄学！港科大清华等联手：撕开推理黑箱，RL让AI像人思考新智元报道编辑：KingHZ【新智元导读】DeepSeek的强化学习GRPO为什么能让大模型「集体顿悟」？港科大、滑铁卢、清华等团队最新研究给出统一解释：在RL中，LLM推理自发分层——先巩固底层「执行」，再探索高层「规划」。基于此，还提出了更强HICRA算法。众所周知，强化学习（Reinforcement Learning，RL）能提升大语言模型LLM的推理能力。但没人说清楚：为什么会这样？最近，香港科技大学、滑铁卢大学、清华大学等机构的研究者在arXiv提交预印本，首次揭示：大模型正在以类人的方式学会推理——通过将高层策略规划与底层程序执行相分离。论文链接：https://arxiv.org/abs/2509.03646DeepSeek究竟如何让LLM学会推理？强化学习（RL）虽已成为提升LLM复杂推理能力的颠覆性技术，但其内在机制始终不甚明朗。在论文中，DeepSeek研究团队强调了强化学习的重要性：大模型与强化学习环境交互，自然涌现出反思和重新评估（reflection）之类的行为。他们给出了两条重要实验线索：「长度缩放效应」（length-scaling）和「顿悟时刻」（aha moment）。在训练过程中，DeepSeek-R1-Zero的思考时长持续增长，自然而然地学会了用更多的思考时间来解决推理任务，如下图所示。在强化学习（RL）过程中，DeepSeek-R1-Zero在训练集上的平均响应长度在DeepSeek-R1-Zero的某个中间版本中，AI出乎意料地进入了「顿悟时刻」。他们认为这是强化学习的「力与美」。 DeepSeek-R1-Zero的中间版本展现了一个有趣的「顿悟时刻」：该模型学会了采用拟人化的方式来表达思考过程这些现象如此奇特，被多家实验室复现。为什么呢？为什么强化学习能提升LLM的推理能力？这些问题之前无人明确解释。这次的研究突破性地揭示：像「顿悟时刻」这类令人困惑的现象并不是孤立的事件，而是新兴推理层次结构的标志，类似于人类认知中高层次策略规划与低层次程序执行的分隔。这一次揭示了强化学习推动推理能力提升的核心机制：模型先固化基础执行能力，再自主发展出策略规划能力。阶段1（底层技能巩固）：以执行tokens（execution tokens）的熵值下降为标志，模型专注于巩固低级技能（如算术计算、格式规范）。阶段2（高层规划探索）：学习重心转向高级规划，以规划tokens（planning tokens）的语义多样性提升为特征，模型持续增强推理能力并出现长度缩放效应（length scaling）。图1：（左图）大语言模型的推理过程呈现出类人的层次化推理结构：高层策略规划与底层程序执行。（右图）在强化学习训练中，层次化推理通过两阶段动态过程涌现研究者通过区分两类token验证这种转变：执行token对应具体操作步骤，规划token则体现为「尝试其他方法」等策略性表达。他们发现，当模型掌握执行token后，规划token的多样性显著增加，这与推理能力提升及解决方案链条延长直接相关。基于此，团队提出分层感知信用分配机制（HICRA）。与传统均匀分配学习权重不同，HICRA重点强化规划token的学习权重，从而加速模型探索和巩固策略的能力。实验表明，HICRA始终优于主流GRPO方法，且在模型已具备扎实执行技能时效果最佳——若执行基础薄弱，HICRA的优势则难以发挥。这项研究的核心启示在于：推理能力的真正突破源于规划能力的提升，而非仅仅优化执行细节。强化学习增强推理的两阶段动力学实验分析表明，经强化学习训练的大语言模型并非整体性提升，而是遵循一种"性能瓶颈"随时间转移的两阶段学习动态。第一阶段：锻造可靠程序引擎初期，模型专注于掌握基础能力。它学习可靠地执行低级操作步骤，如格式规范、算术运算和变量替换。这一阶段体现为「执行token」的不确定性（困惑度及token熵）急剧下降。 RL训练动力学：执行token的熵（图中灰色线）下降，而规划token的语义熵（图中红色线）上升研究者追踪了代表性模型家族的训练动态曲线。上图前两列显示，模型初始聚焦于程序巩固阶段，表现为执行token的模型困惑度（更高置信度）和token熵（更确定性）急剧下降。随后发生向策略规划探索的转变（第三列），规划策略的多样性（语义熵）在Qwen模型上持续增长，或在Llama模型上出现拐点后增长，这与准确率持续提升及推理链延长（第四列）密切相关。对于强模型或易学习数据，此阶段可能短暂甚至不存在，因为模型已具备可靠的基础低级技能，通常仅需对格式token进行最小调整。第二阶段：掌握高级策略规划当模型在低级技能上奠定坚实基础后，学习前沿发生转移。性能提升转为由探索和掌握高级策略驱动——例如选择新方法、回溯或识别关键定理。通过测量规划token的语义熵，这次研究验证了这一转变。其中的语义熵用于反映模型高级策略计划的多样性。规划token的语义熵（红线，第三列）从开始或拐点处持续上升，这种增长与推理准确率提升和长度缩放效应同步发生。这表明策略正在主动扩展其策略计划库，以实现推理能力的持续提升。这与程序巩固阶段token级熵的急剧下降形成鲜明对比。揭秘「神秘的现象」这次的分层框架为强化学习训练中一些长期让人困惑的现象，提供了统一而清晰的解释：1、「顿悟时刻」并非偶然灵光。这类转折并不是随机爆发的才思，而是某种行为特征信号：模型在「发现—掌握—强化」某种强力的高层策略（如自我反思）当策略被纳入并稳定执行时，模型的表现会出现突跃式改善。2、「长度缩放」源于更好的规划。随着模型探索到更丰富、更精细的策略（包括分类讨论、预先规划、回溯等），它自然会生成更长、更有结构的推理链条；而这类更长的输出，往往意味着更高的成功率与更好的表现。换言之，「输出越长越准」的现象，本质是高层规划能力增强的外在体现。3、复杂的「熵」变化，其实并不神秘。整体的token级熵常见下降，并非模型「变笨」，而是因为数量庞大的执行类词元（格式、算术、替换等）在训练中变得高度可预测，把总体曲线往下拉。真正反映策略探索进展的，是高层规划词元的语义熵：它随训练逐步上升，准确刻画出模型在发明与扩充策略谱系方面的探索步伐。归结起来：第一阶段通过降低执行不确定性「打好基本功」，第二阶段通过提升规划多样性「把思路打开」。这些看似各自为政的现象，其实都出自同一套分层学习动力学。这一发现揭示了当前RL方法（如GRPO）的核心低效问题：它们对所有token施加无差别优化压力，稀释了学习信号。既然高级推理的关键在于掌握策略，为何还要在已掌握的程序性步骤上浪费精力？为解决此问题，研究者提出了一种新算法HICRA（Hierarchy-Aware Credit Assignment，分层感知信用分配），其核心设计理念是：将模型的学习能力聚焦于稀疏但高价值的规划token。分层感知信用分配聚焦关键要素通过放大策略举措的学习信号，HICRA加速了有效推理模式的发现与强化进程。实验结果，效果惊人：定向优化规划全赢了！在多个纯文本及视觉语言模型中，HICRA不断超越强大的GRPO基线方法，显著验证了定向优化规划token的有效性。表1：在多项数学推理基准测试中，HICRA、GRPO与基座模型的性能对比。表2：在多模态推理基准测试中，HICRA与GRPO的性能对比为探究强化学习最有效的应用方向，这次分析了失败推演中错误类型的演变规律。首先通过人工审查失败案例，归纳出四种不同的错误成因。随后使用GPT-4o通过多选题形式将每个失败案例归类到对应成因，最后将这些分类解析为两大范畴：「规划与策略」（如逻辑缺陷、高层计划错误）和「其他错误」（如计算失误、事实检索错误）。分析表明，强化学习（RL）的主要优势在于修正高层策略失误，而非细微的计算错误。这也激发了HICRA的设计理念，即将学习重点集中在规划token上。如下图5所示，HICRA的成功与其维持比GRPO更高的语义熵水平密切相关。这种高层策略的更高多样性，直接与更强且更稳定的验证准确率相关联，证实了专注的策略探索是推理能力改进的主要驱动力。何种指标能有效追踪策略探索？准确衡量策略探索，对于诊断策略学习至关重要。然而，这次发现诸如token级熵值等常用指标可能产生误导。1、token级熵值的缺陷：该指标有时会收敛至较低水平，被实践者误判为「崩溃」。但这是错误的。大量低层执行token主导了token级熵值，而这些token本身就会趋于可预测化（即低熵状态）。低层token的熵值下降，会拉低全局平均熵值，但这并不意味探索停止。相反，只要语义熵保持高位，就说明模型正在积极探索新高阶策略，且性能持续提升。2、Pass@K指标的盲点：该通过K次尝试成功率衡量的指标，有时会饱和（例如所有查询都可能被解决），导致无法区分方法优劣或追踪训练后期的持续学习动态。语义熵有效规避了这些缺陷。它直接衡量有意义策略方案的多样性。如下图所示，语义熵始终保持强大区分力：当token熵值崩溃且Pass@8饱和时，仍能清晰显示HICRA持续的策略探索优势。这使其成为追踪真正推理发展的可靠指南。 token熵值（最右）崩溃且Pass@8（右二）饱和失效时，语义熵（最左）仍明确显示HICRA的持续探索优势，该优势与最终准确率提升正相关。现有研究提出使用高熵的「分岔token」作为模型推理过程中决策点的代理指标。链接：https://arxiv.org/abs/2506.01939这类基于熵的token与基于功能定义的规划token之间，到底什么关系？研究发现关键不对称性：虽然大部分规划token确实呈现高熵特性（符合策略选择的预期），但反向关系并不成立。大多数高熵token并非规划token，它们往往对应表述方式的简单变异或不影响整体策略的低层计算。这揭示了仅依靠熵值识别具有精确语义功能token的局限性。虽然功能定义的规划token大多具有高熵特性（下图左），但高熵token并非规划token的有效代理指标，因其多数承担其他功能（下图右）。参考资料：https://arxiv.org/abs/2509.03646https://www.rohan-paul.com/p/new-paper-shows-why-reasoning-improveshttps://tiger-ai-lab.github.io/Hierarchical-Reasoner/

智观行业 1年前

0 87,749 0

ChatGPT每周用户达8亿，OpenAI开发者大会派礼包，助力打造App和AI智能体

ChatGPT每周用户达8亿，OpenAI开发者大会派礼包，助力打造App和AI智能体当地时间10月6日周一，规模最大的一届开发者大会DevDay在旧金山Fort Mason举行。OpenAI的CEO Altman在开场讲话中介绍，聊天机器人ChatGPT每周用户已达到8亿，拥有400万开发者，OpenAI的API每分钟处理80亿个token。以上数据意味着OpenAI的用户时隔一个月增长了10%以上。因为上月OpenAI透露，ChatGPT的单周活跃用户达到7亿。接下来，Altman和OpenAI的员工介绍并演示了OpenAI给开发者派发的“礼包”——为ChatGPT打造应用程序App的框架Apps SDK（软件开发框架）、支持打造AI智能体（Agent）的AgentKit、轻松嵌入ChatGPT聊天功能的ChatKit。Altman畅想了人工智能（AI）改变编程的愿景：让编程从需要大型团队完成的职业转变为，个人在ChatGPT帮助下可以完成的工作。他说： “我们正在见证意义重大的事发生。过去，软件开发需要数月甚至数年的时间。现在，利用AI，开发软件只需几分钟。你不需要庞大的团队，只需要一个好主意，然后就能以前所未有的速度将其变为现实。” 演示App SDK Figma股价盘中转涨超10%Altman介绍OpenAI的Apps SDK，它将允许用户直接通过ChatGPT访问App。例如，用户可以输入“要求聊天机器人为派对创建播放列表”，并获得 Spotify 的推荐。OpenAI现场演示了Apps SDK，一位用户请求 ChatGPT 使用 Canva 为一家遛狗公司制作海报模型。几分钟后，Canva 为这家公司生成了四张不同的海报，并直接在ChatGPT中呈现给用户。用户还可以请求后续编辑并创建其他形式的媒体。OpenAI 还在演示中制作了一份演示文稿。Altman演示了旧金山设计软件公司Figma的技术，涉及Figma与ChatGPT的结合，展示了第三方App如何与OpenAI的App SDK集成。他说： “当有人使用ChatGPT时，你可以通过输入名称来找到某个App。例如，你可以为ChatGPT绘制一个产品流程图，然后告诉Figma，‘请用Figma将草图转换成可行的图表’。Figma App将响应，接管并完成操作。” Altman称，如果用户订阅OpenAI的Apps SDK，将能够在不离开ChatGPT对话的情况下登录该产品。利用Figma开发产品的人还可以启动 FigJam 工具继续推进开发创意。Apps SDK 基于去年11月底OpenAI推出的开放标准模型上下文协议（Model Context Protocol）。软件开发者将能在今年晚些时候提交App供审核。被Altman提及后，早盘曾跌超3%的Figma（FIG）周一午盘拉升转涨，午盘刷新日高时，日内涨超16%，收涨7.4%。该司专注于开发基于浏览器的协作设计工具。首批ChatGPT App之一Coursera 盘中涨超8% DevDay期间，在线学习平台Coursera宣布，成为ChatGPT中首批采用的App之一，并在OpenAI的DevDay上亮相。OpenAI演示了如何使用 ChatGPT 在 ChatGPT 中访问在线学习平台Coursera的视频，并展示了AI 如何深入研究视频中的某些主题。OpenAI的软件工程师Alexi Christakis称：“在训练机器学习模型之前，ChatGPT会回应并解释讲师的数据准备步骤，然后进行多次分解。”Coursera（COUR）股价盘中涨幅迅速扩大，午盘曾涨约8.4%，收涨0.4%。 OpenAI演示AgentKit构建AI智能体 Altman 介绍了 AgentKit，他表示，该工具旨在帮助开发者构建AI智能体，并将其从“原型到生产”阶段推进。Altman表示：“我们希望从个人开发者到大型企业，每个人都能从中获益。”OpenAI的技术人员在八分钟内构建了一个AI智能体，现场向观众演示AgentKit。该智能体在距离八分钟还剩49秒时间内完成，并已上线供参加DevDay的人员使用。演示者说：“在短短几分钟内，我们就以可视化的方式设计了一个智能体工作流程。我们添加了一些工具和小部件，进行了预览、部署和测试，现在大家就可以使用它了。”在介绍最新发布的AgentKit软件时，Altman提到了企业软件公司HubSpot，该软件旨在帮助程序员更快地创建能够自动执行某些任务的AI智能体。Altman说，HubSpot使用AgentKit软件改进了公司的Breeze AI 工具，使其能够对客户咨询生成更具说服力的回复。被Altman提到后，HubSpot（HUBS）股价午盘曾涨11.3%，收涨2.6%。介绍ChatKit Codex上线 Altman表示，利用名为ChatKit的OpenAI产品，App开发者很快就能轻松地将基于ChatGPT的AI聊天功能嵌入到他们的App或网站中。他说：“你将获得一个简单易用的可嵌入聊天界面，你可以自行创建。你可以加入自己的品牌、工作流程以及任何能够让你的产品独具特色的元素。”Altman宣布，OpenAI今年早些时候发布研究预览版的软件工程智能体Codex 正式上线。OpenAI的开发者体验主管 Romain Huet现场未编写任何代码就演示了Codex。他为房间里的摄像头设计了控件，并编写了Xbox控制器实现同样的功能。Huet用自己的声音作为控制器，将灯光照亮人群。他说：“我们把语音、草图和周围的设备都整合在一起，然后将它们变成了可行的软件，而这一切都无需手工编写一行代码。”Huet演示了用语音即时创建一些软件。比如他用语音命令开发环境显示所有与会者的姓名，就像电影中的片尾字幕一样。Huet 表示，这意味着程序员将能够根据用户需求实时重新编写App。“当我要求创建片尾字幕叠加层时，它能够继续编辑这个 React App内的代码，重新加载，找到完成任务所需的内容，然后片尾字幕就开始滚动了。”API推出GTP-5 Pro、小语音模型纳入Sora 2 Altman 表示，OpenAI将在API（应用编程接口）中推出GTP-5 Pro。OpenAI还将在API中推出一个名为GPT-realtime-mini的小语音模型。Altman认为，语音将成为人们与AI交互的主要方式之一。Altman还宣布，上周推出的新一代音视频生成模型Sora 2现已加入API，新的开发者软件现已可供开发者测试。Altman介绍了开发者使用这些工具的一些方式，并展示了 AI 生成的视频，包括狗在沙滩上嬉戏，以及皮划艇运动员在湍急的河流中划桨。Altman说，新模型Sora 2能够完美地将声音与视觉效果完美结合，不仅仅是语音，还有丰富的音景，以及基于用户所看到内容将环境音频效果同步。OpenAI的计划或产品有助评估AI行业格局 OpenAI此前称，今年的DevDay预计有超过1500人到场，参加OpenAI“迄今为止规模最大的活动”。OpenAI的高管将在活动期间发表主题演讲，CEO Altman和“iPhone之父”、前苹果首席设计师Jony Ive将进行炉边谈话。此前分析师预计，OpenAI可能借DevDay之机推出更强大的消费级AI代理和AI浏览器等产品。瑞银称，OpenAI可能发布更多面向消费者的AI代理程序，例如“一个功能更强大的旅行预订代理”，甚至可能推出一款AI浏览器。Ingalls & Snyder高级投资组合策略师Tim Ghriskey称，任何关于OpenAI计划或产品的信息都将帮助投资者评估整个行业格局。最近有消息称，OpenAI可能在DevDay推出名为Agent Builder的新工具，让用户通过一个可视化的画布，以拖拽的方式构建自己的AI智能体工作流。Altman最近在社交媒体发帖称，OpenAI“推出了一些新产品，可以帮你用AI进行构建”。评论称，这一说辞和Agent Builder的消息一致。此外，Altman和Ive的对话有可能让外界了解到OpenAI备受期待的潜在新品进展——OpenAI研发中的AI可穿戴设备有什么最新消息。

智观行业 1年前

0 98,154 0

不藏了！OpenAI 2025开发者日：ChatGPT要变成操作系统，8分钟拖拽可构建超复杂Agent

不藏了！OpenAI 2025开发者日：ChatGPT要变成操作系统，8分钟拖拽可构建超复杂Agent 今天OpenAI的开发者日简直太硬核了，OpenAI的开发者已经达到了惊人的400万，ChatGPT周活跃用户达到8亿，每分钟API处理的60亿token 主要有四个方面内容1.在 ChatGPT 内部构建应用：Apps inside ChatGPT，OpenAI推出自己的App SDK。这可以说是惊雷消息，OpenAI不但要革苹果Appstore的命，还要直接把ChatGPT变为操作系统，看大神怎么说： 2.直接拖拽构建Agent工具：AgentKit。这里有个8分钟拖拽演示，我把视频扒下来了并且翻译好了，大家直接看视频是最直观的3.codex更新，关于codex最新能力演示视频，我也已经扒下来4.API支持：sora 2，gpt-5 pro Apps in ChatGPT：开启一个全新的应用分发与互动生态我认为这是最震撼的，标志ChatGPT正式进军操作系统，简单来说，OpenAI的野心是以后你只需要一个应用够了，这个应用就是ChatGPT，这样ChatGPT就变成事实上操作系统了，苹果Appstore瑟瑟发抖，毫无疑问这是OpenAI战略性的赌注在过去，OpenAI 曾尝试通过 GPTs 和 MCP 等方式，将开发者的服务与 ChatGPT 连接起来。这些尝试有的成功，有的则不尽人意，但都为 OpenAI 积累了宝贵的经验。今天，OpenAI 迈出了决定性的一步，正式向开发者开放 ChatGPT，允许他们在其中构建原生应用 (Apps)这将催生新一代的应用形态，它们具备三大核心特质：互动性 (interactive)、适应性 (adaptive) 和个性化 (personalized)。用户不再是单纯地与一个聊天机器人对话，而是可以直接在对话中与功能丰富的应用进行交互。为了实现这一点，OpenAI 推出了全新的Apps SDK (软件开发工具包)，现已开放预览Apps SDK 为开发者提供了一套完整的全栈解决方案，其主要特性包括：连接数据：开发者可以将自己的数据源和后端服务无缝接入触发动作：应用可以执行具体的后端操作，例如创建一个设计、预订一个行程或分析一份数据渲染完整 UI：开发者可以在 ChatGPT 的对话流中渲染完全互动的用户界面，而不仅仅是文本或卡片。这意味着视频播放器、互动地图、设计画板等复杂的 UI 都可以被直接嵌入基于 MCP 标准：Apps SDK 建立在 MCP 这一开放标准之上，开发者对其后端逻辑和前端 UI 拥有完全的控制权。由于标准是公开的，任何人都可以将其整合到自己的平台对于开发者而言，最大的吸引力在于分发渠道。一旦应用构建完成，它就有机会触及 ChatGPT 全球数亿的用户群体。这将极大地改变产品的规模化扩展方式。同时，OpenAI 也考虑到了商业化的需求。如果用户已经是开发者现有产品的订阅者，他们可以直接在对话中登录账户。未来，OpenAI 还将支持多种变现方式，包括新的Agentic Commerce Protocol (智能体商业协议)，该协议将允许在 ChatGPT 内部实现即时结账在现场演示中，软件工程师 Alexi 展示了几个首批合作伙伴的应用，生动地诠释了这种新模式的魔力：Coursera (在线课程平台)：当用户想要学习某个主题时，可以直接呼叫 Coursera 应用。应用会在对话中直接嵌入课程视频，并支持画中画或全屏播放。与应用对话功能：当用户观看视频时，可以随时向 ChatGPT 提问关于视频当前内容的问题，例如“请解释一下他们现在正在说的概念”。由于 Apps SDK 允许应用将上下文 (context) 暴露给模型，ChatGPT 能够准确理解用户正在观看的视频片段，并给出精准的回答。这将学习体验提升到了全新的高度 Canva (设计平台)：在一个为宠物狗遛弯业务进行头脑风暴的对话中，用户可以直接呼叫 Canva，并用自然语言下达指令，例如“Canva，用这个名字为我制作一个作品集，我希望它色彩丰富、异想天开、明亮，并使用无衬线字体”。Canva 应用会直接在对话中生成设计选项。用户还可以进一步迭代，比如将一张海报转化为一个用于种子轮融资的完整 Pitch Deck (简报)。整个创意流程在同一个对话窗口中无缝完成 Zillow (房地产平台)：当对话延伸到业务扩张，ChatGPT 建议将新城市选在匹兹堡。用户可以接着呼叫 Zillow 应用，要求“显示那里的待售房屋”。Zillow 会在对话中嵌入一个互动地图。用户可以切换到全屏模式，浏览房屋详情，甚至可以直接在地图上发起预约看房。更强大的是，用户可以继续用自然语言对 Zillow 应用进行操作，例如“将地图筛选为仅显示带院子的三居室房屋”。ChatGPT 会理解指令并更新地图。此外，当用户选定一处房产时，可以询问“这处房产离狗狗公园有多远？”。ChatGPT 会将来自 Zillow 应用的房屋位置信息与其自身的搜索工具结合，提供综合性的答案这些演示清晰地表明，Apps in ChatGPT 不仅仅是 API 的简单调用，而是将语言模型的理解能力与应用的丰富功能和互动界面深度融合，创造出前所未有的动态体验目前，Apps SDK 已向开发者提供预览版。今年晚些时候，开发者将能够提交应用进行审核和发布，届时还会推出一个应用目录 (Directory) 供用户浏览。符合基本标准的应用都将被收录，而那些在设计和功能上表现更出色的应用，将会获得更显著的推荐位置，甚至在对话中被主动建议给用户https://developers.openai.com/apps-sdkAgentKit：在几分钟内将智能体从原型带入生产环境智能体 (Agent)，即能够理解上下文、使用工具并自主完成任务的软件，被普遍认为是 AI 的下一个重要发展方向。然而，尽管围绕它的讨论非常火，但真正能投入生产并被大规模使用的智能体却寥寥无几。原因在于其开发过程异常复杂，开发者需要处理诸多难题：从选择合适的框架，到编排复杂的工作流、建立评估循环、连接各种工具，再到构建一个友好的用户界面，每一步都充满了挑战为了解决这些痛点，让每位开发者都能更快速地将想法转化为可用的智能体，OpenAI 推出了全新的AgentKit。这是一套内置于 OpenAI 平台中的完整构建模块，旨在帮助开发者以更少的时间和精力，完成从原型设计到生产部署的全过程AgentKit 核心包含三大组件，以及一个强大的连接器生态系统：1.Agent Builder (智能体构建器)：这是一个可视化的工作流设计工具。开发者不再需要从头编写复杂的协调代码，而是可以通过拖拽节点的方式来设计智能体的逻辑步骤、测试流程。这些节点包括工具调用、需要人类介入的环节、安全护栏和逻辑判断等。它建立在已有数十万开发者使用的 Responses API 之上，对于平台老用户来说非常容易上手2.ChatKit (聊天工具包)：为了让智能体拥有一个精美的用户界面，OpenAI 提供了 ChatKit。它是一个简单、可嵌入的聊天界面组件，开发者可以轻松地将其集成到自己的应用中，并进行品牌化定制，例如修改颜色、Logo 和提示语。这让开发者可以专注于核心业务逻辑，而无需在前端界面上花费过多时间3.Evals for Agents (智能体评估)：衡量智能体的性能至关重要。AgentKit 提供了一套专门的评估功能，包括：Trace Grading (追踪评分)：可以逐一审视智能体每一步的决策过程，深入理解其行为Datasets (数据集)：允许开发者针对工作流中的某个特定节点进行性能评估Automated Prompt Optimization (自动化提示优化)：帮助自动调整和改进提示词，以获得更好的性能External Model Evals (外部模型评估)：甚至支持在 OpenAI Evals 平台内直接对外部模型进行评估Connector Registry (连接器注册中心)：智能体需要安全地访问数据和工具。通过这个管理控制面板，企业可以安全地将智能体连接到内部工具和第三方系统，同时确保数据安全和权限可控现场演示，Christina 发起一项挑战：在 8 分钟内为 DevDay 的官方网站构建并部署一个问答智能体 "Ask Froge"我已经贴心的把这8分钟视频扒下来了，并且做好的翻译，大家就看吧，不用感谢我设计工作流 (在 Agent Builder 中)：1. 她首先拖入一个分类器节点，用来判断用户的提问是关于“会议日程”还是“一般信息”。 2. 接着，她创建了两个专门的智能体节点。一个是“日程智能体”，为其上传了包含所有会议信息的文档作为知识源；另一个是“DevDay 通用智能体”，为其提供了通用信息文件，并设定了其角色风格（像一只名为 Froge 的青蛙一样说话，会发出 "ribbit" 的声音）。 3. 为了让日程推荐更具视觉吸引力，她使用 **Widget Builder (小组件构建器)** 设计了一个精美的日程卡片，并将其附加到“日程智能体”的输出格式中。 4. 为了增强安全性，她添加了一个预置的 **Guardrail (护栏)** 节点，用于自动屏蔽个人身份信息 (PII)。 5. 整个工作流设计完成后，她在 Agent Builder 的预览窗口中进行了测试，确认其能够正确回答问题并以预期的方式呈现结果。部署到网站：1. 她点击“发布”，AgentKit 为这个工作流生成了一个唯一的 ID。 2. 然后，她来到 DevDay 网站的代码中，仅用了几行代码就完成了部署：她引入了 **ChatKit** 的 React 组件，将刚刚生成的工作流 ID 传入，并添加了一些自定义样式，如 Froge 主题的颜色和提示语。 3. 刷新网站，一个名为 "Ask Froge" 的聊天机器人已经出现在页面右下角，并完全可用。整个过程从设计到部署，耗时不到 8 分钟。这个演示完美地展示了 AgentKit 如何将一个原本需要数周开发时间的复杂任务，缩短到几分钟。更重要的是，后续的迭代可以直接在可视化的 Agent Builder 中完成，修改后的智能体无需重新部署代码即可在网站上生效Codex Codex更新今天，Codex 正式结束研究预览，进入通用可用阶段。推出了一系列新功能：1.Slack 集成：开发者可以直接在 Slack 的团队对话中要求 Codex 编写代码或回答问题2.Codex SDK：一个新的开发工具包，帮助团队将 Codex 的能力扩展和自动化到自己的工作流中3.新的管理工具和报告：包括环境控制、监控和分析仪表板，帮助企业更好地管理 Codex 的使用现场演示codex强大的编程能力: Romain 展示了如何利用 Codex 和 OpenAI 的 API，将周围的物理世界变成可交互的软件同样给大家奉上演示视频全过程：**从草图到 UI**：Romain 首先展示了一张他手绘的 UI 草图，然后使用 `Codex CLI` (命令行工具) 将其转换成一个带有摄像头画面的控制面板界面 **控制物理设备**：他的第一个挑战是发布会控制舞台上方的 Sony FR7 摄像机。他对如何开始一无所知，只知道这款摄像机有一个 C++ SDK。他直接向 Codex 下达了任务，Codex 自主研究了有 30 年历史的 VISCA 协议，并用 JavaScript 实现了控制逻辑。Romain 强调，Codex 能够不知疲倦地执行长达数小时的复杂任务 **实时添加新功能**：接着，Romain 在 VS Code 中向 Codex 插件下达了一个新任务：“将一个无线控制器连接起来以控制摄像机”。Codex 在后台开始分析现有代码，制定计划并实现功能。几分钟后，Romain 拿起一个 Xbox 手柄，成功地控制了摄像机的移动 **多模态与多工具协作**：演示的高潮是引入了语音控制。他利用 OpenAI 的实时语音 API 和 Agent SDK，为应用添加了语音交互能力。然后，他向 Codex 发出指令，要求为舞台的灯光系统创建一个 MCP 服务器，并提供了灯光系统的参考文档。Codex 在执行任务时，发现文档信息不全，于是自主上网搜索 GitHub 上的文档，补全了所需信息，最终成功创建了服务器 **人机协同编程的未来**：演示的最后，Romain 通过语音向应用下达指令：“让 Codex 显示一个类似电影结尾的演职员表，演员是现场的观众们”。应用中的语音智能体将这个请求转发给了 **Codex SDK**。Codex 实时地分析了前端应用的代码，注入了新的 React 组件，并在屏幕上滚动显示出了“演职员表”这个现场演示展示codex开发全过程：从草图、物理设备、语音指令到实时应用重构，整个过程几乎没有手写一行代码。Codex 真正成为了一位能够理解意图、解决未知问题并与开发者并肩工作的智能队友模型与 API 更新 GPT-5 Pro API 开放GPT-Realtime-Mini API 开放Sora 2 API 预览版发布DevDay 2025 的所有发布都指向一个共同的目标：OpenAI要为为这个新的开发者时代提供最好的平台。从在 ChatGPT 内部分发应用的 Apps SDK，到简化智能体开发的 AgentKit，再到 Codex，以及 GPT-5 Pro、Sora 2 和 Realtime-Mini 等更强大的模型 API，OpenAI 正在全方位地为开发者赋能就像Sam Altman说的，软件开发曾经是一个需要数月甚至数年才能完成的漫长过程，但今天，我们亲眼见证了它可以在几分钟内完成。在这个新时代，你所需要的，仅仅是一个好的想法。这是一个属于所有新开发者的黄金时代，注意是新开发者，我们都要问自己一句，我们属于这个新行列吗？以上，谢谢你看我的文章。觉得还不错的话，点个赞/在看/转发就更好了～想第一时间收到更新，记得给我加个⭐星标。～我们，下次再见 .../作者：花不玩

智观行业 1年前

0 86,771 0

OpenA野心：把所有App都装进ChatGPT

OpenA野心：把所有App都装进ChatGPT 财联社10月7日讯（编辑史正丞）随着周一的OpenAI发布会结束，一个崭新的问题摆在全球软件开发团队面前：是否要把自家服务直接接入用户数量猛烈增长的聊天机器人？作为背景，OpenAI在周一的开发者日上宣布ChatGPT开始内置第三方应用程序，开发者即日开始可以使用新版Apps SDK来构建这些应用。奥尔特曼也在发布会伊始透露，目前ChatGPT周活跃用户数已达8亿。这个数字上个月才刚突破7亿。简单来讲，此举将ChatGPT升格为系统平台，让应用开发者直接接入他们的服务。首批“吃螃蟹”的平台——出行预订平台缤客网和Expedia、设计网站Canva和Figma、网络教育平台Coursera、音乐流媒体应用Spotify和房产交易平台 Zillow已经上线ChatGPT，向其服务覆盖的市场提供服务。据OpenAI介绍，目前有两种情况可以在ChatGPT中调出第三方应用。首先是直接在发给ChatGPT的信息中明确要求使用某个应用，例如要求Spotify给出“我喜欢的歌手最新推出的、我还没听过的歌单”。或上传一段提纲，让Canva制作PPT。也可以在ChatGPT内播放Coursera的网课，甚至可以让AI解释精确到某个时间节点的授课内容。相较而言，在Expedia上订个机票，对于AI简直就是小菜一碟。 OpenAI透露，ChatGPT也会在聊天中主动推荐相关的应用。例如讨论买房话题时，ChatGPT可能会推荐Zillow应用，直接在AI聊天机器人内部展开交互式地图上，展现符合预算的房源列表。奥尔特曼也在周一宣布，可汗学院、DoorDash、优步、塔吉特等11家公司也将在今年晚些时候接入ChatGPT。公司也将在今年晚些时候开始接受应用提交以供审核和发布，并将分享更多开发者如何获利的信息。” 奥尔特曼表示：“我们希望ChatGPT成为人们提升效率、激发创意、加速学习、优化生活各领域事务的卓越工具。（ChatGPT内置应用）将催生新一代可对话的交互式、自适应且个性化的应用程序。这一动态也是OpenAI打造开发者生态的最新尝试。ChatGPT已经推出GPT商店，但需要用户主动访问商店获取。周一发布的更新直接整合进ChatGPT的回复中，将为开发者带来应用分发渠道的新蓝海，也能为用户提供更加专业的服务。OpenAI透露，如果用户已经订阅了某些应用的服务，他们也能够在ChatGPT内直接登陆账号来使用特定付费功能。通过ChatGPT刚推出的即时结账功能，OpenAI也将支持开发者在ChatGPT内变现。其他更新速览AgentKit：一套完整工具集，帮助开发者和企业构建、部署与优化智能体。包括可视化智能体构建器Agent Builder、对话工具包ChatKit，以及多项智能体评估功能。 Codex自动化编程智能体正式开放通用访问权限。API更新：面向金融、法律等需要“高准确性和深度推理能力”应用的GPT-5 Pro、近期大火的Sora 2，以及更便宜但“质量与表现力相当”的语音模型gpt-realtime mini正式向开发者推出。

智观行业 1年前

0 68,006 0

OpenAI推出小型语音模型GPT-5 Pro

OpenAI推出小型语音模型GPT-5 Pro 财联社10月7日电，OpenAI首席执行官奥尔特曼宣布，OpenAI在API推出GPT-5 Pro模型，公司还同步发布了规模更小的语音模型GPT-realtime-mini。奥尔特曼认为，语音将成为人们与AI交互的主要方式之一。这一布局彰显了OpenAI致力于打造多模态人机交互体验的战略方向，轻量化语音模型的推出也将助力开发者更高效地集成语音功能。

智观行业 1年前

0 46,524 0

“担心依赖美国，恐惧不如中国”，欧盟又挣扎…

“担心依赖美国，恐惧不如中国”，欧盟又挣扎… 【文/观察者网齐倩】近年来，中美竞争态势令欧盟深感焦虑，唯恐在人工智能（AI）等科技领域落后中美。据英国《金融时报》10月5日报道，特朗普政府上台后，欧盟迫切想改变当前“依赖美国、不如中国”的AI发展现状。目前，欧盟正准备推出一项新计划，旨在推广本土AI平台并减少对外国供应商的依赖，以在全球革命性技术竞赛中与中美竞争。《金融时报》看到的一份草案提案显示，欧盟委员会拟提出的“应用AI战略”将推广欧洲本土的AI工具，以提供“安全性和韧性”，同时提升欧盟的工业竞争力。据介绍，该战略强调需要改善AI在欧洲医疗、国防和制造业等领域的使用。草案称，欧盟委员会旨在通过加速开发和使用本土AI技术来“加强欧盟AI主权”，包括制定政策“加速公共管理部门采用欧洲可扩展和可复制的生成式AI解决方案”。报道称，这份战略将由欧盟技术专员亨娜·维尔库宁于7日提出，具体内容可能在公开前发生变化。欧盟技术专员亨娜·维尔库宁草案警告说，欧盟当前在AI技术栈的“外部依赖性”，可能被“其他国家和非国家行为者”武器化，对欧盟AI供应链构成风险。AI技术栈指的是构建、训练和管理AI应用所需的基础设施和软件。草案还提到，欧盟公共管理部门在“通过增加对欧洲制造的开源AI解决方案的需求，帮助AI初创企业成长”中扮演核心角色。《金融时报》指出，自特朗普重返美国总统以来，此类担忧加剧。欧盟内部正广泛关注欧盟依赖美国技术的现状，并加大对欧洲数字独立的呼吁。与此同时，中国AI发展迅速，正挑战美国在该领域的全球领导地位，这令欧盟深感焦虑，惟恐未来对该技术影响力大减。据报道，近年来，多家AI初创公司在欧洲国家设立总部。然而，欧盟在AI开发所需的软件、硬件以及关键矿物方面仍依赖美国和亚洲国家。当地时间3日，欧盟委员会主席冯德莱恩在一个活动上表示，欧盟希望通过应用AI战略“全面加速AI的采用”，以确保欧洲不会错过这项新技术。据报道，欧盟希望将AI定位为不仅仅是生产力工具，而是必须紧密融入欧盟机构、工业和安全系统的“战略资产”。为实施战略中的行动，例如支持制造业和医疗行业的AI采用，欧盟委员会正从现有融资计划中调动10亿欧元。此外，欧盟还希望优先在国防领域采用欧盟本土AI工具，包括加速开发和部署欧洲AI支持的指挥与控制（C2）能力。据悉，当前欧洲军队正严重依赖美国提供的C2能力。去年9月，欧盟发布“德拉吉报告” 其实，早在一年前，欧盟就意识到了欧洲与中美在科技领域的差距。去年9月，欧盟委员会宣布，正式就建立AI工厂发起招标，以提升AI竞争力。与此同时，欧盟发布了旨在提升竞争力的“德拉吉报告”。冯德莱恩当时称，欧洲必须努力成为AI创新领域的全球领导者。但芯片巨头英伟达首席执行官黄仁勋去年10月直言，欧盟在AI投资方面远远落后于美国和中国，必须加快发展人工智能，每个国家都认识到了数据是一种国家资源。今年9月，德意志银行发布研究报告称，在缩小与中美创新差距方面，欧洲举步维艰。报告显示，“德拉吉报告”的后续落实情况令人失望。截至9月4日，建议中仅11.2%已得到全面落实。即便将部分推进的内容计算在内，该议程的实施进度也不到三分之一。本文系观察者网独家稿件，未经授权，不得转载。

智观行业 1年前

0 25,986 0

AI战略又一重要布局将落地！联想(00992)收购高端存储企业Infinidat事宜或于年底前完成

AI战略又一重要布局将落地！联想(00992)收购高端存储企业Infinidat事宜或于年底前完成智通财经APP获悉，近日，高端企业存储解决方案公司Infinidat正式宣布扩展其InfiniBox G4存储阵列产品线，推出更小尺寸的新型号并升级现有产品;与此同时，Infinidat首席营销官(CMO)埃里克·赫尔佐格(Eric Herzog)在接受行业媒体采访时透露，联想集团(00992)对Infinidat的收购计划进展顺利，预计将于2025年底前完成交割。此次InfiniBox G4产品线更新或成为Infinidat作为独立公司的最后一次重大产品动作。Infinidat 已连续多年被评为Gartner主存储魔力象限领导者，这一认可充分证明了其技术实力与市场执行力。据介绍，联想与Infinidat的收购合作自2025年1月官宣以来，始终按计划推进，收购金额虽未对外披露，但双方业务的互补性成为核心亮点。赫尔佐格指出，联想此前已拥有入门级和中端存储解决方案，且在AI服务器领域布局深厚，但缺乏高端存储产品;而Infinidat长期聚焦高端企业级存储市场，不涉及入门及中端品类，其研发的检索增强生成(RAG)AI数据服务可与联想AI服务器业务高度适配，“我们没有服务器业务，联想没有带AI RAG功能的高端存储，双方整合后能填补各自业务空白，形成完整的高端存储与AI算力协同方案。”事实上，联想一直在努力弥补高端存储领域的不足，其存储业务发展历程中曾多次依赖外部合作却面临瓶颈——2012年起转售 EMC 存储产品，2015 年合作 SimpliVity 推进超融合方案、2016 年采用 Nimble Storage 技术推出融合基础设施产品，但后续 SimpliVity、Nimble Storage 先后被竞争对手慧与(HPE)收购，导致联想高端存储布局一直没能打开局面。此次收购 Infinidat，正是联想打破外部合作依赖、填补高端存储自主技术空白的关键举措，也是其完善数据中心基础设施布局的必然选择。值得关注的是，此次合作不存在显著的产品重叠，无需对现有产品线进行大规模调整。赫尔佐格强调，Infinidat为高端存储市场提供的100%可用性保障、网络恢复保障及性能保障等核心优势将保持不变，而这些正是联想此前在高端存储领域未能覆盖的能力，“Infinidat的加入将完善联想的产品组合与解决方案体系，尤其能为联想的合作伙伴提供更全面的高端存储支持。”收购完成后，Infinidat业务将归入联想基础设施解决方案集团(Infrastructure Solutions Group)，进一步补充联想在中小型企业(SMB)及中端存储领域之外的高端市场能力。在此次重磅发布的InfiniBox G4新品上，Infinidat从系统与软件双维度实现突破。硬件层面，新品尺寸较此前的14U(机架单位)进一步缩小30%，降至11U，同时推出低容量版本，入门价格较2024年小尺寸型号降低29%，但仍保持高端企业级产品属性——35微秒低延迟、全套网络安全功能，并新增NVMe高速接口，带宽达到前代入门级产品的两倍。软件层面，G4系列首次实现操作系统原生支持S3兼容对象存储，无需额外附加组件或独立阵列，大幅简化部署流程。此外，Infinidat还升级了混合式G4存储阵列的硬盘配置，使单个机架的有效容量提升至33PB(拍字节)，较当前最大容量17.2PB实现近翻倍增长;未来，Infinidat计划推出低成本QLC(四级单元)闪存存储选项，为客户提供“专用数据保护目标设备”或“低成本主存储阵列”的灵活选择，并将为合作伙伴提供明确的性能指导方案。对于InfiniBox G4的市场前景，行业合作伙伴给予高度认可。总部位于美国加利福尼亚州福斯特城的解决方案提供商Sycomp(同时为Infinidat与联想渠道合作伙伴)首席运营官(COO)尼尔·卡拉汉(Neal Callahan)表示，Infinidat持续投入资源升级G4产品线的举措令人印象深刻，“更小尺寸、更优环境适应性、更快带宽、更强软件功能与更低价格的组合，将推动客户把该存储技术拓展到工厂mini 数据中心、跨国企业小型设施托管数据中心、办公园区等新场景。”他同时看好该产品在远程数据中心、概念验证(POC)中心等区域级场所的应用潜力。针对联想收购Infinidat的长期价值，卡拉汉回忆起联想此前收购IBM部分业务的成功案例，认为此次收购将助力联想大幅扩展产品线，提升市场竞争力，“即便在高端中小型企业市场，这一合作也将带来显著的价值增量，期待看到双方整合后为行业带来更全面的存储与AI协同解决方案。”此次Infinidat新品发布与联想收购进展的同步披露，不仅展现了Infinidat在高端存储领域的技术深耕，更凸显了联想完善企业级IT基础设施布局的战略决心。随着收购交割临近，双方的业务协同将为全球企业客户带来“高端存储+AI服务器+RAG数据服务”的一体化解决方案，推动AI时代企业存储与算力需求的深度融合。

智观行业 1年前

0 2,263 0

保护钱包，微信这个功能一定要开启！

保护钱包，微信这个功能一定要开启！来源：央视新闻微信公众号近日，话题“微信里的钱包一定要上锁”引起网友热议。有网友表示，微信里的钱包一定要上锁，万一手机丢了，别人也无法使用你的微信钱包。很多网友看了之后，纷纷表示：“从来没有打开过！”那么，手把手教学来了——第一步：打开微信，进入“我-服务-钱包”，选择“客服中心”。第二步：在“常用工具”界面，选择消费者保护。第三步：选择“安全保障”。第四步：选择“安全锁”，可以看到有两种解锁方式，一个是“指纹解锁”，另一个是“手势密码解锁”，根据自己的使用习惯选择一种解锁方式，验证身份并设置好解锁方式后，安全锁功能就完成开启了。该功能开启后，不管是点微信右上角的“+”进入“收付款”，还是点右下角的“我-服务”进入钱包，都必须进行验证才可以进入，就算有人捡到你的手机，由于无法解锁进入微信的任何付款渠道，就没法盗刷你的钱了。

智观行业 1年前

0 91,963 0

今日迎本世纪「最晚中秋月圆」；雷军：小米17 五天销量破百万；ChatGPT 或添私信聊天功能 | 极客早知道

今日迎本世纪「最晚中秋月圆」；雷军：小米17 五天销量破百万；ChatGPT 或添私信聊天功能 | 极客早知道 OpenAI AI 社交野心显现：ChatGPT 代码泄露内置私信功能，未来可直接与好友聊天 10 月 6 日消息，科技媒体 bleepingcomputer 10 月 5 日发布博文，报道称 OpenAI 正推动 ChatGPT 向社交平台转型，正在测试内置「私信」（Direct Messages）功能，并配套开发用户名与个人资料系统，支持用户之间直接交流。AI 研究员 @oncescuradu 在 ChatGPT 安卓测试版（版本 1.2025.273 beta）应用代码中发现，OpenAI 公司正内部测试「私信」功能。有行业人士认为该功能如果落地，那么将改变 ChatGPT 的产品定位，从一个单纯的大型语言模型交互工具，转变为一个具备社交属性的 AI 平台，让其不再局限于人机对话，而是向人与人之间的连接拓展。为了支撑该功能，OpenAI 正在同步开发一套完善的配套系统，包括支持用户自定义的「用户名」以及可上传头像的个人资料页面。这意味着用户未来将拥有专属的身份标识，并能够像使用其他社交应用一样，搜索并联系平台上的其他用户。（来源：cnbeta）马斯克脑机接口公司 Neuralink 关键一步：首次公开其人体试验安全数据论文 10 月 5 日消息，马斯克旗下脑机接口公司 Neuralink 已向《新英格兰医学杂志》提交了首个包含其人体试验安全数据的学术论文，介绍了其首批三位受试者的最新情况。这一消息来自 Neuralink 临床试验点之一——巴罗神经学研究所（Barrow Neurological Institute）的首席执行官兼院长 Michael Lawton。Lawton 在纽约西奈山医疗系统主办的脑植入会议间隙透露了相关信息，但拒绝提供更多细节。根据此前披露，Neuralink 目前已在 12 名受试者体内植入设备。Neuralink 总裁 DJ Seo 曾在 9 月表示，公司希望在 2030 年前能够为健康人群植入其脑机接口设备。目前，脑机接口主要用于重症患者实验性地控制计算机。Lawton 指出，公司「设想为几乎所有可能需要的人提供这一技术」，但距离应用于健康人仍有很长的路要走。「他们一直非常谨慎，专注于有残疾的病患。」Neuralink 的目标是到 2031 年每年为 2 万人植入芯片，并实现至少 10 亿美元的年收入。除了帮助患者控制计算机，公司还在研发可恢复视力、从大脑中解码语言以及治疗帕金森病的芯片。（来源：新浪）微软被曝将终止 Xbox 新主机开发，全面转向第三方游戏发行 10 月 5 日消息，微软 Xbox 再次传出新传闻，称该公司可能逐步淡出游戏主机市场，转向全平台的软件与服务战略。这一消息来自爆料者 SneakersSO，他此前曾泄露过 Xbox 计划将游戏移植至其他平台的消息。他昨日在 NeoGAF 论坛披露：Xbox 原定 2026 年投产（预计 2027 年发售）的新主机计划已从「具体落实」状态转为「悬而未决」。SneakersSO 还提到，微软未来的重点将是软件发行和高盈利的游戏 IP，包括《使命召唤》《魔兽世界》《我的世界》《糖果传奇》和《极限竞速：地平线》等。同时，云游戏被定位为「Xbox 平台」的核心，使 Game Pass 订阅服务转变为 xCloud 云游戏入口（并继续提价）。微软的目标是让旗下软件能够在任何具备用户基础的设备上发行游戏。（来源：IT 之家）库克 65 岁在即，苹果硬件主管 John Ternus 成 CEO 最大热门接班人选 10 月 6 日消息，在今天最新一期的 Power On 时事通讯节目中，彭博社记者马克・古尔曼再次探讨了苹果 CEO 接班人的问题。随着苹果首席运营官杰夫・威廉姆斯（Jeff Williams）即将离任，苹果高层正处于十年来最大规模人事更迭的边缘。古尔曼表示，苹果硬件工程高级副总裁约翰・特纳斯（John Ternus）正逐渐走到走向聚光灯下，在苹果内部呼声最高。对此，古尔曼给出了三大因素支撑其判断：首先，苹果内部可选高管有限。50 岁的 Ternus 与库克接任 CEO 时同龄，若进展顺利可执掌公司十年以上，而其他潜在人选均难达到此年限。其次，苹果更需要技术专家而非销售或运营人才。库克任内公司产品线与收入大幅扩张，iPhone 17 也获市场认可，但混合现实、生成式 AI、智能家居与自动驾驶等新兴技术领域进展迟缓。董事会可能因此倾向于产品工程负责人，尽管 Ternus 并不以「冒险大规模投资」著称。第三，Ternus 表现突出。他具个人魅力，深受苹果粉丝认可，并获库克信任，被赋予产品路线图、功能与战略等关键决策权，影响力完全超越硬件工程主管传统职责。近期，其公众曝光度显著增加：他主持发布多年来苹果首款重大改版机型 iPhone Air，并在多场访谈中占据核心位置。（来源：IT 之家）十五的月亮十六圆：本世纪最晚中秋来了，比去年足足晚了 19 天 10 月 5 日消息，明天（10 月 6 日）将迎来中秋佳节，这也是本世纪公历日期最晚的中秋节，比去年中秋节日期整整晚了 19 天。另外，今年中秋同样也是「十五的月亮十六圆」，月亮最圆时出现在 10 月 7 日 11 时 48 分。再加上月球 10 月 8 日 21 时月亮距离地球最近，中秋月圆夜（农历八月十六）将会出现又圆又大又亮的「超级月亮」（其满月视直径在全年满月中排第三）。可惜的是，北京、天津、河北、河南、山东、陕西、云南等地云层较厚，或有雨水来扰，可能无缘欣赏今年的中秋圆月；另外辽宁、吉林、内蒙古、新疆南部、甘肃北部等地天空云量略多、月色朦胧。除此之外，广东、福建、浙江、江苏、安徽、湖北、湖南、江西、重庆、新疆北部、青海西部等地天空晴朗、云量较少，抬头可见皓月当空的美景。（来源：IT 之家）雷军：小米 17 系列靠背屏等创新开售仅 5 天销量破 100 万台 10 月 6 日消息，雷军在社交媒体上发文称，小米 17 系列开售仅 5 天销量破 100 万台。在这之前，卢伟冰还宣布，小米 17 系列目前销量确实已超过 100 万台，比往代速度更快。根据小米公布的海报，小米 17 全系开售仅 5 分钟便刷新了 2025 年国产智能手机全价位段的新机首销纪录。其中，小米 17 Pro Max 单款机型打破今年国产手机首销日销量与销售额纪录。然而，具体销售数据均未披露。（来源：网易）12.43 亿人次！十一假期出行人数再创记录 10 月 5 日消息，据交通运输部统计，10 月 4 日，全社会跨区域人员流动量为 30129.11 万人次，同比增长 6.1％，连续 4 天超过 1 亿人次。至此，国庆中秋假期前半程全社会跨区域人员流动量再创历史新高，累计达到约 12.43 亿人次，日均值超过 3.1 亿人次。具体来看，10 月 4 日，铁路客运量为 1833.4 万人次，同比增长 4.5％；水路客运量为 190.77 万人次，同比增长 5.6％；民航客运量为 231.94 万人次，同比增长 4.1％；公路人员流动量为 27873 万人次，同比增长 6.2％。其中，公路营业性客运量为 3523 万人次，同比增长 2.5％；高速公路及普通国省道非营业性小客车人员出行量为 24350 万人次，同比增长 6.8％。从出行结构看，公路出行仍占主导地位，是公众出行首选。（来源：证券时报）中国地震局：正推进地震预警信息接入苹果 iOS 系统功能对于使用 iPhone 的用户来说，很快也能享受到地震预警信息提示了。近日有公众向中国地震局询问：地震局能否在地震系统上制作 iOS 预警应用呢？以及小区广播功能？另外能否推进在地震预警上的 0 级短信覆盖呢？对此，地震局监测司回复：中国地震局高度重视地震预警服务工作，正在积极对接相关市场主体，推进地震预警信息接入 iOS 系统功能。现阶段，您可通过「中国地震台网」及各地地震预警微信小程序在 iOS 系统上获取权威地震预警信息。目前，我局正在积极推进与相关部门在地震预警信息服务方面的沟通合作，争取尽快实现更多渠道更大范围服务覆盖。后续进展敬请留意相关部门公告。（来源：网易）电子墨水屏阅读器文石 P6 Pro 小白马新品「剧透」：带高清摄像头、支持 5G 流量卡 10 月 5 日消息，文石 BOOK 今日发布了 P6 Pro 小白马的新品「剧透」，定位「高颜值阅读搭档」，将在 10 月 9 日 19:00 正式发布：采用高级荔枝纹素皮背板设计自带高清摄像头，支持扫码支付、文档扫描支持插入流量卡，可实现 5G 信号在线文石 P6 Pro 还将推出小彩马版本（彩色墨水屏，拥有专属达芬奇色彩调校），该版本机型同样支持 5G 网络信号，预装十余年深耕开放系统（预计为 Android 系统），拥有 8G 运存，配备手写笔，可看彩色漫画、彩色图文等内容。（来源：IT 之家）麻省理工混凝土电池问世：储能密度提升十倍 10 月 6 日消息，据媒体报道，麻省理工学院（MIT）研发出一款名为「EC³」的新型导电碳混凝土，这种材料能够像电池一样存储和释放电能，有望让建筑本身成为「储能装置」。研究团队通过优化材料配方，将能量密度提升至以往成果的 10 倍。EC³由水泥、水、超细炭黑与电解质组成，内部形成导电纳米网络，从而使墙体、人行道乃至桥梁在承担结构功能的同时，实现能量存储。实验表明，2023 年时满足一个家庭日用电量需约 45 立方米的 EC³，而采用新型电解质配方后，仅需 5 立方米——相当于普通地下室墙体的体积。研究人员还借助 FIB-SEM 层析技术观察到炭黑在孔隙中形成分形网络，使电解质充分渗透并促进导电。团队负责人 Masic 指出，理解材料在纳米尺度上的「自组装」机制是实现新功能的关键。在电解质选择上，EC³表现出较强适应性，海水也可使用，这为其在沿海工程及海上风电设施中的应用创造了条件。此外，科研人员改进了电解质掺入方式，将其与水混合后浇筑，从而制备出更厚、效率更高的电极。实验结果显示，使用有机电解质时，1 立方米 EC? 可储存超过 2 千瓦时的电量，足够驱动冰箱运行一天。此前，EC³已在日本札幌用于加热人行道以融化积雪。如今，MIT 的进展进一步拓展了该材料在大规模储能领域的应用前景。（来源：快科技）科学家发现关键蛋白质 GALNTL5，有助于诊疗男性不孕不育及研发新型避孕药 10 月 5 日消息，熊本大学和大阪大学参与的国际团队发现了一种名为 GALNTL5 的蛋白质，可能是诊疗男性不育的关键所在。此外，该研究成果还有望用于研发新型避孕药。研究人员发现，这种蛋白质在实验鼠精子与卵子结合过程中发挥关键作用——如果利用基因编辑技术使雄性实验鼠不能合成这种蛋白质，那么雄鼠会失去生育能力。据科研人员介绍，在人体内也存在 GALNTL5 蛋白质和相关的生理机制，目前人类男性不育案例中有很大比例原因不明，因此有可能基于上述成果开发新的针对男性不育的诊疗方法。由于人体内也有这种蛋白质，这项成果可能有助于诊疗男性不育。相关成果已于 9 月 17 日发表在《自然-通讯》上。（来源：极目新闻）印度要让全民抵制微软、谷歌等美国产品 10 月 5 日消息，由于美国在关税上的压制，导致印度现在正急切的摆脱美国产品，这其中也包含大力推广印度本土的应用等。据外媒最新报道称，印度总理莫迪的三名内阁同事正在推广使用本土企业开发的应用程序，以替代 Google 地图、WhatsApp 和微软等美国公司的产品，这是印度在与美国贸易关系紧张之际对"印度制造"产品最有力的支持。今年 8 月，美国对印度进口商品征收 50% 的关税后，莫迪一直在推动使用"本土"产品，即在印度制造的产品。虽然许多行业高管都公开呼吁支持印度产品，但莫迪上个月直接呼吁印度人停止日常使用外国商品。信息技术部长阿什维尼·韦什纳夫本周在介绍高速公路项目时表示，他的演示文稿是使用印度公司 Zoho 制作的，Zoho 是微软 PowerPoint 的本土竞争对手，并且没有使用 Google 地图。"这个地图来自 MapmyIndia，不是 Google 地图，"这位部长微笑着说，MapmyIndia 是一家印度地图服务提供商。（来源：搜狐）*图片来源：视觉中国播客上新极客公园的播客节目「开始连接 LinkStart」持续更新中～一直以来，极客公园忠诚于记录创新。我们愿意走近创新者、创业者，聆听和记录他们创造价值、改变世界的故事；同时，我们也愿意近距离观察创新的阻力、代价，以及时代中被科技潮流裹挟的个体。如果你也想「聆听」这些声音，欢迎长按下方「卡片二维码」关注我们的播客「开始连接 LinkStart」～

智观行业 1年前

0 3,548 0

ChatGPT或正测试私信功能：向社交平台转型

ChatGPT或正测试私信功能：向社交平台转型据报道，OpenAI正推动ChatGPT向社交平台转型，正在测试内置“私信”功能，并配套开发用户名与个人资料系统，支持用户之间直接交流。该功能若落地，将使ChatGPT从大型语言模型交互工具转变为具备社交属性的AI平台。AI研究员在ChatGPT安卓测试版应用代码中发现该功能，其内部开发代号为“Calpico”。未来ChatGPT还将包含更丰富的通知功能，如群聊成员变动提醒及消息推送通知。

智观行业 1年前

0 92,508 0

苹果AI谁来掌舵？彭博社称苹果已向外寻找新帅

苹果AI谁来掌舵？彭博社称苹果已向外寻找新帅 IT之家 10 月 6 日消息，彭博社昨日（10 月 5 日）发布博文，报道称苹果公司正为其人工智能（AI）部门寻找新的负责人，以接替现任主管 John Giannandrea。IT之家援引博文介绍，此次人事变动的直接起因是 Apple Intelligence 发布不力，以及公司承诺已久的 Siri 重大升级一再推迟。Giannandrea 于 2025 年 3 月调离 AI 主管岗位，然而数月过去，苹果至今仍未确定该职位的正式继任者。在 Giannandrea 调离后，苹果曾指派 Apple Vision Pro 负责人 Mike Rockwell 临时接管 Siri 的开发工作。虽然 Rockwell 缺乏专业的 AI 背景，但苹果当时看重的是他的技术专长、成功交付新产品的经验以及卓越的领导能力。根据彭博社“Power On”时事通讯的最新消息，Rockwell 曾被视为有力的继任人选，不过目前来看他正式接任的可能性已大幅降低，彭博社认为，苹果认为要领导其庞大的 AI 项目，深厚的专业背景依然是不可或缺的。报道指出，苹果高管已将目光投向公司外部，希望从 AI 行业中寻找顶尖领袖来填补空缺。其中，来自主要竞争对手 Meta 的一位高级 AI 主管，已成为苹果的重点考虑对象。苹果之所以将目光投向 Meta，部分原因在于后者近期的组织变动。Meta 近期完成了对其 AI 部门长达数月的重组，并新成立了“超级智能实验室”（Superintelligence Labs）。因此，这次重组可能导致部分人才流出，为苹果招募经验丰富的 AI 专家创造了机会。

智观行业 1年前

0 70,536 0

“克隆战争”上演：OpenAI Sora 2 未至、山寨先行，苹果出手整治

“克隆战争”上演：OpenAI Sora 2 未至、山寨先行，苹果出手整治 IT之家 10 月 6 日消息，科技媒体 9to5Mac 昨日（10 月 5 日）发布博文，报道称 OpenAI 的官方文生视频应用 Sora 目前仅限美国和加拿大用户使用，不过由于该应用的爆火，全球范围内的 App Store 正涌现大量山寨 Sora 应用。科技博客 Daring Fireball 作者 John Gruber 指出，一款名为“Sora 2: AI Video Generator”的山寨应用不仅成功上架，而且一度冲上 App Store“照片与视频应用”热门榜单的第 9 位，对于不知情的用户来说，很容易误认为是正版应用。类似的山寨应用远不止一个。经该媒体搜索发现，以“Sora 2”为关键词可以找到约十几个相关应用。为了增加可信度，这些应用无所不用其极：有的直接在图标中盗用 OpenAI 的官方标志，有的则在副标题中捆绑谷歌的 Veo 3 模型。它们的最终目的，都是诱导用户通过应用内购买或高额的周度订阅服务付费。IT之家附上相关图片如下：虽然这种山寨行为在应用商店中屡见不鲜，但由于许多非美国和加拿大地区的用户并不清楚官方 Sora 仅在特定地区推出的事实，因此极易上当受骗，误以为自己下载并付费的是正版应用。这再次暴露了应用商店审核机制在应对热点事件时的滞后性。根据最新消息，在媒体曝光后，苹果公司已迅速采取行动，为遏制骗局的进一步蔓延，目前报道中提及的这些山寨应用已被从 App Store 下架，或被强制恢复其原始名称。

智观行业 1年前

0 35,592 0

OpenAI开发者大会将有新内容，助力AI开发创作

OpenAI开发者大会将有新内容，助力AI开发创作当地时间10月5日，OpenAI创始人山姆·奥特曼在社交平台发帖称：“明天的开发者大会（Dev Day）太让人期待了！我们准备了一些新内容，助力大家用人工智能（AI）进行开发创作。”

智观行业 1年前

0 58,411 0

OpenAI AI社交野心显现：ChatGPT代码泄露内置私信功能

OpenAI AI社交野心显现：ChatGPT代码泄露内置私信功能 IT之家 10 月 6 日消息，科技媒体 bleepingcomputer 昨日（10 月 5 日）发布博文，报道称 OpenAI 正推动 ChatGPT 向社交平台转型，正在测试内置“私信”（Direct Messages）功能，并配套开发用户名与个人资料系统，支持用户之间直接交流。该媒体认为该功能如果落地，那么将彻底改变 ChatGPT 的产品定位，从一个单纯的大型语言模型交互工具，转变为一个具备社交属性的 AI 平台，让其不再局限于人机对话，而是向人与人之间的连接拓展。AI 研究员 @oncescuradu 在 ChatGPT 安卓测试版（版本 1.2025.273 beta）应用代码中发现，OpenAI 公司正内部测试“私信”功能。IT之家附上相关截图如下：为了支撑该功能，OpenAI 正在同步开发一套完善的配套系统，包括支持用户自定义的“用户名”以及可上传头像的个人资料页面。这意味着用户未来将拥有专属的身份标识，并能够像使用其他社交应用一样，搜索并联系平台上的其他用户。代码信息显示，这项全新的私信功能及其相关聊天室的内部开发代号为“Calpico”。值得注意的是，类似的社交功能最早出现在 OpenAI 的文生视频模型 Sora 2 的 iOS 应用中，该应用包含一个类似社交媒体的信息流。除了核心的私信功能外，泄露的代码还揭示了更多旨在提升社交体验的细节。未来的 ChatGPT 将包含更丰富的通知功能，例如当有新成员加入或离开群聊时，系统会发出提醒。同时，当用户收到来自其他用户或 ChatGPT 本身发送的消息时，也会收到相应的推送通知。

智观行业 1年前

0 35,862 0

今日数据精选：黑神话钟馗获金摇杆提名；特斯拉称年底推出第3代人形机器人

今日数据精选：黑神话钟馗获金摇杆提名；特斯拉称年底推出第3代人形机器人【假期数据】再创历史新高，国庆中秋假期前半程交通出行人数约12.43亿人次财联社10月5日电，从交通运输部获悉，10月4日，全社会跨区域人员流动量为30129.11万人次，同比增长6.1%。国庆中秋假期前半程全社会跨区域人员流动量再创历史新高，累计约12.43亿人次，日均值超过3.1亿人次，展现出强劲的出行活力。（财联社APP）【产业/公司数据】黑神话钟馗获金摇杆提名第43届金摇杆奖颁奖典礼将于 2025 年11月20日在伦敦举行，入围游戏名单已于 10 月 3 日公布。其中，《黑神话钟馗》《漫威金刚狼》《深海迷航 2》《生化危机安魂曲》《巫师 4》等游戏入选最受期待游戏提名，玩家投票现已开启。金摇杆是全球历史最悠久的公众投票游戏大奖，今年也将颁发 20 多个奖项以表彰年度最佳游戏、最佳表现和技术成就，去年《黑神话：悟空》获终极年度游戏、最佳视觉设计奖。（IT之家）特斯拉称年底推出第3代人形机器人《科创板日报》10月5日讯，自埃隆·马斯克宣布回归“全职打工人”身份后，特斯拉机器人便频频迎来进展。近日，埃隆·马斯克在社交平台X上传了一段特斯拉机器人Optimus和人类工作人员“过招”练功夫的视频。视频中，Optimus的背部系有一根牵引绳，除此之外并无其他束缚，其紧跟工作人员的动作，并实时作出动作回应。针对Optimus本次“对打”是遥控还是AI驱动的问题，马斯克在评论区明确回应：“是AI，不是遥控。”值得一提的是，就在几日前（9月30日），TeslaAI微博官方账号发文称，特斯拉正在努力扩大人形机器人的规模，计划2025年底推出第三代，并在2026年开始量产。马斯克预计2030年前将年产100万台。（财联社APP）小红书封禁超1200万个虚假账号21记者了解到，当前小红书主要打击的造假账号有两类：一类是机构自建编辑团队运营的“伪素人”账号，会精心营造医生、白领、学生等人设，发生活内容养号的同时，悄悄夹带私货；另一类是在众包平台招募普通用户作假的“众包”账号，批量发布同质化虚假营销笔记和评论。（21世纪经济报道）美国考虑铸造印有特朗普头像的硬币当地时间3日，美国财政部官员公开证实，为庆祝2026年美国独立250周年，财政部正考虑铸造一枚印有特朗普总统肖像的1美元纪念币。根据社交媒体上曝光的设计草图，1美元纪念硬币的正面刻有特朗普的侧面头像与1776至2026年字样，背面则刻有特朗普2024年在宾夕法尼亚州竞选集会上遭遇刺杀未遂时摆出的动作——握紧拳头、看向远方，以及他遭袭后对支持者喊出的口号——“战斗，战斗，战斗”。美国财政部官员布兰登·比奇在社交媒体上转发了草图，称“这不是假消息”，他期待在联邦政府“停摆”结束后分享更多信息。这则消息也获美国财政部长贝森特转发。不过根据美国现行法律，流通货币上一般禁止使用在世或身故时间不满两年的总统肖像。（央视财经）西贝上海部分门店国庆有8成上座率这个超长假期，此前处于风口浪尖的西贝怎么样了？第一财经记者实地探访和采访了北上广深等一线城市的西贝门店，聚焦假期内的西贝经营状况。据记者观察，在北京、深圳等地，在就餐高峰期，消费者需要等待一段时间才能就餐。为了吸引和留住消费者，西贝上新了部分餐饮品类。与此同时，西贝为吸引客人而发放的代金券已经开始被黄牛售卖了。（第一财经日报）【文旅新鲜事】年轻人为什么爱逛漫展，国庆中秋双节全国漫展超400场游客人数动辄数万甚至几十万，外地游客专门赶来，还有企业跨界进驻……据中新经纬不完全统计，10月1日至8日，全国将至少举办413场漫展，包括商业展和同人展等类型。从地域分布来看，一线和新一线城市漫展数量合计157场，占整体比重约38%。 “线下面对面交流是互联网很难替代的体验。尤其是年纪比较小的二次元爱好者，他们有强烈的社交需求。不管以什么样的形式，大家一起聚会，一起讨论一些喜欢的东西，这就是年轻人的一种娱乐方式。” 从事漫展行业近14年的北京策展人海格（化名）表示。（21世纪经济报道）三亚大悦城致歉近日有媒体报道称，海南三亚大悦城商场于10月3日举办“天降红包雨”活动，因现场严重拥挤，有人被推倒受伤。 10月4日晚10时许，三亚大悦城发布“情况通报”称，3日晚举办的现场互动活动，因预判不足，参与人数远超预期，局部区域出现短时拥挤，并有顾客不慎摔倒。“对于由此给您带来的不便与困扰，我们致以诚挚的歉意。”（长安街知事）珠峰东坡突发暴雪近千人被困，官方回应珠峰降雪致部分游客受影响据三湘都市报，10月4日，珠峰东坡出现今年国庆期间最强暴风雪，能见度骤降至不足1米，乌拉山口等关键路段被暴雪完全覆盖。10月4日17时50分起，珠峰景区紧急关闭并停售门票，通往景区路段积雪结冰，车辆无法通行。珠峰大本营游客因道路结冰被困，被迫在帐篷中避险。多个徒步队伍滞留晓乌错、汤湘、热嘎等营地。营地帐篷被积雪全包裹甚至压塌，部分区域因降雪量过大导致帐篷被掩埋，牦牛因积雪过深无法行动。据不完全统计，整条线路受困人员或达上千人，部分人员有能力自行下撤，但多数需救援。另据极目新闻，5日下午，记者联系上刚从珠峰东坡营地下山的孙先生，他说自己9月28日到达营地，4日在暴雪封路前抢着下了山。他说，3日晚山上开始下雪，到4日一直没有停，“听山上朋友反馈当晚山上暴雪，许多人的帐篷都被压塌了，营地积雪达1米多深，下山的通道全部被封了。”10月5日，“日喀则发布”微博发布情况说明：因10月4日夜间降雪，导致在定日县曲当镇嘎玛沟区域徒步旅行的部分游客行程受到一定影响。记者从曲当镇党委、政府及随行向导了解到，定日县委、县政府高度重视，连夜组织相关力量深入该区域开展联络、接应、服务保障等工作。据现场反馈，物资保障充足、人员安全。截至记者发稿前，第一批服务保障队伍已与游客会合，正在开展接应服务工作。（每经综合）原标题：《今日数据精选：黑神话钟馗获金摇杆提名；特斯拉称年底推出第3代人形机器人》栏目主编：尤莼洁来源：作者：解放日报李珺瑶

智观行业 1年前

0 78,901 0