找到
481
篇与
互联网
相关的结果
- 第 3 页
-
保障上海“四节同庆”,WAIC的首发展品,两个月内火速上岗 国庆长假前夕,国网上海电力自研的“天擎”特高压输电线路作业机器人正式投用。谁能想到,这一款机器人刚刚在2025年世界人工智能大会上首发首秀,仅仅两个月就正式上岗了。记者在现场看到,国网上海超高压公司输电专业工程师何冰团队研发的“天擎”特高压输电线路作业机器人,正稳稳地站在1000千伏安塘线导线上,用机械臂将一根2毫米细的销钉精准插入4毫米的销孔。全程仅用20分钟,就消除了一处可能引发线路故障的安全隐患。作为国内第二条1000千伏特高压双回输电线路,安塘线是外电入沪的“高速公路”,单日送电负荷能达到上海最高用电负荷的近十分之一,相当于给数百万上海家庭供电。不久前,输电运维人员发现这里的导线上有个销钉脱落了,可能导致铁塔部件掉落、导线断线,后果不堪设想。随即,运维人员带着“天擎”机器人抵达现场,通过大型无人机将它送到导线上。“天擎”自带导轮可以在导线上自由移动,通过搭载的深度相机、可视化相机、激光雷达等多模态传感器,能够在百米高空识别出毫米级的销钉脱落隐患,并将销钉插入销孔中,实现如穿针引线一般的高精度作业。“过去,我们通过人工作业方式解决这样的隐患需要数个小时。现在通过‘天擎’机器人,可以将作业时间缩短至20分钟。”国网上海超高压公司输电运检中心现场工程师杜袁天说道。据介绍,“天擎”机器人从实验室到在电网中成功应用,经历了无数次试验优化。现在它能稳定识别缺陷、精准作业,未来还要挑战长江大跨越杆塔、极端灾害天气等更复杂的场景。与此同时,位于上海东部的张江科学会堂,在国庆期间也将上演上海国际光影节重要灯光秀,因此跃升为上海假日旅游的热门打卡地。然而,光影节开幕式及核心展示区域设在科学会堂室外楼顶花园,且恰逢黄金周多雨天气,浦东供电公司张江中心能源管家团队除了常规的户外电力设施的安全检查之外,还特别依托“线上监测+线下巡检”联动机制,通过智慧保电数字孪生系统,实时精准监控会场及周边区域的用电负荷变化。工作人员在后台可清晰掌握活动现场大屏回路、灯光回路的实时电流与电压数据,确保电力供应全程“零闪动”,保障灯光秀流畅完美呈现。“今年恰逢国庆、中秋双节叠加,与正在举办的上海旅游节、国际光影节形成‘四节同庆’效应,必然能点燃上海假日旅游热潮。”国网上海电力负责人表示,具身智能、数字孪生等“硬核”科技的加速落地,能更好确保城市电网安全可靠运行。原标题:《保障上海“四节同庆”,WAIC的首发展品,两个月内火速上岗》栏目主编:李晔来源:作者:解放日报 查睿
-
刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok 新智元报道编辑:艾伦 桃子【新智元导读】凌晨1点,OpenAI突然扔出Sora 2核弹,AI视频迎来「GPT-3.5时刻」!一大批惊艳Demo放出,物理智能提升一大截,首次实现音画同步,人物一致性、可控性刷新SOTA。但最绝的还是Sora App,它的问世,或将彻底重塑短视频社交媒体的交互逻辑与社区互动方式。实属没想到,Sora 2深夜炸场!刚刚,OpenAI直播正式官宣新一代AI视频模型——Sora 2,正面狙击谷歌Veo 3。 它在物理准确性、逼真度上,一举刷新SOTA,并在一致性、可控性上实现了巨大飞跃。值得一提的是,Sora 2首次实现「音画同步」。奥特曼发长文激动地表示,「创意领域的ChatGPT时刻来临」!人类创造力即将迎来一次寒武纪大爆发,随之而来的艺术和娱乐质量,也将大幅提升。突然间,创作天地变得无比开阔,令人印象非常深刻。 他还特意强调了一个创意玩法——把自己和朋友们放进视频里,效果好玩到炸! 这不,奥特曼拿着大话筒,直呼「10am PT.开启直播」。 而且,他还和Sora团队负责人Bill Peebles用Sora 2,直接拍了一部官宣2分钟视频,效果极其震撼。令人意外的是,人物角色的一致性非常高,看来我们离好莱坞级大片不远了。正如爆料所言,Sora首个App正式解禁,在iOS端可直接下载。安卓用户,需通过sora.com访问。 Sora 2出世,视频GPT-3.5时刻来临说到AI视频生成,过去总有种「梦里啥都有」的感觉——篮球瞬移进筐、人物刚刚还在左边,下一帧就冒出来个分身。技术进步快没错,但「假」也总是藏不住。直到Sora 2推出,第一次让人觉得,AI终于开始尊重物理和常识,生成世界不再是「随便编编」,而是真能照进现实。 2024年2月,Sora首次放出,堪称视频界的「GPT-1时刻」!这是首次,让所有人看到视频生成真的可用了。过去半年,OpenAI团队死磕「如何让模型真正学会模拟实际运行」这个关键,如今终于取得重大突破。基于海量视频数据的预训练和后训练技术,Sora 2的高光时刻降临。正如官博所言,Sora 2开启了「视频领域的GPT-3.5 时刻」! 接下来,具体看看Sora 2历经一年多,究竟取得了哪些重大突破? AI穿帮,终于被揪出来了最让人感慨的,是Sora 2在物理细节上的进化。别小看这个点,比如你让它生成人投篮,旧模型为了「满足」指令,球会强行飞进篮筐(哪怕角度完全不合理);现在的Sora 2,球打板弹开、甚至投丢都成常态,动作有惯性、受力和材质都说得通。头顶一只猫咪并完成三周半跳?奥运冠军能否做到尚未可知,但Sora认为完全不在话下。 Prompt: figure skater performs a triple axle with a cat on her head被业界封为「AI体操界的图灵测试」,Sora 2一次性就通过了。 Prompt: a gymnast flips on a balance beam. cinematic就连这种不符合逻辑的奇葩操作:一名男子骑在一匹马背上,而这匹马又骑在另一匹马背上,Sora 2也能以意想不到方式完成。 Prompt: a man rides a horse which is on another horse桨板上的后空翻也不是P上去的,而是力学能自洽地演绎。Prompt: a man does a backflip on a paddleboard你甚至能感受到角色的失误、尝试、挣扎,而不是一味「全都对」。有点像在看小型纪录片——会成功,但也会失败。Prompt: Title — Lanterns Above, Distance Between (10.0s, Live Action Black & White Festival Night)Sora 2还能生成各类复杂环境声,效果十分惊艳,几乎听不出AI生成的痕迹。Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time「世界模拟器」这词,终于有点底气了。多镜头、多风格,连贯成片不是梦以前你让AI连续生成几个镜头,角色的衣服总莫名其妙换了、光线乱飘、道具没了。Sora 2这次特别强调「世界状态」连续性——哪怕你让角色从厨房走到阳台,镜头切换时阳光、服饰、甚至地上洒的水都能一气呵成,不再穿帮。你还可以像导演一样指定每个镜头的顺序、节奏、景别变化,把握故事节奏。风格上,它已经能写实、能做电影质感;Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)甚至连日漫那种「超现实高燃」也能做得行云流水。比如生成一场刀光剑影的动漫打斗,每一帧都能让二次元粉感叹「这比PPT流畅多了」。 还有曾经爆火全网的吉卜力风格,Sora 2在生成效果上也能拿捏。 Prompt: in the style of a studio ghibli anime, a boy and his dog run up a grassy scenic mountain with gorgeous clouds, overlooking a village in the distant background而且音频直接跟上,不仅对白和口型对齐,连环境音、动作声效都随场景变化,给人一种「拿来即用」的感觉,省去后期剪辑音频的繁琐。就比如,一位年长的教授可以英语无缝切换德语讲话。Prompt: old professor talks in english then german更多Sora 2官方惊艳Demo一览: 左右滑动查看新玩法:Sora App 让你「投影」自己进故事除了模型本身,这次最让人感到「时代变了」的,是全新iOS 社交App——Sora。打开App,只需要录一小段带声音的视频,系统验证身份和采集形象后,你或朋友,马上就能把你的样子和声音准确「扔进」任意生成场景:可以让自己出现在巴黎铁塔前开派对、和熊猫打乒乓,甚至和马斯克同框唱歌(当然,公众人物暂时不支持哈)。Sora 2可以直出一只鸵鸟叼走男子的帽子,在农场里奔跑的视频,效果非常自然,让人辨别不出这是AI生成的。 Prompt: an ostrich steals dads hat and dad chases after it更令人惊喜的是,在Sora 2中还能赋予一个人「超能力」——飞起来,一个Prompt就可实现。这个功能还用于Sora App,带来了一种全新的社交互动方式。Prompt: Add @kendra except she can actually fly「狗超人」拯救人类的剧情,在Sora 2中上演了。 Prompt: @rocket is a superpowered superhero dog, flying through the sky and saving new york city还有更多的惊艳Demo,以第一视角带你畅玩。 左右滑动查看这个「Cameo」功能用一次就停不下来,很多OpenAI内测员工说靠它结识了新朋友,AI不止能生成内容,还能创造社交纽带。Sora的分发逻辑也颇有趣:推荐更偏向于「有二创价值」的视频,而不是单纯让你无脑刷时长。你可以用自然语言告诉系统想看什么类型、什么风格、哪种故事,算法会主动调整推荐。起步是邀请制,先在美加上线,后续很快扩展。拿到邀请码还能上sora.com网页体验,高质量Pro版则专属ChatGPT Pro用户。历史作品不会丢,API也在路上。全网实测震撼提前拿到内测资格的开发者,已经放出诸多Sora 2的震撼demo。@Miguel | AP直言,Sora是自己见过第一个,可以把动漫效果做到很到位的AI视频模型。 再来看Sora 2极致运镜效果,从近拉到远,完全没有违和感。 还有人体验后惊艳地表示,我非常确定我们已进入一个社交媒体新时代! 漫雪纷飞中,一对情侣在跳舞。 还有OpenAI研究员@gabriel,也在第一时间公开了一些「奥特曼参演剧情」的demo。 奥特曼本尊,正窃取用于Sora推理的GPU。安全与治理:不是喊口号,是真上心能力强了,风险也大了。Sora 2在每一个环节都布下「安全网」: 三层审核:文本提示、上传素材、视频逐帧、自动生成的场景描述和音频转写,全流程分层分类拦截。有些内容在输入就会被拦,有的生成完还要二次封堵,尤其未成年场景严上加严。 肖像权与公众人物保护:刚上线时,禁止用别人的视频做「换脸」,不支持生成公众人物。只有你自己验证授权后,别人才可以用你的形象做视频,所有涉及你形象的作品你都能查到、撤回。 青少年守护:青少年账号内容和Cameo权限都有限制,家长可以通过ChatGPT平台控制推荐、管理私信甚至关掉个性化推荐。 可追溯性:视频下载会带动态水印,所有内容都嵌入行业标准元数据。官方还开发了检测工具,方便未来判断「是不是AI造的」。 压力测试:在成人内容、极端主义、自伤、暴力、误导性政治等维度,都有专门评测和红队攻防。对违规拦截率、误杀率的数据都透明公布,核心指标大多在95-99%区间。 核心团队介绍在Sora 2官博最后,OpenAI放出了所有参与的成员名单,阵容超豪华。 在这份「电影谢幕工作人员表」中,OpenAI的几乎所有员工都被拉出来谢幕。而为我们带来这场如梦如幻的电影的「总导演」,也就是Sora负责人Bill Peebles。 他是一名95后,本科毕业于MIT计算机专业,后于加州伯克利取得计算机博士学位。 他曾先后在英伟达、Adobe、Meta的AI岗实习,博士毕业后直接加入了OpenAI,工作的最大业绩是Created Sora(创造出了Sora)。 字越少事越大,言简意赅。 下一步:从玩内容到「世界模拟」OpenAI说,Sora 2不会是终点。OpenAI坦言它还会犯错,但路线已经明朗:继续用更多、更高质量的视频数据喂养模型,世界模拟的准确性和细节感会越逼真。这个进化带来的不仅仅是让你玩得爽,更会影响影视广告、动画分镜、教育科普、产品演示,甚至是未来AI机器人「在现实世界里学本事」。当然,这也意味着欺诈、非自愿肖像、青少年保护等问题会更加突出,需要靠技术、产品、社区和政策一起盯着。你想把自己「丢」进哪个世界?Sora 2这一波,是真正把视频生成从「像不像」推向「合不合理」,物理逻辑、镜头控制、音画同步、可玩性和安全性全线升级;Cameo则把创作从「看别人」变成「玩自己」,让每个人都能成为主角。不妨现在就想想:如果有30秒,让你出现在任何场景,你最想玩点啥?是和偶像穿越打怪,还是带宠物环游地球,或者干脆做自己的动漫主角?欢迎在评论区留言告诉我们你的第一条Sora 2创意。下一个出圈的爆款视频,也许就来自你手里的Sora。参考资料: https://openai.com/index/sora-2/https://openai.com/index/sora-2-system-card/https://cdn.openai.com/pdf/50d5973c-c4ff-4c2d-986f-c72b5d0ff069/sora_2_system_card.pdfhttps://www.youtube.com/watch?v=gzneGhpXwjU
-
花旗大幅上调谷歌资本开支预测至1110亿美元,AI需求旺盛或将持续推高资本开支 花旗在周二的最新研报中表示,随着生成式人工智能需求持续超过供给,以及谷歌产品迭代加速,该行上调了对谷歌2026年及之后的资本开支预测。花旗预计,谷歌2026年资本开支将达到约1110亿美元,高于2025年的860亿美元。根据最新测算,2024至2029年的资本开支复合年增长率(CAGR)将达26%。花旗认为,这一增长背后是谷歌人工智能产品和服务在核心搜索和云业务中的更大规模应用。目前,Gemini的token使用量持续飙升,已突破每月1万亿次,比今年4月翻了一番。谷歌云(GCP)客户数量季度环比增长28%,积压订单加速增长,Gemini也正驱动更多谷歌核心产品。花旗指出,谷歌的资本开支正推动更快的产品开发周期,这将为公司带来持续增长。尽管搜索领域竞争依然激烈,但花旗认为谷歌执行力更强,因此维持“买入”评级,目标价280美元。谷歌母公司Alphabet A股周二盘中下跌近1%,报241.94美元。 Gemini与AI产品需求加速 根据研报,Gemini的token使用量在2025年6月已增至每月980万亿次,高于4月的480万亿次。谷歌云需求同步走高,新客户季度环比增长28%,单笔2.5亿美元以上的大额合同同比翻倍,Gemini月活跃用户数达到4.5亿,花旗认为9月可能已突破5亿。 同时,Gemini的日均请求量二季度环比增长50%,AI-Overviews与AI-Mode等新功能的部署迅速。花旗指出,大约60%的生成式AI初创公司选择了谷歌云,前十大AI实验室有九家使用谷歌云。而且,第三季度这一势头仍在延续。媒体此前报道,谷歌云已与Meta签订一份为期6年的AI基础设施合同,总额100亿美元。谷歌云积压订单二季度环比增长17%至158亿美元;作为比较,亚马逊AWS同期增加60亿美元。研报表示,Gemini正逐渐嵌入谷歌核心产品。例如在Chrome浏览器中,AI模式被直接集成到地址栏;YouTube推出多项AI新功能,包括Veo 3快速集成、语音转歌曲以及Ask Studio;谷歌也在测试Windows版Gemini应用,允许用户在Chrome和搜索之外直接使用Gemini。花旗认为,Gemini功能快速扩张,使用量水涨船高。基础设施扩张 谷歌近期推出了数据共享的Model Content Protocol (MCP) 服务器,支持Agent-to-Agent通信;该公司还发布开源Agent Development Kit (ADK),方便开发者在多个模型代理之间进行编排,并推出Agent Platform Protocol (AP2),支持超过60家商户和金融机构的自主代理支付。花旗指出,谷歌正在搭建更广泛的智能代理与模型生态的基础设施层。谷歌近期宣布将在未来几年投资超过500亿美元,用于AI基础设施建设。其中包括:在美国宾州、新泽西、马里兰的交汇区域投资250亿美元;在弗吉尼亚两年内投资90亿美元新建数据中心;在俄克拉荷马两年内投资90亿美元用于基础设施和技能培训;在爱荷华投资70亿美元扩展云与AI设施;以及在宾州投资30亿美元改造水电设施。谷歌还宣布了英国等全球项目。花旗认为,这表明随着OpenAI、Meta和亚马逊大幅扩张数据中心规模,谷歌也在持续加码。资本开支或长期保持高位 花旗预计,谷歌2026年资本开支将达到1110亿美元,同比增长29%,比上一年多出250亿美元。2024至2029年复合增长率预计为26%。其中约2/3将投向服务器,1/3投向数据中心和网络设备。研报认为,资本开支已带来显著成果:谷歌云营收同比增长32%,较一季度的28%有所加速。与此同时,AI效率正在提高。Gemini文本提示的能耗和碳足迹同比分别下降33倍和44倍,中位数每次请求耗水量约为0.26毫升。花旗强调,需求依然大于供给,谷歌正抓住机会投资。 由于预计AI需求持续超越产能,花旗上调了2026年及之后的资本开支和折旧摊销(D&A)预测。2026年资本开支上调12%至1110亿美元,2027年上调15%至1310亿美元。更高的资本开支和折旧摊销使得花旗将2026年GAAP每股收益预测下调约2.5%至10.56美元,2027年下调约3%至11.90美元。花旗将谷歌目标价维持在280美元,基于2026年GAAP每股收益10.56美元,给予26.5倍市盈率(此前为26倍)。研报表示,略高的估值倍数反映了AI需求的增长潜力,但也部分被更高的资本开支和折旧抵消。花旗认为,谷歌拥有15款月活用户超过5亿的产品、7款超过20亿的产品,其“产品光环”将推动搜索流量持续增长。同时,花旗对Gemini 2.5 Pro以及AI Mode扩展版印象深刻。不过,研报也提醒,搜索和GenAI产品的竞争加剧,以及监管风险,仍是不可忽视的不确定性。
-
Sora 2 震撼发布!独立 App 上线,颠覆性「客串」功能打造首个 AI 社交宇宙,要革抖音的命? 国庆节不过了,连夜干!!!刚刚,就像爆料的一样OpenAI正式发布Sora 2相比初代Sora模型,Sora 2在物理世界的准确性、真实感和可控性方面都实现了巨大飞跃,并首次加入了同步对话和音效生成功能OpenAI表示,初代Sora是视频生成的“GPT-1时刻”,而Sora 2则直接跃升至视频领域的“GPT-3.5时刻”最重磅的是Sora独立为APP,界面非常像抖音,主打创作、分享,以及一项颠覆性的社交玩法-“Cameo(客串)”的真人穿越功能,用户可以将自己一键置入AI生成的视频场景中 关于 Sora App 的推广计划,OpenAI 采取了分阶段的策略:邀请制推出:为了营造一个以熟人社交为基础的社区氛围,应用将采用邀请制进行推广。成功注册的用户将获得四个邀请码,可以分享给自己的朋友 目前sora app,只在IOS系统提供,现在就可以下载(首批上线地区为美国和加拿大,计划将迅速扩展到更多国家),收到邀请后,用户也可通过sora.com访问Sora 2,Sora 2初期将免费提供,并设有慷慨的使用限制,Sora 2未来也计划发布API,安卓版本还在开发当中Sam Altman把 sora 2称作创造力的ChatGPT时刻以下是sora 2 发布会现场详细信息:Sora 2 本体表现 Sora 2 在物理世界的模拟上达到了前所未有的高度。团队在发布中强调,新模型在运动(motion)、物理(physics)、智商(IQ)和对真实身体运动规律的精准模拟(body mechanics)方面都达到了业界顶尖水平。这意味着 Sora 2 能够更准确地理解和模拟复杂的物理交互。过去,像奥运会体操运动员的整套动作,或是在尾波滑水板上完成后空翻这类包含复杂动态和碰撞的场景,对于视频生成模型来说是极大的挑战。Sora 2 在处理这类复杂碰撞和动态建模方面表现得更为稳健,生成的画面感觉极其自然。例如,视频中展示的滑板爱好者完成踢翻的动作,其物理表现的精准度是以往模型难以企及的。这种对物理世界的深刻理解,是实现更高层次真实感的关键其次,Sora 2 显著增强了模型的可控性。以往的视频生成系统通常需要用户以“逐个镜头”(shot-by-shot)的方式进行创作,很难在一次生成中构建一个包含多个镜头、叙事连贯的长故事。Sora 2 在这方面取得了突破,它能更好地理解和执行复杂的指令,在一次生成任务中讲述更长、更连贯的故事。这使得创作者能够摆脱碎片化镜头的束缚,更自由地构建完整的叙事,为短片、故事创作等应用场景提供了极大的便利最后Sora 2 首次实现了视频与音频的同步生成。这是第一个能够同时生成视频和配套音频的 Sora 模型,并且它是一个非常通用的系统。这意味着用户生成的每一段视频都将自带声音,不再是无声的画面。这个音频生成系统能力非常全面,具体体现在:多语言对话:能够生成涵盖多位说话者的多种语言的对话,并且口型同步非常自然,能够准确捕捉对话内容环境音效:可以生成各种逼真的音效,例如环境中的风声、水声等完整音景:能够创造出完整的音景(soundscapes),为视频增添沉浸感此外,Sora 2 在风格多样性上也表现出色。许多早期的生成模型往往会陷入一种单一的美学风格,而 Sora 2 拥有极其广泛和多样的动态范围。无论是追求极致的现实主义风格,还是充满想象力的动漫风格,Sora 2 都能驾驭自如,并能覆盖两者之间的所有风格。这为全球创作者提供了无尽的创意空间,让人们能够以前所未有的方式将想象力变为现实客串(Cameo)功能:化身万千,步入想象中的任何世界 在 Sora 2 带来的众多新功能中,最具颠覆性的无疑是客串玩法。这项功能是 Sora 2 独有的,它赋予了用户一种前所未有的能力:将真实世界的人物、宠物甚至物体,无缝地植入到任何由 AI 生成的虚拟世界或场景中。这不仅仅是简单的“换脸”,而是一种深度的人物和场景融合,让用户能够真正步入”自己的想象Cameo 的核心工作原理源于 OpenAI 正在构建的世界模拟模型(world simulation models)。该功能通过观察一段关于某个主体(例如一个人、一只宠物)的简短视频片段,模型就能深度理解这个主体的外观、动态和特征。一旦理解完成,这个主体就可以像一个文本token一样,被注入到任何提示词中。这意味着,用户只需提供一个简单的视频素材,就能将自己或朋友“传送”到古罗马斗兽场、未来赛博朋克都市,或是任何能够想象到的场景中,并让他们在其中自然地活动和交互为了确保这项强大功能的安全和用户自主性,OpenAI 设计了一套严谨的设置和权限流程:创建与验证流程:用户若想创建自己的 Cameo,必须经过一个专门的流程。系统会要求用户录制一个动态的音频提示,并进行一次“活性检查”,例如根据指示移动头部。这个过程旨在通过多重验证,确保创建 Cameo 的是用户本人,从而有效防止身份冒用 精细化的权限控制:用户对自己 Cameos 的使用权拥有完全的控制。在设置中,用户可以决定谁有权使用自己的形象进行创作,选项包括“仅限我本人”(Only I)、“我批准的人”(People I approve)、“互相关注的好友”(Mutuals)或“所有人”(Everyone)。这一原则确保了任何人都无法在未经用户明确授权的情况下,使用其形象生成内容。用户的数字肖像权得到了充分的尊重和保护个性化偏好设置:模型虽然强大,但并非完美,有时可能会“幻觉出”一些不符合用户特征的细节,比如给用户穿上紧身牛仔裤或赋予奇怪的口音。为了解决这个问题,用户可以在 Cameo 偏好设置(Cameo preferences)中进行调整,引导模型更准确地描绘自己。这种设置也可以用于娱乐目的,比如用户可以主动为自己的 Cameo 形象添加一个标志性的金项链或一顶有趣的帽子,为创作增添趣味内容所有权与删除权:用户对自己授权创建的所有 Cameo 内容拥有完全的权利。这意味着,即使用户的朋友使用了其 Cameo 创作了一段视频,该用户也被视为该视频的所有者之一,并拥有随时将其删除的权力。这进一步强化了用户对自己数字身份的掌控Cameo 功能的推出,被 OpenAI 团队视为一种全新的沟通方式。它超越了传统的文本、表情符号(emojis)或语音笔记,演变成一种基于视频的全新媒介。朋友之间可以通过 Cameo 共同出演一部微型电影,或是在一个奇幻世界里互动,这种充满乐趣和创意的交流方式,为社交带来了前所未有的可能性Sora App:一个专为 AI 创意而生的社交新大陆 为了将 Sora 2 模型的魔力传递给最广泛的用户,并充分发挥 Cameo 功能的社交潜力,OpenAI 专门开发了一款全新的移动应用——Sora App。团队认为,Sora 2 所带来的体验已经超越了传统工具的范畴,它更像是一种全新的沟通媒介,因此需要一个全新的产品形态来承载。Sora App 的定位是一个以 AI 生成内容为核心的社交平台,旨在激发用户的创造力,并加深人与人之间的连接Sora App 的界面设计看起来非常像抖音。有一个内容流、个人主页(p以及关注系统。但其核心区别在于,这个平台上的所有内容都是由人类用户通过 AI 生成的,而非机器人发布的垃圾信息。这创造了一种非常独特且新奇的体验,用户看到的不再是现实世界的快照,而是朋友们想象力 应用内的核心体验围绕着创造与互动展开:动态流:用户打开应用后,会看到一个由其关注的人所创作的 AI 视频流Remix 功能:这是 Sora App 的一个核心互动机制。当用户看到一个喜欢的视频时,可以点击 Remix 按钮,在其基础上进行二次创作。例如,看到一个香水广告,用户可以输入新的提示词,如“把它变成一个带有巨大羽毛的礼帽广告”,Sora 就会生成一个全新的、与原作相关联的视频。这个功能极大地降低了参与热门趋势和故事线的门槛,让每个人都能轻松地为社区的集体创作贡献一份力量 社交哲学:OpenAI 团队坦言,他们最初对一个完全由 AI 生成内容的平台持怀疑态度,担心它会削弱真实的人际关系。然而,内部测试表明,Cameo 功能反而以一种意想不到的方式拉近了人们的距离。因此,Sora App 的设计理念将重点放在加强朋友和家人之间的联系上。平台会优先推荐来自用户社交圈的内容,并提供一个专门的“关注”流,只显示用户已关注的人发布的内容 推荐:为了提升用户体验并给予用户更多主导权,Sora App 正在测试一项新功能,允许用户根据自己的心情来引导内容推荐。例如,用户可以选择“放松”或“动物”等模式,应用就会相应地展示更符合其当下心境的内容。OpenAI的说法是Sora App 的目标不仅仅是成为一个内容消费平台,更是要成为一个激发每个人创造潜能的社区。它鼓励用户从被动的刷视频转变为主动的创造者,通过简单有趣的工具,将脑海中的奇思妙想变为现实,并与朋友们分享这份快乐当然你可以完全把以上内容看做是OpenAI的宣传,说的很好听,到时候只怕玩的停不下来防沉迷 针对社交媒体普遍存在的沉迷、孤立和算法投喂等问题,OpenAI提出了一系列应对措施:用户控制信息流:用户可通过自然语言指示推荐算法,调整信息流内容。App会定期询问用户的使用感受,并主动提供调整选项优先创作而非消费:App默认优先展示用户关注的人或能激发创作灵感的内容,不以“使用时长”为优化目标强化社区联系:App采用邀请制,旨在鼓励朋友间共同使用,通过Cameos功能加强社区联系青少年保护:为青少年设置了每日观看视频数量的默认限制,并对Cameos功能采用更严格的权限设置。家长可通过ChatGPT使用家长控制工具,管理滚动限制、算法个性化和私信设置肖像权控制:用户对自己的Cameo拥有端到端的控制权,可以决定谁能使用,并随时撤销访问权限或删除包含其Cameo的任何视频商业模式:目前唯一的商业化计划是,当计算资源紧张时,可能允许用户付费生成额外视频Sam Altman的思考:创造力的“寒武纪大爆发”** Sam Altman也发文表示,这感觉像是“创造力的ChatGPT时刻”,从想法到结果变得简单快速,带来了新的社交动态他认为,创造力可能即将经历一场“寒武纪大爆发”,艺术和娱乐的质量将大幅提升。同时,他也表达了忧虑,承认社交媒体的负面影响,如成瘾和霸凌。他强调,团队已深入思考如何避免Sora App落入由强化学习(RL)优化的垃圾信息流的陷阱。为此,Sam Altman提出了产品的几项原则:优化长期用户满意度。大多数用户在回顾过去6个月时,应该觉得使用Sora让他们的生活变得更好鼓励用户控制自己的信息流。用户应该能通过自然语言详细告诉Sora他们想看什么优先考虑创作。让每个人都能轻松参与创作过程。帮助用户实现长期目标。无论是想与朋友更多联系,还是想健身、创业,Sora都将努力提供帮助OpenAI认为通用世界模拟器和机器人智能体将从根本上重塑社会。Sora 2代表了朝此目标迈出的重要一步sora 2会成为抖音一样的超级APP吗?会成为一款颠覆性的社交应用吗?以上,谢谢你看我的文章。觉得还不错的话,点个赞/在看/转发就更好了~想第一时间收到更新,记得给我加个⭐星标。~我们,下次再见.../作者:花不玩参考:https://openai.com/index/sora-2/ https://blog.samaltman.com/sora-2
-
OpenAI发布Sora 2.0及独立社交App:称视频生成进入“ChatGPT时刻” OpenAI周二正式发布其迄今最先进的视频生成模型Sora 2.0,并同步推出一款全新的iOS应用,旨在让AI视频创作走向大众,用户可以制作并与朋友分享AI生成的视频。媒体称,此次发布被视为该公司推动新兴技术普及的重要举措,类似三年前ChatGPT带动聊天机器人的爆发。Sora 2.0在今年早些时候的研究预览版基础上大幅升级。OpenAI表示,新版本在物理真实感、音视频同步和多镜头叙事方面实现了重大突破。这款Sora应用为免费app,目前采用邀请制,运行于最新版本的同名视频生成软件。与去年12月发布的首个版本一样,用户可以根据文字提示生成短视频,但新版应用新增了社交功能:用户不仅能浏览他人生成的视频,还能创建一个逼真的AI虚拟形象和声音,在获得许可的情况下被嵌入自己或朋友制作的视频中。媒体报道,尽管ChatGPT已吸引每周超过7亿用户使用,但OpenAI尚未让Sora成为家喻户晓的名字。该公司正面临来自谷歌母公司Alphabet、Runway AI、Midjourney等竞争对手的强烈挑战,这些公司同样提供快速生成短视频的AI工具,有些甚至比从零拍摄更便宜。分析称,此次发布也标志着OpenAI在社交媒体领域迈出最大一步,使其与TikTok和Meta的服务正面竞争。Meta近期推出的AI视频流Vibes就是类似的尝试。业内人士对媒体指出,这将为OpenAI打开新的广告收入渠道,同时提升技术的曝光度。“视频生成领域的ChatGPT时刻” OpenAI工程师Thomas Dimson在记者会上表示,最初公司内部不少人对AI生成视频流的想法持怀疑态度,但“客串功能”让大家看到其价值,因为用户可以出现在朋友的视频中。他指出,许多社交平台已逐渐偏离“朋友和连接”的理念,而Sora可能带回这一点。新版Sora还针对AI视频生成的一些长期缺陷进行了改进。OpenAI称,新版软件更擅长生成符合物理规律的视频,并能更好地执行用户提示,尤其是在多个镜头的连续视频中。Sora团队负责人Bill Peebles表示, “我们认为这很可能会成为视频生成领域的ChatGPT时刻。” Peebles补充道,新版Sora能生成更复杂的视觉效果,例如一个人站在水中桨板上后空翻,且包含真实的流体动力学和浮力效果。它还能自动拼接多个场景,而无需用户手动编辑。此外,新Sora支持生成并同步音效,包括背景声、对白和多语种配音,这使其对好莱坞更具吸引力,尽管OpenAI此前在打入影视行业的努力收效不一。在展示中,公司播放了一段仿新闻片段:Dimson从麦当劳酱料机里喝番茄酱。另一段则模仿香水广告,打出标语:“Sora全新香氛——清新、纯净、毫不掩饰,献给你想成为的任何人。”版权争议仍在 不过媒体表示,随着功能增强,担忧也随之而来。批评者认为,这可能冲击电影行业就业,并让真假难以分辨的网络内容更加泛滥。OpenAI强调,应用不会允许生成包含公众人物的视频,但公众人物可选择为自己创建“客串形象”;同时也不允许根据照片生成视频。这一发布已引发知识产权方面的担忧。有媒体此前报道,OpenAI已通知多家影视公司和经纪公司,除非明确选择退出,否则其受版权保护的素材可能会出现在Sora生成的内容中。OpenAI称,这一做法借鉴了其图像生成工具的内容政策。公司认为,用户在AI创作中混合或引用熟悉的虚拟世界,属于一种粉丝表达和创意互动。高管们表示,他们观察到用户强烈希望通过AI与自己喜爱的故事和角色互动,Sora为人们提供了新的参与方式。同时,OpenAI也明确划定了版权与个人肖像的界限。热门系列的角色或视觉风格可能会出现在视频中(除非版权方阻止),但个人形象则完全禁止生成,除非该人主动提交并完成身份验证,允许以“客串”形式出现在视频中。公司称,这一政策旨在让个人完全掌控自己是否以及如何出现在AI生成的内容里。Sora应用中的所有视频都会打上水印,导出视频同样如此,以确保观众明确知晓其为AI生成。公司还禁用了屏幕录制功能,以限制视频的外部传播。Sora将率先在苹果iOS系统上线,未来计划拓展至安卓平台。新版Sora软件(Sora 2)也将在sora.com网站提供。
-
破局流量内卷,搜狐视频用科学家对话重塑知识直播价值体系 文/李乐编辑/子夜一场持续四年的硬核直播“实验”,将如何影响前沿科学传播?今年7月,一场场跨越山海的思想碰撞在搜狐视频直播间上演。搜狐创始人张朝阳与2004年诺贝尔物理学奖获得者David Gross相对而坐,探讨前沿物理学领域的重要课题“时空的本质是什么”,David Gross抛出一个颇为革命性的观点,时空可能并非宇宙的基本属性,而是一种源自物质的“涌现现象”,从这个角度看,时空可能只是人类的幻觉。 搜狐创始人张朝阳与诺贝尔物理学奖获得者David Gross对谈,图源搜狐官方微信公众号在与著名物理学家、德国洪堡研究奖获得者、美国艺术与科学院院士徐一鸿的对谈中,科学的脉络被层层梳理,两人从牛顿力学勾勒天地运行的秩序,谈到量子力学解构微观世界的奥秘,从狭义相对论重塑时空认知,谈到量子场论搭建物理统一的框架。与剑桥大学教授David Tong的同台中,他们同样用通俗语言解析物理大厦的根基,谈宇宙之谜,也聊到地外生命的存在性,原本藏于学术论文中的艰深理论,在实时互动与通俗解读中变得触手可及。看似小众的科学直播,直播间人气却极高,弹幕里满是对前沿科学的追问与讨论。很难想象到,在如今带货直播喧嚣、娱乐内容扎堆的当下,竟然有一种反流量的内容形态:让诺奖得主、科学家与普通观众围坐在“云端课堂”,让学术塔尖的前沿科学,变成触手可及的思想盛宴。从2021年《张朝阳的物理课》开播,到2025年汇聚全球科学家对话,搜狐视频用四年时间在直播行业开辟出一条差异化路径,以硬核知识内容构建起竞争壁垒,改写着前沿科学的传播规则。这个知识IP的价值,远不止于重塑科学传播范式,更成为搜狐视频知识直播业务的核心增长引擎。在该IP的带动下,天文、数学、生物、医学等多领域的专家学者纷纷入驻搜狐视频,构建起覆盖多学科、多层次的高价值内容体系,最终推动知识直播从特色板块跃升为平台核心业务之一。这背后,是平台独特的内容与价值坚守,也是“量变引起质变”最生动的行业样本。1、四年嬗变,为大众打开一扇理解科学的“新窗口”一直以来,前沿科学的传播,始终面临专业深度与通俗表达失衡的困境。对大众而言,此前接触科学的渠道多局限于学术论文或者科普书籍,在碎片化内容占据主流的网络环境中,基础物理、量子科学等前沿领域的传播相对较少,普通人难有机会、有合适的场域深度触碰核心理论,感受其核心魅力。而此次搜狐视频推出的科学家对话系列,恰恰打破了这层壁垒。在这个系列中,张朝阳集结了David Gross、David Tong、徐一鸿三位学者,与传统对话方式不同,这场对话用实时互动、深度解析的形式,让普通观众既能直观感受科学思想的碰撞,也能跟随对话节奏获取时空涌现、量子场论等前沿领域的新观点,在轻松语境中开拓科学视野。三场对话中,科学家们不仅传递知识,更展现了科学探索的本质。科学家们坦诚分享对未知的思考,将科学探索充满疑问、持续求证的本质呈现在大众面前:David Gross 剖析“时空非基本属性”时,不回避理论尚未完全验证的争议;徐一鸿追溯物理学统一之路时,直言每个理论突破都藏着无数次失败的尝试。解读宇宙谜题时,David Tong也笑着承认地外生命的存在仍是开放答案,多数物理学家从概率角度认为,宇宙中应当存在外星生命,毕竟银河系有百亿颗恒星,全宇宙有千亿个星系,且类太阳系的结构普遍存在。但生物学家往往持反对意见,他们认为生命形成需要一连串极低概率的巧合事件。这种兼具专业深度与人文温度的内容,在流量导向的当下更显稀缺。 张朝阳与剑桥大学教授、英国皇家科学院院士汤大卫(David Tong)对谈,图源搜狐官方微信公众号三场“学术塔尖理论走向大众”的实践并非偶然,而是《张朝阳的物理课》IP进化的必然结果。《张朝阳的物理课》的起点,就带着反常规的基因,2021年11月,毕业于麻省理工学院的物理学博士张朝阳把白板搬进直播间,用完整推导、深度解析的方式,打破物理学科的高冷滤镜。在直播间里,他开始以知识播主的全新身份掀起科学学习热潮,讲解雨滴从几千米高空落下为何不伤人时,他会从流体力学最基本的NS方程出发,推导出斯托克斯定律,同时用空气的波动方程,解释了为什么在零下30℃的哈尔滨,声音传播速度比北京慢10%。2022年,从线上直播延伸至线下公开课,《张朝阳的物理课》开始一步步破圈,让更多人意识到物理离生活并不远。2023年,张朝阳进一步走进清华大学、重庆大学等高校课堂,与学子们共同探讨物理难题,同时将目光投向产业实践,用物理知识解析汽车、智能硬件、航天等硬科技领域中的科学原理与应用,让抽象的物理公式与现实世界的硬科技产生奇妙联结。在前期积累的专业公信力与用户基础上,2024年7月,《张朝阳的物理课》IP迎来里程碑时刻,2024国际基础科学大会期间,张朝阳对话著名物理学家徐一鸿、Cumrun Vafa,首次联动国际学者,将国际学术资源引入直播场景,让观众同步接触到全球最前沿的科学思想。而今年,这一模式持续深化,David Gross、David Tong 多名学者的加入,让这场科学传播的“盛宴”愈发丰盛。 张朝阳与著名物理学家徐一鸿对谈从一张白板推演起步,到线上线下联动、国际学者的加入,《张朝阳的物理课》用对硬核内容的坚守、对科学传播的深耕,为大众打开一扇理解科学的新窗口。2、搜狐“筑塔”:知识IP的稀缺性壁垒,如何越建越高?260余期直播课、30余期线下课、数场硬核对话……《张朝阳的物理课》四年间的质变,核心在于它构建了一套与娱乐直播、电商直播乃至传统知识IP截然不同的价值逻辑。当直播行业普遍遵循快迭代、快变现的主流路径,追求流量与即时商业转化时,这个IP从诞生起就选择了一条相反的发展方向,以重投入的深度内容为核心,凭借对科学传播本质的坚守,跨越时间周期形成滚雪球式的价值积累。这种“反效率”恰恰成为其最独特的竞争力。在信息爆炸的当下,行业多聚焦于碎片化内容的快速生产,却忽视了用户对深度、系统知识的需求。《张朝阳的物理课》精准捕捉到这一缺口,用持续且扎实的内容填补空白:从牛顿力学的基础公式推导,到电磁学、量子场论等前沿理论解析,每场直播都保持足够的时长与知识密度,确保科学逻辑的完整呈现,积累了稳定的高粘性用户。当内容足够有价值,用户也愿意投入时间与精力参与进来,形成与IP之间的深度信任联结。 《张朝阳的物理课》线下课,图源搜狐官方微信公众号更重要的是,《张朝阳的物理课》IP始终以知识普惠为核心价值导向,通过直播这一去中心化的传播形式,打破地域与时空对科学教育的限制。无论是身处一线城市的白领,还是偏远县城的学生,只要拥有网络,就能同步接触到诺奖得主对时空本质的解读、教授对宇宙演化的分析。这种特质让它超越了普通知识IP的范畴,成为推动全民科学素养提升的认知基础设施,它不仅传递物理公式与科学结论,更通过科学家对话中对未知的坦诚探讨,还原科学探索的本真面貌,让大众理解直面未知、持续好奇。这种社会价值,正是当前直播行业最应承担的部分,也是《张朝阳的物理课》区别于其他内容形态的关键所在。一个鲜活的例证是,笔者在搜索网站或AI模型上搜索量子场论推导、狭义相对论公式等相关物理知识时,《张朝阳的物理课》的相关内容总会出现在推荐列表中,成为许多学生、物理爱好者的学习参考资料。这一细节背后,折射出该IP在中文互联网物理知识领域的独特地位,它不仅是一档直播节目,更成为补充线上物理教育资源的重要力量,填补了中文网络世界中系统物理科普的内容。于搜狐视频而言,《张朝阳的物理课》更是构筑平台内容生态“护城河”的差异化样本之一。一直以来,搜狐视频将直播业务的核心定位于知识与价值内容直播,试图打造中文互联网的知识入口。早在2019年,搜狐视频在情感、文化、汽车、法律等垂直领域推出了一系列知识直播,到2021年全面打造知识直播平台。从物理IP为支点,逐步将知识直播拓展到自然科学领域:邀请高校教授学者讲解数学、化学、天文、地理、生物等基础学科,形成了覆盖多领域、多层次的知识内容矩阵。这种布局的价值正在逐步显现:一方面,知识直播为搜狐视频吸引了大量高学历、高消费潜力的用户,与平台的中高端内容定位高度契合,也为商业转化奠定了优质用户基础。另一方面,在物理IP的带动下,大量优质知识传播者主动入驻搜狐视频,比如中科大副教授带来了《古生物有答案》栏目;康奈尔物理博士、央视科学顾问、科普专家打造《包大人玩科学》栏目;中国科学院植物学博士推出《顾有容说植物》栏目。 图片为《包大人玩科学》栏目,图源搜狐视频这些多元内容的加入,让搜狐视频的知识生态愈发丰富,更带动平台在多元领域实现深度积累,最终形成内容吸引用户、用户反哺生态,生态推动商业的良性循环。正如徐一鸿在对话中所言,科研在满足好奇心的同时也在推动人类进步。《张朝阳的物理课》的价值亦在于此,它将物理知识背后的人类智慧传递给更广泛的大众,凭借独特的内容逻辑筑成难以复制的知识高塔,也为直播行业照亮了一条新航道。(本文头图为《张朝阳的物理课》直播画面,来源于搜狐官方微信公众号。)
-
十一黄金周开战!高德、美团狂撒亿元红包补贴 本文来源:时代财经 作者:庞宇 图源:视觉中国 双节叠加,中秋国庆超长黄金周开启!国内消费市场提前已进入“沸腾模式”。打开手机,高德地图的“每天分1亿红包”弹窗不停跳转;小红书上“小红卡”精选门店推荐被反复收藏;美团App里飞往新疆、云南的“捡漏机票”引发网友刷屏;飞猪的“串游”路线热度大增——一场围绕8天长假的“流量争夺战”,在各大平台间打响。线下商家们也“铆足了劲”,从餐饮小店到星级酒店都在摩拳擦掌,准备接住这波“流量红利”。多位餐饮店老板向时代财经透露,近期流量上涨“肉眼可见”。有商家上榜高德“扫街榜”一周后,线上曝光量翻倍,到店咨询量明显增加;有大众点评必吃榜商家表示,外地游客尤其喜欢“沿榜吃饭”,已提前备货。时代财经走访发现,无论是平台的“撒钱式补贴”,还是商家的“全力备战”,都在预示着今年国庆或将迎来一场前所未有的消费盛宴。平台各出奇招:推榜、撒券、发现金这个黄金周,对于各大互联网平台而言注定不一般。平台间的比拼,早早便拉开帷幕。“大额扫街券包1688元,倒计时X天”。近日,只要打开高德APP,就能看到首页“扫街榜”入口旁醒目的“分红包”标语。这是高德为国庆推出的“每天分1亿红包”活动。与此同时,“高德扫街榜”的广告也铺满了各大城市的地铁和电梯间。半个多月前,高德地图推出行业内首个基于导航和出行行为的生活服务榜单——“高德扫街榜”,而后放出多个大招:推出超10亿补贴促线下消费的“烟火好店计划”、与淘宝和支付宝一道上线团购业务,并宣布对全国餐饮商家免收首年开店费。一系列动作,在行业内“激起千层浪”。据高德透露,高德扫街榜上线当天,使用高德扫街榜的用户便超过4000万人;高德扫街榜上线第一周,上榜的烟火小店流量增长187%;开店费政策官宣三天,已收到超过15万家餐饮商家的入驻咨询。据了解,商家在高德App内搜索“免费入驻”,便可直达相关服务页面。有商家向时代财经表示,“入驻流程简单,包括填信息在内,大概两天左右就能上线。”坐上牌桌后,高德开始疯狂“撒券”——自9月20日至10月8日推出“每天分1亿红包”活动,用户通过参与“助力人间烟火”“出门去扫街”等活动并完成对应任务,就能获得酒店、加油、门票、打车等优惠券和现金奖励。9月30日,位于深圳的李木(化名)向时代财经表示,其在高德打车时,页面中出现了比较醒目的0.9元的国庆券包套餐,包括一些立减券,不限车型。“考虑到国庆期间有外出打车需求,所以就果断购买了。最后4.6km路程原价14.3元,用了减5元券之后只需支付9.3元。”面对高德的攻势,百度也于近期拉上了美团与携程,推出基于用户出行数据生成的“AI去·榜中榜”,覆盖美食、景点、酒店、购物等领域,大众点评榜与携程口碑榜也一并接入。时代财经注意到,不少上榜餐饮商家提供“到店套餐”,由美团提供服务;同时用户也可领取“百度专享券”(包括1~22元的美食券、5元打车券、酒店满减券等)。不过,时代财经实际购买到店套餐时发现,“百度专享券”未能叠加使用。关于“百度专享券”的使用规则和活动期限,时代财经向百度询问,截至发稿未获得回复。内容社区玩家小红书也在节前加码本地业务。9月26日其在第三届“马路生活节”上发布“小红卡”,张定位为“精选吃喝玩乐一卡通”,售价168元,持卡用户可在该卡覆盖的线下“精选门店”统一享受9折优惠。“目的是让用户消费时更简单,不用花时间挑选套餐和计算折扣。”小红书交易产品负责人、本地产品负责人莱昂表示。当大厂们纷纷发力“到店”生意,本地生活赛道巨头美团则主打“面面俱到”,面向商家发放现金补贴,为消费者提供酒店、门票、闪购、外卖等多类消费券。9月30日晚,美团宣布,十一假期期间将为1万多家中小餐饮商家发放助力金,单笔最高可达5万元。同时,美团还将投入亿元补贴,支持餐饮商家推出新产品和服务组合。9月30日至10月9日,美团外卖将联合全国各地近20万家茶饮门店,推出“买一赠一”活动;9月30日至10月12日,大众点评将发放5000万张“品质堂食外卖消费券”。此前,美团已上线“国庆低价门票提前囤·抢148元券包”“美团小团游省心又自由·中秋国庆提前订享888元出游福利”“最高666元闪购出行神券”等多个国庆专题活动。大众点评相关负责人还表示,将为全量用户发放大额“境外吃喝玩乐消费券”。以机票为例,时代财经在美团平台上查询到,9月29日由长沙飞往乌鲁木齐的直飞最低票价仅为545元,根据美团AI比价功能提供的信息,过去7天该航线直飞最低票价降幅达49%,比去年同期便宜205元。成都9月29日出发飞往乌鲁木齐的直飞最低票价在过去7天则已降243元,不到500元即可直飞乌鲁木齐。上海、杭州、长沙、武汉等热门出发城市前往乌鲁木齐的票价亦有不同程度降低。商家备战!曝光量暴增,提前“排兵布阵”平台激战正酣,线下商家也摩拳擦掌,准备接住这波“流量红利”。游客“沿榜吃饭”的习惯,让不少上榜商家率先尝到流量甜头。“最近收到很多高德转进来的电话问:有没有在营业,现在要不要排队、有没有包厢。”入选高德扫街榜“热门店”的浙菜店醉衢味店老板廖姐说,9月20日上榜后,门店曾迎来一波消费高潮,“高峰期的时候需要在店门口多摆个五六桌。”廖姐是上海人,两年前来杭州创业,在滨江区相继开了两家“醉衢味”,“以前来店里都是本地人,上榜后见到不少新面孔。”她预计,以往国庆老客会因出游减少,但今年上榜了,“说不定会迎来不少游客。”上榜迄今,其两家门店“流量比8月上涨了70%,近一周营业额增长了20%~30%”。廖姐补充,目前店铺入驻高德以及流量曝光都是免费的。“高德最近广告投放力度特别大,在回家的地铁站里、电梯里都能看到高德的广告。”有商家提到。同样大手笔投入的还有美团。经营深圳一家昌记隆江猪脚饭的黄老板表示,其店铺已经连续两年登上大众点评“必吃榜”,他预计,今年“十一”,除了“必吃榜”带来的线下流量,大众点评的“品质外卖”券预计也将带来可观的线上客流。“假期还没正式开始,已经有不少外卖单的地址是周边酒店和民宿了,按经验估计,假期堂食和外卖的新客流量增幅都会超过30%。”为接住流量,不少商家已提前放出优惠揽客及备货。挂出“庆国庆迎中秋,产品买二送一”横幅的北京朝阳区“丝路传奇”中国拉面店负责人张露丹告诉时代财经,为应对节假日客流量增长,门店提前完成原材料备货与人员盘点,“十一期间全员停休,二线也要顶到一线去,保证我们的服务品质。预计十一期间订单能增长30%~40%。” 图源:商家供图 备战潮同步席卷酒店业。“今年国庆黄金周明显特点是‘拼长假’,酒店入住高峰期可能比往年持续更久。9月29日已经迎来预订高峰,整体看,入住率会略高于去年,10月2日至5日大概率满房。”广州花园酒店副总经理梁健芬向时代财经表示。她透露,“酒店一个月前就开始为国庆做准备,部署人员、策划活动。”不仅在美团推出“住宿+双人自助晚餐+下午茶+酒店文化艺术导览”的打包套餐,还为游客准备了“做灯笼”等手工活动。截至目前,酒店在美团平台上的国庆期间餐饮单日预订增速同比上涨超3成。当所有参与者都已站在“起跑线上”,没人能确切预判,这个超长黄金周里,哪张榜单会带火更多小店,又有多少商家能实现营收新高。但可以肯定的是,平台的每一轮券、商家的每一份备货,最终都将交由市场检验。
-
钱志敏承认用比特币洗钱 曾称要给投资者"三世富贵" 据都市快报,当地时间9月29日,英国最大规模比特币洗钱案、中国天津蓝天格锐特大非法集资案主犯钱志敏在伦敦出庭受审,当庭承认关于比特币洗钱的相关指控。该案中有超过12.8万人被骗,涉及6.1万枚比特币(约合人民币493.5亿元),她承认获取并持有这些非法所得。 图为钱志敏(Zhimin Qian,音译)被告人名为钱志敏(Zhimin Qian,音译),化名张雅迪(Yadi Zhang,音译),47岁。伦敦警察局发布声明称:“2014至2017年间,张雅迪在中国策划了一起特大诈骗案,超过12.8万名受害者被骗,其非法所得随后被转存为比特币资产。”警方补充道,该女子随后使用伪造证件潜逃离开中国,入境英国,并于2018年9月试图通过购置房地产洗钱。英国警察局经济与网络犯罪部门负责人威尔・莱恩表示,此案 “不仅是英国史上最大规模案件之一,也是全球加密货币案件中涉案金额数一数二的案件”。该案历时7年调查,去年同案女共犯,42岁英国华裔女子温简(Jian Wen 音译)被判处6年8个月监禁。 图为温简(Jian Wen 音译)钱志敏目前已被羁押,等待宣判,宣判日期尚未确定。伦敦警察局调查组组长格罗托表示,被告人在被捕前的5年间一直在“逃避法律制裁”,此案的调查涉及多个司法管辖区,过程十分复杂。英国皇家检察署(CPS)副首席检察官韦耶尔表示:“比特币及其他加密货币正越来越多地被有组织犯罪分子用于掩饰和转移资产,以便诈骗者能享受其犯罪行为带来的利益。这起案件是英国最大的加密货币查获案,充分体现了这些诈骗者可获取的犯罪收益规模。”英国皇家检察署去年曾表示,依据中国设立的赔偿计划,许多受害者已获得部分赔偿。据界面新闻,一位蓝天格锐受害人证实了上述进展。但对于接下来能在多大程度上追回损失,他们也都心里没底。鉴于钱志敏已认罪,英国方面会启动财产没收程序。此次庭审预计持续12周。多名中国受害者将在天津的法院远程视频出庭作证。中国天津蓝天格锐特大非法集资案2017年案发,涉案金额超430亿元,受害者近13万人,遍及全国31个省、直辖市、自治区,钱志敏是该公司实际控制人。2017年产品爆雷后,钱志敏将非法所得转换为比特币转移至海外,并利用假护照逃至英国。2021年5月,警方查获并冻结了钱志敏设备中的6.1万枚比特币。2024年4月,钱志敏在英国落网。钱志敏此前否认所有洗钱指控据界面新闻,钱志敏于2024年10月21日在接受庭审时对所有的洗钱指控均表示不认罪。她的律师表示:“钱志敏否认所有犯罪行为指控,并打算积极抗辩此案。”当时与她一同出庭的还有一名叫“Senghok Ling”的同案被告,后者对一项在明知是犯罪财产的情况下参与洗钱的指控同样拒不认罪。受委托的律师已经帮债权人向英国高等法院提交了民事追偿申请。就此,英国检察署专门告知中国受害人:该机构已就英国方面从钱志敏方面冻结的资产启动民事追偿程序,在该程序进行到《2002年犯罪收益追缴法》第281条所规定的进展之后,才会进行国家间的接触。如果没有其他个人或实体对犯罪资产主张权利,那么一半将归英国警方所有,另一半则划归英国内政部,目的是便于处理犯罪所得收益,以及阻止进一步的犯罪。蓝天格锐案发后携带加密钱包逃到英国公开的判决文书显示,2014年3月31日,钱志敏在天津注册成立了蓝天格锐,蓝天格锐有京津冀、东北、华东、华南、华中、西北、西南七个大区管理全国理财产品的销售业务。自2014年4月至2017年8月,蓝天格锐推出了十款理财产品,以1~3倍的投资回报率为诱饵,非法吸收公众存款。据中国新闻周刊报道,关于钱志敏,几乎没有“投资者”知悉其底细,大家口口相传的,只有蓝天格锐的公开宣传信息以及未经证实的传说。 右一戴口罩者为钱志敏,受访者提供 图片来源:中国新闻周刊蓝天格锐宣传说,“花花”(钱志敏在蓝天格锐的花名)毕业于清华大学,有双博士学位,曾在美国留学,懂金融。来自沈阳的“投资者”韩星海(化名)听说,“花花”从美国带回不少技术。他曾在推介会上问过“花花”为何不让拍照,“她说是因为美国技术被她带了回来,如果透露出去,美国会对她进行制裁”。来自内蒙古呼和浩特市的张莉(化名)2016年在北京参加一场上千人规模的蓝天格锐组织的推介会,曾见过钱志敏。当时,钱志敏蒙着粉白色的面纱,坐着轮椅,在通往会议台的过道上,被人连带轮椅高举起来,众人一边高举钱志敏,一边高呼口号,其中一句是“三世富贵”——它来自蓝天格锐的宣传语:“你给格锐三年时间,格锐给你三世富贵。” 蓝天格锐产品推介会 图源:受访者供图2024年4月下旬,英国媒体报道钱志敏在英国落网后,她以张亚迪(Yadi Zhang)的身份向法院提供的出生日期是1990年11月10日。而据《中国新闻周刊》从不愿具名的知情人士处获悉,这个日期可能不实。该人士称钱志敏1978年9月出生于江苏如皋,专科学历,结过婚,后来离异。因为发现蓝天格锐具有涉嫌非法吸收公众存款的行为,2017年4月21日,公安机关立案侦查。2019年6月,天津市公安局河东分局发布通报,公安机关共抓获蓝天格锐法人代表任江涛等犯罪嫌疑人50名,其中28名已移送审查起诉。任江涛供述,其是通过玩网络游戏认识的钱志敏,因其在游戏中完全服从钱志敏的指挥,钱志敏让其担任蓝天格锐法人代表,但实际上只是挂名,具体工作还是听钱志敏的安排。据专项审计,自2014年8月至2017年7月,蓝天格锐共吸收资金402亿多元,这些钱均由钱志敏控制支配。自2014年4月至2017年8月,蓝天格锐向128409人返款341亿多元,用于购买珠宝款项9568多万元,用于购买不动产款项9189万多元,用于日常运营支出2.1亿多元,生命环客户服务中心项目支出1.2亿多元,此外值得关注的是,其中有11.4亿多元被用于购买比特币。据界面新闻报道,2022年12月,蓝天格锐案启动退赔程序,全国多地公安机关发布该案集资参与人信息线上登记公告。蓝天格锐案发后,钱志敏通过英联邦国家的伪造护照逃出了国外,并随身携带一部装有加密钱包的笔记本电脑,该钱包内存有事先通过下属的火币账号转出的比特币。2018年,因未能及时将比特币兑换成英镑,钱志敏和助理试图直接用比特币购买一幢价值2350万英镑的汉普斯特德豪宅。最终因资金来历不明,两人房子没买成功,反而引起了警察的关注。 钱志敏尝试用比特币购买的豪宅调查二人期间,英国警方查获逾6.1万枚比特币,为英国历来查获的最大额加密货币。按照9月30日每枚比特币最新报价113631美元计算,目前上述比特币总价值为69.32亿美元(约合人民币493.5亿元)。来源:每日经济新闻综合都市快报、界面新闻、中国新闻周刊、澎湃新闻等
-
带6.1万枚比特币逃到英国 钱志敏承认比特币洗钱指控 涉大量中国投资者的英国最大比特币洗钱案有了最新进展。当地时间9月29日,中国天津蓝天格锐特大非法集资案主犯钱志敏在伦敦南华克刑事出庭受审,期间承认关于比特币洗钱的相关指控。 图为钱志敏照片一位蓝天格锐受害人向界面新闻证实了上述进展。但对于接下来能在多大程度上追回损失,他们也都心里没底。鉴于钱志敏已认罪,英国方面会启动财产没收程序。此次庭审预计持续12周。多名中国受害者将在天津的法院远程视频出庭作证。今年47岁的钱志敏(曾化名张亚迪、花花)于2024年10月21日在接受庭审时对所有的洗钱指控均表示不认罪。她的律师表示:“钱志敏否认所有犯罪行为指控,并打算积极抗辩此案。”当时与她一同出庭的还有一名叫“Senghok Ling”的同案被告,后者对一项在明知是犯罪财产的情况下参与洗钱的指控同样拒不认罪。该案的审理过程备受关注,原因在于钱志敏还是8年前天津蓝天格锐非法集资案的幕后主谋,以她为首的犯罪团伙被指控将这些资金换成比特币资产后逃到英国消费。被卷入其中的12.8万名中国投资者一直在积极追偿,但却始终面临跨境追债,虚拟货币权属、价值转换等多重困境。受委托的律师已经帮债权人向英国高等法院提交了民事追偿申请。就此,英国检察署专门告知中国受害人:该机构已就英国方面从钱志敏方面冻结的资产启动民事追偿程序,在该程序进行到《2002年犯罪收益追缴法》第281条所规定的进展之后,才会进行国家间的接触。如果没有其他个人或实体对犯罪资产主张权利,那么一半将归英国警方所有,另一半则划归英国内政部,目的是便于处理犯罪所得收益,以及阻止进一步的犯罪。2017年,中国七部委联合叫停了各类代币发行融资活动。当时全国共立案侦办非法集资案件8600起,涉案金额超亿元的案件达50起。其中蓝天格锐非法吸收公众存款资金达430亿元人民币。案发后,钱志敏通过英联邦国家的伪造护照逃出了国外,并随身携带一部装有加密钱包的笔记本电脑,该钱包内存有事先通过下属的火币账号转出的比特币。抵达英国后,她在伦敦招聘了一位叫温简(Jian Wen)的华裔女子,协助自己在瑞士、意大利、希腊等欧洲各地考察,目的是将非法所得进行房产、汽车、珠宝等大宗消费。与此同时,英国金融监管局开始打击通过加密资产洗钱的犯罪行为。2018年,钱志敏和温简试图直接用比特币购买一幢价值2350万英镑的豪宅,最终因资金来历不明而引起了警察关注。 Jian Wen与钱志敏共住的英国豪宅 图/网络随后温简被警方拘捕,但钱志敏提前逃匿。据悉后者在躲避追捕时曾计划投资未被国际社会承认的东欧微型“国家”利伯兰,打算在当地获选“领导人”,并建设欧洲最大的佛教寺庙、机场后获得外交豁免权。利伯兰自称要通过加密货币投资来打造欧洲的避税天堂。伦敦警方在新冠疫情期间反复对两人及其住所进行搜查,最终依据《2002年犯罪收益追缴法》冻结了6.1万枚比特币,规模为该国历来最大。直至上述民事追偿程序结束,或高等法院发出进一步命令之前,这些资产会一直保持冻结状态。英国《2002年犯罪收益追缴法》规定了以犯罪收益为对象的刑事没收制度,以及以违法所得为对象的民事追缴。2024年3月18日,陪审团认定温简参与洗钱罪名成立,后者随后被判入狱6年零8个月。钱志敏则于去年4月在英国归案,并在5月22日以张亚迪的身份与Senghok Ling一同在威斯敏斯特地方法院首次出庭。关于后者的身份和涉案细节,目前没有进一步的公开信息。此前报道全球最大"比特币洗钱案中案"落槌 华裔女子获刑6年8个月英国伦敦的一家法院对一起涉及比特币的洗钱案作出量刑裁定,一名华裔英国籍女子因协助雇主洗钱获刑6年8个月。这起案件也因为“英国警方查抄6.1万个比特币”,以及多年前发生在中国的一起400亿非法吸收公众存款案,备受两国投资者关注。法官:毫不怀疑你知道自己在做什么公开资料显示,本案被告人Jian Wen出生于中国,2007年怀孕7个月时跟随丈夫Marcus Barraclough赴英。后因丈夫“有暴力倾向”,两人在2010年离婚,Jian Wen带着儿子生活,一边工作、一边攻读法学、经济学文凭。2017年时,正在伦敦中餐馆打工、居住在地下室里的Jian Wen看到一份“招募管家”的广告,而背后的雇主正是化名为“Yadi Zhang”的钱志敏——蓝天格锐非法吸收公众存款案的幕后主使。根据当时的警方通报,该案涉及资金达430亿元,来自31个省、市、自治区的12.6万名投资者卷入其中。东窗事发前夕,钱志敏使用假护照,带着装有加密钱包的笔记本电脑辗转逃至英国伦敦。由于语言不通,她急需一名华人来处理生活事务,以及将比特币换成房产、珠宝等。据英国警方披露,在成为钱志敏的助理后,Jian Wen瞬间进入了“奢华的生活状态”——从地下室搬进月租1.7万英镑的六居室公寓,大肆购买奢侈品并开始“环球旅行”,同时在欧洲、迪拜多地购买房产。 Jian Wen在德国旅行 图/伦敦警察厅然而,当Jian Wen试图购买多处价值千万英镑的伦敦豪宅时,触发了英国的反洗钱程序。基于她在2016/2017年仅申报了5979英镑的收入,同时她也无法解释支付购房款的比特币来源,英国警方在2018年10月31日搜查了她的住所,并查扣了藏有比特币的电脑。具有戏剧性的是,英国警方直到两年半后才发现电脑里藏着高达6.1万枚比特币。同年5月Jian Wen被捕归案,而钱志敏则在警方试图问讯她前逃离英国。 警方在豪宅中缴获的现金 图/网络历经过去几年的多次审理,伦敦南华克刑事法庭的陪审团在今年(2024年)3月裁定,Jian Wen在2017年至2022年间“为一名中国女子洗钱150比特币”的罪名成立。Jian Wen始终拒绝所有针对她的指控,并计划对定罪提出上诉。在本周五(2024年5月24日)庭审中,Jian Wen的辩护律师Mark Harries表示,Wen在成为罪犯前就已经是受害者了,毫无疑问她是被所谓的“策划者”欺骗和利用。她只是“按下比特币交易按钮的中间人”,并对自己行为的犯罪程度认知有限。检察官Gillian Jones则强调,Jian Wen是受到“贪婪”和自己经济利益的驱使,而不是受到胁迫、恐吓或剥削的影响,并且她也是操作自己加密钱包的决策者。很显然,本案法官Sally-Ann Hales最终没有采信辩方的说词,在周五宣判时她对Jian Wen说:“这是一种复杂且涉及重大计划的犯罪行为,我毫不怀疑你知道自己在做些什么。”那...钱志敏呢?在Jian Wen被捕后,有关钱志敏下落的线索便中断了。不过根据英国《金融时报》报道,消失许久的钱志敏已经在今年4月回到伦敦,遭到羁押并出庭面对英国检方的刑事指控。据悉,皇家检察署指控她自2017年10月1日起至今年4月,在伦敦和英国多地持有、获取和使用犯罪财产,也就是加密货币。有一点令人在意的是,钱志敏在提供给法院的信息中声称自己的出生日期是1990年11月10日,但综合各方信息,她实际应该是在1978年出生。通过翻译,钱志敏当庭表示不认罪,但也没有申请保释。法官决定她将继续留在看守所里,并将此案转交给此前审判Jian Wen的南华克皇家刑事法庭。
-
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。 海外社区也注意到DeepSeek使用了它而不是OpenAI开发的Triton语言。有接触过的开发者感叹TileLang是一种非常优雅的语言,只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现。 那么什么是TileLang,又为何引人瞩目?首先,TileLang是一种专门用来开发GPU内核的领域专用语言,性能上可以对标英伟达CUDA,DeepSeek官方推荐使用此版本做实验,在方便调试和快速迭代上有优势。更重要的是,TileLang与国产算力生态适配,连华为昇腾都要在第一时间公告对TileLang的支持。 在几周前的华为全联接大会2025的开发者日上,TileLang团队成员董宇骐就介绍了TileLang实现FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。此外TileLang团队成员王磊和沐曦集成电路的高级总监董兆华也在同一个圆桌沙龙上出现过,讨论了沐曦GPU与TileLang的适配。DeepSeek为什么选择TileLangDeepSeek与TileLang第一次同框亮相,其实是在6月的北京智元大会。在DeepSeek实习过的北大博士袁境阳,在报告中就提到“TileLang的算子实现会更快一点”。TileLang的发起人之一,北大博士研究生王磊当时还专门发帖感谢DeepSeek尝试他们的语言。 TileLang由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智。 2025年1月,TileLang在GitHub上正式开源,至今已获得1.9k标星。 简单来说,Tile语言 ( tile-lang ) 是一种简洁的领域专用语言,旨在简化高性能 GPU/CPU 内核的开发。tile-lang采用Python式语法,并在TVM之上构建底层编译器基础架构,使开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。 王磊曾在7月HyperAI超神经主办的Meet AI Compiler技术沙龙分享TileLang的核心设计理念:将调度空间(包括线程绑定、内存布局、张量化和流水线等)与数据流解耦,并将其封装为一组可自定义的注解和原语。这种方法允许用户专注于内核的数据流本身,而将大部分优化工作交给编译器完成。TileLang将“Tile”作为编程模型的核心概念,通过显式的Tile抽象,让开发者能够直观地控制数据在全局内存、共享内存和寄存器之间的流动。TileLang提供了三个不同层次的编程接口,满足不同水平开发者的需求。初学者可以使用硬件无关的高层接口,专注于算法逻辑而不必关心底层细节。有经验的开发者可以使用ile Library,这里包含了各种针对不同硬件架构优化过的预定义操作。对于追求极致性能的专家用户,TileLang还提供了线程原语级别的控制,允许他们直接操作线程同步、内存合并等底层特性。 DeepSeek显然就属于追求极致性能的专家用户了,根据v3.2公告的说法,在早期DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能。v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制(lightning indexer)运行速度远超传统实现。 在TileLang的文档中也有相关的技术介绍,在计算过程中缓存中间数据,比全局内存快得多。 TileLang与DeepSeek双向奔赴更早之前,在DeepSeek连续一周发布开源代码库的第一天,王磊就曾向DeepSeek团队推荐TileLang语言。 后来TileLang也以DeepSeek在这天发布的FlashMLA内核作为评测基准,在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当。 在最新的DeepSeek v3.2发布之后,王磊也发帖致敬DeepSeek敢于使用一门新的编程语言来开发核心产品。并且DeepSeek v3.2也验证了TileLang确实可以用来训练模型。 DeepSeek V3.2技术报告: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdfTileLang: https://github.com/tile-ai/tilelang参考链接: [1]https://x.com/Lei_Wang_1999/status/1932331703747698786 [2]https://x.com/nathancgy4/status/1972613835598299245 [3]https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519 [4]https://hub.baai.ac.cn/view/46173
-
2025云栖大会:高德地图透露AI文博布局 时空大模型重构文化体验 来源:环球网【环球网科技报道 记者 李文瑶】在2025年云栖大会上,高德展区前人头攒动。一位参会者戴上VR设备,瞬间“走入”故宫未开放的造办处遗址,俯身端详清代内务府的陈设细节——这一幕,正是高德地图以AI技术切入文博数字化赛道的缩影。在接受记者采访时,高德商业业务负责人韩鹏系统阐释了高德以“空间智能”为核心,布局文博数字化领域的战略逻辑与技术路径。从地图工具到文化平台:高德的“三维跃迁”高德地图此前已被公众熟知为出行工具,但其底层能力实则是“还原真实世界”。韩鹏指出,而AI时代的到来加速了其从二维平面向三维立体空间的升级。 “以前高德是点、线、面的组合,现在我们要构建的是全方位立体的数字空间。”韩鹏表示,高德云图团队推出的三大空间智能技术——云境(图生三维)、云睿(预测分析)、云迹(轨迹安全)——正是这一跃迁的技术支撑。其中,“云境”三维重建技术能够快速实现对文物单体乃至大型场景的三维重建,成为高德切入文博赛道的技术基石。文博数字化的三大痛点与高德新解法韩鹏分享,文博行业仍然面临三大限制:物理空间限制、数字化成本高、运营压力大。而高德的空间智能正试图从技术层面突破这些瓶颈。单就博物馆文物的数字化建模来说,传统手工建模耗时耗力。高德“云境”模型可将单体文物采集时间压缩至1~2天,并通过“单体化”技术实现展品的快速替换与内容更新,极大降低数字化门槛。此外,通过“云睿”时空大模型预测客流、疏导人流,高德还能帮助博物馆平衡文物保护与游客体验。“我们不仅要帮大型博物馆提质增效,更要让中小博物馆用得起、用得好。”韩鹏强调,高德正在将头部项目中沉淀的能力产品化,推出轻量级管理平台,服务中小型博物馆的数字化需求。从“数字孪生”到“文化串联”:AI重构文化体验高德的布局不止于复制线下博物馆。韩鹏提到,未来希望打破时空界限,实现文化主题的“跨馆串联”。例如,用户可在高德地图上追溯苏东坡一生足迹,联动多家博物馆的藏品、文献与场景,形成一条完整的文化叙事线。“文化传承不应受限于物理空间。”韩鹏举例称,青州佛像的“东方微笑”若能通过三维建模精准还原,将成为东方文化的“蒙娜丽莎”,助力文化自信的输出。这一愿景与谷歌“艺术与文化”项目异曲同工,但高德的优势在于其扎根中国本土文化生态,并拥有10亿用户流量的加持。面对行业在文博领域的布局,韩鹏认为高德的差异化在于“技术纯粹性”与“平台中立性”。“高德一心一意打造文博地图,不做内容生产,只做技术输出。”这种定位更易获得博物馆信任。此外,高德延续“老师傅+新技能”的生态合作模式,与央美、北航等院校及文博专家共建内容生态。例如,湖南博物馆线上展厅既包含官方严肃内容,也开放用户创作入口,形成“严肃+趣味”的双层体验。未来展望:从“示范项目”到“普惠平台”据了解,“十四五”课题将于11月结题,但高德已同步筹备申请“十五五”课题,计划将文博数字化能力进一步普惠化。韩鹏透露,下一步将推动成果标准化,让中小博物馆低成本接入数字化管理平台。在云栖大会的展区,观众通过VR设备“走入”考古遗址的那一刻,或许已预示着文博体验的未来形态。高德地图正试图用时空大模型打破文化的时空壁垒,让文物“活”起来,让文化“流”起来。而这背后,不仅是技术赋能行业的商业故事,更是一场关于如何以AI展现文化的长期实践。
-
Waymo自动驾驶汽车开到高尔夫球场?官方回应称当时由人类驾驶 IT之家 9 月 30 日消息,谷歌旗下 Waymo 已就近期在社交媒体上传播的一段视频作出澄清,视频显示该公司旗下一辆自动驾驶汽车驶入了高尔夫球场并在场地内行驶。 与其他 Waymo 自动驾驶车辆的行驶场景不同,视频中的这辆车直接在草坪上行驶,且距离周边人群仅数米之遥。视频中可清晰听到旁观者的笑声,而涉事 Waymo 车辆则在高尔夫球场上缓慢行驶。在网上各种猜测不断发酵之际,Waymo 作出回应称,这段热传视频中的涉事车辆实际上由人类驾驶员操控,视频拍摄期间该车辆并未处于自动驾驶状态。Waymo 在帖子中写道:“大家好,这辆车当时是由人类驾驶的,正为在彭马尔高尔夫球场(Penmar Golf Course)举办的一场活动做准备。” IT之家注意到,这段视频也引发了特斯拉爱好者群体的关注,不少网友表示,若视频中的自动驾驶出租车换成特斯拉,这家电动汽车制造商很可能会遭到媒体的猛烈抨击。
-
大摩评“英伟达投资OpenAI”:争议再大,这也是实实在在的“重大利好” 本文作者:董静来源:硬AI大摩认为,尽管市场存在质疑声音,但这笔交易为英伟达带来的是实实在在的增量收入。据见闻文章写道,9月22日,英伟达与OpenAI宣布,签署意向书确立达成战略合作,OpenAI将借此利用英伟达的系统打造和部署至少10千兆瓦(GW)的AI数据中心。9月30日,据硬AI,摩根士丹利在最新研报中指出,尽管英伟达投资OpenAI的交易引发市场争议,但该协议将为英伟达带来3500-4000亿美元的潜在增量收入,这一规模完全超出了当前市场预期。研报称,这笔交易完全是增量业务,此前市场预期这部分需求将由其他云服务提供商满足。该协议描述的建设规模是当前市场预估的数倍,将大幅推高英伟达的基本面预期。研报称,英伟达将成为OpenAI的主要计算合作伙伴,获得完全增量的业务增长,而当前估值仍然合理。摩根士丹利维持英伟达"增持"评级,目标价210美元,较当前股价有19%的上涨空间。交易规模远超市场预期 摩根士丹利在研报中详细分析了这笔交易的规模和影响。根据协议,英伟达将帮助OpenAI部署10GW计算能力,这将产生3500-4000亿美元的潜在收入,而这部分收入此前完全不在市场预估范围内。分析师指出,从英伟达的共识预期来看,2027、2028和2029财年的美元增长预期分别为600亿、450亿和420亿美元,这仅相当于每年超过2026年后增加几个GW的建设量。相比之下,OpenAI的更广泛目标是到2033年建设200GW,比今年年底的2GW大幅增长,这意味着未来8年平均每年需要增加31GW。摩根士丹利表示,英伟达在OpenAI宏大计划中只扮演一小部分角色,而这些计划反映的是市场目前尚未承认的看涨情况。研报还指出,交易设计体现了审慎的风险控制机制。摩根士丹利指出,每千兆瓦100亿美元的投资——总计500-600亿美元的资本投资,其中350-400亿美元流向英伟达——只有在公开或私人市场估值支持这项投资时才可能实现。摩根士丹利认为这是健康的机制,并不意味着锁定的10GW投资概况。英伟达的投资将随着每一千兆瓦的部署而进行,这将是对公司整体股权的直接投资,而非基于项目的投资。合理估值下的确定性机会 摩根士丹利强调,无论这笔交易的每一美元是否都能实现,它都在推高基准情形预期。该投行继续看到强劲的建设在加速进行,因为多个客户仍有大量支出意愿。研报指出,底线是,虽然牛市情形存在投机成分,但这些都还没有反映在预期中,估值仍然合理。摩根士丹利给予英伟达"增持"评级,基于其2025年每股收益预期6.36美元的约33倍市盈率。该行分析师认为,这一估值相对于大型AI同行博通有折价,相对于半导体整体板块有溢价,,反映了英伟达在该领域更高的确定性、上调预期的可能性以及溢价的利润率和增长前景。从最新的股价表现数据来看,英伟达年初至今涨幅达到221%,在摩根士丹利覆盖的半导体股票中领涨。当前股价为178.19美元,距离210美元目标价仍有19%的上涨空间 摩根士丹利总结称,虽然存在一些周期性风险的相似之处,但这些都是看涨情况的风险,而非基础情况的风险
-
DeepSeek V3.2发布,API成本减半;特斯拉员工被机器人打伤,索赔5100万美元;Claude新模型登场 |极客早知道 DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价 9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention,针对长文本的训练和推理效率进行了探索性的优化和验证。DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。本次更新带来了 API 大幅度降价,开发者调用 DeepSeek API 的成本将降低 50% 以上。 DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试。为方便用户进行对比测试,官方为 V3.1-Terminus 临时保留了额外的 API 访问接口。(来源:IT 之家) OPPO 回应新品对标大疆、GoPro:已启动研发新形态影像产品系列,预计 2026 年内发布 9 月 29 日消息,据界面新闻报道,OPPO 确认启动立项手持智能影像设备,对标 GoPro、大疆等主流手持智能影像设备厂商。据介绍,该产品负责人为前 Find 系列 GTM 李阳,归属 Find 产品规划部所属的智能影像团队,此前 OPPO 内部曾多次调研手持智能影像设备市场,但结果经常是「不需要下场」,但几个月前高层一反常态,突然下定决心立项。针对此消息,OPPO 在今天下午回应第一财经称,已启动新形态影像产品系列,计划于 2026 年内发布。而根据 IT 之家此前报道,另一家智能手机厂商——vivo 也在积极布局手持云台相机市场,去年年底立项,其首款产品已完成开模,按照节奏预计明年能发布。vivo 内部对运动相机非常重视,由现任 vivo 智慧终端产品总经理洪沂牵头整个项目的推进,目前参与人数超过 200 人,多位 vivo 员工表示已见过「样机」。(来源:IT之家)余承东被任命为华为公司 IRB 主任:仍继续负责华为终端、鸿蒙智行等业务 据媒体报道,华为公司任命余承东为公司产品投资评审委员会(IRB)主任,任命文件由任正非签发,余承东仍然担任华为常务董事、终端 BG 董事长,掌管华为终端、鸿蒙智行等业务。此次任命意味着余承东将主导华为 IRB ,该委员会负责对公司重大战略方向的资源投入、项目立项及预算审批进行关键决策,确保资源高效聚焦核心战略目标。(来源:快科技)EA 正式宣布以 550 亿 美元被收购,史上最大的全现金私有化交易 当地时间周一,美国知名游戏公司艺电公司(简称 EA)正式宣布将被沙特阿拉伯主权财富基金(PIF)、银湖资本和特朗普女婿库什纳旗下 Affinity Partners 组成的投资者财团收购。该交易预计将在 2027 年第一季度完成,交易完成后,EA 的估值将达到 550 亿美元,也将是历史上最大的全现金发起人私有化投资。三家投资方将提供 360 亿美元的现金进行收购,剩余的约 200 亿美元将通过向摩根大通银行贷款的形式进行融资。现有股东将每股获得 210 美元。其中沙特主权财富基金(PIF)已持有 EA 公司 10% 的股份,本次收购交易完成后持股比例将维持在相同水平。收购完成后,EA 股票将从公开市场退市,现任 CEO 安德鲁·威尔逊将继续执掌公司。EA 作为美国游戏大厂,旗下拥有 DICE(Digital Illusions Creative Entertainment)、BioWare、Motive Studios、Respawn Entertainment 等多个知名工作室。近年来,EA 持续推出体育类主力作品,《EA Sports FC 26》《麦登橄榄球 NFL 26》以及重启的滑板系列新作。10 月即将发售的《战地风云 6》,将是 EA 今年最核心产品。(来源:竞核) 鸿蒙 5 终端设备已突破 2000 万 9 月 29 日消息,华为常务董事、终端 BG 董事长余承东刚刚发布视频祝福用户国庆、中秋双节双倍快乐,并宣布鸿蒙 5 终端设备已突破 2000 万。 据华为常务董事、终端 BG 董事长余承东介绍,鸿蒙 5 终端设备从 0 到 1000 万,华为用了将近 10 个月的时间,而从 1000 万到 2000 万,只用了短短 2 个月时间。(来源:IT 之家)iPhone17e 比标准版相差甚远 彭博社记者马克・古尔曼昨天发布新一期《Power On》通讯,透露苹果 iPhone 17e 手机相比 iPhone 17 标准版「相差甚远」。古尔曼表示,iPhone 17e 将升级为「灵动岛」挖孔屏幕,相比 iPhone 16e 的刘海屏更为现代,但刷新率仍维持 60Hz,沿用 iPhone 16e 同款的 4800 万像素后置单摄。古尔曼认为 iPhone 17e 可能搭载 A19 芯片,在性能上看齐 iPhone 17 标准版,符合苹果下放旗舰芯片到预算型机器的一贯作风。因此,iPhone 17e 对消费者的吸引力较弱,但这可能是苹果刻意为之,他们希望 iPhone 17 与 iPhone 17e 的差距更加明显,同时与目前仍在售的 iPhone 16 标准版拉开性能差距,好让消费者更好做出选择。这样一来,iPhone 17e 就成为了一款定位纯粹的预算型手机,有望成为那些预算稍微紧张、希望获得更好性能用户的首选。不过 iPhone 17e 目前还处于前期阶段,消费者们可能还是要等多一段时间才能知道这款手机的具体配置。(来源:IT 之家)问界 M9 多车跨地域组队 K 歌功能官宣「即将上线」,支持异地与朋友一起唱歌 9 月 29 日消息,问界汽车官方宣布,科技旗舰问界 M9 多车跨地域组队 K 歌功能「即将上线」(具体上线时间暂未公布),支持在异地与朋友一起唱歌,宣称「千里之外,一麦相连」。从问界汽车官方发布的宣传视频来看,用户启用多车跨地域组队 K 歌功能后会生成一串邀请码,接受邀请的用户在车机端的 App 上输入这串邀请码即可加入一起唱歌。 (来源:IT 之家) 全球最佳编程 AI 模型:Claude Sonnet 4.5 登场,自主写代码超 30 小时 9 月 30 日消息,Anthropic 今天(9 月 30 日)发布博文,宣布推出前沿 AI 模型 Claude Sonnet 4.5,并声称这是「世界上最好的编程模型」。 与以往模型主要用于构建原型不同,Claude Sonnet 4.5 的核心突破在于能够创建「生产就绪级」(production-ready)的应用程序,标志着 AI 在软件开发的可靠性上实现了显著飞跃。在过去一年中,Anthropic 凭借其模型在软件工程任务上的卓越表现,已成为众多开发者和企业的首选。Anthropic 表示,Claude Sonnet 4.5 在包括 SWE-Bench Verified 在内的多个行业标准编程基准测试中取得了业界领先的性能。公司 AI 研究员 David Hershey 还向 TechCrunch 透露,仅凭基准测试分数难以完全体现该模型的真实能力。他观察到,在部分企业客户的早期试用中,Claude Sonnet 4.5 能够自主编程长达 30 小时。Anthropic 联合创始人兼首席科学官贾里德・卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:「人们注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。」(来源:IT 之家)第三代领克 03 家族 10 月 17 日上市,增加极光银 / 哑光灰车色 9 月 29 日消息,据易车报道,新款领克 03 及领克 03 + 车型将于 10 月 17 日正式上市。领克汽车副总经理穆军 19 日在社交平台分享了第三代领克 03 外观图,第一代领克 03 于 2018 年诞生,已经过去 7 年时间。 穆军介绍称,在基础版的 03 上,领克新增了极光银的全新车色,银色如疾风掠影,映射对速度的追求。整体造型上依旧延续 03 宽体、低趴的风格,斜线设计格栅,像层叠的机械羽翼,专属「03」数字标识,出街亮身份。在 03 + 上,领克为大家带来了「哑光灰」的全新车色,同时搭配上碳纤维前唇、碳纤维尾翼、碳纤维后唇包角等,整体造型,性能感拉满。官方预热显示,第三代领克 03 家族搭载千里浩瀚辅助驾驶 H3 方案,128TOPS 算力芯片 + J6M 驾驶辅助系统芯片加持,配备 11 个高清摄像头、3 个毫米波雷达、12 个超声波雷达大算力芯片 + 高感知硬件组合,支持 39 项安全驾驶辅助功能,新增 NOA 高速领航驾驶辅助、安全驾驶辅助指示灯等。(来源:IT 之家)贾跃亭宣布新车 FX 4:极致性价比、人工智能电车时代下 RAV4 颠覆者 现在的贾跃亭,正是干劲十足的时候,其公开宣布了法拉第未来 FX 4 计划。按照贾跃亭的说法,FX 品牌第二款车型 FX 4 目标是打造 AIEV 时代下 RAV4 的颠覆者。法拉第未来将在 10 月 28 日举行 FX Super One 中东 Final Launch 发布会,并计划 11 月率先在中东市场开启交付,并发布 FX 4 重大项目进展及产品设计图。(来源:快科技) 特斯拉技术员被有故障的机器人打成重伤,起诉要求赔付 5100 万美元 据媒体报道,近日,一名特斯拉技术员因在工作期间被有故障的机器人击打受伤,将特斯拉及其供应商告上了法庭。据了解,这名技术人员是在 2023 年 7 月,在美国加州佛利蒙工厂协助工程师拆卸机器人时受到击打的。事故发生时,工程师试图移除机器人底部的电机以查看内部组件,但机器人臂「突然且毫无警告地释放」,以相当于「约 8000 磅配重」的巨大力量击中上述技术人员的身体,把他「扔到地上」并导致其「失去意识」。为此,这名技术人员遭受了严重身体伤害,包括物理创伤、情绪困扰和财务损失,已累计医疗费用达 100 万美元,预计未来还将额外产生 600 万美元费用。于是,技术人员把特斯拉和机器人发那科美国公司告上法庭,后者是一家日本公司,是肇事机器人生产商。据了解,这名技术人员要求赔偿 5100 万美元,包括工资损失、精神损害、疼痛折磨以及收入能力下降。(来源:快科技)*图片来源:视觉中国 播客上新极客公园的播客节目「开始连接 LinkStart」持续更新中~一直以来,极客公园忠诚于记录创新。我们愿意走近创新者、创业者,聆听和记录他们创造价值、改变世界的故事;同时,我们也愿意近距离观察创新的阻力、代价,以及时代中被科技潮流裹挟的个体。如果你也想「聆听」这些声音,欢迎长按下方「卡片二维码」关注我们的播客「开始连接 LinkStart」~
-
Sora 2做“AI版抖音”,Agent做“AI版亚马逊”,OpenAI力推“AI应用” 本文作者:龙玥来源:硬AIOpenAI在下一盘大棋,其正兵分两路,一边准备推出一款由其最新视频模型Sora 2驱动的社交应用,另一边则已在ChatGPT中集成了即时购物功能。这家人工智能巨头的战略重心正从技术提供商向应用平台服务商加速转变。据《连线》杂志最新报道,OpenAI正准备发布一款独立的Sora 2应用程序。该应用在设计上与TikTok高度相似,采用垂直视频流和滑动浏览的交互方式,但所有内容均由AI生成。据报道,该应用上周已在公司内部推出,并获得了员工的积极反馈。与此同时,在商业应用领域,OpenAI近日宣布与电商平台Etsy和Shopify达成合作,在美国市场推出即时结账功能。用户可在ChatGPT的对话中直接完成商品购买,无需跳转至外部网站。此举被市场视为电商行业的重大变革,消息公布后,Etsy股价收盘飙升近16%,Shopify股价也上涨超过6%。然而,OpenAI的雄心勃勃的应用计划并非没有阻力。其Sora 2应用在版权处理上的策略——默认使用版权内容,除非权利方主动“选择退出”——已经引发了内容创作者和影视公司的强烈担忧,预示着一场围绕AI与知识产权的激烈博弈即将展开。Sora 2:高仿TikTok的AI短视频平台? 据报道,Sora 2应用将允许用户生成最长10秒的视频片段,并在推送右侧提供点赞、评论和再创作(remix)等社交功能。应用还包含一个由推荐算法驱动的“为你推荐”页面。值得注意的是,该应用不允许用户从手机相册或其他应用上传现有视频或照片,旨在打造一个纯粹的AI生成内容生态。该应用还包含一项身份验证功能,用户在验证后便可以在视频中使用自己的肖像,其他用户也可以标记并使用其肖像进行创作。知情人士透露,即使用户的肖像被用于一个从未发布的草稿视频中,本人也会收到通知。OpenAI此举被认为意在复制ChatGPT在文本领域的成功,通过一款颠覆性的应用让公众直观体验AI视频的潜力。OpenAI于去年12月正式推出Sora。最初,人们只能通过网页访问它,但很快它就直接被整合到ChatGPT应用程序中。同时,内部人士认为,在TikTok美国业务前景不明朗的背景下,这对OpenAI而言是一个独特的机遇。此举也让OpenAI直接进入了与Meta和谷歌的竞争赛道,后两者近期分别推出了AI视频平台Vibes和集成了Veo 3模型的YouTube。AI Agent:联手电商巨头开启“即时购物” 在另一条战线上,OpenAI的商业化落地更为直接。华尔街见闻写道,通过与Etsy和Shopify的合作,超过一百万Shopify商家,包括Glossier和SKIMS等知名品牌,将能够通过ChatGPT直接向消费者销售商品。这项功能基于OpenAI与支付公司Stripe合作开发的代理商务协议,旨在将ChatGPT庞大的对话流量无缝转化为商业交易。据OpenAI透露,其应用8月份的周活跃用户已超700万,其中相当一部分提问与购物相关。OpenAI产品负责人Michelle Fradin表示:“我们对ChatGPT的愿景是,它不仅为用户提供信息,还帮助用户在现实世界中完成事务。”目前该功能仅支持单件商品购买且面向美国用户,但OpenAI计划未来推出多商品购物车并扩展服务区域。公司将对通过ChatGPT完成的交易收取费用,但具体费率包含在保密合同中,用户端则无需支付额外费用。“先用后退”:版权争议成最大隐忧 尽管应用前景广阔,但OpenAI在版权问题上的处理方式正成为其最大的潜在风险。华尔街见闻提及,知情人士称,OpenAI已开始通知各大经纪公司和影视公司,告知他们Sora 2即将发布,并说明了如何通过“选择退出”(opt-out)流程来保护其版权内容。这意味着,除非电影公司等知识产权持有者主动告知OpenAI,否则其受版权保护的角色和内容可能会被Sora 2用于生成视频。OpenAI首席战略官Jason Kwon表示,公司一贯将人物肖像权和版权问题分开处理,新版Sora不会在未经允许的情况下使用公众人物的形象。然而,OpenAI不打算接受“整包式”的版权排除请求,权利方必须在发现侵权内容后逐一举报。这一做法引发了业界的普遍担忧。AI授权平台Vermillio的首席执行官Dan Neely表示,此举印证了行业长期以来的担忧。这场争议正值AI公司与好莱坞关系紧张之际。创作者们一直要求AI公司在使用其作品训练模型时应获得许可并支付报酬。尽管近期有法院裁决部分支持AI公司对版权内容的“合理使用”,但迪士尼等巨头已就类似问题起诉了AI公司Midjourney,显示出内容行业的强硬立场。OpenAI的版权策略无疑将使其成为新一轮法律和舆论风暴的中心。本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里
-
十年来首次重大更新:谷歌启用全新渐变色“G”形 Logo IT之家 9 月 30 日消息,据谷歌于当地时间周一发布的公告,该公司正将渐变色“G”标志定为全公司新标识。该新标识于今年 5 月首次在安卓(Android)和 iOS 系统的谷歌应用中亮相,很快将全面应用于公司所有平台,这也是谷歌十年来首次对标识进行重大更新。 谷歌的旧 Logo(左)与新 Logo(右) IT之家注意到,2015 年,谷歌推出的彩色“G”标志中,红、黄、绿、蓝四色相互独立;而此次新标识将四色融合,并提升了色彩饱和度,设计风格与旗下 Gemini 的渐变色标识一致。谷歌表示,这一变更旨在体现公司“在人工智能时代的演进”。 除新“G”标识外,谷歌还悄然更新了 Google Home 的标识,使其视觉风格与新形象统一。 谷歌称,新设计将在“未来数月”内进一步扩大应用范围,这意味着用户很快会在 Gmail、云端硬盘(Drive)、Meet 会议软件及日历(Calendar)等其他谷歌应用中,也看到这一渐变色设计。
-
“最强编程模型”发布,可自主运行长达30小时 9月30日消息,人工智能(AI)公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示,Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异,且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。 Anthropic称,根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试,Claude Sonnet 4.5是“全球最强的编程模型”。 Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)在接受CNBC采访时表示:“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。” 公司表示,新模型能够生成质量更高的代码,更擅长发现代码的改进空间,并且遵循指令的可靠性显著提升。 在此之前,Anthropic已于今年5月发布了Claude Sonnet 4,并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。 Anthropic由前OpenAI研究人员于2021年创立,两家公司自此形成激烈的竞争格局。 2022年,OpenAI发布聊天机器人ChatGPT,引爆生成式人工智能热潮。今年8月份,这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5,但发布过程一波三折,部分用户抱怨无法再使用OpenAI的旧版模型。 Anthropic首席产品官迈克·克里格(Mike Krieger)则表示,Claude Sonnet 4.5将成为用户的默认模型,公司推荐的这款模型适用“几乎所有使用场景”。 他还补充说,付费订阅用户仍然可以选用Opus模型,而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。 克里格补充道,Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小,但“几乎所有方面”都更智能。 克里格说:“我们自己和客户都发现,这个模型在实际工作中极具实用价值。” 据Anthropic介绍,Claude Sonnet 4.5可持续自主运行长达30小时,期间能持续专注于处理复杂的多步骤任务。相比之下,今年5月份发布的Claude Opus 4只能自主运行7小时。 Anthropic还表示,他们通过大量的安全训练成功改善了模型的行为表现,有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。 Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力,可有效避免被诱导执行泄露敏感数据等恶意操作。 卡普兰说:“这可能是过去一年到一年半以来,我们在安全性方面取得的最大突破。” Anthropic还将发布更多新模型。卡普兰透露,更先进的模型即将问世,其中“很可能包括新版Opus”。 他表示:“虽然目前不会做出承诺,但我认为在今年年底前,我们很可能还会发布一到两款新模型。” 各方观点与市场解读 《彭博社》在报道中特意提到,最近数周的多项研究表明,AI并未给竞相采用它的公司带来显著效益。但Anthropic强调,Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为,企业要充分实现AI的价值,“必须要有几个大前提”,其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说,“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。 路透社则认为,Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布,将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能,其中包括Excel和Word中的“智能体模式”(Agent Mode)、Copilot聊天中的“Office智能体”(Office Agent)等等。随后还将在PowerPoint中上线相关功能。 《The Verge》也提到,Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示,Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能,让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受《The Verge》采访时提到,新模型的运作水平达到了“参谋长级别”,能够查询多人日程找出空闲时间并安排会议,查看数据仪表盘整合不同见解,还能根据与下属的一对一会议内容撰写工作状态更新等。 《商业内幕》(Business Insider)认为,此次升级距离前代产品Sonnet 4的发布仅四个月,凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出,新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特( Alex Albert)在接受《商业内幕》采访时表示:“这些进步证实,通过扩展计算能力等输入,AI模型的性能将持续提升。”该报道提到,Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体,从而创造出实际的商业成果。文中援引艾尔伯特的话称,“编码和智能体能力的提升正在转化为实实在在的生产力增长。” 《商业内幕》的报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能,并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外,Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包,为开发者提供精细化的工具,用于开发定制化、具备上下文感知能力的AI智能体。(辰辰)
-
Claude Sonnet 4.5 发布,登顶编程测试,可连续工作超 30 小时 Anthropic 发布 Claude Sonnet 4.5,性能大幅提升。在 SWE-bench Verified 测试中,Claude Sonnet 4.5 登顶业界第一,且能连续专注工作超 30 小时。它可一次性敲出约 1.1 万行代码,构建复杂智能体、操作电脑、推理和数学等能力大幅提升。在 OSWorld 测试中拿下 61.4% 的成绩。Claude Chrome 插件可像真人一样在浏览器里操作任务。Claude Code 新增「检查点」功能,终端界面翻新,发布原生 VS Code 插件。Claude API 增加上下文编辑功能和记忆工具,代码执行和文件创建整合到对话里。Anthropic 还开放了 Claude Agent SDK,供开发者构建自己的产品。Claude Sonnet 4.5 定价与 Claude Sonnet 4 一致,每百万 tokens 3/15 美元。网友体验后评价其重构代码库表现优雅但结果无法运行。Cursor 认为其在处理长周期任务时提升明显,Dan Shipper 表示新版本响应速度更快、可控性更强、更稳定。Claude Sonnet 4.5 是 Anthropic 到目前为止对齐度最高的前沿模型,减少了不良行为,在防御提示注入攻击和减少内容误判方面有重大突破。同时推出「Imagine with Claude」临时研究预览功能,但仅对 Max 订阅用户开放五天。Anthropic 估值达 1830 亿美元,8 月年化营收 50 亿美元,但面临 OpenAI 和 Google Gemini 的竞争压力。此前 Claude 系列模型曾经历「降智」风波,此次发布 Claude Sonnet 4.5 是为挽回用户,其实际表现还需后续观察。