作者归档:admin

实测AI找房:1分钟内做好方案 AI正悄然改变房地产行业

国庆中秋长假期间,各大城市的售楼处客流攀升。考虑为家人置业的记者,也不免受到销售人员铺天盖地的电话、信息“轰炸”。

过去有部分销售人员和房产中介打着降价噱头,承诺超高得房率,或者隐瞒楼盘不利信息,让购房者蒙受不明不白的损失。在贵州平远古镇和贵阳市出游途中,如何在众多楼盘里挑选一套满意的房子,让记者犯了难。

今年以来,不少房地产咨询服务平台升级或上线AI(人工智能)大模型产品,根据专业数据库,分析城市市场、区域板块、二手房成交、土地交易、开盘节奏和竞品动态等内容,自动生成买房报告,记者决定试一试。

在平远古镇和织金古城附近,记者用地产垂直AI智能体“CRIC深度智联”,输入“帮我找找贵州平远古镇附近有哪些楼盘可以买房子”“大户型”“四代宅”的需求信息。

不到1分钟,它就推荐了温贵商依云尚品、山禾源商都、东方之花织金印象、龙城南苑等项目,顺带给出了一份织金县房地产市场概况和购房建议。

从地图上看,温贵商依云尚品是一处距离古镇约3公里的小区,靠近织金县第八小学,周边有半岛温泉、织金印象等住宅区。按照AI的推荐,记者来到了温贵商依云尚品。

这里的确是一处在售项目,长假期间,售楼处工作人员全员在岗,休息区有购房者在咨询洽谈。

置业顾问小韦介绍,这里是织金县首个第四代住宅项目,在售房源的户型面积为116~142平方米不等,项目突破了错层设计,将庭院从地面搬向天空,户户外延大露台、层高约6米的错层庭院,最大赠送面积达到80平方米。

在与温贵商依云尚品的销售负责人王经理攀谈时,他介绍,会安排营销团队不定期拍摄抖音视频,并在视频下方设置楼盘的独特关键词。这样,购房者在使用AI工具找房的时候,就能很快关联到项目上,增加项目来访量。

不过,CRIC深度智联在精准快速分析推荐楼盘的同时,也存在一些不足。比如在织金县这类县城,它缺乏支撑楼盘不利因素分析的数据,像上述项目地段相对偏远、生活配套不足等信息有待完善。

记者又将购房需求提给AI智能体,这次选择的是贵阳市。它很快就推荐了中铁阅山湖·臻藏、铁建城·悦墅、天瀑南明府和中海印龙泉等项目。

这次它不仅给出了项目的房价整体水平、周边价格变化趋势、市场成交情况、年度变化对比,还从市场全局分析了销售金额表现突出的项目,开发商层面的竞争格局,以及项目特色。

与此同时,AI还从交通条件、周边环境(噪音污染、靠近公路或工厂、物业服务水平)等因素,分析了观山湖区一处楼盘存在交通不便的缺点。

在数字化浪潮下,AI技术正重塑各行各业,让房子更懂人,赋能房产交易效率和质量。

贝壳一位内部人士告诉记者,如今,越来越多的经纪人在运用“来客”AI系统为客户寻找高度匹配的房源,过去需要翻阅十几本台账去匹配房源,如今系统推荐只需要3秒。

“经纪人的专业经验加上AI的数据洞察,我们不再仅仅聚焦于房源匹配,更像一位值得信赖的顾问,与客户建立起深厚的信任关系。”一位经纪人如是说。

的确,在传统房产服务中,经纪人依赖个人经验进行房源推荐,只是往往受限于经纪人能力不一,会因为信息不对称导致客户流失。如今,从“经验驱动”到“数据智能”,AI正在房产交易环节掀起一场“效率革命”,行业未来将迎来新的变局。

贵阳市一处楼盘。每经记者 刘颂辉 摄

记者手记:AI正悄然改变房地产行业

外出旅行时,用AI快速翻译当地语言或者搜集历史故事;日常生活中,用AI制定一段问答方案,这是我较多使用AI的场景。坦率来说,房子作为一项大宗资产,我之前并没有想过用AI来帮助决策。

这次“长假走中国·AI探热度”让我意料之外的是,将自己的购房需求整理发给AI,它会推荐市场最前沿的第四代住宅;有置业顾问在手机里随手一搜,还能实时了解竞品楼盘的动态。

当然,人工智能在房地产行业中的应用场景还有很多,陆续有企业主动拥抱新技术,推动AI从测试走向一线业务,使得它越来越普惠化和平民化。

公开数据显示,“十四五”期间,头部房企年均数字化投入在2021年达到1.5亿元的峰值。在“十五五”期间,毫无疑问,AI会成为这一轮投资的重点,超过九成的头部房企判断AI将在1至2年当中实现业务落地,近四成企业预计AI投资的年增长率在10%到30%之间。

随着人工智能在房地产行业的热度升高,我也将用文字和视频带来更多内容呈现

黄仁勋:近半年AI需求大增,英伟达参投马斯克的xAI,可惜没投更多,对OpenAI也这样遗憾

英伟达CEO黄仁勋再次力挺人工智能(AI)需求强劲的观点,并确认了英伟达参投马斯克旗下初创xAI的消息。

美东时间10月8日周三的媒体采访中,黄仁勋表示,过去六个月AI计算需求大幅上升,英伟达新一代架构Blackwell的芯片需求“非常非常高”。他认为这标志着“新一轮工业革命”开始。对于英伟达投资xAI,黄仁勋表示,唯一的遗憾是没给马斯克更多投资。

黄仁勋提到AI需求激增后,英伟达股价周三扭转三连跌的势头,收涨超2%。

对于英伟达的竞争对手AMD本周宣布与OpenAI达成大规模的芯片供应协议,黄仁勋称该交易“巧妙”但令人吃惊,因为AMD向OpenAI提供了相当于10%AMD股权的认股权证。对于两周前公布的英伟达千亿美元投资OpenAI计划,黄仁勋认为只是遗憾没投更多。

业内分析师预计,到2026年,全球的AI基础设施合计支出可能达到2万亿美元。AI模型正在从提供简单问答向拥有复杂的推理能力演进,这推动了计算需求呈指数级增长。

AI计算需求激增 Blackwell芯片供不应求

本周三,被问到投资者最常问什么问题时,黄仁勋强调:

“今年、特别是过去六个月,计算需求大幅增长。”

黄仁勋解释称,AI推理模型正使用指数级的计算能力,但同时也看到指数级的需求增长,因为其结果非常出色。他说:“AI已经足够智能,人人都想用它。我们现在同时看到两个指数级增长。”

英伟达最先进的Blackwell图形处理器(GPU)需求尤其旺盛。该芯片拥有2080亿个晶体管和全新AI加速技术,已成为从OpenAI的ChatGPT到其他AI模型数据中心的核心支撑。

黄仁勋说,“对Blackwell的需求非常非常高”,还说”我认为我们正处于新一轮建设的开端,新工业革命的开端。”

英伟达上月宣布,计划未来十年向OpenAI共计投资1000亿美元,支持OpenAI部署需要10千兆瓦电力的英伟达系统,相当于400万至500万个GPU。

英伟达据称20亿美元参与xAI融资轮

本周三有媒体报道,xAI正寻求筹集约200亿美元资金,英伟达将投资20亿美元。该融资包括股权和债务,通过特殊目的工具购买英伟达处理器并租给xAI用于其Colossus 2项目。

该媒体获悉,xAI的融资将分为约75亿美元股权和高达125亿美元债务。xAI今年早些时候已通过股权和债务融资约100亿美元,但鉴于今年6月有报道援引财务数据称,xAI每月大概烧钱10亿美元,该公司仍需追加数十亿美元资金投入。

黄仁勋周三对另一媒体确认了英伟达投资xAI,称:

“我对他们(xAI)提供的融资机会感到非常兴奋。我们已经是xAI的投资者,我对xAI的唯一遗憾是没有给他(马斯克)更多资金。”

黄仁勋高度评价马斯克的创业经历,称这位特斯拉和SpaceX的创始人擅长打造变革性的公司。他表示:

“几乎所有埃隆(·马斯克)参与的事,你都真的想参与其中。”

对AMD协议给OpenAI股份感到吃惊 遗憾投资OpenAI不够多

对于AMD本周一宣布的与OpenAI多年合作协议,黄仁勋表示吃惊。根据协议,OpenAI承诺购买6千兆瓦(GW)芯片,包括AMD即将推出的MI450系列,作为交换,OpenAI将获得最多1.6亿股AMD认股权证。

黄仁勋说:

“考虑到他们对下一代产品如此兴奋,这(协议)真是富有想象力,而且独一无二,令人吃惊。我很惊讶,他们竟然在产品还没开发出来之前就放弃了10%的公司股份。无论如何,我想这很巧妙。”

AMD股价自宣布该协议以来大幅上涨,本周累计涨幅达35%。该交易挑战了英伟达在AI芯片行业的主导地位。

黄仁勋说,英伟达对OpenAI的投资同OpenAI与AMD 的交易“截然不同”,因为它允许英伟达直接向OpenAI出售产品。

被问到OpenAI如何为与英伟达的交易筹集资金时,黄仁勋表示,OpenAI“现在还没钱”,“首先要通过他们正在成倍增长的收入、股权或债务来筹资。他们给了我们机会,让我们在时机成熟时与其他投资者一起投资。”

黄仁勋同时表达了对英伟达投资OpenAI不足的遗憾。他说:“我们之前投资OpenAI后,唯一的遗憾就是没有投更多。”

黄仁勋表示,他认为云服务商CoreWeave 是英伟达近期几项“非常出色的投资”之一。“他们是真正特别的公司,他们正在构建,他们是我们生态系统的一部分,正在为世界构建 AI 基础设施。”

AI竞争:中国在能源建设方面遥遥领先

在谈及AI竞争格局时,黄仁勋表示美国目前“领先不多”。他指出,中国在建设支持AI所需电力方面的速度远超美国。

黄仁勋说:“中国在能源方面遥遥领先。” 他认为AI行业需要在电网之外建设新的发电能力,以快速满足需求并保护消费者免受电价上涨影响。

黄仁勋建议数据中心应配备天然气发电设备,未来可能使用核电。他表示:“我们应该投资几乎所有可能的发电方式。数据中心自发电比接入电网移动更快,我们必须这样做。”

按照与英伟达达成的协议,OpenAI计划建设10GW的数据中心。这一容量相当于800万美国家庭全年的耗电量,或者等于2024年夏季纽约市的峰值基准电力需求量,凸显了AI行业对能源的巨大需求。

本文来自华尔街见闻,欢迎下载APP查看更多

阿里巴巴出手:组建机器人和具身智能团队,让AI从虚拟走进现实

IT之家消息,阿里通义千问大语言模型负责人林俊旸 10 月 8 日在社交媒体 X 上发文表示,已组建机器人和具身智能的小型团队。他表示,多模态基础模型正转变为基础智能体(agents),这些智能体可以利用工具和记忆通过强化学习进行长视野(long-horizon )推理,“它们绝对应该从虚拟世界走向物理世界”。

IT之家注意到,在全球科技巨头纷纷布局机器人领域的背景下,阿里云近期首次布局具身智能,上月领投了中国机器人初创公司自变量机器人(X Square Robot)的 1.4 亿美元融资。此外,两周前的 2025 云栖大会上,阿里巴巴 CEO 吴泳铭表示,未来五年全球 AI 投资总额将加速增长到 4 万亿美元,阿里必须保持同步。除了 2 月公布的未来三年为云和 AI 硬件基础设施投入 3800 亿元外,阿里还计划追加投入。

作为通义千问的技术负责人,林俊旸此前参与开发了可处理声音、图像及文本输入的多模态模型。

Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生

卷编程,还得看 Claude。
就在刚刚,Anthropic 正式发布 Claude Sonnet 4.5。
先说 Claude Sonnet 4.5 交出的成绩单,在考察真实编程水平的 SWE-bench Verified 测试里,Claude Sonnet 4.5 直接登顶业界第一。
更离谱的是,它能连续专注干活超过 30 小时。
好好好,AI 取代人类的优势又 +1 了。
比如让它写个类似 Slack 或 Teams 的聊天应用,它能一口气敲出大约 1.1 万行代码。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能独立工作七小时。
用 Anthropic 的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。
比方说,在 OSWorld 这个专门测试真实计算机任务的基准里,它拿下了 61.4% 的成绩,直接第一。要知道,四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先,这才多久性能就又往上抬了一大截。
而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务,像个真人在操作似的。推理、金融这些测评项目上也都更强了,各项指标都在往上涨。
有了这么强的能力,Anthropic 这次自然不会只发个模型就完事。
具体来看:
Claude Code加了「检查点」功能,能随时保存进度,想回退到之前某个状态一键搞定
终端界面翻新,还发布了原生 VS Code 插件
Claude API 增加了上下文编辑功能和记忆工具
代码执行和文件创建现在直接整合到对话里
甚至,Anthropic 把自己内部用来搭建 Claude Code 的底层基础设施也开放出来了,叫 Claude Agent SDK。
智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标,这些都是构建和设计 AI 智能体的棘手问题。
而借助 Claude Agent SDK,现在你也能拿去构建自己的产品。
今天起,开发者还可以通过 Claude API 调用 claude-sonnet-4-5。定价还是跟 Claude Sonnet 4 一样,每百万 tokens $3/$15,价格没变能力更强。
网友 @vasumanmoza 体验完直接发帖:
「Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。」这评价,属于又爱又恨那种。
Cursor 表示,在 Claude Sonnet 4.5 上看到了最前沿的编程性能,尤其处理长周期任务时提升明显。这也再次说明为什么很多 Cursor 用户会选 Claude 来解决最复杂的问题。
知名测评博主 Dan Shipper 则表示,新版 Sonnet 4.5 在使用体验上响应速度更快,可控性更强,也更稳定。
图片
性能强是一方面,安全性也得跟上。
据介绍,Claude Sonnet 4.5 也是 Anthropic 到目前为止对齐度最高的前沿模型。
靠着 Claude 更强的能力加上完善的安全训练,Anthropic 在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,Anthropic 在防御提示注入攻击和减少内容误判这块也有了重大突破。
图片
比较让我感兴趣的是,Anthropic 还在 Claude Sonnet 4.5 发布的同时推出了个临时研究预览功能,叫「Imagine with Claude」。
在这个功能里,Claude 会实时生成软件,所有功能不是预设的,所有代码也不是提前写好的。你看到的一切都是 Claude 跟你互动时当场创造和调整出来的。
不过,「Imagine with Claude」接下来五天内只会对 Max 订阅用户开放。
附上传送门 claude.ai/imagine。
图片
毫无疑问,今年的 AI 赛道依旧是卷编程的一年。
目前 Anthropic 估值已经到了 1830 亿美元,8 月还实现了年化营收 50 亿美元,但这其中相当一部分增长靠着来自编程软件的普及。问题是,老对手 OpenAI 和 Google Gemini 也在疯狂推类似工具抢程序员用户。
甚至一周之后就是 OpenAI 年度开发者大会,Anthropic 这个时候抢先发布 Claude Sonnet 4.5,时间卡得够精准,明摆着就是要给对手上一波压力。
此外,Anthropic 联合创始人兼首席科学官 Jared Kaplan 还表示,更先进的 Opus 模型,预计今年晚些时候推出:「Anthropic 在大小模型的使用上都能占优势。」
图片
不过有一说一,Anthropic 自己眼下也有麻烦要解决。
过去两个月,Claude 系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连付费的 Max 用户都没能幸免。
虽然 Anthropic 后来紧急回滚了 Opus 4.1 更新,还承认了两个独立 Bug,声明「绝非为省成本故意降智」,但由于没提供补偿或退款,GitHub 和 X 等平台上还是出现了退订潮,不少用户直接转投 Codex。
这次 Claude Sonnet 4.5 的发布,显然就是 Anthropic 想用实打实的性能提升来挽回流失的用户。至于能不能成功,就看接下来几周的实际表现了。

智谱旗舰模型GLM-4.6上线,代码能力全面进阶

在AGI的探索中,我们再次突破大模型的能力边界。

作为GLM系列的最新版本,GLM-4.6是我们最强的代码Coding模型(较GLM-4.5提升27%)。在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。如下:

  • 高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
  • 上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。
  • 推理能力:推理能力提升,并支持在推理过程中调用工具。
  • 搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。
  • 写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope开源,遵循MIT协议。

Coding能力创国产模型新高

  1. 1. 综合评测

在8大权威基准:AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA 模型通用能力的评估中,GLM-4.6在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

  1. 2. 真实编程评测

为了测试模型在实际编程任务中的能力,我们在Claude Code环境下进行了74个真实场景编程任务测试。结果显示,GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。

在平均token消耗上,GLM-4.6比GLM-4.5节省30%以上,为同类模型最低。

为确保透明性与可信度,智谱已公开全部测试题目与Agent轨迹,供业界验证与复现(链接:https://huggingface.co/datasets/zai-org/CC-Bench-trajectories)

适配寒武纪、摩尔线程芯片

GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。

基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,充分印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势。

GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。

Coding Plan 全面升级

随着GLM-4.6发布,智谱同步升级GLM Coding Plan(最低20元包月畅玩套餐)同时推出GLM Coding Plan企业版套餐,为企业级用户提供兼具安全、成本效益与国际顶尖性能的编码套餐。

此前订阅GLM Coding Plan包月套餐的用户自动升级至GLM-4.6,新增:

  • 图像识别与搜索能力。
  • 支持Claude Code、Roo Code、Kilo Code、Cline等10+主流编程工具。
  • 面向高频重度开发者提供GLM Coding Max,是Claude Max (20x) plan三倍用量。

获取与体验

  • 智谱MaaS平台bigmodel.cn、z.ai、智谱清言已全面支持GLM-4.6;
  • 海外用户可通过z.ai使用 API;
  • 开源部署:GLM-4.6模型将在Hugging Face、ModelScope发布;
  • 开发者和企业通过bigmodel.cn直接购买GLM Coding Plan套餐/企业版套餐。

GLM-4.6的上一代模型GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合。GLM-4.5在代码能力上的突出表现让其取得一些成绩,在OpenRouter上稳居全球前十供应商,自发布后智谱MaaS平台API商业化实现10倍以上增长。

更多资料:

GLM-4.6 技术博客:https://z.ai/blog/glm-4.6

腾讯混元3D开源+2:瞄准游戏建模、3D 打印痛点

今天,混元3D生成模型家族迎新——混元3D-Omni、混元3D-Part发布并开源。
这是腾讯混元在可控3D生成上的新突破,让AI 3D建模更具实用性,加速3D生成模型在游戏、打印和AR/VR 等实际生产流程中的落地应用。
作为业界首个统一支持多条件控制的3D生成框架,混元3D-Omni 突破传统图像输入的局限性,支持多种模态输入,实现对物体几何结构、拓扑和姿态的精细控制。

混元3D-Part则实现了灵活可控的部件拆分和生成,让分解和生成3D模型像玩乐高一样简单。

混元3D-Omni、混元3D-Part将完整开放推理代码和权重,全面开源、免费使用,便于学术研究和工业部署,助力可控3D生成的社区探索。

乐享科技完成2亿元“天使++”轮融资,天使轮融资总额近5亿元,聚焦消费级具身智能赛道

9 月 28 日,消费级具身智能企业苏州乐享智能科技有限公司正式宣布完成 2 亿元 “天使 ++” 轮融资。这已是乐享科技在 9 个月内完成的第三轮融资,天使轮融资总金额接近 5 亿元。

本轮融资由 钟鼎资本 领投,老股东 IDG资本 持续加注。资金将主要投入核心零部件自研、机器人本体与运动控制技术、意识仿生模型迭代等,目标加速消费级具身智能产品规模化落地。

01

为什么是乐享科技?

在人工智能浪潮席卷全球的今天,乐享科技选择了一条最具潜力也最具挑战的赛道——让具身智能机器人真正走进普通人的日常生活。

创始人郭人杰(1997 年生),15岁进入西安交通大学少年班,拥有工科与经济学跨学科背景和丰富的行业经验。曾任追觅中国区执行总裁,三年带队实现 60亿营收,管理团队超 1500人。

图片

我们的团队 研发人员占比超 80%,核心成员均来自清华大学、浙江大学、中国科学院、加州大学伯克利分校、卡耐基梅隆大学等全球顶尖学府与研究机构。

拥有二十年消费级机器人经验的创始团队加全球顶尖的年轻研发力量,构成了兼具远见与实战经验的核心团队。

硬核技术 + 全球视野 + 实战经验,让机器人不再只是“前沿概念”,而是触手可及的生活伙伴。

02

WAWA的成长足迹

你可能已经在一些重要场合见过乐享科技的产品。

在世界人工智能大会、世界机器人大会上,履带式机器人 W-bot(昵称 “WaWa”)凭借精准的运动控制和自然的交互体验,吸引了众多关注。

今年 7 月,WaWa 更是作为苏州主场的首位机器人领队亮相苏超赛场,开创了具身机器人在公共体育场景应用的先例。

图片

更早之前,WaWa 初代原型机已率先开启市场验证:

5月:亮相京东 618 夏日歌会

6月:在京东拍卖以 29799 元成交,初步验证了市场对消费级具身智能产品的认可

图片

03

未来已来:

人机共生的时代序章

智能机器人将走入千家万户

从赛场到家庭,从展会到日常生活,具身智能正在从技术验证走向真实场景。

除了频频出圈的 W-bot,一款高 60 厘米的小型家庭机器人 Z-Bot也在同步开发中。两者将构成覆盖室内外的产品矩阵,让具身智能机器人真正成为人们生活的一部分。

图片
乐享的目标很清晰:

Z-Bot

聚焦家庭场景,探索陪伴、教育、交互等全新可能

W-Bot

覆盖户外与公共空间,拓展零售、安防、娱乐等多元应用

在两大核心平台的并行推进下,乐享不断丰富产品矩阵,打造高度平台化的研发体系,让具身机器人真正成为未来社会的基础能力与普惠资源,从而改变人与智能交互的方式,加速人机共生的新时代到来。

OpenAI 推出“即时结账”功能,ChatGPT 变身购物支付一体机

IT之家 9 月 30 日消息,当地时间周一(9 月 29 日),OpenAI 在官网宣布推出“即时结账”(Instant Checkout)功能,并允许用户直接在聊天机器人 ChatGPT 内购买商品。

目前,美国地区的 ChatGPT 用户可在对话界面内直接完成 Etsy 平台购物及 Shopify 平台下单,这一功能不仅为消费者带来新体验,也标志着掌控商品发现、推荐及支付环节的平台向在线购物未来形态迈出关键一步。换言之,OpenAI 或许已踏上重塑电商领域权力格局的征程。

据 OpenAI 透露,其全新推出的“即时结账”功能已面向 ChatGPT Pro、Plus 付费用户及登录状态下的免费用户开放,现阶段支持从美国本土 Etsy 卖家处购物;而涵盖 Glossier、Skims、Spanx、Vuori 等品牌在内的超 100 万家 Shopify 商户,将在“很快”支持该功能。

据IT之家了解,“即时结账”功能是在 ChatGPT 原有购物功能基础上的升级。此前,当用户提出“该给喜欢陶艺的朋友买什么礼物?”或“适合办公室穿的最佳运动鞋有哪些?”这类购物相关问题时,ChatGPT 会展示相关商品、图片、用户评价、价格,并提供指向商家的直接链接。如今,用户无需离开对话界面,只需点击“购买”(Buy)按钮,确认订单信息、配送地址及支付详情(支付方式包括 Apple Pay、Google Pay、Stripe 支付或信用卡),即可完成整个购买流程。

事实上,去年 Perplexity 就已推出类似的“对话内购物与支付”功能;微软也通过“Copilot 商户计划”(Copilot Merchant Program),为商户提供在对话中搭建店铺前端的能力。

这种无缝购物体验有望引发在线购物模式的新变革,用户将逐渐脱离谷歌等搜索引擎及亚马逊等电商平台,转向具备精选推荐、商品对比功能且支持便捷结账的对话式智能助手。

与此同时,这一趋势也为电商领域催生新“权力中介”奠定了基础。长期以来,谷歌与亚马逊一直是零售领域商品发现环节的“守门人”。若未来更多消费行为转移至 AI 聊天机器人内完成,开发这些机器人的企业将突然获得更大控制权,既能决定哪些商品得以展示,也能自主制定佣金或服务费率标准。

历史上,亚马逊与谷歌曾多次利用自身市场主导地位优先推广自有产品或合作方商品,通过压低竞争对手在搜索结果中的排名,或向商家收取高额费用以维持其商品曝光度。对此,OpenAI 在一篇博客文章中表示,其平台展示的商品结果“均为自然推荐、无赞助属性,纯粹依据与用户需求的相关性排序”,且仅会对已完成的订单向商家收取“小额费用”。

除推出“对话内结账”功能外,OpenAI 还宣布将开源其“智能体电商协议”(Agentic Commerce Protocol,简称 ACP)。该协议是与 Stripe 合作开发的核心技术,为“即时结账”功能提供支持;开源后,其他商户及开发者可将“智能体结账”功能集成至自身平台。

Stripe 技术与业务总裁威尔・盖布里克(Will Gaybrick)在声明中表示:“Stripe 正为 AI 领域构建经济基础设施。这意味着我们要重新设计当前的电商体系,并为数十亿用户打造由 AI 驱动的全新体验。”

尽管部分用户可能对向 ChatGPT 提供私人支付信息存在顾虑,但 OpenAI 强调,订单处理、支付操作及商品履约全流程均由商家通过其现有系统完成,ChatGPT 仅扮演“智能中介”角色,负责在用户与商家之间安全传递信息。

开源 ACP 协议将降低商户与 ChatGPT 的集成门槛,进而推动具备“虚拟店铺”功能的 AI 聊天机器人进一步普及。与此同时,这一举措也将扩大 OpenAI 在零售商品发现及结账环节的潜在控制权,助力其成为 AI 电商生态系统中事实上的“规则制定者”。

这一发展态势或将使 OpenAI 与谷歌再次陷入竞争僵局,谷歌近期已推出面向 AI 智能体发起购物行为的自有开放协议,名为“智能体支付协议”(Agent Payments Protocol,简称 AP2)。

Ring-1T-preview,深思不必久等

最近,我们一直忙于 Ling 2.0 家族 1T 语言基座的后训练,试图最大程度地激发这个万亿规模基座模型的自然语言推理潜力。对如此巨大的模型进行后训练,尤其是大规模强化学习的“调教”,是 Ling Team 自成立以来,遇到最有技术挑战的事情之一。但另一方面,也是不断刷新我们技术认知,不断坚定“scaling is all you need”的过程。

Ring-1T

在大规模强化学习训练的早期,1T 语言基座的思考模型版本 Ring-1T 就已经表现出强大的自然语言推理思考能力。在 AIME 2025(美国数学邀请赛),该模型通过纯自然语言推理即可取得 92.6 的高分,进一步逼近 GPT-5 with thinking (no tools) 的 94.6 水平。此外,在哈佛-麻省理工数学竞赛 HMMT 2025,竞赛级代码生成任务 LiveCodeBench v6 、CodeForces 上,以及抽象推理基准 ARC-AGI-1 等任务中,模型同样展现出极强的竞争力。

图片

为了进一步探索 Ring-1T 早期版本的推理上限,我们将其接入多智能体框架 AWorld(https://github.com/inclusionAI/AWorld),并在 IMO 2025(国际数学奥林匹克竞赛,6道题)上进行了纯自然语言推理测试。

此前,我们曾以相同方法测试过 Ring 系列“二哥”——Ring-flash-2.0。在允许三次推理尝试的设定下,它直到第三次才勉强解出第 3 题。相比之下,Ring-1T 在本次测试中仅用一次推理就解出了第 3 题,并且在第 1、2、4、5 题上也能一次性给出部分正确答案。这不仅展示了顶级数学竞赛所要求的洞察力、构造能力、反例构造、策略思维和严谨的逻辑链推理等高阶能力,也凸显了大尺寸思考模型在推理潜力上的显著提升。我们目前仍在持续开展更多高难度推理任务的测试验证,例如 ICPC、CCPC 等编程竞赛,以进一步挖掘这个万亿思考模型的潜能。

第四题

图片

第五题

图片

为便于社区尽早探索万亿思考模型Ring-1T的推理上限,我们决定提前开源其预览版 Ring-1T-preview。该模型延续Ling 2.0高效MoE架构,在20T高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研高效强化学习系统ASystem(其中AReaL框架已开源)上进行了针对推理能力的RLVR训练。

Ring-1T 仍在持续训练中,虽然此次发布的预览版已展现出强大的自然语言推理能力,但仍存在语种混杂、推理重复、身份认知错误等问题。我们期待社区的探索与反馈,共同加速万亿基座的迭代完善。

智谱旗舰模型GLM-4.6上线,代码能力全面进阶

在AGI的探索中,我们再次突破大模型的能力边界。

作为GLM系列的最新版本,GLM-4.6是我们最强的代码Coding模型(较GLM-4.5提升27%)。在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。如下:

高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。
推理能力:推理能力提升,并支持在推理过程中调用工具。
搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。
写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope开源,遵循MIT协议。

Coding能力创国产模型新高
1. 综合评测

在8大权威基准:AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA 模型通用能力的评估中,GLM-4.6在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

2. 真实编程评测

为了测试模型在实际编程任务中的能力,我们在Claude Code环境下进行了74个真实场景编程任务测试。结果显示,GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。

在平均token消耗上,GLM-4.6比GLM-4.5节省30%以上,为同类模型最低。

为确保透明性与可信度,智谱已公开全部测试题目与Agent轨迹,供业界验证与复现(链接:https://huggingface.co/datasets/zai-org/CC-Bench-trajectories)。

适配寒武纪、摩尔线程芯片

GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。

基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,充分印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势。

GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。

Coding Plan 全面升级

随着GLM-4.6发布,智谱同步升级GLM Coding Plan(最低20元包月畅玩套餐)。同时推出GLM Coding Plan企业版套餐,为企业级用户提供兼具安全、成本效益与国际顶尖性能的编码套餐。

此前订阅GLM Coding Plan包月套餐的用户自动升级至GLM-4.6,新增:

图像识别与搜索能力。
支持Claude Code、Roo Code、Kilo Code、Cline等10+主流编程工具。
面向高频重度开发者提供GLM Coding Max,是Claude Max (20x) plan三倍用量。

获取与体验
智谱MaaS平台bigmodel.cn、z.ai、智谱清言已全面支持GLM-4.6;
海外用户可通过z.ai使用 API;
开源部署:GLM-4.6模型将在Hugging Face、ModelScope发布;
开发者和企业通过bigmodel.cn直接购买GLM Coding Plan套餐/企业版套餐。

GLM-4.6的上一代模型GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合。GLM-4.5在代码能力上的突出表现让其取得一些成绩,在OpenRouter上稳居全球前十供应商,自发布后智谱MaaS平台API商业化实现10倍以上增长。

更多资料:

GLM-4.6 技术博客:https://z.ai/blog/glm-4.6