职贝云数AI新零售门户

标题: DeepSeek强势回归,Claude新模型编程登顶,OpenAI和谷歌同时限流!| AI Weekly 11.24-30 [打印本页]

作者: ZqUIC 时间: 5 小时前
标题: DeepSeek强势回归,Claude新模型编程登顶,OpenAI和谷歌同时限流!| AI Weekly 11.24-30
📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🧮 DeepSeek 发布 DeepSeekMath-V2 ：685B 参数数学推理模型，Putnam 2024 拿下 118/120 分超越人类最高分，IMO 2025 达金牌程度，首个开源的顶级数学模型。

2️⃣ 🎨 阿里开源 Z-Image ：6B 参数打出 20B 效果，16GB 显存可跑，8 步采样亚秒级出图，中文海报渲染是一大亮点，发布首日下载超 50 万。

3️⃣ 📊 Kimi 上线 Agentic Slides ：一键将 PDF/图片/文档转为演示文稿，集成谷歌 Nano Banana Pro 生成设计师级信息图，支持 PPTX 导出。

4️⃣ 🗣️ 豆包语音大晋级：支持粤语、东北话、四川话、陕西话 4 种方言输入，能听懂上海话、天津话等 18 种方言输入，ASR 准确率达 92%。

5️⃣ 🎙️ ChatGPT 语音形式并入主界面：语音和文字可在同一对话中自在切换，AI 回答实时显示文字，图片/地图同步呈现，边说边看成为默许体验。

6️⃣ 🛒 ChatGPT 上线购物研讨功能：由 GPT-5 mini 购物公用版驱动，经过问答了解需求后生成个性化购物指南，黑五时期收费用户几乎有限运用。

7️⃣ ⚠️ Sora 和 Nano Banana Pro 同时限流：OpenAI 收费用户每天仅能生成 6 条视频，谷歌收费图像生成从 3 张砍到 2 张，算力告急，收费 AI 黄金时代或将收尾。

8️⃣ 🏆 Claude Opus 4.5 发布：SWE bench 首破 80%（80.9%），外部工程考试得分超过一切人类候选人，定价较上代降价 66%，同步推出 Chrome 和 Excel 扩展。

9️⃣ 🖼️ Black Forest Labs 发布 FLUX.2 ：32B 参数，最高支持 4MP 输入，可同时输入 10 张参考图保持分歧性，开放权重版本已可在 ComfyUI 运转。

01｜DeepSeek 发布 DeepSeekMath-V2：Putnam 118 120 超人类最高分

11 月 27 日，DeepSeek 开源数学推理模型 DeepSeekMath-V2，主打“自我验证”才能，不只追求答案正确，更要求推理过程严谨可查。模型基于 DeepSeek-V3.2 Exp Base 构建，参数量 685B，在顶级数学竞赛中表现惊人：IMO 2025 解出 6 题中的 5 题达金牌程度，Putnam 2024 拿下 118 120 分，超过当年人类最高分 90 分。在 Google DeepMind 开发的 IMO ProofBench 基准测试中，基础测试超越了同为金牌级别的 DeepThink 模型。

技术核心是“验证器-生成器”双模型架构：先训练一个严厉的证明验证器，再让生成器学会产出能经过验证的证明。当生成器变强后，系统会自动扩展验证算力来标注更难的证明，构成持续退化的闭环。模型权重已在 HuggingFace 开放下载，遵照 Apache 2.0 协议。这是继 OpenAI 和 Google 之后，第三个达到 IMO 金牌程度的数学模型，也是首个开源的同级别选手。

02｜阿里开源 Z-Image：6B 参数打出 20B 效果，16G 显存可跑

11 月 27 日，阿里通义实验室开源图像生成模型 Z-Image，参数量仅 6B，但官方称视觉质量接近 20B 级别的闭源模型。核心是单流 DiT 架构，把文本和图像 token 塞进同一个 Transformer 处理，省掉了双流模型的反复参数开支。蒸馏版 Z-Image Turbo 只需 8 步采样即可出图，H800 上完成亚秒级生成，16GB 显存的 RTX 30 系列也能流利运转。发布首日下载量超 50 万。

(, 下载次数: 0)

模型分三个版本：Turbo 主打疾速生成和中英双语文字渲染，Base 供社区微调，Edit 专攻自然言语指令编辑。中文海报渲染是一大卖点，这块不断是海外开源模型的软肋。采用 Apache 2.0 协议开源，发布工夫恰在 32B 参数的 FLUX.2 之后，走了一条小参数高效率的差异化道路。

03｜Kimi 上线 Agentic Slides，集成 Nano Banana Pro 生成信息图

11 月 28 日，月之暗面旗下 Kimi 推出“Agentic Slides”功能，可将 PDF、图片、文档一键转为演示文稿，并集成谷歌 Nano Banana Pro 生成设计师级别的信息图和插画。生成的幻灯片支持在线编辑和 PPTX 导出，搭配 Kimi K2 的智能搜索才能自动补充内容。感恩节时期提供 48 小时收费有限运用。

(, 下载次数: 0)

早期测试显示，Nano Banana Pro 生成的信息图可一键转为可编辑文本，但部分页面转换不残缺，且暂不支持企业品牌模板定制。对于需求疾速出稿的场景是个适用工具，但专业设计场景仍需人工调整。

04｜豆包语音晋级：能说 4 种方言，能听懂 18 种

11 月 28 日，豆包 App 更新语音对话功能，现支持用粤语、东北话、陕西话、四川话停止对话。技术上采用方言迁移方案，单个音色即可切换多种方言，呼应延迟控制在 0.3 秒内；辨认端更强，能听懂上海话、南京话、天津话等 18 种方言输入，ASR 准确率达 92%，比传统方案效率提升 40%。

(, 下载次数: 0)

用户更新至最新版后，发送“用粤语和我聊天”即可切换。系统会根据对话意图自动辨认并灵敏切换方言，同时保持默许音色的自然度。对不习气普通话的老年群体来说是个适用更新，也让语音助手在方言地区的车载、智能家居场景更接地气。

05｜ChatGPT 语音形式并入主界面，边说边看成为默许体验

11 月 25 日，OpenAI 将 ChatGPT 的语音形式整合进主聊天界面，结束了此前需求切换到独立全屏的交互方式。更新后，用户点击波形图标即可在聊天窗口内开启语音对话，AI 的回答会实时显示为文字，图片、地图等视觉内容也会同步呈现，比如问附近的面包店，ChatGPT 会一边语音回答一边展现地图和店铺照片。

(, 下载次数: 0)

这一改动让语音和文字可以在同一对话中自在切换，对需求边听边看的场景（查道路、审代码、分析图片）愈加适用。习气旧界面的用户可在设置中开启“Separate mode”恢复全屏语音形式。更新已向全平台用户推送，需手动更新 App。

06｜ChatGPT 上线购物研讨功能，假期时期收费用户几乎有限运用

11 月 25 日，OpenAI 推出 ChatGPT “购物研讨”功能，专为假日季的深度购物决策设计。与普通搜索不同，该功能会先经过问答了解用户预算、偏好和运用场景，再从全网抓取价格、库存、评测、规格等信息，几分钟后生成一份个性化购物指南。用户可在过程中标记“更多相似”或“不感兴味”来实时调整引荐方向。外部测试显示，在多约束条件查询中产品准确率达 52%，比 ChatGPT Search 的 37% 高出 15 个百分点。

(, 下载次数: 0)

功能由 GPT-5 mini 的购物公用版本驱动，经过强化学习训练以辨认可信来源，OpenAI 表示 Reddit 等真适用户评价比产品页的付费评论更受信任。目前支持 Free、Go、Plus、Pro 全部套餐，黑五时期几乎有限量运用。合适电子产品、美妆、家居、厨电、户外装备等规格复杂的品类，简单的价格查询用普通搜索即可。将来将支持经过 Instant Checkout 直接在 ChatGPT 内完成购买。

07｜算力告急：Sora 和 Nano Banana Pro 同时收紧收费额度

OpenAI 和谷歌在感恩节周末同时下调了收费用户的生成额度。Sora 担任人 Bill Peebles 在 X 上直言“我们的 GPU 快烧了”，宣布收费用户每天只能生成 6 条视频；谷歌则将 Nano Banana Pro 的收费图像生成从每天 3 张砍到 2 张，Gemini 3 Pro 也从固定 5 次改为“基础访问，限制能够频繁变化”。付费用户暂不受影响，Google AI Pro 仍为每天 100 次，Ultra 500 次。

(, 下载次数: 0)

两家巨头同步限流并非巧合。此前 NotebookLM 已因用户用 Nano Banana Pro 生成 PPT 信息图的需求暴涨，不得不暂停收费访问。Peebles 这次没说限制是暂时的，而是提示用户“可按需购买额外次数”，收费 AI 的黄金时代能够正在收尾。

08｜Claude Opus 4.5 发布：SWE bench 首破 80%，价格降 66%

11 月 25 日，Anthropic 发布旗舰模型 Claude Opus 4.5，在 SWE bench Verified 编程基准测试中拿下 80.9%，成为首个打破 80% 的 AI 模型，抢先 GPT-5.1 Codex Max（77.9%）和 Gemini 3 Pro（76.2%）约 3-4 个百分点。更值得一提的是，该模型在 Anthropic 外部 2 小时限时工程考试中得分超过了公司历史上一切人类候选人。

(, 下载次数: 0)

Claude Opus 4.5 的定价大幅下调：输入 5 美元每百万 tokens，输入 25 美元每百万 tokens，较上代（15、75 美元）降价 66%。同步推出的“工具搜索”功能可按需加载工具定义，将上下文开支增添 85%。此外，Claude for Chrome 向 Max 用户开放，Claude for Excel 扩展至 Team 和 Enterprise 用户。发布工夫距 Gemini 3 Pro 仅一周、距 GPT-5.1 仅 12 天，三巨头 11 月扎堆发布旗舰模型。

09｜Black Forest Labs 发布 FLUX.2：32B 参数，最高 4MP 输入

11 月 25 日，德国 AI 实验室 Black Forest Labs 发布第二代图像生成模型 FLUX.2，参数量 32B，架构上将 Mistral 3 24B 视觉言语模型与 Rectified Flow Transformer 结合，让生成图像具有更真实的光影、透视和物理逻辑。核心晋级包括：最高支持 4MP（约 2048×2048）分辨率输入、可同时输入 10 张参考图保持角色产品风格分歧性、文字排版才能大幅加强。在开放权重模型对比中，FLUX.2 dev 文生图胜率 66.6%，多参考编辑胜率 63.6%，抢先同类。

模型分四个版本：pro 为托管 API，flex 可调理步数平衡速度与质量，dev 开放权重供本地部署，klein 即将以 Apache 2.0 开源。NVIDIA 结合优化了 FP8 量化版本，VRAM 占用和功能均改善 40%，已可在 ComfyUI 中直接运转。商用需向官方央求授权。发布工夫恰在 Nano Banana Pro 上线一周后，开源阵营与闭源巨头的图像生成之战正式开打。

我是木易，一个专注 AI 范畴的技术产品经理，国内 Top2 本科 + 美国 Top10 CS 硕士。

置信 AI 是普通人的“外挂”，努力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用 AI 为你的将来加速。

精选引荐

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)