职贝云数AI新零售门户

标题: DeepSeek强势回归,Claude新模型编程登顶,OpenAI和谷歌同时限流!| AI Weekly 11.24-30 [打印本页]

作者: ZqUIC    时间: 5 小时前
标题: DeepSeek强势回归,Claude新模型编程登顶,OpenAI和谷歌同时限流!| AI Weekly 11.24-30
📢 本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 🧮 DeepSeek 发布 DeepSeekMath-V2 :685B 参数数学推理模型,Putnam 2024 拿下 118/120 分超越人类最高分,IMO 2025 达金牌程度,首个开源的顶级数学模型。

2️⃣ 🎨 阿里开源 Z-Image :6B 参数打出 20B 效果,16GB 显存可跑,8 步采样亚秒级出图,中文海报渲染是一大亮点,发布首日下载超 50 万。

3️⃣ 📊 Kimi 上线 Agentic Slides :一键将 PDF/图片/文档转为演示文稿,集成谷歌 Nano Banana Pro 生成设计师级信息图,支持 PPTX 导出。

4️⃣ 🗣️ 豆包语音大晋级 :支持粤语、东北话、四川话、陕西话 4 种方言输入,能听懂上海话、天津话等 18 种方言输入,ASR 准确率达 92%。

5️⃣ 🎙️ ChatGPT 语音形式并入主界面 :语音和文字可在同一对话中自在切换,AI 回答实时显示文字,图片/地图同步呈现,边说边看成为默许体验。

6️⃣ 🛒 ChatGPT 上线购物研讨功能 :由 GPT-5 mini 购物公用版驱动,经过问答了解需求后生成个性化购物指南,黑五时期收费用户几乎有限运用。

7️⃣ ⚠️ Sora 和 Nano Banana Pro 同时限流 :OpenAI 收费用户每天仅能生成 6 条视频,谷歌收费图像生成从 3 张砍到 2 张,算力告急,收费 AI 黄金时代或将收尾。

8️⃣ 🏆 Claude Opus 4.5 发布 :SWE bench 首破 80%(80.9%),外部工程考试得分超过一切人类候选人,定价较上代降价 66%,同步推出 Chrome 和 Excel 扩展。

9️⃣ 🖼️ Black Forest Labs 发布 FLUX.2 :32B 参数,最高支持 4MP 输入,可同时输入 10 张参考图保持分歧性,开放权重版本已可在 ComfyUI 运转。


01|DeepSeek 发布 DeepSeekMath-V2:Putnam 118 120 超人类最高分

11 月 27 日,DeepSeek 开源数学推理模型 DeepSeekMath-V2,主打“自我验证”才能,不只追求答案正确,更要求推理过程严谨可查。模型基于 DeepSeek-V3.2 Exp Base 构建,参数量 685B,在顶级数学竞赛中表现惊人:IMO 2025 解出 6 题中的 5 题达金牌程度,Putnam 2024 拿下 118 120 分,超过当年人类最高分 90 分。在 Google DeepMind 开发的 IMO ProofBench 基准测试中,基础测试超越了同为金牌级别的 DeepThink 模型。

技术核心是“验证器-生成器”双模型架构:先训练一个严厉的证明验证器,再让生成器学会产出能经过验证的证明。当生成器变强后,系统会自动扩展验证算力来标注更难的证明,构成持续退化的闭环。模型权重已在 HuggingFace 开放下载,遵照 Apache 2.0 协议。这是继 OpenAI 和 Google 之后,第三个达到 IMO 金牌程度的数学模型,也是首个开源的同级别选手。


02|阿里开源 Z-Image:6B 参数打出 20B 效果,16G 显存可跑

11 月 27 日,阿里通义实验室开源图像生成模型 Z-Image,参数量仅 6B,但官方称视觉质量接近 20B 级别的闭源模型。核心是单流 DiT 架构,把文本和图像 token 塞进同一个 Transformer 处理,省掉了双流模型的反复参数开支。蒸馏版 Z-Image Turbo 只需 8 步采样即可出图,H800 上完成亚秒级生成,16GB 显存的 RTX 30 系列也能流利运转。发布首日下载量超 50 万。

(, 下载次数: 0)

模型分三个版本:Turbo 主打疾速生成和中英双语文字渲染,Base 供社区微调,Edit 专攻自然言语指令编辑。中文海报渲染是一大卖点,这块不断是海外开源模型的软肋。采用 Apache 2.0 协议开源,发布工夫恰在 32B 参数的 FLUX.2 之后,走了一条小参数高效率的差异化道路。


03|Kimi 上线 Agentic Slides,集成 Nano Banana Pro 生成信息图

11 月 28 日,月之暗面旗下 Kimi 推出“Agentic Slides”功能,可将 PDF、图片、文档一键转为演示文稿,并集成谷歌 Nano Banana Pro 生成设计师级别的信息图和插画。生成的幻灯片支持在线编辑和 PPTX 导出,搭配 Kimi K2 的智能搜索才能自动补充内容。感恩节时期提供 48 小时收费有限运用。

(, 下载次数: 0)

早期测试显示,Nano Banana Pro 生成的信息图可一键转为可编辑文本,但部分页面转换不残缺,且暂不支持企业品牌模板定制。对于需求疾速出稿的场景是个适用工具,但专业设计场景仍需人工调整。


04|豆包语音晋级:能说 4 种方言,能听懂 18 种

11 月 28 日,豆包 App 更新语音对话功能,现支持用粤语、东北话、陕西话、四川话停止对话。技术上采用方言迁移方案,单个音色即可切换多种方言,呼应延迟控制在 0.3 秒内;辨认端更强,能听懂上海话、南京话、天津话等 18 种方言输入,ASR 准确率达 92%,比传统方案效率提升 40%。

(, 下载次数: 0)

用户更新至最新版后,发送“用粤语和我聊天”即可切换。系统会根据对话意图自动辨认并灵敏切换方言,同时保持默许音色的自然度。对不习气普通话的老年群体来说是个适用更新,也让语音助手在方言地区的车载、智能家居场景更接地气。


05|ChatGPT 语音形式并入主界面,边说边看成为默许体验

11 月 25 日,OpenAI 将 ChatGPT 的语音形式整合进主聊天界面,结束了此前需求切换到独立全屏的交互方式。更新后,用户点击波形图标即可在聊天窗口内开启语音对话,AI 的回答会实时显示为文字,图片、地图等视觉内容也会同步呈现,比如问附近的面包店,ChatGPT 会一边语音回答一边展现地图和店铺照片。

(, 下载次数: 0)

这一改动让语音和文字可以在同一对话中自在切换,对需求边听边看的场景(查道路、审代码、分析图片)愈加适用。习气旧界面的用户可在设置中开启“Separate mode”恢复全屏语音形式。更新已向全平台用户推送,需手动更新 App。


06|ChatGPT 上线购物研讨功能,假期时期收费用户几乎有限运用

11 月 25 日,OpenAI 推出 ChatGPT “购物研讨”功能,专为假日季的深度购物决策设计。与普通搜索不同,该功能会先经过问答了解用户预算、偏好和运用场景,再从全网抓取价格、库存、评测、规格等信息,几分钟后生成一份个性化购物指南。用户可在过程中标记“更多相似”或“不感兴味”来实时调整引荐方向。外部测试显示,在多约束条件查询中产品准确率达 52%,比 ChatGPT Search 的 37% 高出 15 个百分点。

(, 下载次数: 0)

功能由 GPT-5 mini 的购物公用版本驱动,经过强化学习训练以辨认可信来源,OpenAI 表示 Reddit 等真适用户评价比产品页的付费评论更受信任。目前支持 Free、Go、Plus、Pro 全部套餐,黑五时期几乎有限量运用。合适电子产品、美妆、家居、厨电、户外装备等规格复杂的品类,简单的价格查询用普通搜索即可。将来将支持经过 Instant Checkout 直接在 ChatGPT 内完成购买。


07|算力告急:Sora 和 Nano Banana Pro 同时收紧收费额度

OpenAI 和谷歌在感恩节周末同时下调了收费用户的生成额度。Sora 担任人 Bill Peebles 在 X 上直言“我们的 GPU 快烧了”,宣布收费用户每天只能生成 6 条视频;谷歌则将 Nano Banana Pro 的收费图像生成从每天 3 张砍到 2 张,Gemini 3 Pro 也从固定 5 次改为“基础访问,限制能够频繁变化”。付费用户暂不受影响,Google AI Pro 仍为每天 100 次,Ultra 500 次。

(, 下载次数: 0)

两家巨头同步限流并非巧合。此前 NotebookLM 已因用户用 Nano Banana Pro 生成 PPT 信息图的需求暴涨,不得不暂停收费访问。Peebles 这次没说限制是暂时的,而是提示用户“可按需购买额外次数”,收费 AI 的黄金时代能够正在收尾。


08|Claude Opus 4.5 发布:SWE bench 首破 80%,价格降 66%

11 月 25 日,Anthropic 发布旗舰模型 Claude Opus 4.5,在 SWE bench Verified 编程基准测试中拿下 80.9%,成为首个打破 80% 的 AI 模型,抢先 GPT-5.1 Codex Max(77.9%)和 Gemini 3 Pro(76.2%)约 3-4 个百分点。更值得一提的是,该模型在 Anthropic 外部 2 小时限时工程考试中得分超过了公司历史上一切人类候选人。

(, 下载次数: 0)

Claude Opus 4.5 的定价大幅下调:输入 5 美元 每百万 tokens,输入 25 美元 每百万 tokens,较上代(15、75 美元)降价 66%。同步推出的“工具搜索”功能可按需加载工具定义,将上下文开支增添 85%。此外,Claude for Chrome 向 Max 用户开放,Claude for Excel 扩展至 Team 和 Enterprise 用户。发布工夫距 Gemini 3 Pro 仅一周、距 GPT-5.1 仅 12 天,三巨头 11 月扎堆发布旗舰模型。


09|Black Forest Labs 发布 FLUX.2:32B 参数,最高 4MP 输入

11 月 25 日,德国 AI 实验室 Black Forest Labs 发布第二代图像生成模型 FLUX.2,参数量 32B,架构上将 Mistral 3 24B 视觉言语模型与 Rectified Flow Transformer 结合,让生成图像具有更真实的光影、透视和物理逻辑。核心晋级包括:最高支持 4MP(约 2048×2048)分辨率输入、可同时输入 10 张参考图保持角色 产品 风格分歧性、文字排版才能大幅加强。在开放权重模型对比中,FLUX.2 dev 文生图胜率 66.6%,多参考编辑胜率 63.6%,抢先同类。

模型分四个版本:pro 为托管 API,flex 可调理步数平衡速度与质量,dev 开放权重供本地部署,klein 即将以 Apache 2.0 开源。NVIDIA 结合优化了 FP8 量化版本,VRAM 占用和功能均改善 40%,已可在 ComfyUI 中直接运转。商用需向官方央求授权。发布工夫恰在 Nano Banana Pro 上线一周后,开源阵营与闭源巨头的图像生成之战正式开打。




我是木易,一个专注 AI 范畴的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

置信 AI 是普通人的“外挂”,努力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的将来加速。


精选引荐






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5