职贝云数AI新零售门户

标题: Manus片面开放注册,OpenAI发布Codex,ChatGPT上线GPT-4.1!| AI Weekly 5.12-18 [打印本页]

作者: Y1Ob6L 时间: 昨天 15:27
标题: Manus片面开放注册,OpenAI发布Codex,ChatGPT上线GPT-4.1!| AI Weekly 5.12-18
📢本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 📝 Manus 片面开放注册：无需约请码即可注册，新用户收费获得 1000 积分，每日 300 积分收费义务。

2️⃣ 🔍 阿里 Qwen 推出「深化研讨」：QwenChat 收费开放深度研讨助理，仅需数分钟完成复杂研讨义务。

3️⃣ 🔧 阿里通义实验室开源 ZeroSearch ：强化学习框架让大模型无需依赖真实搜索引擎，自主学习搜索与推理。

4️⃣ 📸 腾讯发布混元图像 2.0 ：毫秒级实时生图，超写实画质，避免 AI 味，细节更丰富。

5️⃣ 🧑‍💻 OpenAI 发布 Codex 软件工程智能体：支持自动化编程义务，覆盖代码编写、错误修复、测试运转等。

6️⃣ 💡 OpenAI 上线 GPT-4.1 模型：编程专家版上线 ChatGPT，GPT-4.1 mini 替代 GPT-4o mini，一切用户可运用。

7️⃣ 🔗 OpenAI 测试 MCP 协议：ChatGPT 即将支持 Model Context Protocol，可衔接第三方服务。

8️⃣ 🎤 OpenAI 计划推出 ChatGPT Record 功能：实理想时会议录音、转录和自动总结。

9️⃣ ⚡ Windsurf 发布 SWE-1 系列：专为软件工程设计，SWE-1、SWE-1-lite、SWE-1-mini 片面上线。

🔟 🌐 Anthropic 即将发布 Claude Neptune ：安全测试收官，应战 OpenAI 和谷歌 Gemini，估计 5 月底或 6 月初发布。

1️⃣1️⃣ 🚀 马斯克称 Grok 3.5 仍需打磨：还有点太粗糙，估计还需一周推出。

1️⃣2️⃣ ⏳ Meta 推延发布 Behemoth 模型：因技术瓶颈，发布工夫推至春季，引发投资者担忧。

1. Manus 官宣片面开放注册

5 月 12 日，曾因约请码炒至数万元而备受关注的 AI 智能体平台 Manus 宣布片面开放注册，一切用户无需约请码即可收费体验。注册用户将一次性获得 1000 积分奖励，并可每日收费获得 300 积分，用于执行一项义务，积分当日有效，不可结转。

Manus 由中国初创团队 Monica 开发，定位为通用型 AI 智能体，可以自主完成复杂义务，如撰写报告、制造表格等。此前，Manus 采用约请制，约请码在二手平台一度被炒至近 10 万元人民币，引发广泛关注。

据报道，Manus 最近完成了由美国风险投资公司 Benchmark Capital 领投的 7500 万美元融资，估值达 5 亿美元。此次融资将用于加速产品开发和市场拓展，应对来自 OpenAI、Google 等科技巨头的竞争。
2. 阿里通义千问上线「深化研讨」功能

5 月 13 日，阿里巴巴旗下的通义千问（Qwen）正式推出全新智能助理系统「深化研讨」（Deep Research），并在 QwenChat 平台收费向一切用户开放体验。

(, 下载次数: 0)

「深化研讨」可以根据用户提供的提示词（prompt），自动规划多步骤的研讨流程。系统首先分析用户需求，提出反问以确认义务细节，随后制定研讨计划，自动查找、分析并整合来自网络的相关信息，最终生成结构明晰、数据可信的研讨报告。这一过程大幅延长了研讨工夫，本来需求数小时的义务如今仅需十几分钟即可完成。

该功能深度交融了 Qwen 的模型推理才能、Agent 才能及长上下文窗口技术，并经过强化学习优化功能，完成了从需求了解到成果交付的闭环。用户只需在 QwenChat 对话框中点击“深化研讨”按钮，即可立刻体验这一智能助理。
3. 阿里通义实验室开源搜索框架 ZeroSearch

阿里通义实验室近日正式开源了 ZeroSearch，这是一个创新性的强化学习框架，旨在让大型言语模型（LLM）在无需依赖真实搜索引擎的状况下，学习搜索与推理才能。该方法经过模拟搜索环境，分明降低了训练成本，同时在多个评测中展现出超越传统搜索引擎的功能。

ZeroSearch 的核心在于运用预训练的 LLM（如 Qwen2.5 系列）模拟搜索引擎的行为。实验结果显示，运用 3B 参数的模拟模型即可有效训练 LLM 的搜索才能；7B 模型的功能已与谷歌搜索相当；而 14B 模型则在多个基准测试中超越了谷歌搜索。

(, 下载次数: 0)

传统的搜索加强训练方法依赖于真实搜索引擎，导致高昂的 API 成本和不可控的文档质量。ZeroSearch 经过模拟搜索过程，成功将训练成本降低了近 88%。例如，运用谷歌搜索 API 训练 64,000 个查询的成本约为 586.70 美元，而运用 14B 参数的模拟模型在四个 A100 GPU 上训练的成本仅为 70.80 美元。

目前，ZeroSearch 已在 GitHub 和 Hugging Face 上开源，提供残缺的代码、数据集和预训练模型，支持全球开发者在本地环境中停止训练和部署。这一创新性的框架为中小型企业和研讨机构提供了低成本、高效能的处理方案，有望推进 AI 搜索技术的普及与发展。
4. 腾讯发布生图模型：混元图像 2.0

5 月 16 日，腾讯正式发布了混元图像 2.0 模型（Hunyuan Image2.0），在腾讯混元官方网站上线，并对外开放注册体验。该模型的核心特点为“实时生图”和“超写实画质”。

(, 下载次数: 0)

混元图像 2.0 相较前代模型，参数量提升了一个数量级，得益于超高紧缩倍率的图像编解码器以及全新分散架构，其图像生成速度分明快于行业抢先模型。在同类商业产品每张图推理速度需求 5 到 10 秒的状况下，腾讯混元号称可完成毫秒级呼应，支持用户可以边打字或者边说话边出图，改变了传统“抽卡 — 等待 — 抽卡”的方式，带来交互体验革新。

除了速度快以外，腾讯混元图像 2.0 模型图像生成质量提升分明，经过强化学习等算法以及引入大量人类美学知识对齐，生成的图像可有效避免 AIGC 图像中的“AI 味”，真实感强、细节丰富、可用性高。
5. OpenAI 推出 Codex 软件工程智能体

5 月 16 日，OpenAI 正式发布了 Codex 智能体，这是一个基于云端的 AI 软件工程助手，经过自动化编程义务，如代码编写、错误修复和测试运转，提升开发者的工作效率。

(, 下载次数: 0)

Codex 由 OpenAI 的 codex-1 模型驱动，这是在 o3 推理模型基础上，专为软件开发义务优化的版本。该智能体可以并行处理多个开发义务，包括完成新功能、修复代码错误、回答代码库相关成绩，并提出代码审查央求。每项义务都在独立的云端沙盒环境中运转，预加载用户的代码库，确保操作的安全性和隔离性。

与传统的代码自动补全工具不同，Codex 不只能生成代码，还能在虚拟环境中执行命令、运转测试，并根据测试结果停止迭代优化。此外，Codex 具有解释其操作的才能，协助开发者了解其生成的代码和修正建议，从而提高协作效率。

Codex 目前已集成至 ChatGPT，面向 ChatGPT Pro、Team 和 Enterprise 用户开放运用。将来，OpenAI 计划将 Codex 的访问权限扩展至 Plus 和 Edu 用户，并持续优化其功能。
6. OpenAI 为 ChatGPT 推出 GPT-4.1 模型

5 月 14 日，OpenAI 正式在 ChatGPT 中上线了全新一代多模态模型 GPT-4.1，并同步推出轻量版 GPT-4.1 mini。

(, 下载次数: 0)

GPT-4.1 被定位为“编程专家模型”，在代码生成、调试、测试和文档撰写等义务中表现出色。相比前代 GPT-4o，新模型在 SWE-bench 编程基准测试中的得分提升了 21%，并支持高达 100 万个 token 的上下文窗口，约为 GPT-4o 的 8 倍，分明加强了处理大型项目和复杂指令的才能。

目前，GPT-4.1 已向 ChatGPT 的 Plus、Pro 和 Team 用户开放，Enterprise 和 Edu 用户将在将来几周内获得访问权限。

同步推出的 GPT-4.1 mini 替代了原有的 GPT-4o mini，成为一切 ChatGPT 用户（包括收费用户）的默许模型。
7. 爆料：ChatGPT 即将支持 MCP 协议

5 月 16 日，科技媒体 bleepingcomputer 发布爆料称，OpenAI 正在测试将 Model Context Protocol（模型上下文协议，简称 MCP）集成至 ChatGPT 的功能，允许用户将第三方服务作为上下文接入 AI 对话流程。这一新功能经过新增的“Connectors”设置，用户可自定义添加工具，输入称号、URL 和描画，使 ChatGPT 可以访问外部运用或 API 的信息。例如，用户可衔接 Gmail、日历、数据库等服务，完成更丰富的交互体验。

(, 下载次数: 0)

MCP 是由 Anthropic 于 2024 年推出的开源标准，旨在简化 AI 模型与外部工具、数据源的集成流程。经过 MCP，开发者无需为每个数据源编写专属代码，只需一次集成，即可让 AI 系统与多种服务无缝衔接。目前，包括 Replit、Codeium 和 Sourcegraph 在内的多家企业已在其 AI 工具中采用 MCP，提升了 AI 系统互操作性。

ChatGPT 对 MCP 的支持功能目前仍处于外部测试阶段，估计 OpenAI 将在将来几天或几周内正式公布。
8. 爆料：OpenAI 计划推出 ChatGPT “Record” 功能

5 月 14 日，X 用户 @M1Astra 发现，OpenAI 正在为 ChatGPT 开发一项名为 “Record” 的新功能，旨在实理想时会议录音、转录和总结。该功能能够会作为 ChatGPT 移动运用中的一项内置工具，允许用户在会议、头脑风暴或想法记录过程中，直接经过运用停止录音，并自动生成文字记录和摘要。

(, 下载次数: 0)

根据泄露的信息，“Record” 功能将包括以下次要特性：

目前，微软 Teams 的 Copilot 曾经提供了相似的会议记录和总结功能，但次要面向 Microsoft 365 订阅用户。OpenAI 的“Record”功能假如成功推出，能够会为更广泛的用户群体提供相似的服务，降低运用门槛，尤其对中小企业和个人用户具有吸引力。

目前，OpenAI 尚未正式宣布 “Record” 功能的发布工夫和详细细节。
9. Windsurf 发布 SWE-1 系列软件工程模型

5 月 15 日，AI 初创公司 Windsurf（前身为 Codeium）正式发布其首个自研 AI 模型系列 SWE-1，该系列专为软件工程全流程设计，涵盖代码生成、调试、测试、文档生成等多个环节，旨在将开发效率提升至 99%。

(, 下载次数: 0)

SWE-1 系列包括三款模型，分别针对不同的开发场景和用户需求：

根据外部评测，SWE-1 在编程义务中的表现与 GPT-4.1 和 Gemini 2.5 Pro 相当，尤其在复杂的多轮义务和工具调用方面表现突出。

目前，开发者可经过 Windsurf Editor 体验 SWE-1 系列模型。

值得一提的是，此前 OpenAI 已与 Windsurf 达成协议，将以约 30 亿美元收买 Windsurf。
10. 爆料：Anthropic 新模型 Claude Neptune 即将发布

5 月 14 日，科技媒体 TestingCatalog News 爆料：Anthropic 正在为其下一代大型言语模型 Claude Neptune 停止最后的外部安全测试，估计将于 5 月 18 日完成红队演练，随后能够在 5 月底或 6 月初正式发布。

(, 下载次数: 0)

Claude Neptune 的红队测试重点在于评价其对越狱攻击的抵抗才能，特别是对 Anthropic 独有的宪法式 AI 安全框架的稳健性停止验证。初步测试结果显示，该模型在处理潜在有害央求时表现出更高的敏感度和防御才能。

在架构方面，Claude Neptune 估计将引入以下关键晋级：

11. 马斯克：Grok 3.5 仍太粗糙，估计一周内发布

5 月 12 日，埃隆・马斯克在 X 平台上回应网友关于 Grok 3.5、o3 pro 和 GTA 6 哪个将最先发布的发问时表示：“3.5 还是有点太粗糙了。还需求一周左右的工夫。

(, 下载次数: 0)

Grok 3.5 是马斯克旗下 xAI 公司开发的下一代大型言语模型，旨在提升 AI 的推理才能和技术成绩解答才能。据马斯克引见，该模型可以准确回答关于火箭发动机和电化学等复杂技术成绩，采用“第一性原理”停止推理，提供不依赖互联网现有内容的原创答案。

Grok 3.5 的测试版估计将在将来一周外向 SuperGrok 订阅用户开放。此前，Grok 3 于 2025 年 2 月发布，采用了 xAI 的 Colossus 超级计算平台停止训练，具有图像编辑、语音形式和高级推理等功能。
12. Meta 推延发布 Behemoth 模型

据《华尔街日报》5 月 15 日报道，Meta 公司已将其旗舰 AI 模型 Behemoth 的发布计划推延至往年春季或更晚，缘由是外部对模型功能的担忧。该模型原定于 4 月在 Meta 首届 AI 开发者大会上亮相，后延期至 6 月，但目前尚未确定详细发布日期。

Behemoth 是 Llama 4 系列中的核心模型，采用混合专家（MoE）架构，拥有约两万亿参数，旨在处理多模态输入。但是，外部工程师在训练过程中遇到技术瓶颈，模型在波动性和输入分歧性方面未达预期，引发了对其发布机遇和竞争力的质疑。

此次延期也反映出大型科技公司在 AI 模型开发中面临的共同应战。例如，OpenAI 的 GPT-5 和 Anthropic 的 Claude 3.5 Opus 也因技术限制而推延发布。此外，Meta 在 2025 年第一季度的资本支出已达 140 亿美元，全年估计将投入 500 至 580 亿美元用于 AI 基础设备建设，但目前尚未明白 AI 投资的商业化途径，这引发了投资者对其报答的担忧。

我是木易，一个专注AI范畴的技术产品经理，国内Top2本科+美国Top10 CS硕士。

置信AI是普通人的“外挂”，努力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的将来加速。

精选引荐

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)