职贝云数AI新零售门户

标题: Manus片面开放注册,OpenAI发布Codex,ChatGPT上线GPT-4.1!| AI Weekly 5.12-18 [打印本页]

作者: Y1Ob6L    时间: 昨天 15:27
标题: Manus片面开放注册,OpenAI发布Codex,ChatGPT上线GPT-4.1!| AI Weekly 5.12-18
📢本周 AI 快讯 | 1 分钟速览🚀

1️⃣ 📝 Manus 片面开放注册 :无需约请码即可注册,新用户收费获得 1000 积分,每日 300 积分收费义务。

2️⃣ 🔍 阿里 Qwen 推出「深化研讨」 :QwenChat 收费开放深度研讨助理,仅需数分钟完成复杂研讨义务。

3️⃣ 🔧 阿里通义实验室开源 ZeroSearch :强化学习框架让大模型无需依赖真实搜索引擎,自主学习搜索与推理。

4️⃣ 📸 腾讯发布混元图像 2.0 :毫秒级实时生图,超写实画质,避免 AI 味,细节更丰富。

5️⃣ 🧑‍💻 OpenAI 发布 Codex 软件工程智能体 :支持自动化编程义务,覆盖代码编写、错误修复、测试运转等。

6️⃣ 💡 OpenAI 上线 GPT-4.1 模型 :编程专家版上线 ChatGPT,GPT-4.1 mini 替代 GPT-4o mini,一切用户可运用。

7️⃣ 🔗 OpenAI 测试 MCP 协议 :ChatGPT 即将支持 Model Context Protocol,可衔接第三方服务。

8️⃣ 🎤 OpenAI 计划推出 ChatGPT Record 功能 :实理想时会议录音、转录和自动总结。

9️⃣ ⚡ Windsurf 发布 SWE-1 系列 :专为软件工程设计,SWE-1、SWE-1-lite、SWE-1-mini 片面上线。

🔟 🌐 Anthropic 即将发布 Claude Neptune :安全测试收官,应战  OpenAI 和 谷歌 Gemini,估计 5 月底或 6 月初发布。

1️⃣1️⃣ 🚀 马斯克称 Grok 3.5 仍需打磨 :还有点太粗糙,估计还需一周推出。

1️⃣2️⃣ ⏳ Meta 推延发布 Behemoth 模型 :因技术瓶颈,发布工夫推至春季,引发投资者担忧。


1. Manus 官宣片面开放注册

5 月 12 日,曾因约请码炒至数万元而备受关注的 AI 智能体平台 Manus 宣布片面开放注册,一切用户无需约请码即可收费体验。注册用户将一次性获得 1000 积分奖励,并可每日收费获得 300 积分,用于执行一项义务,积分当日有效,不可结转。

Manus 由中国初创团队 Monica 开发,定位为通用型 AI 智能体,可以自主完成复杂义务,如撰写报告、制造表格等。此前,Manus 采用约请制,约请码在二手平台一度被炒至近 10 万元人民币,引发广泛关注。

据报道,Manus 最近完成了由美国风险投资公司 Benchmark Capital 领投的 7500 万美元融资,估值达 5 亿美元。此次融资将用于加速产品开发和市场拓展,应对来自 OpenAI、Google 等科技巨头的竞争。
2. 阿里通义千问上线「深化研讨」功能

5 月 13 日,阿里巴巴旗下的通义千问(Qwen)正式推出全新智能助理系统「深化研讨」(Deep Research),并在 QwenChat 平台收费向一切用户开放体验。

(, 下载次数: 0)

「深化研讨」可以根据用户提供的提示词(prompt),自动规划多步骤的研讨流程。系统首先分析用户需求,提出反问以确认义务细节,随后制定研讨计划,自动查找、分析并整合来自网络的相关信息,最终生成结构明晰、数据可信的研讨报告。这一过程大幅延长了研讨工夫,本来需求数小时的义务如今仅需十几分钟即可完成。

该功能深度交融了 Qwen 的模型推理才能、Agent 才能及长上下文窗口技术,并经过强化学习优化功能,完成了从需求了解到成果交付的闭环。用户只需在 QwenChat 对话框中点击“深化研讨”按钮,即可立刻体验这一智能助理。
3. 阿里通义实验室开源搜索框架 ZeroSearch

阿里通义实验室近日正式开源了 ZeroSearch,这是一个创新性的强化学习框架,旨在让大型言语模型(LLM)在无需依赖真实搜索引擎的状况下,学习搜索与推理才能。该方法经过模拟搜索环境,分明降低了训练成本,同时在多个评测中展现出超越传统搜索引擎的功能。

ZeroSearch 的核心在于运用预训练的 LLM(如 Qwen2.5 系列)模拟搜索引擎的行为。实验结果显示,运用 3B 参数的模拟模型即可有效训练 LLM 的搜索才能;7B 模型的功能已与谷歌搜索相当;而 14B 模型则在多个基准测试中超越了谷歌搜索。

(, 下载次数: 0)

传统的搜索加强训练方法依赖于真实搜索引擎,导致高昂的 API 成本和不可控的文档质量。ZeroSearch 经过模拟搜索过程,成功将训练成本降低了近 88%。例如,运用谷歌搜索 API 训练 64,000 个查询的成本约为 586.70 美元,而运用 14B 参数的模拟模型在四个 A100 GPU 上训练的成本仅为 70.80 美元。

目前,ZeroSearch 已在 GitHub 和 Hugging Face 上开源,提供残缺的代码、数据集和预训练模型,支持全球开发者在本地环境中停止训练和部署。这一创新性的框架为中小型企业和研讨机构提供了低成本、高效能的处理方案,有望推进 AI 搜索技术的普及与发展。
4. 腾讯发布生图模型:混元图像 2.0

5 月 16 日,腾讯正式发布了 混元图像 2.0 模型(Hunyuan Image2.0),在腾讯混元官方网站上线,并对外开放注册体验。该模型的核心特点为“实时生图”和“超写实画质”。

(, 下载次数: 0)

混元图像 2.0 相较前代模型,参数量提升了一个数量级,得益于超高紧缩倍率的图像编解码器以及全新分散架构,其图像生成速度分明快于行业抢先模型。在同类商业产品每张图推理速度需求 5 到 10 秒的状况下,腾讯混元号称可完成毫秒级呼应,支持用户可以边打字或者边说话边出图,改变了传统“抽卡 — 等待 — 抽卡”的方式,带来交互体验革新。

除了速度快以外,腾讯混元图像 2.0 模型图像生成质量提升分明,经过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免 AIGC 图像中的“AI 味”,真实感强、细节丰富、可用性高。
5. OpenAI 推出 Codex 软件工程智能体

5 月 16 日,OpenAI 正式发布了 Codex 智能体,这是一个基于云端的 AI 软件工程助手,经过自动化编程义务,如代码编写、错误修复和测试运转,提升开发者的工作效率。

(, 下载次数: 0)

Codex 由 OpenAI 的 codex-1 模型驱动,这是在 o3 推理模型基础上,专为软件开发义务优化的版本。该智能体可以并行处理多个开发义务,包括完成新功能、修复代码错误、回答代码库相关成绩,并提出代码审查央求。每项义务都在独立的云端沙盒环境中运转,预加载用户的代码库,确保操作的安全性和隔离性。

与传统的代码自动补全工具不同,Codex 不只能生成代码,还能在虚拟环境中执行命令、运转测试,并根据测试结果停止迭代优化。此外,Codex 具有解释其操作的才能,协助开发者了解其生成的代码和修正建议,从而提高协作效率。

Codex 目前已集成至 ChatGPT,面向 ChatGPT Pro、Team 和 Enterprise 用户开放运用。将来,OpenAI 计划将 Codex 的访问权限扩展至 Plus 和 Edu 用户,并持续优化其功能。
6. OpenAI 为 ChatGPT 推出 GPT-4.1 模型

5 月 14 日,OpenAI 正式在 ChatGPT 中上线了全新一代多模态模型 GPT-4.1,并同步推出轻量版 GPT-4.1 mini。

(, 下载次数: 0)

GPT-4.1 被定位为“编程专家模型”,在代码生成、调试、测试和文档撰写等义务中表现出色。相比前代 GPT-4o,新模型在 SWE-bench 编程基准测试中的得分提升了 21%,并支持高达 100 万个 token 的上下文窗口,约为 GPT-4o 的 8 倍,分明加强了处理大型项目和复杂指令的才能。

目前,GPT-4.1 已向 ChatGPT 的 Plus、Pro 和 Team 用户开放,Enterprise 和 Edu 用户将在将来几周内获得访问权限。

同步推出的 GPT-4.1 mini 替代了原有的 GPT-4o mini,成为一切 ChatGPT 用户(包括收费用户)的默许模型。
7. 爆料:ChatGPT 即将支持 MCP 协议

5 月 16 日,科技媒体 bleepingcomputer 发布爆料称,OpenAI 正在测试将 Model Context Protocol(模型上下文协议,简称 MCP)集成至 ChatGPT 的功能,允许用户将第三方服务作为上下文接入 AI 对话流程。这一新功能经过新增的“Connectors”设置,用户可自定义添加工具,输入称号、URL 和描画,使 ChatGPT 可以访问外部运用或 API 的信息。例如,用户可衔接 Gmail、日历、数据库等服务,完成更丰富的交互体验。

(, 下载次数: 0)

MCP 是由 Anthropic 于 2024 年推出的开源标准,旨在简化 AI 模型与外部工具、数据源的集成流程。经过 MCP,开发者无需为每个数据源编写专属代码,只需一次集成,即可让 AI 系统与多种服务无缝衔接。目前,包括 Replit、Codeium 和 Sourcegraph 在内的多家企业已在其 AI 工具中采用 MCP,提升了 AI 系统互操作性。

ChatGPT 对 MCP 的支持功能目前仍处于外部测试阶段,估计 OpenAI 将在将来几天或几周内正式公布。
8. 爆料:OpenAI 计划推出 ChatGPT “Record” 功能

5 月 14 日,X 用户 @M1Astra 发现,OpenAI 正在为 ChatGPT 开发一项名为 “Record” 的新功能,旨在实理想时会议录音、转录和总结。该功能能够会作为 ChatGPT 移动运用中的一项内置工具,允许用户在会议、头脑风暴或想法记录过程中,直接经过运用停止录音,并自动生成文字记录和摘要。

(, 下载次数: 0)

根据泄露的信息,“Record” 功能将包括以下次要特性:

目前,微软 Teams 的 Copilot 曾经提供了相似的会议记录和总结功能,但次要面向 Microsoft 365 订阅用户。OpenAI 的“Record”功能假如成功推出,能够会为更广泛的用户群体提供相似的服务,降低运用门槛,尤其对中小企业和个人用户具有吸引力。

目前,OpenAI 尚未正式宣布 “Record” 功能的发布工夫和详细细节。
9. Windsurf 发布 SWE-1 系列软件工程模型

5 月 15 日,AI 初创公司 Windsurf(前身为 Codeium)正式发布其首个自研 AI 模型系列 SWE-1,该系列专为软件工程全流程设计,涵盖代码生成、调试、测试、文档生成等多个环节,旨在将开发效率提升至 99%。

(, 下载次数: 0)

SWE-1 系列包括三款模型,分别针对不同的开发场景和用户需求:

根据外部评测,SWE-1 在编程义务中的表现与 GPT-4.1 和 Gemini 2.5 Pro 相当,尤其在复杂的多轮义务和工具调用方面表现突出。

目前,开发者可经过 Windsurf Editor 体验 SWE-1 系列模型。

值得一提的是,此前 OpenAI 已与 Windsurf 达成协议,将以约 30 亿美元收买 Windsurf。
10. 爆料:Anthropic 新模型 Claude Neptune 即将发布

5 月 14 日,科技媒体 TestingCatalog News 爆料:Anthropic 正在为其下一代大型言语模型 Claude Neptune 停止最后的外部安全测试,估计将于 5 月 18 日完成红队演练,随后能够在 5 月底或 6 月初正式发布。

(, 下载次数: 0)

Claude Neptune 的红队测试重点在于评价其对越狱攻击的抵抗才能,特别是对 Anthropic 独有的宪法式 AI 安全框架的稳健性停止验证。初步测试结果显示,该模型在处理潜在有害央求时表现出更高的敏感度和防御才能。

在架构方面,Claude Neptune 估计将引入以下关键晋级:
11. 马斯克:Grok 3.5 仍太粗糙,估计一周内发布

5 月 12 日,埃隆・马斯克在 X 平台上回应网友关于 Grok 3.5、o3 pro 和 GTA 6 哪个将最先发布的发问时表示:“3.5 还是有点太粗糙了。还需求一周左右的工夫。

(, 下载次数: 0)

Grok 3.5 是马斯克旗下 xAI 公司开发的下一代大型言语模型,旨在提升 AI 的推理才能和技术成绩解答才能。 据马斯克引见,该模型可以准确回答关于火箭发动机和电化学等复杂技术成绩,采用“第一性原理”停止推理,提供不依赖互联网现有内容的原创答案。

Grok 3.5 的测试版估计将在将来一周外向 SuperGrok 订阅用户开放。 此前,Grok 3 于 2025 年 2 月发布,采用了 xAI 的 Colossus 超级计算平台停止训练,具有图像编辑、语音形式和高级推理等功能。
12. Meta 推延发布 Behemoth 模型

据《华尔街日报》5 月 15 日报道,Meta 公司已将其旗舰 AI 模型 Behemoth 的发布计划推延至往年春季或更晚,缘由是外部对模型功能的担忧。该模型原定于 4 月在 Meta 首届 AI 开发者大会上亮相,后延期至 6 月,但目前尚未确定详细发布日期。

Behemoth 是 Llama 4 系列中的核心模型,采用混合专家(MoE)架构,拥有约两万亿参数,旨在处理多模态输入。但是,外部工程师在训练过程中遇到技术瓶颈,模型在波动性和输入分歧性方面未达预期,引发了对其发布机遇和竞争力的质疑。

此次延期也反映出大型科技公司在 AI 模型开发中面临的共同应战。例如,OpenAI 的 GPT-5 和 Anthropic 的 Claude 3.5 Opus 也因技术限制而推延发布。此外,Meta 在 2025 年第一季度的资本支出已达 140 亿美元,全年估计将投入 500 至 580 亿美元用于 AI 基础设备建设,但目前尚未明白 AI 投资的商业化途径,这引发了投资者对其报答的担忧。




我是木易,一个专注AI范畴的技术产品经理,国内Top2本科+美国Top10 CS硕士。

置信AI是普通人的“外挂”,努力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的将来加速。


精选引荐






欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5