职贝云数AI新零售门户

标题: 清华开源AIGC机器人大模型,谷歌Gemini 2.5 Pro编程才能登顶 [打印本页]

作者: rC9s7r2 时间: 前天 20:43
标题: 清华开源AIGC机器人大模型,谷歌Gemini 2.5 Pro编程才能登顶
{ AiCC } 小报 5月7日

每天3分钟了解 AI 最新态  AI Creative Commons

00后华人打造AI作弊工具狂揽3800万融资：求职不再是人找人，AI对轰时代来了

本文讨论了AI在招聘和求职中的广泛运用，包括AI面试工具、简历挑选及面试模拟等。以Interview Coder为例，展现了AI如何辅助用户在多种场景下获取实时协助。同时，文章指出AI的运用能够导致候选人同质化成绩，影响企业用人多样性。Anthropic等公司对AI运用的限制反映了行业对于AI依赖度与人才多样性的平衡应战。

https://36kr.com/p/3282229781979780

2025-05-07T16:53:59.570336 · 标签：模型安全、AI对话、求职AI

98%财务顾问依赖AI，揭秘7家先锋企业如何解锁商业新格局

OpenAI最新报告深化分析了7家前沿公司运用AI的成功阅历，涵盖金融服务、电商批发等多个范畴。这些公司在员工表现提升、常规操作自动化及产品赋能方面获得分明成果。例如，摩根士丹利经过片面评价确保AI项目质量与安全；Indeed应用GPT-4o mini优化职位婚配，提高央求量和成功率；Klarna推出AI客服助手，大幅延长处理成绩工夫并提升客户称心度。此外，Lowe's经过微调模型提高了产品搜索准确性，而西班牙对外银行则鼓励员工掌握AI技术以处理特定成绩。

https://36kr.com/p/3282162619785863

2025-05-07T16:53:51.294014 · 标签：模型安全、AI对话、生成模型

清华、星动纪元开源首个AIGC机器人大模型

清华、星动纪元开源首个AIGC机器人大模型——VPP（Video Prediction Policy）。据了解，VPP将视频分散模型的泛化才能转移到了通用机器人操作策略中，巧妙处理了diffusion推理速度的成绩，让机器人实时停止将来预测和动作执行，大大提升机器人策略泛化性，并且现已全部开源。

https://www.tmtpost.com/nictation/7558398.html

2025-05-07T15:52:25.359893 · 标签：AI视频、模型打破、机器人AI

阶跃星斗与ACE Studio结合开源音乐大模型ACE-Step

阶跃星斗与ACE Studio正式结合发布并开源音乐大模型——ACE-Step（中文名：音跃）。ACE-Step支持包括LoRA和ControlNet在内的多种微调方式，可灵敏适配音频编辑、人声合成、伴奏生成、声线克隆、风格迁移等多种下游义务，降低音乐AI运用的开发门槛。

https://www.tmtpost.com/nictation/7558453.html

2025-05-07T15:52:25.331126 · 标签：音乐AI、AI音频、生成模型

一个LoRA完成GPT-4o级图像编辑，浙大哈佛新模型冲上Hugging Face榜二

浙大哈佛团队提出ICEdit图像编辑方法，仅用0.1%的数据量（50k）和1%的训练参数（200M），完成高质量图像编辑，媲美甚至超越GPT-4o等商业大模型。该方法基于DiT多模态大模型，经过上下文提示词让模型了解编辑指令并生成结果，结合LoRA微调与test-time scaling策略，分明提升编辑功能和效率。

(, 下载次数: 0)

https://36kr.com/p/3282163754885769

2025-05-07T15:52:05.545603 · 标签：多模态AI、模型打破、AI绘画

为什么AI视频工具长得越来越像？

AI视频范畴竞争激烈，玩家纷纷加速迭代模型与产品，重点提升视频生成的分歧性、可用性和可玩性。技术上，经过多模态交融、优化底层模型等手腕加强视频质量；运用方面，则聚焦于降低制形成本、提高创作效率及丰富交互方式。但是，当前AI视频仍面临成本控制、功能同质化等成绩，行业正积极探求更高效、低成本的处理方案以推进商业化进程。

(, 下载次数: 0)

https://36kr.com/p/3282187534083593

2025-05-07T15:52:00.348123 · 标签：多模态AI、AI视频、生成模型

OpenAI估计到2030年将减少支付给微软的支出分成比例

OpenAI 计划到2030年将其支付给微软等商业伙伴的支出份额从当前的20%降至10%，这反映出其在成本控制与商业策略上的调整。虽然微软已向OpenAI投资数十亿美元，并享有API独占权和知识产权运用权，但对OpenAI提出的新公司结构持保留态度，旨在保护本身巨额投资。此变化预示着AI企业在追求技术创新与商业利益平衡时面临的应战。

https://techcrunch.com/2025/05/07/openai-expects-to-cut-share-of-revenue-it-pays-microsoft-by-2030/

2025-05-07T15:51:44.817405 · 标签：企业合作、AI商业、支出分成

收费！鹅厂最新3D生成模型火爆外网，CG导演都曾经用上了

腾讯最新发布的混元3D生成模型在外网遭到广泛关注，该模型支持文/图到3D模型及动画的转换。其弱小的3D建模才能已在游戏开发、CG创作等范畴得到运用，并被赞誉为当前AI生成3D范畴的佼佼者。此外，混元还提供了人物生成、动画制造等高级功能，展现了计算机视觉技术在3D内容创作中的宏大潜力。

(, 下载次数: 0)

https://www.qbitai.com/2025/05/280509.html

2025-05-07T15:46:19.000 · 标签：多模态AI、3D建模、AI生成

黄仁勋放话：中国AI市场3年内达500亿美元，AI救了旧金山，整个世界急于与AI互动

黄仁勋预测中国AI市场将来两到三年内将达到约500亿美元，强调错过这一机遇将带来宏大损失。他还指出，AI技术的运用促进了旧金山等城市的经济复苏，并推进了新的失业机会的产生。随着生成式AI需求激增，英伟达作为GPU供应商，在AI 2.0浪潮中表现突出，估计支出将同比增长65%。黄仁勋建议片面拥抱AI技术，鼓励运用如Perplexity和ChatGPT等工具，以顺应不断变化的工作环境。

(, 下载次数: 0)

https://36kr.com/p/3281987761890182

2025-05-07T12:42:32.074955 · 标签：AI对话、模型打破、生成模型

AI编程模型范畴迎新王？谷歌发布Gemini 2.5 Pro I/O，单条文本提示即可生成残缺运用

谷歌DeepMind发布Gemini 2.5 Pro I/O，该多模态大言语模型在代码生成、视觉风格婚配及复杂组件开发上获得分明提高。新版本支持高效开发工作流，如将YouTube视频疾速转换为互动学习运用等。其功能超越了包括GPT-4在内的多个竞品，在WebDev Arena的人类评审中获得最高分。此模型不只降低了设计导向型开发者的入门门槛，也展现了弱小的适用性和市场竞争力。

(, 下载次数: 0)

https://36kr.com/p/3281991045358212

2025-05-07T12:42:26.391433 · 标签：多模态AI、AI对话、模型打破

碾压Cursor？谷歌突发Gemini 2.5 Pro 预览版，编码才能全网第一

谷歌发布 Gemini 2.5 Pro Preview（I/O 版），该模型在编程才能上获得分明提高，在 LMArena 编程类别和 WebDev Arena 排行榜中首屈一指。新版本在视频了解和前端 Web 开发方面表现出色，可以自动生成代码并优化用户界面设计。经过 Gemini API 和 Vertex AI 平台提供服务，旨在提升开发者效率。虽然存在局限性，但其在实践编程义务中的牢靠性得到认可，为将来 AI 辅助编程工具的发展提供了新的方向。

(, 下载次数: 0)

https://36kr.com/p/3281996438905481

2025-05-07T12:42:14.982956 · 标签：AI对话、模型打破、生成模型

豪掷30亿美元，OpenAI史上最大收买案

OpenAI将以30亿美元收买AI编程工具Windsurf，整合其先进技术以巩固在AI编程范畴的抢先地位。Windsurf以其模型有关性和多模态支持策略在市场中锋芒毕露，提供智能代码建议和企业级代码库管理等功能。此次收买反映了AI编程助手市场的激烈竞争态势及该范畴将来的发展潜力，也标志着OpenAI对全栈控制的战略规划。

(, 下载次数: 0)

https://36kr.com/p/3281955627393929

2025-05-07T11:40:44.623503 · 标签：多模态AI、AI对话、模型打破

AI再破2000年前「上古卷轴」，古希腊著作原文初次重见天日

2025年，研讨人员应用AI图像分割与墨迹检测技术初次非侵入性地读取了赫库兰尼姆古卷PHerc. 172的标题。此打破标志着AI在计算机视觉和形式辨认范畴的严重停顿，并为解读更多古代文献铺平道路。该成果荣获维苏威应战赛首标题奖，奖金6万美元。

(, 下载次数: 0)

https://36kr.com/p/3281842309603975

2025-05-07T10:38:56.340067 · 标签：古文辨认、AI图像、模型打破

2025 全球顶尖教育科技公司榜单：中国包揽前三，AI 重塑全球格局

2025年全球顶尖教育科技公司榜单显示，中国企业初次包揽前三甲，标志着从在线补课到AI重构的深层变革。编程猫、网易有道等企业仰仗AI技术在编程教育、智能辅导等范畴获得分明停顿。AI已成为决议教育科技生死的关键基础设备，不只在中国教育中深度交融，还在印度等国家推进普惠教育。成人技能市场和差异化服务成为新趋向，预示着教育科技正向全生命周期覆盖发展。

(, 下载次数: 0)

https://36kr.com/p/3281195079541638

2025-05-07T10:38:47.999420 · 标签：AI对话、模型打破、教育科技

谷歌发布 Gemini 2.5 Pro I/O 特别版：编程双榜第一

谷歌正式发布 Gemini 2.5 Pro "I/O 特别版"技术预览。作为 2.5 Pro 的严重晋级版本，其编程才能获得打破性提升 —— 不只在 LMArena 编码排行榜登顶，更在 WebDev Arena 排行榜稳居第一。  残缺更新内容可查阅谷歌官方技术博客。  异样可以在 ai.dev 中直接用，选 Gemini 2.5 Pro Preview 05-06

(, 下载次数: 0)

https://sanhua.himrr.com/news/629aafa2-09aa-4ace-af51-1cd0b5d9d7c8

2025-05-07T09:37:20.517537 · 标签：编程才能、AI对话、模型打破

LTXStudio 发布 130 亿参数 LTX-Video 开源模型

LTXStudio 最新发布了 LTX-Video 13B 开源视频生成模型：  130亿参数规模采用多尺度渲染技术，呈现更精细的细节分明提升运动轨迹与场景了解才能可在本地GPU运转，比同类产品快 30 倍支持关键帧、镜头/角色运动控制及多镜头序列生成  残缺更新引见可以看官方推文

https://sanhua.himrr.com/news/b6cbef4d-37dd-41e0-98b7-75b53d7a0b18

2025-05-07T09:37:20.517510 · 标签：多模态AI、AI视频、生成模型

ComfyUI 新增多款付费模型 API 节点支持

继上周推出 GPT-Image-1 API 节点后，ComfyUI 现已新增多个付费模型的 API 节点支持。  这些节点的定价与直接调用各模型官方 API 的价格分歧。付费模型残缺价格表：点击查看。  ComfyUI 团队还表示，将来版本将支持用户运用本人的 API key。  此外，居然还换了 Logo，采用了更古代的扁平化设计风格，似乎是第二次换了吧

https://sanhua.himrr.com/news/e224f9a2-2a58-4b49-896a-bf0ce729b421

2025-05-07T09:37:20.517482 · 标签：AI对话、模型打破、API支持

ACE-Step 开源音乐 AI：19 种言语支持

ACE-Step 是由 ACE Studio 和 StepFun 结合开发的开源音乐生成模型，基于分散模型，支持生成多种风格歌曲，支持包括中文在内的 19 种言语。  支持各种控制才能，包括声响克隆、歌词修正、人声性别调整、混音及音轨生成。  生成的效果程度接近 Suno，旋律连接，歌词对齐。  官方还提供了在线演示，感兴味的佬可以立刻体验。

(, 下载次数: 0)

https://sanhua.himrr.com/news/8143c11d-0765-4faf-8a07-5b5943203100

2025-05-07T09:37:20.517437 · 标签：AI音频、生成模型、多言语支持

从“形似”到“神似”，我们离完美数字人越来越近了

旧事讨论了数字人在AI技术驱动下的演进，重点引见了从早期的CNN、GAN到近期的NeRFs、Transformer和分散模型等核心技术的发展，完成了从静态笼统到全身动作、情感表达与实时交互的跨越。在运用层面，数字人正广泛浸透至内容创作、广告营销及企业培训等多个范畴，极大降低了制形成本并提升了用户体验。虽然面临唇形同步精度、背景环境交融等应战，但随着算法优化和算力加强，数字人产业将迎来疾速发展期。

https://36kr.com/p/3281793256498053

2025-05-07T09:36:58.832822 · 标签：多模态AI、AI对话、模型打破

160人卖了217亿，AI运用首个大额套现项目，CEO解密成功秘诀

Windsurf以30亿美元估值被OpenAI收买，其创始人Mohan强调AI运用层的差异化价值，以为不能仅靠“套壳”，需长期技术投入与创新。自2024年底发布AI原生IDE产品以来，Windsurf用户数破百万，年度常常性支出超1亿美元。Mohan指出，在生成式AI模型日益普及背景下，AI基础设备公司需转型，经过垂直整合构建下一代伟大运用。

(, 下载次数: 0)

https://36kr.com/p/3281084272272256

2025-05-07T08:35:37.322485 · 标签：AI运用、模型打破、商业成功

Substack推出仅音频直播功能

Substack 推出仅音频直播功能，为内容创作者提供低压力互动方式。此功能支持匿名直播，并允许听众实时评论与订阅，简化了创作者与粉丝之间的衔接。虽然旧事本身未直接提及 AI 技术，但其背后能够触及语音辨认、自然言语处理等技术以优化用户体验和互动效率，表现了AI在提升在线平台交互性方面的运用潜力。

(, 下载次数: 0)

https://techcrunch.com/2025/05/06/substack-launches-audio-only-livestream-feature/

2025-05-07T08:34:34.932697 · 标签：模型安全、AI音频、生成模型

Hugging Face发布了一款收费的类Operator代理型AI工具

Hugging Face发布了一款收费的云端AI代理——Open Computer Agent，可在Linux虚拟机上运转多个运用并执行义务。虽然该代理在处理复杂央求时表现不佳且常遇验证码成绩，但其展现了开放AI模型日益增长的才能与成本效益。随着视觉模型才能提升，它们可以支持更复杂的代理工作流程，如图像元素定位和点击操作。据预测，AI代理市场将从2025年的7.84亿美元增长至2030年的52.62亿美元，显示出微弱的增长潜力。

https://techcrunch.com/2025/05/06/hugging-face-releases-a-free-operator-like-agentic-ai-tool/

2025-05-07T06:00:52 · 标签：AI智能体、模型打破、成本效益

优步携手中国公司抢占欧洲和中东地区的机器人出租车市场份额

Uber 宣布与三家中国自动驾驶公司Pony AI、Momenta和WeRide合作，计划在中东和欧洲推出机器人出租车服务。此举展现了Uber在全球新兴的无人驾驶出行范畴的雄心壮志。经过这些合作，Uber旨在加速其在国际市场的扩张，并应用中国企业在自动驾驶技术上的优势来应对来自特斯拉等竞争对手的压力。这不只表现了自动驾驶作为AI重要运用场景之一的宏大潜力，也反映了跨国合作对于推进AI技术创新及商业化落地的重要性。

(, 下载次数: 0)

https://techcrunch.com/2025/05/06/uber-turns-to-chinese-companies-to-snap-up-robotaxi-market-share-in-europe-middle-east/

2025-05-07T00:47:34 · 标签：跨国合作、AI智能体、模型打破

Particle将其人工智能旧事阅读器引入网络

Particle推出AI驱动的旧事阅读网站，经过AI技术提供旧事摘要、关键引述及问答功能，协助用户更高效地了解旧事。该平台涵盖多个旧事类别，并为特定实体提供详细信息页面。此外，Particle与多家知名媒体合作，确保流量导向原始内容发布者，表现了AI在旧事范畴的运用潜力和对行业生态的积极影响。

(, 下载次数: 0)

https://techcrunch.com/2025/05/06/particle-brings-its-ai-powered-news-reader-to-the-web/

2025-05-07T00:08:15 · 标签：AI对话、生成模型、旧事AI

(, 下载次数: 0)

/ / / AiCC 往期精选 ///

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

(, 下载次数: 0)

© 2025 AI知识共创 · 获取授权方可转载

假如对您有启示，欢迎赞 / 在看 / 转发三连🌟，星标更新不迷路～感激阅读，下次见！

「AiCC」努力于塑造新型学习范式，跨界交流社群与前沿信息共享，构建开放包容的AI知识生态。用智慧碰撞激发创新势能，助力企业与个体爱好者在智能设计、数字内容等范畴等场景中探求AI运用，让技术真正服务于创新与价值增长。

(, 下载次数: 0)

进群聊AI ：扫码加小助手微信 uw1ngs爆料 / 交流 / 合作：请加主编微信 uwings

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)