场景 | 主流模型 |
文生图片 | DALL-E(OpenAI)、Imagen(Google)、Stable Diffusion(Stability AI)、混元文生图(腾讯)等 |
文生视频 | Sora(OpenAI)、Stable Video Diffusion(Stability AI) |
图生文(图片了解) | GPT-4V(OpenAI)、Gemini(Google)、Qwen-VL(阿里) |
图文生视频 | Runway Gen-2(Runway AI)、Stable Video Diffusion(Stability AI) |
视频生文(视频了解) | Gemini 1.5 / Gemini Pro Vision(Google) |
模型 | 开发者 | 初次支持 Function Calling 工夫 |
GPT-4 | OpenAI | 45090 |
Claude-3 | Anthropic | 45355 |
Gemini-2.0 | Google | 45627 |
DeepSeek-R1 | 深度求索公司 | 45709 |
才能 | 传统LLM | 支持Function Calling的LLM |
获取实时信息 | ❌ 依赖训练数据 | ✅ 调用搜索引擎/数据库 |
执行精准计算 | ❌ 常出错(如复杂数学) | ✅ 调用计算器/Python |
操作外部系统 | ❌ 无法执行 | ✅ 发送邮件/控制智能家居 |
前往结构化数据 | ❌ 文本难解析 | ✅ 输入标准JSON |
维度 | 传统形式 | MCP 形式 | 变革价值 |
集成成本 | 每对接新工具需定制开发 | 一次开发,全网复用 | 开发效率提升 10 倍 |
功能范围 | 单一工具调用 | 多工具协同执行复杂义务链 | AI 从“助手”晋级为“执行者” |
生态开放性 | 封闭式 API,厂商锁定 | 开源协议,社区共建工具库 | 催生“AI 运用商店”形式 |
安全可控性 | API 密钥暴露风险 | 数据不离域,权限分级管控 | 满足企业级合规需求 |
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) | Powered by Discuz! X3.5 |