R1在函数调用上表现仍欠佳,而且在这项研讨里甚至没有针对这一点停止微调。但即便如此,只需给它搭配合适的框架,它在HLE这个难度很高的测试中就能拿到32%的成绩。
虽然大家能够会习气性地称R1为“最佳基础模型”,但我觉得这其实是给V4打下了基础。我敢一定,V4一出来就会自带智能体功能。
即便没有针对智能体行为停止明白的微调,该模型也可以自主生成和执行代码,与环境交互,并最终发挥出弱小的智能体功能。
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) | Powered by Discuz! X3.5 |