大家好我是科技探求员,明天接着和大家分享DeepSeek的技术创新点,本次和大家分享,DeepSeek提出的MTP(Multi-Token Prediction)。在末尾分析MTP之前,先简单说下token和自回归的概念。什么是token?大言语模型其实 ...