日期:2025-10-15 12:29:22
自然语言处理领域模型的王者,长期以来都是自回归(Autoregressive)模型。蚂蚁开源了业界首个高性能扩散语言模型推理框架dInfer。专门解决扩散模型推理的“三大难题”:计算成本高、KV(键值)缓存用不了、并行解码容易“翻车”;让扩散模型推理效率超过自回归模型。他们联合各大名校发了一篇论文,《dInfer: An Efficient Inference Framework for Diffusion Language Models》,详细阐述了该框架的实现细节。(AIGC开放社区)
淘配网提示:文章来自网络,不代表本站观点。