北大团队提出2比特复数模型iFairy{±1, ±i},精度反超量化前,可手机部署 - 新华报业网原文
2025-08-15 21:23
69
北京大学杨仝团队提出名为iFairy的2比特复数模型量化方案,使用{±1, ±i}对权重进行编码,实现1/8极致压缩与无乘法推理加速。该模型在语言建模和下游任务表现上反超全精度LLaMA基座模型,困惑度降低10%,为边缘设备部署大模型提供新可能。
全部评论