深入理解模型量化的原理与动机,掌握浮点数与整数的底层表示方式(如 IEEE-754 与二进制补码)
熟练区分并应用 对称 / 非对称量化、静态 / 动态量化、Per-Tensor / Per-Channel 粒度
理解 Post-Training Quantization (PTQ) 和 Quantization-Aware Training (QAT) 的完整流程与关键技巧
能够使用AutoRound、VLLm等主流工具,独立完成 LLM(如 Qwen3)模型的 4-bit/2-bit 量化压缩与部署



