大多数深度学习硬件,全都支持基本的离线量化校准,这是因为离线量化是最快而且可以完全独立于训练的方式,最容易支持,使用方式也最容易被人接受。
离线量化的难点(总结不错):
BRECQ : Pushing The Limit of Post-training Quantization by Block Reconstruction 上面这篇文章探索了不同的粒度(带来量化空间大小的变化)对量化的影响,以块为单位作为量化粒度可以更好地权衡?
照抄: