类说明
QuantFA是承载了量化fa的layer,其中包含了量化fa的相关权重,使用def quantize量化使用时,需要确保attention类中有heads和inner dim的属性即可自动生成,在模型推理时需要更换fa的推理逻辑forward。
父主题: class QuantFA
QuantFA是承载了量化fa的layer,其中包含了量化fa的相关权重,使用def quantize量化使用时,需要确保attention类中有heads和inner dim的属性即可自动生成,在模型推理时需要更换fa的推理逻辑forward。