量化Python接口参考 量化API接口,已在2.1.RC1版本迁移到vLLM Ascend,请参见vLLM Ascend量化指南。如场景需要必须使用MindIE Turbo的量化API接口,请下载安装MindIE Turbo 2.0.RC2版本,具体参见MindIE Turbo 2.0.RC2的《MindIE Turbo开发指南》。 父主题: API接口说明