W16A16SC稀疏量化-量化特性-特性介绍-MindIE LLM-大语言模型推理框架-MindIE3.0.0开发文档-昇腾社区

[object Object][object Object]

此量化方式为浮点稀疏量化，对已有权重作如下两步操作：

表 1 float16权重量化后dtype及shape信息（假设原始权重的shape为[n, k]）

[object Object]undefined

[object Object]

在使用稀疏量化脚本之前，需要安装压缩工具msModelSlim，安装步骤参见《msModelSlim工具》的“”章节。

[object Object]

以Qwen3-32B为例：

使用以下指令生成W16A16S浮点稀疏权重。

[object Object]
- 以上指令包含生成Qwen3-32B W16A16S浮点稀疏权重的最优参数配置。
- 该量化方式目前已经集成到msModelSlim工具的一键量化功能中，参数配置及详细说明可参考《msModelSlim工具》的“”章节。
使用以下指令设置msModelSlim工具所在的Python路径环境变量，{Python Lib Path}为安装msmodelslim时编译步骤中所在的Python路径。

[object Object]
使用以下指令对浮点稀疏权重进行压缩，生成W16A16SC量化权重。

[object Object]
TP数为张量并行个数，需和权重运行时的张量并行个数保持一致。

[object Object]

以Qwen3-32B为例，您可以使用以下指令执行对话测试，推理内容为"What's deep learning?"。

[object Object]