完整样例参考
本示例是以transformers的llama模型为样例,主要展示PD分离前后的脚本变化点,提供如何从非分离脚本改为PD分离脚本的一个参考,PD分离脚本示例请参考gitee。样例中将全量模型和增量模型进行分离,部署到不同集群节点上执行。
如上分离脚本在整个推理流程中是如何被服务层调度的,请参考如下步骤。
父主题: 快速入门
本示例是以transformers的llama模型为样例,主要展示PD分离前后的脚本变化点,提供如何从非分离脚本改为PD分离脚本的一个参考,PD分离脚本示例请参考gitee。样例中将全量模型和增量模型进行分离,部署到不同集群节点上执行。
如上分离脚本在整个推理流程中是如何被服务层调度的,请参考如下步骤。