角色切换
使用场景
主要用于在PD集群节点数量固定的场景下,由于业务的变化,期望PD集群节点间可以相互切换,充分利用资源。
功能示例
示例由角色Decoder切换为Prompt。切换角色后,根据业务功能调用LLM-DataDist其他接口。
- LLM-DataDist初始化时,需要设置OPTION_ENABLE_SET_ROLE为"1"。
1 2 3 4 5 6 7 8 9 10 11 12
LlmDataDist llm_data_dist(DECODER_CLUSTER_ID, LlmRole::kDecoder); std::map<AscendString, AscendString> options; options[OPTION_DEVICE_ID] = "0"; options[OPTION_BUF_POOL_CFG] = R"({ "buf_pool_size": 2147483648 })"; options[OPTION_ENABLE_SET_ROLE] = "1"; auto ret = llm_data_dist.Initialize(options); if (ret != LLM_SUCCESS) { printf("[ERROR] Initialize failed, ret = %u\n", ret); return -1; }
父主题: 专题