常见的LLM推理性能优化手段都有哪些

算子融合、量化、Tensor并行、ContinuousBatching等。