服务侧拉起模型时出现“Max retries exceeded with url”报错

问题现象描述

服务侧拉起模型时出现“Max retries exceeded with url”报错,具体报错信息如下:

原因分析

大概率是内网访问的问题。

解决措施

以Qwen-VL为例,打开权重文件夹下tokenization_qwen.py文件,按照如下29~30行修改: