使用glibc 2.17的镜像训练模型时出现Core Dump问题 问题现象 在使用基础镜像为Centos7.6的环境跑推荐模型时,遇到如下堆栈问题。 可能原因 glibc 2.17在处理TLS(Thread-Local Storage, 线程局部存储)时,大量dlopen、dlclose、pthread_create并发执行可能会导致_dl_allocate_tls_init段错误。详细信息请参考链接中的问题根因、测试代码、修复代码。 解决方案 glibc 2.34版本已修复该问题。建议用户使用glibc 2.34及以上版本训练模型。 参考链接中的修复代码,修复训练环境中的glibc。 尝试执行命令:export LD_PRELOAD=/usr/lib64/libstdc++.so.6。 父主题: FAQ