方案介绍
在当今社会,随着科技的发展和人们生活节奏的加快,诗歌作为一种传统的文学形式,逐渐被边缘化。然而,诗歌所蕴含的丰富情感、深刻哲理和独特审美,却具有不可替代的价值。为了传承和弘扬诗歌文化。 诗歌生成项目不仅推动了文学创作的边界,还为人们的文化生活增添了新的色彩。它通过大模型技术手段,使得每个人都有机会接触到量身定制的诗歌作品,满足了不同个体的审美需求。此外,这个项目还促进了人工智能技术的进步,尤其是在自然语言生成领域,为未来的语言处理任务奠定了基础。 Qwen-14b具有强大的语言理解和生成能力。通过对海量诗歌数据进行训练,Qwen-14b可以学习到诗歌的韵律、节奏和语言规律,从而生成具有较高艺术价值的诗歌作品。 1、大规模高质量训练语料:使用超过3万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。 2、强大的性能:Qwen-14B在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的相近规模开源模型,甚至在部分指标上相比更大尺寸模型也有较强竞争力。具体评测结果请详见下文。 3、覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-14B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展
方案架构图
算法/关键配置
适配算法/关键配置名称算法/关键配置描述
Qwen-14B模型使用诗歌数据集进行全参微调,制做专属于诗歌生成的语义大模型
优势亮点
  • Qwen-14b具有强大的语言理解和生成能力。通过对海量诗歌数据进行训练,Qwen-14b可以学习到诗歌的韵律、节奏和语言规律,从而生成具有较高艺术价值的诗歌作品。
  • 1、大规模高质量训练语料:使用超过3万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
  • 2、强大的性能:Qwen-14B在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的相近规模开源模型,甚至在部分指标上相比更大尺寸模型也有较强竞争力。具体评测结果请详见下文。
  • 3、覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-14B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展
资源下载
  • 沈阳紫光启明科技有限公司诗歌生成系统AI方案.pdf

下载技术认证书
  • Compatible认证证书.pdf

暂无评分
我要评分