数据精度指标

数据集选取,选取SuperGLUE作为标的数据集主要是考虑到它的多样性以及整体难度两个方面。GLUE的原作者保留了RTE和WNLI这两个任务(其中WNLI仅改变了任务形式,更名为 WSC),并引入形式多样且更具挑战的6个任务,组成了新的语义理解基准SuperGLUE。它共包含8个数据集,每个数据集都是针对语言的不同侧面设计了不同的任务,以求尽量从多个角度来考察模型的能力。