中文AI能力评测发布,即中文通用大模型综合性基准SuperCLUE。
这是针对中文可用的通用大模型的一个测评基准。
它主要回答的问题是:在当前通用大模型大力发展的背景下,中文大模型的效果情况,包括但不限于”这些模型不同任务的效果情况”、”相较于国际上的代表性模型做到了什么程度”、 “这些模型与人类的效果对比如何”。
中文通用大模型基准(SuperCLUE),是针对中文可用的通用大模型的一个测评基准。
它主要回答的问题是:在当前通用大模型大力发展的背景下,中文大模型的效果情况,包括但不限于”这些模型不同任务的效果情况”、”相较于国际上的代表性模型做到了什么程度”、 “这些模型与人类的效果对比如何”。
它尝试在一系列国内外代表性的模型上使用多个维度能力进行测试。SuperCLUE是中文语言理解测评基准(CLUE)在通用人工智能时代的进一步发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容