“源1.0″是由浪潮信息发布的全球最大规模人工智能巨量模型。它是一种通用NLP预训练模型,具有2457亿个参数,超过了美国OpenAI组织研发的GPT-3模型,成为全球最大的中文语料AI巨量模型。源1.0模型通过在海量中文互联网上收集整理超过5000G的高质量中文训练数据集进行训练,训练集规模达到了GPT-3模型的近10倍,并且获得了比GPT-3更低的训练损失。
源1.0模型具有以下功能特点:
- 规模大:源1.0模型包含2457亿个参数,是1750亿参数的英文语言模型GPT-3的1.4倍。其超大规模的参数量能够降低AI应用开发的门槛,提升创新速度。
- 数据多:为训练源1.0模型,浪潮信息收集了超过5000G的高质量中文训练数据集。训练数据规模比GPT-3模型的训练数据集近10倍,从而得到更低的训练损失。
- 性能强:在权威中文语言理解测评基准CLUE中,源1.0模型在零样本学习和小样本学习两个榜单上都名列榜首。基于源1.0模型,可以快速开发多种不同的AI应用,如客服机器人、舆情分析、智能内容处理和虚拟数字人等。
相关导航
暂无评论...