源1.0

“源1.0″是由浪潮信息发布的全球最大规模人工智能巨量模型。它是一种通用NLP预训练模型，具有2457亿个参数，超过了美国OpenAI组织研发的GPT-3模型，成为全球最大的中文语料AI巨量模型。源1.0模型通过在海量中文互联网上收集整理超过5000G的高质量中文训练数据集进行训练，训练集规模达到了GPT-3模型的近10倍，并且获得了比GPT-3更低的训练损失。

源1.0模型具有以下功能特点：

规模大：源1.0模型包含2457亿个参数，是1750亿参数的英文语言模型GPT-3的1.4倍。其超大规模的参数量能够降低AI应用开发的门槛，提升创新速度。
数据多：为训练源1.0模型，浪潮信息收集了超过5000G的高质量中文训练数据集。训练数据规模比GPT-3模型的训练数据集近10倍，从而得到更低的训练损失。
性能强：在权威中文语言理解测评基准CLUE中，源1.0模型在零样本学习和小样本学习两个榜单上都名列榜首。基于源1.0模型，可以快速开发多种不同的AI应用，如客服机器人、舆情分析、智能内容处理和虚拟数字人等。