复旦MOSS回应服务器被挤崩:模型还不成熟

2月20日,复旦团队发布国内首个类ChatGPT模型MOSS ,引起不少网友关注。由于瞬时访问压力过大,MOSS服务器当晚被网友挤崩。2月21日,MOSS官网发布公告称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。据了解,在MOSS完成初步验证后,团队会将MOSS的经验、代码、模型参数开源供大家参考。

据了解,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。在对话能力阶段,复旦团队采用了不同的技术路线,通过让MOSS和人类以及其他对话模型都进行交互,显著提升了其学习效率和研发效率,短时间内就高效完成了对话能力训练。

领导开发MOSS模型的邱锡鹏教授表示,MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。

目前,MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。

值得一提的是,复旦大学团队开发的这个对话式大型语言模型的名字刚好和《流浪地球》系列电影中的人工智能550W量子计算机MOSS重名。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注