3月2日,阿里巴巴与清华大学联合发布业界最大的中文多模态预训练AI模型M6,该模型参数规模超千亿,具备超越传统AI的文本、图像的理解和生成能力,图像设计效率超越人类,可应用于产品设计、信息检索、机器人对话、文学创作等领域。
此次发布的M6模型采用了新型AI训练思路,即先自动学习 大量语言文字和图像数据,记忆和理解人类丰富的先验知识,再进一步学习专业领域信息,从而让AI同时掌握常识和专业知识。与此同时,阿里巴巴研究团队将参数规模提升到1000亿,这也是多模态预训练领域史上最大的模型,其理解和生成能力超越传统AI。
据介绍,在图像设计场景中,M6相比目前主流AI,可生成更高清、细节更丰富的图像,并可根据文本特征创造新事物,模型可设计包括服饰、鞋类、家具、首饰、书籍等在内的30多个物品类别的图像,最短一分钟即可完成作品的创作,效率超越普通设计师。
阿里巴巴达摩院智能计算实验室资深算法专家杨红霞表示:“多模态预训练是下一代人工智能的基础,M6模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”