1. 主页 > AI展台 > AI大模型

【大模型巡展】蚂蚁大模型:打造大模型完整技术链条

11月6日,据北京商报记者从蚂蚁集团获悉,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,将向公众开放。

蚂蚁集团

本次通过备案的是蚂蚁百灵语言大模型,该大模型采用TransFormer架构,基于万亿级Token语料训练而成,支持窗口长度达32K。据了解,蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

在算力方面,蚂蚁建设了万卡异构集群,其中硬件算力效率(HFU)超过60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍。

在安全力方面,蚂蚁研发了大模型安全一体化解决方案——蚁天鉴。蚁鉴平台作为业内首个大模型安全评测工具,支持50万/天饱和式攻击,全面覆盖生成内容数百类风险;天鉴平台可在大模型运行时,覆盖八大类风险,采用大模型对抗大模型的方式,使得风险召回率大于99%,其Guardrails前置护栏功能,能精确召回20多类提问风险意图。

在知识力上,蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化,形成了完备的知识处理能力。其中,集评测数据集与评测框架一体化的大模型评测平台——EVE,能支持语言大模型和多模态大模型一站式自动化评测。

据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。

易观分析金融行业高级咨询顾问苏筱芮评价称,通用的大语言模型既可与蚂蚁擅长的金融业务结合,向企业经营关键环节进行渗透,促进业务能效及可持续发展能力大幅提升,同时也可以向整个阿里生态内的其他本地生活、消费类等业务进行赋能,通过灵活的AI能力助力业务经营。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林同样解读称,蚂蚁作为互联网巨头,在算力、算法等方面有一定的基础,介于蚂蚁自身赋能中小商户的特性,其实可以针对中小商户的需求来应用大模型,比如一个导购的大语言模型,用户可以基于需求和蚂蚁大模型进行对话,找到适合自己的商品;又如金融垂直领域的大模型应用。

谈及业务场景,蚂蚁集团副总裁、百灵大模型负责人徐鹏透露,备案通过后,“百灵”将全线应用到蚂蚁的各个业务场景,并在各垂直领域创新研发产品,更多应用产品即将面向社会开放。

蚂蚁百灵大模型完成备案,即将开放

本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/aimodel/1392.html