140亿参数模型!阿里云通义千问开源
9月25日,阿里云开源通义千问AIGC大模型,并可供用户免费商用。该大模型为140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat。在多个权威评测中,Qwen-14B超越同等规模模型,部分指标甚至接近Llama2-70B。阿里云此前开源了70亿参数模型Qwen-7B等,一个多月下载量破100万,成为开源社区的口碑之作。
作为一款支持多种语言的高性能开源模型,Qwen-14B相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B最大支持8k的上下文窗口长度。
据介绍,Qwen-14B-Chat是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。
通义千问已成落地应用最深的中国大模型,目前已有多个月活过亿应用接入。
一个小插曲:
小熊AI网小编9月25日下午18时左右,测试阿里通义千问AIGC功能时,输入问题,回合内容一直不断地重复,通义千义出故障了?希望这是暂时的,期待通义千问出彩的能力!
通义千问故障现象
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/info/797.html