智谱AI推出全自研的第三代基座大模型“ChatGLM3”
在2023中国计算机大会(CNCC)上,智谱AI推出了全自研的第三代基座大模型“ChatGLM3”及相关系列产品。这是智谱AI第三次对ChatGLM基座模型进行深度优化,拥有更强大的功能,采用了独创的多阶段增强预训练方法、更丰富的训练数据和更优的训练方案,使训练更为充分。
评测显示,与ChatGLM二代模型相比,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。其中,MMLU提升36%、CEval提升33%、GSM8K提升179%、BBH提升126%。
ChatGLM3集成了自研的AgentTuning技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于ChatGLM二代提升1000%。同时,它开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。
ChatGLM3推出了可手机部署的端测模型“ChatGLM3-1.5B”和“ChatGLM3-3B”,支持包括Vivo、小米、三星在内的多种手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20tokens/s。而在精度方面,ChatGLM3-1.5B和ChatGLM3-3B在公开Benchmark上与ChatGLM2-6B模型性能接近。
在全新升级的ChatGLM3赋能下,生成式AI助手智谱清言已成为国内首个具备代码交互能力的大模型产品(Code Interpreter),可支持图像处理、数学计算、数据分析等使用场景。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/aimodel/1282.html