Baichuan2-192K大模型:号称“全球最长的上下文窗口”
百川智能今日宣布推出 Baichuan2-192K大模型,该模型的上下文窗口长度达到了惊人的 192K,能够处理约 35 万个汉字,成为目前全球最长的上下文窗口。
百川智能CEO王小川
据百川智能介绍,Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2(100K 上下文窗口,实测约 8 万字)的 4.4 倍,是 GPT-4(支持 32K 上下文窗口,实测约 2.5 万字)的 14 倍。
上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息,更好地捕捉上下文的相关性、消除歧义,进而更加准确、流畅地生成内容,提升模型能力。
百川智能测评结果
百川智能测评结果
百川智能测评结果
百川智能测评结果
在 Dureader、NarrativeQA、LSHT、TriviaQA 等 10 项中英文长文本问答、摘要的评测集上,Baichuan2-192K 表现良好,有 7 项取得了 SOTA(state-of-the-art)的成绩。
百川智能表示,Baichuan2-192K 将以 API 调用和私有化部署的方式提供给企业用户。目前,百川智能已启动 Baichuan2-192K 的 API 内测,并开放给法律、媒体、金融等行业的核心合作伙伴使用。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/aimodel/1303.html