【大模型巡展】Kimi Chat：支持输入超过20万汉字的长文本

大模型正在以“肉眼可见”的速度变得越来越长。长文本能力似乎成为了大模型厂商出手的新标配，Kimi Chat的出道引起了行业的关注。

Kimi Chat的迅速起势

目前，国内外已有OpenAI、Anthropic、Meta、月之暗面等一大批顶级的大模型技术公司、机构和团队将对上下文长度的拓展作为更新升级的重点。

国外，OpenAI经过三次升级，GPT-3.5上下文输入长度从4千增长至1.6万token，GPT-4从8千增长至3.2万token；OpenAI最强竞争对手Anthropic一次性将上下文长度打到了10万token；LongLLaMa将上下文的长度扩展到25.6万token，甚至更多。

这些大模型公司或机构都是资本市场热捧的“当红炸子鸡”。OpenAI自不必说，大模型Top级明星研究机构，斩获投资近120亿美元，拿走了美国生成式AI领域60%的融资。Anthropic近期风头正盛，接连被曝亚马逊、谷歌投资消息，前后相差不过几天，估值有望达到300亿美元，较3月份翻五番。

而成立仅半年的月之暗面出道即巅峰，一成立就迅速完成首轮融资，获得红杉、真格、今日资本、monolith等一线VC的押注，市场估值已超过3亿美元，而后，红杉孵化式支持，循序完成两轮共计近20亿元融资。

作为一款多语言能力强大的聊天机器人，Kimi Chat与目前市面上以英文为基础训练的大模型服务不同。在中文上，Kimi Chat具有显著的优势，能够支持约20万汉字的上下文，其性能优于Anthropic公司的Claude-100k和OpenAI公司的GPT-4-32k。

Moonshot AI

同时，火山引擎，作为字节跳动旗下的企业技术服务平台，与月之暗面进行了深度合作。火山引擎独家提供高稳定性和高性价比的AI训练和推理加速解决方案。此外，Kimi Chat即将入驻火山引擎大模型服务平台——火山方舟，双方将继续在大模型生态领域为企业和消费者提供更丰富的AI应用。

月之暗面是一家专注于探索通用人工智能边界的公司，致力于找到将算力转化为智能的最佳方式。火山引擎拥有国内领先的基础设施能力和算力储备，双方将进一步在AI算力基础设施和应用场景拓展等方面展开合作。

火山引擎智能算法负责人吴迪表示，火山引擎一直专注于技术、赋能合作伙伴以及价值共享的合作模式。月之暗面拥有国内先进的大模型研发团队，对AI技术有着深入的理解和应用经验。双方的合作将在多模型生态服务领域为企业和消费者提供更丰富的AI应用。

大模型公司为什么铆足劲攻克长文本技术？

表面上看是可输入的文本长度越来越长，阅读能力越来越强。若将抽象的token值量化，GPT-3.5的4000 token最多只能输入3000个英文单词或者2000个汉字，连一篇公众号文章都难以读完；3.2万token的GPT-4达到了阅读一篇短篇小说的程度；10万token的Claude可输入约7.5万个单词，仅22秒就可以阅读完一本《了不起的盖茨比》；40万token的Kimi Chat支持输入20万汉字，阅读一本长篇巨著。

另一方面，长文本技术也在推动大模型更深层次的产业落地。在金融、司法、科研等精艰深的领域里，长文档摘要总结、阅读理解、问答等能力是其基本，也是亟待智能化升级的练兵场。

参考上一轮大模型厂商“卷”参数，大模型参数不是越大就越好，各家都在通过尽可能地扩大参数找到大模型性能最优的“临界点”。同理，作为共同决定模型效果的另一项指标——文本长度，也不是越长，模型效果就越好。

有研究已经证明，大模型在支持更长上下文输入与更好模型效果之间，并不能直接画上等号。模型能够处理的上下文长度不是真正的关键点，更重要的是模型对上下文内容的使用。但就目前而言，国内外对于文本长度的探索还远没有达到“临界点”状态。国内外大模型公司还在马不停蹄地突破，40万token或许也还只是开始。

未来，月之暗面的大模型服务Kimi Chat将加入火山引擎的火山方舟平台。火山引擎将与国内优秀的大模型服务商合作，提供全方位的功能和服务，包括模型训练、推理、评测和精调等，以帮助各行各业加速AI进程。

小编推荐：大模型服务Kimi Chat开始内测，将与火山引擎合作

本文由小熊AI网发布，不代表小熊AI网立场，转载联系作者并注明出处：https://www.xiaoxiong360.com/html/aimodel/1198.html

【大模型巡展】Kimi Chat：支持输入超过20万汉字的长文本

Kimi Chat的迅速起势

大模型公司为什么铆足劲攻克长文本技术？

相关推荐