【大模型巡展】Kimi Chat:支持输入超过20万汉字的长文本
大模型正在以“肉眼可见”的速度变得越来越长。长文本能力似乎成为了大模型厂商出手的新标配,Kimi Chat的出道引起了行业的关注。
Kimi Chat的迅速起势
目前,国内外已有OpenAI、Anthropic、Meta、月之暗面等一大批顶级的大模型技术公司、机构和团队将对上下文长度的拓展作为更新升级的重点。
国外,OpenAI经过三次升级,GPT-3.5上下文输入长度从4千增长至1.6万token,GPT-4从8千增长至3.2万token;OpenAI最强竞争对手Anthropic一次性将上下文长度打到了10万token;LongLLaMa将上下文的长度扩展到25.6万token,甚至更多。
这些大模型公司或机构都是资本市场热捧的“当红炸子鸡”。OpenAI自不必说,大模型Top级明星研究机构,斩获投资近120亿美元,拿走了美国生成式AI领域60%的融资。Anthropic近期风头正盛,接连被曝亚马逊、谷歌投资消息,前后相差不过几天,估值有望达到300亿美元,较3月份翻五番。
而成立仅半年的月之暗面出道即巅峰,一成立就迅速完成首轮融资,获得红杉、真格、今日资本、monolith等一线VC的押注,市场估值已超过3亿美元,而后,红杉孵化式支持,循序完成两轮共计近20亿元融资。
作为一款多语言能力强大的聊天机器人,Kimi Chat与目前市面上以英文为基础训练的大模型服务不同。在中文上,Kimi Chat具有显著的优势,能够支持约20万汉字的上下文,其性能优于Anthropic公司的Claude-100k和OpenAI公司的GPT-4-32k。
同时,火山引擎,作为字节跳动旗下的企业技术服务平台,与月之暗面进行了深度合作。火山引擎独家提供高稳定性和高性价比的AI训练和推理加速解决方案。此外,Kimi Chat即将入驻火山引擎大模型服务平台——火山方舟,双方将继续在大模型生态领域为企业和消费者提供更丰富的AI应用。
月之暗面是一家专注于探索通用人工智能边界的公司,致力于找到将算力转化为智能的最佳方式。火山引擎拥有国内领先的基础设施能力和算力储备,双方将进一步在AI算力基础设施和应用场景拓展等方面展开合作。
火山引擎智能算法负责人吴迪表示,火山引擎一直专注于技术、赋能合作伙伴以及价值共享的合作模式。月之暗面拥有国内先进的大模型研发团队,对AI技术有着深入的理解和应用经验。双方的合作将在多模型生态服务领域为企业和消费者提供更丰富的AI应用。
大模型公司为什么铆足劲攻克长文本技术?
表面上看是可输入的文本长度越来越长,阅读能力越来越强。若将抽象的token值量化,GPT-3.5的4000 token最多只能输入3000个英文单词或者2000个汉字,连一篇公众号文章都难以读完;3.2万token的GPT-4达到了阅读一篇短篇小说的程度;10万token的Claude可输入约7.5万个单词,仅22秒就可以阅读完一本《了不起的盖茨比》;40万token的Kimi Chat支持输入20万汉字,阅读一本长篇巨著。
另一方面,长文本技术也在推动大模型更深层次的产业落地。在金融、司法、科研等精艰深的领域里,长文档摘要总结、阅读理解、问答等能力是其基本,也是亟待智能化升级的练兵场。
参考上一轮大模型厂商“卷”参数,大模型参数不是越大就越好,各家都在通过尽可能地扩大参数找到大模型性能最优的“临界点”。同理,作为共同决定模型效果的另一项指标——文本长度,也不是越长,模型效果就越好。
有研究已经证明,大模型在支持更长上下文输入与更好模型效果之间,并不能直接画上等号。模型能够处理的上下文长度不是真正的关键点,更重要的是模型对上下文内容的使用。但就目前而言,国内外对于文本长度的探索还远没有达到“临界点”状态。国内外大模型公司还在马不停蹄地突破,40万token或许也还只是开始。
未来,月之暗面的大模型服务Kimi Chat将加入火山引擎的火山方舟平台。火山引擎将与国内优秀的大模型服务商合作,提供全方位的功能和服务,包括模型训练、推理、评测和精调等,以帮助各行各业加速AI进程。
小编推荐:大模型服务Kimi Chat开始内测,将与火山引擎合作
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/aimodel/1198.html