可匹敌GPT-4，谷歌发布AI大模型Gemini

在今年5月的开发者大会上，谷歌首次向公众揭示了其正在研发的AI大模型Gemini。经过7个月的努力，Gemini终于在12月7日正式发布。

据谷歌官方公众号消息，Gemini 1.0是谷歌迄今为止构建的最强大、最通用、最灵活的模型。这一消息引发了业界的广泛关注，因为Gemini的性能被认为遥遥领先于OpenAI的GPT-4。

谷歌针对不同场景发布了三种不同版本的Gemini：Gemini Ultra、Gemini Pro和Gemini Nano。

1）Gemini Ultra是规模最大且功能最强大的模型，适用于处理高度复杂的任务；

2）Gemini Pro则是适用于各种任务的最佳模型；

3）Gemini Nano则是为手机等设备设计的最高效模型。

谷歌将Gemini与GPT-4进行了比较，结果显示，除了HellaSwag数据集外，Gemini在其他基准测试中全面领先GPT-4，这一结果无疑证明了Gemini的强大性能。

在32项被大型语言模型（LLM）研究和开发中广泛使用的学术基准中，Gemini Ultra的性能有30项超过了目前最先进的水平。在MMLU（大规模多任务语言理解）测试中，Gemini Ultra以90.0%的得分成为第一个超过人类专家的模型。MMLU综合使用了数学、物理、历史、法律、医学和伦理等57个科目，用于测试世界知识和解决问题的能力。

在新的MMMU基准测试中，Gemini Ultra也取得了59.4%的成绩，该基准测试由横跨不同领域、需要仔细推理的多模态任务组成。

Gemini 1.0具有复杂多模态推理能力，可以同时识别并理解文本、图像、音频等信息，因此它能更好地理解具有细微差别的信息，回答与复杂主题相关的问题，尤其擅长解释数学和物理等复杂科目中的推理。

在编码能力上，第一代Gemini可以理解、解释和生成世界上最流行的编程语言（如Python、Java、C 和Go）的高质量代码。

谷歌表示，Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等，将在170多个国家和地区提供英语服务，并计划在未来扩展不同的模态，并支持新的语言和地区。

此外，谷歌还将在谷歌Pixel上使用Gemin，Pixel 8 Pro是首款搭载Gemini Nano的智能手机，将支持录音应用中的总结”等新功能，并在Gboard中推出智能回复”功能。

未来几个月，Gemini将应用于谷歌搜索、广告、Chrome和Duet AI。从12月13日开始，开发者和企业客户可通过Google AI Studio或Google Cloud Vertex AI中的Gemini API获取Gemini Pro。

对于Gemini，谷歌表示，这是AI发展过程中的一座重要里程碑，也标志着谷歌迈进新纪元的开始。

推出AI Core，谷歌正式向端侧AI大模型迈进

谷歌生成式图像动力学：可让静态图动起来

谷歌云预测：2024年AIGC将助长网络钓鱼活动

本文由小熊AI网发布，不代表小熊AI网立场，转载联系作者并注明出处：https://www.xiaoxiong360.com/html/info/2090.html

可匹敌GPT-4，谷歌发布AI大模型Gemini

相关推荐