Gemini 1.5-谷歌发布的新一代AI大模型

Gemini 1.5是谷歌发布的全新AI大模型,除了性能显著增强,还在长上下文理解方面取得突破,它可以处理多达100万token,实现了迄今为止任何大型基础模型中最长的上下文窗口。甚至能仅靠提示词学会一门训练数据中没有的新语言。

ade31a2f799bbfc453c0ba18d7431bcbGemini 1.5主要功能特点

谷歌表示相比较前代产品 Gemini 1.0 Ultra,1.5 新模型在多个方面都取得了长足进步,能够更高效、更长时间地处理信息。

  • 性能提升:Gemini 1.5 在多个维度上展示了显著的性能提升,尤其是在长上下文理解方面。
  • 长上下文窗口:模型支持长达 100 万 token 的上下文窗口,这是迄今为止任何大规模基础模型中最长的上下文窗口。
  • 多模态处理:Gemini 1.5 能够处理和理解视频、音频、文本和代码等多种数据模态。
  • 高效架构:采用 Mixture-of-Experts (MoE) 架构,提高了模型的训练和推理效率。
  • 长上下文理解:能够处理大量信息,如 1 小时视频、11 小时音频、超过 30,000 行代码或超过 700,000 个单词。
  • 复杂推理:能够分析、分类和总结大量内容,例如 Apollo 11 任务的 402 页记录。
  • 跨模态理解与推理:能够对视频内容进行高级理解和推理,例如分析 Buster Keaton 的 44 分钟无声电影。
  • 代码问题解决:能够处理和推理超过 100,000 行代码,提供有用的修改建议和解释。
  • 增强性能:在文本、代码、图像、音频和视频评估中,1.5 Pro 在 87% 的基准测试中优于 1.0 Pro,与 1.0 Ultra 的性能相当。

eb790bd833aa4fb386a5a808a6f94b86如何使用Gemini 1.5?

开发者和企业客户现在可以通过AI Studio and in Vertex AI申请试用1.5 Pro,其中有12.8万token上下文窗口,稍后可扩展到100万token。

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享