Gemini 1.5是谷歌发布的全新AI大模型,除了性能显著增强,还在长上下文理解方面取得突破,它可以处理多达100万token,实现了迄今为止任何大型基础模型中最长的上下文窗口。甚至能仅靠提示词学会一门训练数据中没有的新语言。
Gemini 1.5主要功能特点
谷歌表示相比较前代产品 Gemini 1.0 Ultra,1.5 新模型在多个方面都取得了长足进步,能够更高效、更长时间地处理信息。
- 性能提升:Gemini 1.5 在多个维度上展示了显著的性能提升,尤其是在长上下文理解方面。
- 长上下文窗口:模型支持长达 100 万 token 的上下文窗口,这是迄今为止任何大规模基础模型中最长的上下文窗口。
- 多模态处理:Gemini 1.5 能够处理和理解视频、音频、文本和代码等多种数据模态。
- 高效架构:采用 Mixture-of-Experts (MoE) 架构,提高了模型的训练和推理效率。
- 长上下文理解:能够处理大量信息,如 1 小时视频、11 小时音频、超过 30,000 行代码或超过 700,000 个单词。
- 复杂推理:能够分析、分类和总结大量内容,例如 Apollo 11 任务的 402 页记录。
- 跨模态理解与推理:能够对视频内容进行高级理解和推理,例如分析 Buster Keaton 的 44 分钟无声电影。
- 代码问题解决:能够处理和推理超过 100,000 行代码,提供有用的修改建议和解释。
- 增强性能:在文本、代码、图像、音频和视频评估中,1.5 Pro 在 87% 的基准测试中优于 1.0 Pro,与 1.0 Ultra 的性能相当。
如何使用Gemini 1.5?
开发者和企业客户现在可以通过AI Studio and in Vertex AI申请试用1.5 Pro,其中有12.8万token上下文窗口,稍后可扩展到100万token。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END