Google DeepMind 正式发布 Gemini 2.0,这是其最强大的多模态 AI 模型。
主要突破
图像理解
Gemini 2.0 在图像理解方面实现了重大突破,可以精确理解复杂图表、流程图甚至是手绘草图。
视频生成
新增的视频生成能力可以根据文本描述创建高质量视频内容,支持多种风格和格式。
代码执行
内置的代码执行环境让模型能够直接运行、调试和优化代码,大大提升了开发效率。
性能对比
| 能力 | Gemini 1.5 | Gemini 2.0 |
|---|---|---|
| 图像理解 | 85% | 96% |
| 视频生成 | 不支持 | 支持 |
| 代码执行 | 基础 | 高级 |
使用方式
通过 Google AI Studio 或 Vertex AI 即可体验 Gemini 2.0 的强大能力。