Gemini 2.0 发布:多模态能力再创新高

Google DeepMind 推出 Gemini 2.0,在图像理解、视频生成和代码执行方面取得突破性进展。

Google DeepMind 正式发布 Gemini 2.0,这是其最强大的多模态 AI 模型。

主要突破

图像理解

Gemini 2.0 在图像理解方面实现了重大突破,可以精确理解复杂图表、流程图甚至是手绘草图。

视频生成

新增的视频生成能力可以根据文本描述创建高质量视频内容,支持多种风格和格式。

代码执行

内置的代码执行环境让模型能够直接运行、调试和优化代码,大大提升了开发效率。

性能对比

能力Gemini 1.5Gemini 2.0
图像理解85%96%
视频生成不支持支持
代码执行基础高级

使用方式

通过 Google AI Studio 或 Vertex AI 即可体验 Gemini 2.0 的强大能力。

相关工具

Google AI StudioVertex AI