Gemini 3.1 Flash Lite上线超低成本推理

（AI 资源之家讯）5 月 9 日，谷歌 Gemini 3.1 Flash Lite 正式上线 OpenRouter 平台。该模型支持文本、图像、视频、音频和 PDF 多模态输入，上下文窗口达 100 万 Token，输入价格仅为 0.25 美元每百万 Token，输出 1.50 美元每百万 Token，以极致性价比刷新了多模态大模型的成本底线。

## 100 万上下文加多模态

Gemini 3.1 Flash Lite 的核心卖点是 100 万 Token 的超长上下文加全模态支持。这意味着用户可以一次性输入数百页文档、长视频或大量图片，模型能完整理解并处理。在需要跨文档比对、长视频分析和大规模数据提取的场景中，这一能力几乎无可替代。此前，具备百万级上下文的模型通常价格昂贵，Flash Lite 以极低成本提供了同等级别的能力。

## 价格颠覆行业预期

0.25 美元每百万 Token 的输入价格，在多模态大模型中几乎是白菜价。作为对比，GPT-5.5 Instant 的输入价格为 2.5 美元每百万 Token，Claude Sonnet 4.6 为 3 美元。Flash Lite 的价格仅为竞品的十分之一左右，这让大量原本因成本问题无法使用多模态大模型的场景成为可能——比如实时的视频监控分析、大规模文档的自动化处理等。

## 对竞争格局的冲击

Flash Lite 的定价策略对竞争对手构成了直接压力。在 AI 推理成本持续下降的大趋势下，谷歌此次的激进定价意在快速抢占开发者市场份额。OpenRouter 上的模型调用数据显示，Gemini 系列的 Token 调用量近期已跃居前列，Flash Lite 的加入将进一步巩固谷歌在开发者生态中的地位。

正文完