(AI 资源之家讯)5 月 9 日,谷歌 Gemini 3.1 Flash Lite 正式上线 OpenRouter 平台。该模型支持文本、图像、视频、音频和 PDF 多模态输入,上下文窗口达 100 万 Token,输入价格仅为 0.25 美元每百万 Token,输出 1.50 美元每百万 Token,以极致性价比刷新了多模态大模型的成本底线。
## 100 万上下文加多模态
Gemini 3.1 Flash Lite 的核心卖点是 100 万 Token 的超长上下文加全模态支持。这意味着用户可以一次性输入数百页文档、长视频或大量图片,模型能完整理解并处理。在需要跨文档比对、长视频分析和大规模数据提取的场景中,这一能力几乎无可替代。此前,具备百万级上下文的模型通常价格昂贵,Flash Lite 以极低成本提供了同等级别的能力。
## 价格颠覆行业预期
0.25 美元每百万 Token 的输入价格,在多模态大模型中几乎是白菜价。作为对比,GPT-5.5 Instant 的输入价格为 2.5 美元每百万 Token,Claude Sonnet 4.6 为 3 美元。Flash Lite 的价格仅为竞品的十分之一左右,这让大量原本因成本问题无法使用多模态大模型的场景成为可能——比如实时的视频监控分析、大规模文档的自动化处理等。
## 对竞争格局的冲击
Flash Lite 的定价策略对竞争对手构成了直接压力。在 AI 推理成本持续下降的大趋势下,谷歌此次的激进定价意在快速抢占开发者市场份额。OpenRouter 上的模型调用数据显示,Gemini 系列的 Token 调用量近期已跃居前列,Flash Lite 的加入将进一步巩固谷歌在开发者生态中的地位。