谷歌近日开源了其AI编程工具Gemini CLI,为开发者提供前所未有的免费服务。该工具基于Gemini 2.5 Pro模型,支持100万token的超长上下文窗口,每分钟允许60次请求,每日上限达1000次,被业界誉为"最慷慨"的试用方案。这一举措被视为谷歌在终端AI领域的重要布局,目前项目已在GitHub获得18k星标,直接对标OpenAI的Codex CLI和Anthropic的Claude Code等竞品。
Gemini CLI的核心优势在于其强大的多场景应用能力。它不仅支持代码编写、错误修复等开发任务,还能通过自然语言指令完成视频生成、研究报告撰写等通用工作。工具深度集成VS Code环境,开发者可通过聊天窗口直接调用AI完成测试用例编写、功能开发等复杂工作流。谷歌高级工程师Taylor Mullen强调,该工具将"用自然语言与电脑对话"变为现实,产品总监Ryan J. Salva更预言这将成为未来十年的工作范式。技术层面,Gemini CLI与Gemini Code Assist同源,支持跨平台协作,其开放的API还能连接Veo 3模型、Deep Research智能体等谷歌AI生态,展现出远超编程辅助的通用人工智能潜力。
2. 谷歌发布Gemini Robotics On-Device,实现机器人AI模型本地化运行
谷歌DeepMind近日推出全新机器人端侧模型Gemini Robotics On-Device,这是其首个可直接部署在机器人上的视觉-语言-动作(VLA)模型,基于多模态推理模型Gemini 2.0开发。该模型由加州大学伯克利分校、多伦多大学等机构联合支持,其配套的MuJoCo Playground模拟器刚获得机器人科学与系统会议杰出论文奖,标志着机器人智能研究的重要进展。