零成本部署多人Gemini Pro AI 服务
我的 AI 模型使用历程可以概括为:ChatGPT → Gemini 1.5-pro → Deepseek-R1 → Gemini 2.5 pro。 我从 ChatGPT 诞生以来开始使用大模型,最后一个有印象的版本是 ChatGPT-4o。但是由于 GPT 网络经常连不上,我转而尝试了 Gemini 1.5 flash/pro 模型。其中,flash 模型极快的速度让我印象深刻,3 秒就能得到结果在一些简单场景下用起来很方便。而 pro 模型给我留下的印象则是,它的回答基本没有废话,它的思维链也非常有逻辑。 之后随着 Deepseek-R1 的发布,我又转向使用 Deepseek 模型了,主要是因为不必解决网络问题实在是方便,再加上它的性能已经能满足我大部分的需求。直到 1 个多月前,我开始使用 gemini 2.5 pro,它的效果让我感到惊艳。与 Deepseek-R1 相比,它带给我一种跨代式的提升感,于是成为我目前主要使用的模型之一。
p.s 感觉 google AI 模型最近风头比较盛,前段时间发布的 nano banana 画图模型刚火出圈过一次,现在又新发布了 gemini 3.0 和 nano banana2,再次引起不小热度(20251118)。
目前官方途径使用 gemini 2.5 pro 有 3 种方式:
- gemini 官网 - google gemini 单独的网站。我一开始使用的这个网站,后面发现它不仅有较少的免费使用次数限制,并且还不支持联网。 - 之前有过学生认证免费试用 12个月 Google One 会员,普通用户也能免费试用 1 个月。会员可以无限制使用 2.5 Pro 模型。
- Google AI studio - 也是 Google 的官方网站,不仅能第一时间使用 google 最新的模型,2.5 pro 居然还没有次数限制。 - 还可以使用 google 的 nano banana 模型画图
- Vertex AI Platform | Google Cloud - 基于谷歌 GCP(Google Cloud Platform) - 是谷歌的企业级方案 - Vertex AI studio 也可以通过网页使用
我是在 Gemini 网站的 1 个月 Google One 会员到期后开始研究如何继续低成本使用 gemini 模型,毕竟 gemini 会员 20 美元/月 实在是有点贵。最好是基于 API 的方式,可以按量付费。接着我了解到 google cloud 新会员有 300 美金试用金,可以使用 3 个月,于是就有了这篇博客。
本文介绍了一种搭建多人共享 Gemini AI 服务的方案。该方案利用 Google Cloud Platform (GCP) 的 300 美元试用金创建 Gemini API,并结合 Open WebUI 作为前端界面,实现多人访问。该方案使用了 litellm 作为 AI gateway。litellm 项目用于将各种来源的 AI 服务集中在一起管理。可以将一些不支持 openai 的服务转换成 openai API。 虽然 Google AI studio 原生支持 openai API,但是 litellm 也是有用的,可以解决一些小问题比如联网搜索不生效、显示思维链异常等。
虽然 300 美元试用金只有 3 个月,但是通过这套 setup,未来可以将许多免费 AI 额度(比如 Google AI studio)给集中起来使用,还是很有用的。
实现之后的一些收获感想
- open-webui 功能很成熟:有完整的用户管理、权限管理、还可以分享对话。基本可以满足小团队的集中化 AI 使用需求
- open-webui 的一些其它功能也有点超乎我的想象 - 对于本地部署 AI 模型也很合适,支持 ollama, comfyui 画图等 - 有 function,tool 等高级功能,支持社区插件,貌似可以实现很多扩展玩法
大纲
- 注册 google cloud - 绑定国外支付信用卡 - 注册时的疑问 - google cloud 的用法
- 创建 API
- open-webui 配置
- litellm 配置










