返回列表 // BACK
2026-05-31 | AI & DevOps
INDEX ID: LOG-011

多源聚合:基于 New-API 快速构建自用大模型中转网关与分发教程

为了将零碎的免费 AI API 额度(如 Google Gemini、硅基流动、GitHub Models 等)统一包装并安全分发,搭建一个私人的大模型中转网关是极佳的选择。New-API 是目前最流行的大模型 Token 分发与额度中转管理框架,能将各种非标准或专有的大模型接口一并转换为标准的 OpenAI 接口格式。这意味着,无论底层接入了多少种大模型,我们在第三方客户端(如 Chatbox、LobeChat、Next Chat 等)中,只需配置这一个统一的域名和密钥即可无缝调用所有模型。

在部署 New-API 时,考虑到个人服务器的内存资源(通常为 1GB 甚至更低),我们应当摒弃繁重的 MySQL,采用极轻量级的 SQLite 单机本地数据存储模式。通过 Docker Compose 编排容器,并在配置文件中限制其内存上限。我们在 `docker-compose.yml` 中配置 New-API 容器运行,并加入 `deploy.resources.limits.memory: 200M` 做出物理级安全熔断限制。实测在 SQLite 模式下,New-API 启动后的静态物理内存仅消耗 16MiB 左右,完美兼顾了高并发处理能力与极致的系统资源消耗,是一套极为优雅的微服务部署方案。

当 New-API 容器在宿主机的 8080 端口(例如宿主机 `8080:3000`)映射启动后,我们需要在服务器防火墙上予以放行。以 Ubuntu 系统为例,可运行命令 `sudo iptables -I INPUT -p tcp --dport 8080 -j ACCEPT` 并在云控制台安全组中放行 8080 端口。此时在浏览器中输入 `http://服务器IP:8080` 即可秒级推开漂亮的网关大门。初次登录使用系统预置的管理员默认账号 `root` 及初始密码 `123456`。进入后台后,必须第一时间在【个人设置】中修改默认密码,并在【系统设置】通用选项中开启 “自用模式 (Self-use Mode)”,以一键简化计费与标价拦截,畅享纯净的自用环境。

在渠道管理后台,我们可以非常便捷地接入全球主流大模型。录入 Google Gemini 免费 API 密钥时,选择渠道类型为 `Google Gemini`,在密钥框填入从 Google AI Studio 获取的 Key(特别提示:复制 Key 时务必小心,防止多复制了末尾的换行符导致验签失败)。针对 GitHub 提供的免费大模型 API,选择渠道类型为 `OpenAI`,填入 GitHub 申请的个人访问令牌(PAT Token)。为了避免 New-API 默认测试按钮请求 `gpt-3.5-turbo` 导致 GitHub 渠道报错 404,在渠道的“模型重定向”中需配置映射 `{"gpt-3.5-turbo": "gpt-4o-mini"}` 并在弹窗中点击“添加后提交”。配置完毕后,点击测试即可完美绿灯通行!

渠道对接完成后,最后一步是生成我们自己消费的 API 密钥。进入网关的【令牌】管理页面,点击【添加新的令牌】,将其额度设为无限(或分配指定数额),随后复制系统生成的以 `sk-` 开头的专属令牌。打开您的客户端(例如 Chatbox 等工具),将 API 域名设置为 `http://您的服务器IP:8080/v1`,并将 API 密钥框粘贴入刚才生成的 `sk-` Token。此时在客户端中便能畅快地与 `gemini-1.5-flash` 或 `gpt-4o-mini` 等全球顶级大模型无间断对话,顺利完成了多渠道高可用大模型中转网关的完整搭建!