多源聚合：基于 New-API 快速构建自用大模型中转网关与分发教程

为了将零碎的免费 AI API 额度（如 Google Gemini、硅基流动、GitHub Models 等）统一包装并安全分发，搭建一个私人的大模型中转网关是极佳的选择。New-API 是目前最流行的大模型 Token 分发与额度中转管理框架，能将各种非标准或专有的大模型接口一并转换为标准的 OpenAI 接口格式。这意味着，无论底层接入了多少种大模型，我们在第三方客户端（如 Chatbox、LobeChat、Next Chat 等）中，只需配置这一个统一的域名和密钥即可无缝调用所有模型。

在部署 New-API 时，考虑到个人服务器的内存资源（通常为 1GB 甚至更低），我们应当摒弃繁重的 MySQL，采用极轻量级的 SQLite 单机本地数据存储模式。通过 Docker Compose 编排容器，并在配置文件中限制其内存上限。我们在 `docker-compose.yml` 中配置 New-API 容器运行，并加入 `deploy.resources.limits.memory: 200M` 做出物理级安全熔断限制。实测在 SQLite 模式下，New-API 启动后的静态物理内存仅消耗 16MiB 左右，完美兼顾了高并发处理能力与极致的系统资源消耗，是一套极为优雅的微服务部署方案。

当 New-API 容器在宿主机的 8080 端口（例如宿主机 `8080:3000`）映射启动后，我们需要在服务器防火墙上予以放行。以 Ubuntu 系统为例，可运行命令 `sudo iptables -I INPUT -p tcp --dport 8080 -j ACCEPT` 并在云控制台安全组中放行 8080 端口。此时在浏览器中输入 `http://服务器IP:8080` 即可秒级推开漂亮的网关大门。初次登录使用系统预置的管理员默认账号 `root` 及初始密码 `123456`。进入后台后，必须第一时间在【个人设置】中修改默认密码，并在【系统设置】通用选项中开启 “自用模式 (Self-use Mode)”，以一键简化计费与标价拦截，畅享纯净的自用环境。

在渠道管理后台，我们可以非常便捷地接入全球主流大模型。录入 Google Gemini 免费 API 密钥时，选择渠道类型为 `Google Gemini`，在密钥框填入从 Google AI Studio 获取的 Key（特别提示：复制 Key 时务必小心，防止多复制了末尾的换行符导致验签失败）。针对 GitHub 提供的免费大模型 API，选择渠道类型为 `OpenAI`，填入 GitHub 申请的个人访问令牌（PAT Token）。为了避免 New-API 默认测试按钮请求 `gpt-3.5-turbo` 导致 GitHub 渠道报错 404，在渠道的“模型重定向”中需配置映射 `{"gpt-3.5-turbo": "gpt-4o-mini"}` 并在弹窗中点击“添加后提交”。配置完毕后，点击测试即可完美绿灯通行！

渠道对接完成后，最后一步是生成我们自己消费的 API 密钥。进入网关的【令牌】管理页面，点击【添加新的令牌】，将其额度设为无限（或分配指定数额），随后复制系统生成的以 `sk-` 开头的专属令牌。打开您的客户端（例如 Chatbox 等工具），将 API 域名设置为 `http://您的服务器IP:8080/v1`，并将 API 密钥框粘贴入刚才生成的 `sk-` Token。此时在客户端中便能畅快地与 `gemini-1.5-flash` 或 `gpt-4o-mini` 等全球顶级大模型无间断对话，顺利完成了多渠道高可用大模型中转网关的完整搭建！