Appearance
接入AI网关Higress实现多个AI大模型的无缝切换,比如当deepseek调用失败,可以降级调用qwq-32b
近期,通义千问发布了一款全新的推理模型 QwQ-32B。在各类基准测试中,这个拥有 320 亿参数的模型展现出了与 DeepSeek-R1(6710 亿参数)相当的性能。这意味着:
- 对于个人用户而言,QwQ-32B 能够直接在本地运行,且对设备的要求更低,适合在更小的移动设备上使用。
- 对于企业用户来说,调用推理大模型 API 的成本可以进一步降低,最高可减少 90% 的费用。
在实际应用中,无缝切换多个大模型的需求日益凸显。例如,企业可能需要同时对接多个大模型,以满足不同业务场景的需求;当单个模型出现稳定性问题时,能够迅速回退到另一个模型,确保业务的连续性和稳定性;在 Multi Agent 场景下,一个复杂任务可能需要调用多个模型来协同完成。Higress AI 网关提供了一个强大的解决方案,支持多模型服务,并具备消费者鉴权、模型自动切换等高级功能。

本文将为您提供一份详细的教程,指导您如何使用 Higress AI 网关在 DeepSeek-R1 和 QwQ-32B 大模型之间实现无缝切换。通过以下步骤,您可以轻松完成这一目标:
1. 环境准备
plain
# 一键安装Higress(需Docker环境)
curl -sS https://higress.cn/ai-gateway/install.sh | bash安装完成后访问控制台http://localhost:8001,完成初始化配置。


注意:默认脚本是监听的127.0.0.1,如果想通过windows本地机器访问虚拟机中的higress,将ip替换为0.0.0.0

访问Higress控制台,首次访问需要设置管理员账号密码

成功登录之后,会进入Higress控制台界面

2.模型接入配置
在 Higress 控制台中,分别配置 DeepSeek-R1 和 QwQ-32B 的接入方式。对于厂商模型,选择相应的厂商名进行配置;对于自建模型,使用 OpenAI 兼容模式,填入 baseURL 即可。

接下来,创建路由规则,按照匹配模型名称的方式转发给两个不同的模型。
例如,创建一个名为 aliyun 的路由,匹配模型名称精确匹配 qwq-32b,转发给阿里云百炼平台的 QwQ-32B 模型服务;

创建另一个名为 deepseek 的路由,匹配模型名称精确匹配 deepseek-,转发给 DeepSeek平台服务。

3.测试示例
统一访问Higress网关地址即可,可以通过设置model进行模型的切换
plain
base_url="http://Higress网关地址/v1"示例
plain
curl 'http://192.168.65.185:8080/v1/chat/completions' -H 'Content-Type: application/json' -d '{
"model": "qwen-turbo",
"messages": [
{
"role": "user",
"content": "你是谁!"
}
]
}'
plain
curl 'http://192.168.65.185:8080/v1/chat/completions' -H 'Content-Type: application/json' -d '{
"model": "deepseek-chat",
"messages": [
{
"role": "user",
"content": "你是谁!"
}
]
}'
higress添加消费者认证后,测试
plain
curl 'http://192.168.65.185:8080/v1/chat/completions' -H 'Content-Type: application/json' -H 'Authorization: Bearer cbfda275-56ff-4d45-a984-6482502e2f25' -d '{
"model": "qwen-max",
"messages": [
{
"role": "user",
"content": "你是谁"
}
]
}'
4.Spring Ai整合Higress实现多模型无缝切换
1)引入依赖
在项目中接入具有 OpenAI API 规范的大模型时,只需要引入 spring-ai-openai-spring-boot-starter 即可。
plain
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-openai-spring-boot-starter</artifactId>
</dependency>2)配置 application.yml
plain
spring:
application:
name: higress-demo
ai:
openai:
api-key: cbfda275-56ff-4d45-a984-6482502e2f25 #Higress的消费者认证key
base-url: http://192.168.65.185:8080/v1 #Higress的网关地址
chat:
options:
model: deepseek-chat- 使用ChatModel 实现对话
plain
@RestController
public class ChatModelController {
private final ChatModel chatModel;
public ChatModelController(ChatModel chatModel) {
this.chatModel = chatModel;
}
@RequestMapping("/chat")
public String chat(String input) {
ChatResponse response = chatModel.call(new Prompt(input));
return response.getResult().getOutput().toString();
}
}4)测试

更新: 2025-04-07 17:02:39
原文: https://www.yuque.com/tulingzhouyu/db22bv/lca70bns0cpw7sgl