接入AI网关Higress实现多个AI大模型的无缝切换，比如当deepseek调用失败，可以降级调用qwq-32b

近期，通义千问发布了一款全新的推理模型 QwQ-32B。在各类基准测试中，这个拥有 320 亿参数的模型展现出了与 DeepSeek-R1（6710 亿参数）相当的性能。这意味着：

对于个人用户而言，QwQ-32B 能够直接在本地运行，且对设备的要求更低，适合在更小的移动设备上使用。
对于企业用户来说，调用推理大模型 API 的成本可以进一步降低，最高可减少 90% 的费用。

在实际应用中，无缝切换多个大模型的需求日益凸显。例如，企业可能需要同时对接多个大模型，以满足不同业务场景的需求；当单个模型出现稳定性问题时，能够迅速回退到另一个模型，确保业务的连续性和稳定性；在 Multi Agent 场景下，一个复杂任务可能需要调用多个模型来协同完成。Higress AI 网关提供了一个强大的解决方案，支持多模型服务，并具备消费者鉴权、模型自动切换等高级功能。

本文将为您提供一份详细的教程，指导您如何使用 Higress AI 网关在 DeepSeek-R1 和 QwQ-32B 大模型之间实现无缝切换。通过以下步骤，您可以轻松完成这一目标：

1. 环境准备

plain

# 一键安装Higress（需Docker环境）
curl -sS https://higress.cn/ai-gateway/install.sh | bash

安装完成后访问控制台http://localhost:8001，完成初始化配置。

注意：默认脚本是监听的127.0.0.1，如果想通过windows本地机器访问虚拟机中的higress，将ip替换为0.0.0.0

访问Higress控制台，首次访问需要设置管理员账号密码

成功登录之后，会进入Higress控制台界面

2.模型接入配置

在 Higress 控制台中，分别配置 DeepSeek-R1 和 QwQ-32B 的接入方式。对于厂商模型，选择相应的厂商名进行配置；对于自建模型，使用 OpenAI 兼容模式，填入 baseURL 即可。

接下来，创建路由规则，按照匹配模型名称的方式转发给两个不同的模型。

例如，创建一个名为 aliyun 的路由，匹配模型名称精确匹配 qwq-32b，转发给阿里云百炼平台的 QwQ-32B 模型服务；

创建另一个名为 deepseek 的路由，匹配模型名称精确匹配 deepseek-，转发给 DeepSeek平台服务。

3.测试示例

统一访问Higress网关地址即可，可以通过设置model进行模型的切换

plain

 base_url="http://Higress网关地址/v1"

示例

plain

curl 'http://192.168.65.185:8080/v1/chat/completions'       -H 'Content-Type: application/json'       -d '{
        "model": "qwen-turbo",
        "messages": [
          {
            "role": "user",
            "content": "你是谁!"
          }
        ]
      }'

plain

curl 'http://192.168.65.185:8080/v1/chat/completions'       -H 'Content-Type: application/json'       -d '{
        "model": "deepseek-chat",
        "messages": [
          {
            "role": "user",
            "content": "你是谁!"
          }
        ]
      }'

higress添加消费者认证后，测试

plain

curl 'http://192.168.65.185:8080/v1/chat/completions'       -H 'Content-Type: application/json'   -H 'Authorization: Bearer cbfda275-56ff-4d45-a984-6482502e2f25'    -d '{
        "model": "qwen-max",
        "messages": [
          {
            "role": "user",
            "content": "你是谁"
          }
        ]
      }'

4.Spring Ai整合Higress实现多模型无缝切换

1）引入依赖

在项目中接入具有 OpenAI API 规范的大模型时，只需要引入 spring-ai-openai-spring-boot-starter 即可。

plain

<dependency>
            <groupId>org.springframework.ai</groupId>
            <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
        </dependency>

2）配置 application.yml

plain

spring:                                                            
  application:                                                     
    name: higress-demo                                             
                                                                   
  ai:                                                              
    openai:                                                        
      api-key: cbfda275-56ff-4d45-a984-6482502e2f25   #Higress的消费者认证key              
      base-url: http://192.168.65.185:8080/v1    #Higress的网关地址                  
      chat:                                                        
        options:                                                   
          model: deepseek-chat

使用ChatModel 实现对话

plain

@RestController
public class ChatModelController {
  private final ChatModel chatModel;

  public ChatModelController(ChatModel chatModel) {
    this.chatModel = chatModel;
  }

  @RequestMapping("/chat")
  public String chat(String input) {
    ChatResponse response = chatModel.call(new Prompt(input));
    return response.getResult().getOutput().toString();
  }
}

4）测试

更新: 2025-04-07 17:02:39
原文: https://www.yuque.com/tulingzhouyu/db22bv/lca70bns0cpw7sgl

大厂真题

京东面试真题

美团面试真题

阿里面试真题

最全面经

面试指导与简历模板

项目亮点和难点

TCP和UDP协议的区别？

CAP原则和BASE原则怎么理解

说下paxos算法

说下Raft算法

基础篇

SpringAOPandAspectJAOP有什么区别？

高级篇

BeanFactory和FactoryBean有什么区别？

基础篇

高级篇

BIO、NIO、AIO有什么区别

基础

高级

新SSM

Spring6资料-徐庶

Spring6

接入AI网关Higress实现多个AI大模型的无缝切换，比如当deepseek调用失败，可以降级调用qwq-32b

1. 环境准备

2.模型接入配置

3.测试示例

4.Spring Ai整合Higress实现多模型无缝切换

京东面试真题

美团面试真题

阿里面试真题

SpringAOPandAspectJAOP有什么区别？

BeanFactory和FactoryBean有什么区别？

Spring6资料-徐庶

Spring6

接入AI网关Higress实现多个AI大模型的无缝切换，比如当deepseek调用失败，可以降级调用qwq-32b ​

1. 环境准备 ​

2.模型接入配置 ​

3.测试示例 ​

4.Spring Ai整合Higress实现多模型无缝切换 ​

接入AI网关Higress实现多个AI大模型的无缝切换，比如当deepseek调用失败，可以降级调用qwq-32b

1. 环境准备

2.模型接入配置

3.测试示例

4.Spring Ai整合Higress实现多模型无缝切换