雷霆(Thunder Router)项目内容总结

 

一、产品定位

 

雷霆并非全新大模型,而是基于Python FastAPI开发的AI智能路由中间层,核心作用是接收用户请求后自动匹配、转发至适配的DeepSeek系列底层模型,解决用户手动挑选模型的选择困难,支持SSE流式与普通请求转发。

 

二、核心工作流程(三步机制)

 

1. 关键词意图检测

依靠预设关键词字典无模型调用、零延迟识别用户需求,划分5类意图:code代码、math数学运算、creative创意写作、reasoning逻辑深度分析、general日常闲聊。

2. 优先级模型匹配

按意图预设候选模型队列:

- 代码:优先DeepSeek V3,失败切换DeepSeek Coder;

- 数学/深度推理:优先DeepSeek R1推理模型,降级V3;

- 创意、闲聊:固定使用DeepSeek V3。

3. 自动故障转移

遍历候选模型依次转发,遇超时、限流等异常自动切换下一个;全部模型失效则返回502错误,返回结果会附加路由标记字段,记录识别意图与实际调用模型。

 

三、技术架构与优势

 

1. 技术栈:Python FastAPI、httpx异步转发,意图识别纯关键字匹配,响应速度毫秒级;配套重试、API密钥轮转容错机制。

2. 价值:不同场景模型各有专长,单一模型无法兼顾所有需求,雷霆提供统一访问入口,省去人工切换模型操作,兼顾效果、速度与成本。

 

四、实测效果

 

部署于alexskrillex.com,用户选择“雷霆”模型即可自动路由:闲聊分发V3、代码需求分发V3、数学极限类计算分发R1,自动输出对应专业回复。

 

五、后续迭代规划

 

1. 扩充模型池,接入通义千问、文心一言等国产大模型;

2. 新增QPS负载均衡、多模型A/B自动择优、用户自定义路由规则功能。

 

六、使用方式

 

访问官网alexskrillex.com注册,模型列表选择「雷霆」即可免费体验,项目核心理念:用户专注提问,路由自动分配适配模型。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐