Qwen-Ranker Pro在Ubuntu20.04上的安装与配置全攻略

周立-ric

217人浏览 · 2026-02-13 00:29:30

周立-ric · 2026-02-13 00:29:30 发布

Qwen-Ranker Pro在Ubuntu20.04上的安装与配置全攻略

如果你正在构建一个智能搜索系统，或者想让你的RAG应用返回的结果更精准，那么“精排”这个环节你一定不陌生。简单来说，它就像一个严格的面试官，从海量候选人（初步检索结果）中，精准地挑出最符合要求的那几位。

今天要聊的Qwen-Ranker Pro，就是通义千问团队推出的一款专业级精排模型。它就像一个语义理解专家，能深入分析你的查询和候选文档之间的深层关联，给出一个精确的匹配分数，帮你把最相关的结果排到最前面。

不过，好东西往往需要一点“动手能力”。网上的教程要么太零散，要么环境要求苛刻，让不少朋友在第一步“安装部署”上就卡住了。特别是对于还在使用Ubuntu 20.04 LTS这个经典、稳定版本的用户来说，找到一份靠谱的指南并不容易。

这篇文章，就是为你准备的。我会手把手带你，在Ubuntu 20.04系统上，从零开始完成Qwen-Ranker Pro的安装、环境配置到最终测试验证。整个过程力求清晰，即便你是刚接触Linux的新手，跟着步骤走也能顺利完成。我们这就开始。

1. 出发前的准备：理清思路与检查环境

在动手安装之前，我们先花几分钟时间，搞清楚我们要做什么，以及确保你的系统已经准备好了。这能避免很多中途出现的“莫名其妙”的错误。

Qwen-Ranker Pro本质上是一个基于深度学习的模型服务。要让它在你的Ubuntu服务器上跑起来，我们需要做三件事：

准备它的“家”：安装Python、PyTorch等基础运行环境。
把它“请进来”：通过pip安装qwen-ranker-pro这个Python包。
让它“能工作”：处理可能缺失的系统依赖，并进行简单的测试，验证它是否安装成功。

你的Ubuntu 20.04系统最好是一个刚安装好的，或者比较“干净”的环境，这样可以减少软件包冲突。首先，打开你的终端，让我们检查一下系统版本并更新软件源，这是所有Linux操作的好习惯。

# 1. 确认系统版本
lsb_release -a

# 2. 更新软件包列表，获取最新的版本信息
sudo apt update

# 3. 升级已有的软件包到最新版本（可选，但推荐）
sudo apt upgrade -y

接下来，安装一些我们后续肯定会用到的工具，比如用于管理Python版本的python3-pip和venv，以及编译可能需要的build-essential。

sudo apt install -y python3-pip python3-venv build-essential

2. 构建专属工作区：创建Python虚拟环境

我强烈建议你为Qwen-Ranker Pro创建一个独立的Python虚拟环境。这就像给它一个单独的卧室，它在这个房间里怎么布置（安装依赖）都不会影响到客厅（系统全局环境）和其他房间（其他项目）。管理起来方便，出了问题也容易清理。

# 1. 创建一个你喜欢的项目目录，并进入
mkdir ~/qwen-ranker-pro && cd ~/qwen-ranker-pro

# 2. 创建一个名为‘venv’的Python虚拟环境
python3 -m venv venv

# 3. 激活这个虚拟环境
# 激活后，你的命令行提示符前面通常会显示 (venv)
source venv/bin/activate

激活后，你的pip和python命令都会指向这个虚拟环境内部的版本。你可以通过以下命令确认：

which python
which pip
# 输出路径应该包含你项目目录下的‘venv’文件夹

3. 安装核心：Qwen-Ranker Pro与PyTorch

现在来到了核心步骤。我们将安装qwen-ranker-pro包以及它最重要的依赖——PyTorch。

请注意：PyTorch的安装命令需要根据你的硬件（是否有CUDA显卡）来选择。下面的命令是仅限CPU的版本，适合绝大多数没有独立显卡的服务器或虚拟机。如果你的机器有NVIDIA显卡并已安装好CUDA，请前往PyTorch官网获取对应的安装命令。

# 1. 首先安装PyTorch（CPU版本）及相关依赖
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

# 2. 安装Qwen-Ranker Pro
# 这个过程会自动安装transformers、sentencepiece等必要的库
pip install qwen-ranker-pro

安装过程可能会持续几分钟，取决于你的网络速度。如果一切顺利，你会看到所有包成功安装的提示。

4. 解决潜在的“拦路虎”：系统依赖问题

在Ubuntu 20.04上，你可能会遇到一个常见问题：运行模型时，提示缺少libGL.so.1或libgthread-2.0.so.0等库。这是因为一些底层的图像或系统库没有安装。别担心，我们可以通过安装一些系统包来解决。

# 安装常见的系统依赖库，这些库是很多AI/机器学习软件的基础
sudo apt install -y libgl1-mesa-glx libglib2.0-0 libsm6 libxrender1 libxext6 libgthread-2.0-0

安装完这些，就能解决绝大多数因系统环境缺失导致的导入错误。

5. 激动人心的时刻：验证安装是否成功

环境装好了，包也安上了，现在让我们写一个最简单的测试脚本，看看Qwen-Ranker Pro能不能正常工作。

在你的项目目录下（~/qwen-ranker-pro），创建一个名为test_installation.py的文件：

# test_installation.py
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

# 尝试加载Qwen-Ranker Pro模型和分词器
# 这里使用一个较小的、公开的模型进行检查，原理相同
model_name = "Alibaba-NLP/gte-multilingual-reranker-base" # 用于测试的类似精排模型
print(f"正在尝试加载模型: {model_name}...")

try:
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForSequenceClassification.from_pretrained(model_name, trust_remote_code=True)
    print("✓ 模型和分词器加载成功！")

    # 准备一个简单的测试用例
    pairs = [
        ["中国的首都在哪儿", "北京"],
        ["What is the capital of China?", "Beijing"]
    ]
    print(f"测试句子对: {pairs}")

    # 进行推理
    with torch.no_grad():
        inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
        scores = model(**inputs, return_dict=True).logits.view(-1, ).float()
        print(f"✓ 推理成功！相关性分数: {scores.tolist()}")

except Exception as e:
    print(f"✗ 加载或推理过程中出现错误: {e}")
    import traceback
    traceback.print_exc()

然后运行这个脚本：

python test_installation.py

如果看到“模型和分词器加载成功！”和“推理成功！”的输出，并且打印出了两个分数（例如[8.5, 7.2]），那么恭喜你！这证明你的Python环境、PyTorch、Transformers库以及核心的依赖全部工作正常，已经为运行Qwen-Ranker Pro做好了准备。

6. 更进一步：运行真正的Qwen-Ranker Pro示例

上面的测试用的是公开模型。要使用完整的Qwen-Ranker Pro，你通常需要从指定的模型仓库或路径加载。这里提供一个更贴近真实使用场景的示例。请注意，你需要将path_to_your_qwen_ranker_pro_model替换为你实际的模型权重文件路径（可能是从网盘下载或官方渠道获取的）。

# run_ranker.py
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

# 假设你的模型文件放在本地目录‘./model’下
model_path = "./model" # 请修改为你的实际路径
print(f"从本地路径加载模型: {model_path}")

try:
    # 加载分词器和模型
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForSequenceClassification.from_pretrained(model_path, trust_remote_code=True)
    model.eval() # 设置为评估模式
    print("模型加载完毕，准备就绪。")

    # 模拟一个搜索精排场景
    query = "如何学习Python编程"
    candidates = [
        "Python编程从入门到实践这本书很不错。",
        "今天北京的天气是晴天。",
        "学习Python需要掌握基础语法和项目实践。",
        "红烧肉的做法需要五花肉和冰糖。"
    ]

    print(f"\n查询: ‘{query}’")
    print("候选文档:")
    for i, cand in enumerate(candidates):
        print(f"  {i+1}. {cand}")

    # 构建（查询，文档）对
    pairs = [[query, cand] for cand in candidates]

    # 编码并计算分数
    with torch.no_grad():
        inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
        outputs = model(**inputs)
        scores = outputs.logits.squeeze().tolist()

    # 打印结果并排序
    print("\n精排结果 (分数越高越相关):")
    ranked_results = sorted(zip(candidates, scores), key=lambda x: x[1], reverse=True)
    for cand, score in ranked_results:
        print(f"  [分数: {score:.4f}] {cand}")

except FileNotFoundError:
    print(f"错误：在路径 ‘{model_path}’ 未找到模型文件。")
    print("请确保：")
    print("  1. 你已经下载了Qwen-Ranker Pro的模型权重。")
    print("  2. ‘model_path’变量指向了正确的目录。")
except Exception as e:
    print(f"运行过程中发生错误: {e}")

运行这个脚本：

python run_ranker.py

如果模型路径正确，你将看到模型对四个候选文档的相关性打分，并且与查询最相关的文档（关于Python学习的）应该获得了最高的分数。这完美演示了精排模型是如何工作的。

7. 写在最后：回顾与建议

走完以上所有步骤，你应该已经在Ubuntu 20.04系统上成功搭建起了Qwen-Ranker Pro的运行环境。整个过程从系统准备、环境隔离、核心安装到排错验证，我们一步步拆解，最终让这个强大的精排工具在你的机器上“活”了起来。

回顾一下，最关键的三点是：第一，使用虚拟环境保持项目整洁；第二，根据硬件情况正确安装PyTorch；第三，遇到libGL等缺失库错误时，知道如何安装系统依赖来修复。

现在，你可以开始探索如何将它集成到你的RAG管道、搜索系统或者任何需要精准排序的场景中了。比如，你可以将它与Milvus、Chroma这样的向量数据库结合，先用向量检索召回Top K个结果，再用Qwen-Ranker Pro对这K个结果进行精细重排，这样组合的效果通常比单一方法好很多。

部署中如果遇到其他问题，多关注错误信息本身，它们通常能给出很直接的线索。祝你使用愉快！

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

DeepSeek-V3：671B 参数的大模型，训练只花了不到 300 万 GPU 小时

DeepSeek-V3是一款671B参数的MoE架构开源大模型，仅激活37B参数进行推理。其创新点包括无辅助损失的负载均衡策略和多token预测训练目标，显著提升了训练效率。该模型在14.8万亿token数据上仅消耗278.8万GPU小时完成训练，且全程无崩溃。性能方面，MMLU得分87.1，编程能力突出，多项基准超越LLaMA3和Qwen2.5。支持多种部署方案（SGLang/LMDeploy等

AI Agent技术社区

Codex++ 增强工具深度解析：解锁 ChatGPT Codex 插件入口与 API Key 中转方案

AI Agent技术社区

AnythingLLM：本地部署的全能 AI 应用

AnythingLLM是一款开源的本地AI应用，可将各种大语言模型转变为私有ChatGPT，支持三步快速接入模型、导入文档和对话。它兼容多种主流闭源和开源模型，默认使用LanceDB向量数据库，支持文档自动向量化和语音识别/合成功能。核心功能包括文档对话、AI Agent、动态模型路由、记忆系统和定时任务等，还提供多用户支持和嵌入式聊天组件。技术架构采用monorepo设计，支持Docker一键部