Nature Communications 重磅:DeepSeek 驱动的 Janus-Pro-CXR——轻量级 AI 改写胸片诊断工作流

一、研究背景

胸部 X 线(Chest X-ray, CXR)是全球范围内使用频率最高的医学影像检查,占所有放射科检查量的 40% 以上,在基层医疗、急诊分诊和体检筛查中扮演着不可替代的角色 [1]。然而,放射科医生的全球性短缺正日益加剧胸片解读的负担。据世界卫生组织(WHO)估算,全球约三分之二的人口无法获得基本的放射诊断服务,在低收入国家,每百万人口仅有不到 1 名放射科医生 [2]。即便在发达国家,放射科医生的人均工作量也在持续攀升,报告周转时间延长、诊断疲劳导致的漏诊误诊风险不断累积 [3]。

近年来,人工智能(AI)在医学影像诊断领域取得了显著进展。2024 年,Nature Medicine 发表的 CheXagent 等视觉-语言基础模型展示了 AI 生成放射学报告的潜力,但其临床验证主要局限于回顾性数据集 [4]。2025 年,多项系统综述表明,虽然 AI 辅助胸片解读在实验室环境中表现优异,但缺乏严格的前瞻性多中心验证,导致临床采纳率远低于预期 [5]。

2026 年 5 月 7 日,武汉大学计算机学院、华中科技大学同济医学院附属协和医院、郑州大学第一附属医院等多中心联合团队在 Nature Communications 发表了一项里程碑式研究——Janus-Pro-CXR,一个由 DeepSeek 多模态基础模型驱动的轻量级 AI 胸片解读系统 [6]。该研究通过前瞻性多中心临床试验(NCT07117266),在 296 例真实临床病例中验证了 AI 辅助对报告质量和效率的双重提升效果,为 AI 放射学系统从实验室走向临床提供了关键证据。

二、研究创新点

Janus-Pro-CXR 的核心创新体现在以下五个方面:

1. 基于 DeepSeek 多模态基础模型的领域自适应微调。 首次将 DeepSeek 系列多模态大模型应用于胸部 X 线影像解读,通过领域特定的微调策略,使通用基础模型在放射学专业领域获得专家级诊断能力,避免了从零开始训练的巨量数据需求。

2. 轻量级架构设计。 与动辄数百亿参数的大模型不同,Janus-Pro-CXR 采用轻量级架构,可在标准消费级硬件上高效运行,显著降低了基层医疗机构和资源受限场景的部署门槛。

3. 前瞻性多中心临床试验验证。 区别于大多数仅进行回顾性验证的 AI 放射学研究,该研究在真实临床工作流中进行了前瞻性多中心验证(NCT07117266),提供了 AI 辅助诊断系统临床价值的最高级别证据。

4. 结构化临床报告生成。 系统不仅能识别胸部关键病变,还能自动生成符合专家标准的临床结构化报告,涵盖病变描述、位置、大小和临床建议等关键信息。

5. 人机协作范式验证。 研究表明,AI 辅助并非替代放射科医生,而是通过减少报告撰写时间和提升报告质量,实现人机协作效率的最大化。

三、技术原理

Janus-Pro-CXR 的技术架构围绕三个核心模块展开:

基础模型选型:DeepSeek 多模态架构。 研究团队选择 DeepSeek 系列多模态基础模型作为骨干网络。DeepSeek 模型采用混合专家(Mixture of Experts, MoE)架构,在保持轻量级推理成本的同时,实现了强大的多模态理解能力。其视觉编码器能够从胸部 X 线图像中提取多尺度特征,涵盖肺纹理、纵隔结构、胸廓骨骼和软组织密度等关键影像信息。

领域自适应微调(Domain-specific Fine-tuning)。 在预训练的 DeepSeek 多模态模型基础上,研究团队使用大规模胸部 X 线影像-报告配对数据集进行领域自适应微调。微调过程包括两个阶段:第一阶段使用海量公开数据集(如 MIMIC-CXR、ChestX-ray14 等)进行初步的放射学领域迁移;第二阶段使用多中心私有数据集进行精细化调优,使模型能够适应不同医院、不同设备产生的影像差异。这种"通用预训练 + 领域微调"的策略,有效解决了医学影像数据稀缺性对模型性能的制约。

推理与报告生成。 在推理阶段,Janus-Pro-CXR 接收胸部 X 线图像作为输入,视觉编码器提取影像特征后,语言模型解码器生成结构化放射学报告。报告采用标准化的临床模板,包括:检查技术描述、主要发现(病变类型、位置、大小)、阴性发现确认、与既往检查对比(如有)、以及临床建议。系统还支持交互式操作,放射科医生可对 AI 生成的报告进行实时编辑和确认。

人机协作工作流。 在临床部署中,Janus-Pro-CXR 嵌入 PACS/RIS 系统,在胸片上传后自动触发 AI 推理,优先生成初步报告草稿。放射科医生审阅并修改 AI 报告后,一键确认即可完成最终报告签发。整个流程无需额外操作,在不改变现有工作流的前提下实现了效率提升。

四、实验结果

Janus-Pro-CXR 在多个维度展现了卓越性能:

1. 诊断性能。 在内部测试中,Janus-Pro-CXR 对胸部关键病变(如肺结节、渗出性病变、气胸、胸腔积液、心脏增大等)的检出性能达到专家级水平,多项指标的 AUC 超过 0.90。系统在识别常见胸部病变方面展现了与资深放射科医生相当的诊断准确性。

2. 前瞻性多中心部署(n=296)。 在涵盖华中科技大学同济医学院附属协和医院、郑州大学第一附属医院等多中心的前瞻性真实世界部署中,296 例连续患者的胸片解读结果显示:

- AI 辅助显著提升了报告质量评分(P<0.001),由三位独立盲法评审专家进行标准化评分;

- 解读时间平均缩短 18.3%,从传统的平均约 8.5 分钟降至约 6.9 分钟;

- 报告结构化程度和术语规范性显著提高。

3. 硬件效率。 Janus-Pro-CXR 在标准消费级 GPU(如 NVIDIA RTX 3090/4090)上即可完成单张胸片的秒级推理,无需昂贵的服务器级硬件。在 CPU-only 模式下也可运行,推理时间约 30-60 秒,满足基层医疗机构的实际需求。

4. 人机协作效果。 在不同年资放射科医生中,AI 辅助均带来了效率提升,且对低年资医生的获益更为显著。这一发现与 iAorta(Nature Medicine, 2025)[7] 和 Reti-Pioneer(Nature Medicine, 2026)[8] 等近期研究中的 AI 赋能效应一致,再次验证了 AI 在弥合经验差距方面的独特价值。

评估指标 Janus-Pro-CXR 表现
关键病变检出 AUC >0.90(多项指标)
报告解读时间缩短 18.3%
报告质量评分提升 显著(P<0.001)
部署硬件要求 消费级 GPU(RTX 3090/4090)
前瞻性验证样本量 296 例
研究注册号 NCT07117266

五、技术优势

1. 轻量级可部署性。 与依赖云端大模型推理的 AI 系统不同,Janus-Pro-CXR 可在本地标准硬件上高效运行,兼顾数据隐私保护和响应速度,尤其适合对数据安全要求严格的医疗场景。

2. 多模态基础模型赋能。 基于 DeepSeek 的视觉-语言联合理解能力,系统不仅能"看懂"影像,还能"写出"符合临床规范的报告,真正实现了从图像到文本的端到端自动化。

3. 前瞻性证据支持。 作为少数完成前瞻性多中心临床试验的 AI 放射学系统,Janus-Pro-CXR 的临床证据等级远高于仅依赖回顾性验证的同类系统,为临床采纳和监管审批提供了坚实的数据基础。

4. 不改变现有工作流。 系统嵌入 PACS/RIS 系统,在放射科医生常规工作流程中无缝提供 AI 辅助,无需额外操作步骤,最大化临床采纳率。

5. 跨年资赋能。 AI 辅助对各年资放射科医生均有获益,对低年资医生和基层放射科人员的赋能效果尤为突出,有助于缓解医疗资源分布不均的问题。

6. 开源生态兼容。 研究团队基于 DeepSeek 开源生态进行开发,模型架构和训练方法具有较好的可复现性和社区支持,有利于全球研究者的后续扩展和优化。

六、应用前景

1. 基层医疗赋能。 在社区卫生服务中心、乡镇卫生院等基层机构,Janus-Pro-CXR 可作为"AI 放射科助手",为缺乏放射科专科医生的基层机构提供高质量的胸片初步解读服务,推动优质医疗资源下沉。

2. 急诊快速分诊。 在急诊场景中,Janus-Pro-CXR 可在胸片完成后数秒内生成初步报告,帮助急诊医生快速识别气胸、大量胸腔积液等危急病变,缩短"门-诊断"时间。

3. 大规模体检筛查。 在入职体检、健康体检等大规模胸片筛查场景中,AI 系统可自动过滤正常胸片(约占 70%-80%),使放射科医生专注于异常病例,大幅提升筛查效率。

4. 放射科减负。 在大型医院放射科,AI 辅助报告撰写可减少放射科医生的重复性文书工作,使其将更多精力投入复杂病例的诊断和临床沟通中,提升整体医疗质量。

5. 全球南方国家放射服务可及性。 基于轻量级硬件需求,Janus-Pro-CXR 尤其适合在低中收入国家推广,通过低成本、高效率的 AI 辅助方案缩小全球放射诊断服务的可及性差距。

6. 远程医疗整合。 结合远程医疗平台,Janus-Pro-CXR 可实现"基层拍片 + AI 预读 + 上级医院远程审核"的协作模式,构建分级诊疗的影像学闭环。

七、研究局限性与未来方向

1. 前瞻性样本量有限。 当前前瞻性验证的样本量为 296 例,虽足以证明 AI 辅助对报告质量和效率的改善效果,但尚不足以全面评估系统在罕见胸部病变(如纵隔肿瘤、先天性心脏病等)上的诊断性能,未来需更大规模的前瞻性研究。

2. 疾病谱局限。 当前系统主要针对成人常见胸部病变,对儿科胸片、术后胸片和重症监护胸片等特殊场景的适应性有待验证。

3. 多设备、多协议泛化。 尽管研究涵盖了多个中心的数据,但不同品牌 X 线设备、不同摄片协议(如床旁胸片 vs. 标准 PA 位胸片)对模型性能的影响仍需进一步系统评估。

4. 长期临床结局。 当前研究关注的是报告质量和效率的短期改善,AI 辅助对患者最终临床结局(如诊断准确率、误诊率、治疗延误率)的长期影响需通过随机对照试验(RCT)进一步评估。

5. 多语言报告生成。 当前系统主要生成英文结构化报告,中文及其他语言的报告生成能力需进一步开发,以满足不同国家和地区的临床需求。

6. 监管审批。 作为 AI 辅助诊断医疗器械,Janus-Pro-CXR 需通过 NMPA、FDA 或 CE 等监管审批方可进入临床常规使用。

7. 扩展至多模态影像。 未来可将技术框架扩展至 CT、MRI 等其他影像模态,构建统一的放射学 AI 报告平台。

八、结论

Janus-Pro-CXR 是首个基于 DeepSeek 多模态基础模型、完成前瞻性多中心临床试验验证的胸部 X 线 AI 解读系统。其在 296 例真实临床病例中展现的报告质量提升和解读时间缩短 18.3% 的效果,为 AI 放射学系统从实验室走向临床提供了关键证据。该研究的轻量级架构设计、前瞻性验证策略和人机协作范式,为 AI 医学影像领域的后续研究提供了重要参考。随着大规模前瞻性 RCT 的推进和多模态、多语言的扩展,以 Janus-Pro-CXR 为代表的轻量级 AI 放射学系统有望成为全球放射科医生的"标配助手",使高质量的放射诊断服务真正普惠可及。

参考文献

1. Raoof S, Feigin D, Sung A, et al. Interpretation of plain chest roentgenogram. *Chest*, 2012, 141(2): 545-558. PMID: 22315122.

2. World Health Organization. WHO guideline on health policy and system support to optimize community health worker programmes. *WHO*, 2018.

3. Waite S, Scott J, Gale B, et al. Interpretive error in radiology. *American Journal of Roentgenology*, 2017, 208(4): 739-749. PMID: 28125268.

4. Chen Z, Varma M, Delbrouck JB, et al. CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation. *Nature Medicine*, 2024. DOI: 10.1038/s41591-024-03302-1.

5. Aggarwal R, Sounderajah V, Martin G, et al. Diagnostic accuracy of deep learning in medical imaging: a systematic review and meta-analysis. *npj Digital Medicine*, 2021, 4: 65. PMID: 33828217.

6. Bai Y, Zhang R, Lei Y, et al. A DeepSeek-powered AI system for automated chest radiograph interpretation in clinical practice. *Nature Communications*, 2026. DOI: 10.1038/s41467-026-72680-6. PMID: 42098114.

7. Hu Y, Xiang Y, Zhou YJ, et al. AI-based diagnosis of acute aortic syndrome from noncontrast CT. *Nature Medicine*, 2025, 31(11): 3832-3844. PMID: 40835970.

8. Zhang X, Li Q, Liang Y, et al. AI framework for multidisease detection via retinal imaging. *Nature Medicine*, 2026. PMID: 42050182.

论文信息

项目 内容
论文标题 A DeepSeek-powered AI system for automated chest radiograph interpretation in clinical practice
期刊 Nature Communications(IF: 16.6)
发表时间 2026年5月7日
作者 Yaowei Bai, Ruiheng Zhang, Yu Lei, Xuhua Duan, et al.
通讯作者 Dacheng Tao, Yongchao Xu, Chuansheng Zheng, Huangxuan Zhao, Bo Du
主要机构 武汉大学、华中科技大学同济医学院附属协和医院、郑州大学第一附属医院
DOI 10.1038/s41467-026-72680-6
PMID 42098114
临床试验注册 NCT07117266
研究类型 前瞻性多中心临床研究
Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐