4个skill,跑通整套科研流程

用Claude Code写论文的一整套流水线被打包开源,项目名叫academic - research - skills(简称ARS),是Claude Code技能包,github星标达6.4k。ARS核心架构由4个skill组成,构成从选题到交稿的完整链路。

Deep Research是13个Agent的研究团队,负责文献调研等,团队中有做文献溯源、苏格拉底导师、魔鬼代言人等不同功能的Agent。

Academic Paper是12个Agent的写作团队,覆盖大纲设计等全流程,有风格校准功能,输出格式支持多种类型,可编译成特定格式PDF。

Academic Paper Reviewer是7个Agent的审稿团队,模拟真实评审流程,从多维度打分,采用0到100量化标准,还会输出修改路线图。

Academic Pipeline是流程编排器,串联前三个团队成10阶段流水线,各阶段有明确产物和检查点,可在任意阶段插入,一篇1.5万字论文全程约4到6美元。

比较有意思的设计

ARS在底层设计上有过人之处,可系统性防止AI搞砸学术研究。

引用核验:ARS在Deep Research阶段有引用核验机制,用Levenshtein相似度算法做模糊匹配,阈值0.70以上通过。

完整性闸门:流水线Stage 2.5和Stage 4.5有完整性闸门,运行7项AI失败模式检查清单,源自2026年Nature研究,实测抓到伪造引用和统计错误。

反谄媚协议:ARS在审稿环节有反谄媚机制,魔鬼代言人挑刺,有让步阈值协议,AI不能轻易让步,攻击强度要保持,评分轨迹会被追踪。

三层数据隔离:ARS将数据流分三层,写作和审稿团队分两次独立调用,中间有隔离,写作AI只能收到自然语言反馈,设计灵感来自Anthropic研究。

诚实文档化:ARS为每个产物生成repro_lock文件,记录配置,但声明LLM输出不可复现,文件只是配置文档。

持续迭代,注重可靠性

从更新日志看,ARS从2月上线到现在提交commit数达三百多次,作者对AI学术研究系统风险理解深刻,其设计哲学是“AI是副驾驶,不是飞行员”。

安装方式与费用

安装方式简单,用Claude Code只需两行命令,验证运行/ars - plan可启动对话梳理论文结构,也可用/ars - lit - review单条命令测试。还可直接把SKILL.md上传到claude.ai知识库,此方式适合轻度体验,跑完整流水线需Claude Code,项目支持繁体中文和英文。

作者推荐Claude Opus 4.7搭配Max订阅计划,完整跑完10个阶段消耗大量token,Max订阅计划分两档,每月100刀或200刀,科研经费可报销可考虑。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐