DeepKE-LLM终极指南：大语言模型知识抽取技术深度解析与实战应用

DeepKE是一个开源的知识图谱抽取与构建工具包，基于大语言模型（LLM）技术，提供了从文本中抽取实体、关系和事件等知识的完整解决方案。本文将详细介绍DeepKE-LLM的核心功能、技术原理、实战案例及性能表现，帮助新手快速掌握大语言模型知识抽取技术。## 大语言模型知识抽取的核心技术### 提示工程（Prompt Engineering）DeepKE-LLM采用先进的提示工程技术，通

缪生栋

976人浏览 · 2026-03-26 19:22:33

缪生栋 · 2026-03-26 19:22:33 发布

DeepKE-LLM终极指南：大语言模型知识抽取技术深度解析与实战应用

【免费下载链接】DeepKE An Open Toolkit for Knowledge Graph Extraction and Construction published at EMNLP2022 System Demonstrations. 项目地址: https://gitcode.com/gh_mirrors/de/DeepKE

DeepKE是一个开源的知识图谱抽取与构建工具包，基于大语言模型（LLM）技术，提供了从文本中抽取实体、关系和事件等知识的完整解决方案。本文将详细介绍DeepKE-LLM的核心功能、技术原理、实战案例及性能表现，帮助新手快速掌握大语言模型知识抽取技术。

大语言模型知识抽取的核心技术

提示工程（Prompt Engineering）

DeepKE-LLM采用先进的提示工程技术，通过精心设计的指令引导大语言模型完成知识抽取任务。典型的提示模板包括上下文学习（In-Context Learning）和模式生成（Schema-constrained Data Generation）两种形式。

上下文学习提示模板示例：

Given a context, a pair of head and tail entities in the context, decide the relationship between the head and tail entities from candidate relations: [RELATION List].
Context: TEXT. The relation between (HEAD TYPE) 'HEAD ENTITY' and (TAIL TYPE) 'TAIL ENTITY' in the context is ______

代码增强知识抽取（CodeKGC）

CodeKGC是DeepKE-LLM的创新功能，通过将知识抽取任务转化为代码生成任务，利用大语言模型的代码理解能力提升复杂结构信息的抽取效果。该方法将自然语言文本中的实体和关系转化为结构化的代码表示，显著提高了知识抽取的准确性和可解释性。

快速上手：DeepKE-LLM安装与基础使用

环境配置

DeepKE-LLM支持多种主流大语言模型，包括GPT系列、LLaMA、Baichuan等。通过以下命令快速安装所需依赖：

>> pip install git+https://github.com/zjunlp/EasyInstruct
>> pip install hydra-core

核心功能模块

DeepKE-LLM提供了丰富的知识抽取功能，主要包括：

命名实体识别（NER）：从文本中识别出具有特定意义的实体，如人物、组织、地点等
关系抽取（RE）：识别实体之间的语义关系，如"属于"、"创办于"等
事件抽取（EE）：抽取文本中的事件信息，包括事件类型、触发词和论元
三元组抽取（RTE）：联合抽取实体和关系，形成(头实体, 关系, 尾实体)三元组

基本使用流程

参数配置：在conf文件夹中设置任务类型、模型名称、API密钥等参数
数据准备：准备输入文本数据，支持自定义示例数据
运行抽取：执行run.py启动知识抽取流程

>> python run.py

实战案例：零样本与少样本知识抽取

零样本知识抽取

在零样本设置下，DeepKE-LLM仅通过指令提示即可完成知识抽取任务，无需提供示例数据。以下是中文零样本知识抽取的性能对比：

从结果可以看出，DeepKE-LLM的OneKE模型在命名实体识别（NER）、关系抽取（RE）和事件抽取（EE）任务上均表现出优异性能，平均F1值达到40.68，显著优于其他基线模型。

少样本知识抽取

当有少量标注数据可用时，DeepKE-LLM通过上下文学习（In-Context Learning）进一步提升抽取性能。以下是不同模型在多任务知识抽取上的性能对比：

雷达图展示了OneKE与GPT系列、Baichuan2等模型在中英文NER、RE和EE任务上的表现。OneKE在多个任务中表现接近GPT-4，尤其在中文任务上具有明显优势。

事件抽取性能对比

在事件抽取任务中，DeepKE-LLM的OneKE模型与其他主流模型的对比结果如下：

表格数据显示，OneKE在ACE2005、CASIE等多个事件抽取数据集上均取得了 competitive 的结果，尤其在触发词识别和论元抽取任务上表现突出。

高级应用：CCKS2023指令驱动知识图谱构建

DeepKE-LLM可直接应用于实际竞赛任务，如CCKS2023指令驱动的知识图谱构建。该任务要求根据用户输入的指令抽取相应类型的实体和关系，构建知识图谱。

任务示例

instruction="使用自然语言抽取三元组,已知下列句子,请从句子中抽取出可能的实体、关系,抽取实体类型为{'专业','时间','人类','组织','地理地区','事件'},关系类型为{'体育运动','包含行政领土','参加','国家','邦交国','夺得','举办地点','属于','获奖'},你可以先识别出实体再判断实体之间的关系,以(头实体,关系,尾实体)的形式回答"
input="2006年，弗雷泽出战中国天津举行的女子水球世界杯，协助国家队夺得冠军。2008年，弗雷泽代表澳大利亚参加北京奥运会女子水球比赛，赢得铜牌。"
output="(弗雷泽,获奖,铜牌)(女子水球世界杯,举办地点,天津)(弗雷泽,属于,国家队)(弗雷泽,国家,澳大利亚)(弗雷泽,参加,北京奥运会女子水球比赛)(中国,包含行政领土,天津)(中国,邦交国,澳大利亚)(北京奥运会女子水球比赛,举办地点,北京)(女子水球世界杯,体育运动,水球)(国家队,夺得,冠军)"

关键实现

DeepKE-LLM提供了完整的CCKS2023任务解决方案，主要实现代码位于example/llm/LLMICL/run.py。通过设置task=rte（三元组抽取）和language=ch（中文），即可启动中文知识图谱构建任务。

总结与展望

DeepKE-LLM作为一款功能强大的知识抽取工具包，通过大语言模型技术实现了高效、准确的知识抽取。其核心优势包括：

多任务支持：覆盖命名实体识别、关系抽取、事件抽取等多种知识抽取任务
灵活的提示策略：支持零样本、少样本等多种提示方式，适应不同数据场景
优异的性能表现：在多个公开数据集上取得了领先的性能
丰富的实战案例：提供了从基础使用到竞赛应用的完整示例

未来，DeepKE-LLM将继续优化大语言模型知识抽取技术，探索多模态知识抽取、领域自适应等方向，为知识图谱构建提供更强大的工具支持。

想要开始使用DeepKE-LLM？只需克隆仓库并按照文档进行配置：

git clone https://gitcode.com/gh_mirrors/de/DeepKE
cd DeepKE

更多详细教程和API文档，请参考项目中的docs/目录和各模块的README文件。

【免费下载链接】DeepKE An Open Toolkit for Knowledge Graph Extraction and Construction published at EMNLP2022 System Demonstrations. 项目地址: https://gitcode.com/gh_mirrors/de/DeepKE

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

让 Codex 桌面版拥抱 DeepSeek-V4：协议桥接与模型网关接入实践

4SAPI 提供了一套标准的 Chat Completions 接口，完全兼容 DeepSeek V4 Pro 等模型，使用时只需将 base URL 和密钥替换为平台分配的值即可。这样一来，既保留了桥接层的协议转换能力，又获得了网关带来的额外弹性。这样的模型网关，则进一步提升了链路的稳定性和密钥管理的便捷度，尤其适合团队或对服务可用性有更高要求的场景。│Codex 桌面版│ ──────────

AI Agent技术社区

别再迷信“突破限制”：Gemini 3.5-flash 边界测试实战复盘

AI Agent技术社区

Hermes Agent 上下文压缩机制深度剖析：长对话场景下的有损压缩策略

大语言模型的上下文窗口是有限资源。在长对话场景中，Token 数量不可避免地逼近模型的上下文长度上限，此时系统面临两难选择：截断历史导致信息丢失，或超出限制导致 API 报错。Hermes Agent 的上下文压缩引擎（`ContextCompressor`）实现了一套三阶段有损压缩算法，在保持对话连续性的同时将 Token 消耗控制在安全阈值内。本文从源码层面详细分析该机制的算法设计、边界处理、