在这里插入图片描述

网罗开发 (小红书、快手、视频号同名)

  大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:华为HDE/HDG

我的博客内容涵盖广泛,主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告,同时也会提供产品优缺点分析、横向对比,并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。

展菲:您的前沿技术领航员
👋 大家好,我是展菲!
📱 全网搜索“展菲”,即可纵览我在各大平台的知识足迹。
每周定时推送干货满满的技术长文,从新兴框架的剖析到运维实战的复盘,助您技术进阶之路畅通无阻。


引言

过去一年,越来越多开发者开始尝试把 AI 集成到 HarmonyOS App 中。

最开始,大家做的是:

聊天机器人

后来变成:

AI 搜索
AI 问答
AI 助手

再后来,越来越多团队开始尝试:

AI Agent

例如:

智能日程

智能办公

智能客服

智能教育

智能车机

智能家居

很多 Demo 看起来都很炫。但真正进入企业项目之后,却发现一个现实的问题:

模型已经够聪明了,为什么 Agent 还是跑不起来?

原因其实很简单。很多团队都把重点放在:

Prompt

模型

RAG

却忽略了真正决定 AI App 能否落地的一层:

Agent Runtime。

一句话来说:

LLM 决定 Agent 能思考,而 Runtime 决定 Agent 能不能真正运行。

一、什么是真正的 Agent Runtime?

很多人认为:

Runtime
=
调用一下模型

实际上完全不是,Runtime 更像:

Android Runtime(ART)

Java JVM

Node Runtime

它不是一个 SDK,而是一整套运行环境。

对于 HarmonyOS AI Native App 来说,Runtime 要负责:

生命周期

状态

调度

上下文

记忆

工具

Agent

治理

一句话:

Runtime 就是整个 AI 系统的大脑中枢。

二、为什么 Agent 一定需要 Runtime?

很多 Demo 都是:

User

↓

LLM

↓

Tool

↓

Answer

几十行代码,非常简单。但是企业系统通常会变成:

用户:

帮我整理今天会议

↓

Planner

↓

Calendar

↓

Search

↓

Summary

↓

Memory

↓

Notification

↓

UI

这里出现一个问题,这些模块:

谁创建?

谁销毁?

谁通信?

谁调度?

谁恢复?

如果没有 Runtime,整个系统就是:

几十个 Agent

几十个 Tool

几十个 Context

互相调用

最后完全失控。

三、HarmonyOS Agent Runtime 整体架构

一个完整 Runtime 可以拆成九层。

                     User
                      │
                      ▼
             Agent Runtime Kernel
                      │
 ┌──────────┬──────────┬──────────┬──────────┐
 ▼          ▼          ▼          ▼
Planner   Context    Scheduler  Governance
 │          │          │          │
 ▼          ▼          ▼          ▼
Memory   StateMgr   Agent Bus  Policy
      └────────┬──────────────┘
               ▼
          Tool Runtime
               ▼
          MCP Connector
               ▼
     HarmonyOS System Ability

可以发现,真正运行的中心已经不是:

LLM

而是:

Runtime

LLM 只是 Runtime 的一个组件。

四、Runtime 第一职责:生命周期管理

Agent 并不是一直存在,它应该拥有完整生命周期:

Created

↓

Initialized

↓

Running

↓

Waiting

↓

Completed

↓

Destroyed

Runtime 必须统一维护:

创建

暂停

恢复

超时

释放

否则:

Agent 无限增长

内存泄漏

Context 泄漏

都会发生。

五、Runtime 第二职责:任务调度

真正企业级 Agent 不是一个任务。而是一棵任务树,例如:

帮我生成今天日报

Planner 会拆成:

查询数据

↓

统计分析

↓

生成图表

↓

生成摘要

↓

发送邮件

Scheduler 会进一步转换成:

Task DAG

例如:

       Query
      /     \
 Statistics  Charts
      \     /
      Summary
          |
        Email

相比传统串行执行:

Task A

↓

Task B

↓

Task C

DAG 可以:

并行

失败恢复

动态插入节点

优先级调度

这也是 Runtime 最重要能力之一。

六、Runtime 第三职责:上下文管理

很多人觉得 Context 就是聊天记录,实际上企业 Context 包括:

用户状态

设备状态

Memory

Tool Result

Planner

Session

系统策略

Runtime 每次推理前,都会重新构建:

Prompt Context

而不是一直追加聊天记录,否则:

Token 爆炸

Latency 飙升

推理成本增加

七、Runtime 第四职责:Agent 调度

一个企业 App 通常不是:

一个 Agent

而是:

Planner

Memory

Search

UI

Code

Vision

多个 Agent,Runtime 必须:

创建 Agent

释放 Agent

调度 Agent

通信 Agent

同步状态

否则:

Agent 数量越多

系统越混乱。

八、Runtime 第五职责:Tool Runtime

很多开发者认为 Tool Calling 就是:

LLM

↓

Function

实际上 Runtime 负责:

Tool Registry

↓

Permission

↓

Dispatcher

↓

Executor

↓

Observation

↓

Context Update

模型,只是决定:

调用哪个 Tool。

真正执行,全部交给 Runtime。

九、Runtime 第六职责:Memory Center

真正企业 Agent,Memory 不是:

Vector DB

而是:

Working Memory

↓

Session Memory

↓

Long Memory

↓

Semantic Memory

Runtime 必须动态:

Recall

Summarize

Compress

Forget

否则 Memory 永远增长。

十、Runtime 第七职责:事件驱动

企业 Runtime 不应该依赖同步调用,推荐采用:

Event Bus

例如:

TASK_CREATED

↓

Planner

↓

SEARCH_DONE

↓

Summary

↓

UI_REFRESH

Runtime 负责:

Publish

Subscribe

Retry

Priority

Timeout

整个系统变成:

Reactive Runtime

而不是:

Function Runtime

十一、Runtime 第八职责:治理

真正 AI App 最大问题,不是不会回答。而是:

做错事。

因此 Runtime 必须,内置:

Permission

Policy

Risk

Audit

Quota

Human Approval

例如,删除联系人 Runtime,不会直接执行。而是:

Require Approval

这是企业项目必须具备的能力。

十二、HarmonyOS Agent Runtime 推荐工程结构

建议采用模块化设计:

src
├── runtime
│   ├── kernel
│   ├── scheduler
│   ├── lifecycle
│   ├── context
│   ├── state
│   ├── governance
│   ├── metrics
│   └── recovery
│
├── planner
├── memory
├── tools
├── agents
├── bus
├── mcp
├── services
└── ui

这种设计的好处是:

  • Runtime 与业务解耦
  • Agent 可插拔
  • Tool 可扩展
  • Scheduler 可替换
  • MCP Server 可动态接入

后期无论增加新的 Agent,还是增加新的系统能力,都无需重构整个应用。

十三、企业级 Agent Runtime 还需要哪些能力?

很多开源 Agent Framework 更关注"功能能跑起来",但企业级 Runtime 更关注"系统能稳定跑下去"。

因此建议再增加以下几个核心模块。

1、Observability(可观测性)

每一次推理、Tool 调用、Agent 通信都应该记录。例如:

Trace ID

Task ID

Agent ID

Latency

Token Usage

Tool Cost

Memory Recall Count

最终形成完整调用链:

User
↓

Planner

↓

Search

↓

Memory

↓

Summary

↓

UI

方便定位性能瓶颈。

2、Checkpoint(任务检查点)

长任务执行过程中:

Planner

↓

Search

↓

Summary

↓

Report

如果 Search 完成后应用退出,Runtime 不应该重新开始。

而应该:

Resume From Checkpoint

继续执行,这是 Workflow Runtime 常见设计。

3、Resource Manager(资源管理)

移动端最大的限制:

CPU

GPU

NPU

Memory

Battery

Runtime 应根据:

设备负载

温度

电量

网络状态

动态调整:

模型大小

推理频率

Agent 数量

并发任务

真正做到:

智能调度,而不是盲目运行。

十四、HarmonyOS AI Native App 的终极架构

整个 AI Native 技术栈串联起来:

                    User Intent
                         │
                         ▼
                Agent Runtime Kernel
                         │
 ┌──────────┬──────────┬──────────┬──────────┐
 ▼          ▼          ▼          ▼
Planner  Context  Scheduler  Governance
 │          │          │          │
 ▼          ▼          ▼          ▼
Memory  StateMgr  Agent Bus  Metrics
      └──────────┬───────────────┘
                 ▼
           Tool Runtime
                 ▼
           MCP Connector
                 ▼
      HarmonyOS System Service
                 ▼
       ArkUI / Ability / AI SDK

整个 Runtime 负责组织:

  • Agent 的生命周期
  • 多智能体协作
  • Context 与 Memory 管理
  • Tool Calling 与 MCP 接入
  • 系统资源调度
  • 安全治理与可观测性

最终让 AI 从一个"聊天能力",升级为一个真正能够持续运行、持续执行、持续优化的智能系统。

总结

过去我们认为:

模型决定 AI 的能力。

今天越来越多企业发现:

Runtime 决定 AI 的工程化能力。

如果用一句话总结 HarmonyOS Agent Runtime:

它不是一个 SDK,也不是一个框架,而是一套负责调度 Agent、管理 Context、协调 Memory、执行 Tool、治理系统行为的 AI 应用运行时平台。

未来 HarmonyOS AI Native App 的竞争,将逐渐从模型能力转向Runtime 能力

真正能够支撑复杂业务、企业级应用和多智能体协作的,不是某一个大模型,而是围绕 Agent Runtime 构建起来的完整 AI 基础设施。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐