AI Agent是通往AGI的必经之路吗?
AI Agent是通往AGI的必经之路?从核心原理、技术瓶颈到落地实践的全维度解析
摘要/引言
2023年AutoGPT上线仅一周就斩获10万+GitHub星标,2024年AI程序员Devin凭借自主完成完整软件开发任务的能力震惊全球科技圈,OpenAI CEO Sam Altman多次公开表示「AI Agent是下一代大模型的核心演进方向,也是我们探索AGI(通用人工智能)的核心路径」。一时间几乎所有AI公司都把AI Agent作为核心研发方向,甚至有创投圈人士喊出「所有的应用都值得用Agent重做一遍」的口号。
但热闹背后也有大量质疑:现有基于大模型的Agent频繁出现「跑飞」「幻觉叠加」问题,连简单的行程规划都可能做不明白,真的能支撑起AGI的宏大目标吗?AGI需要的具身认知、常识推理、自主进化能力,Agent架构真的能实现吗?会不会未来出现完全不同的技术路线,直接绕开Agent实现AGI?
读完这篇文章你将完全搞懂:
- AI Agent和AGI的核心定义、能力边界、核心构成差异
- 为什么说AI Agent是目前最接近AGI的技术路径
- 现有AI Agent的技术瓶颈和无法突破的固有缺陷
- AI Agent落地的最佳实践和未来10年的演进路线
- 普通开发者现在切入Agent领域的正确姿势
本文会从核心概念、技术原理、落地案例、行业趋势多个维度展开,既会有硬核的数学模型、代码实现,也会有通俗易懂的类比和行业案例,哪怕你是刚接触AI的新手也能完全看懂。
一、核心概念解析:AI Agent与AGI到底是什么
1.1 AI Agent的定义与核心构成
AI Agent的概念最早出自人工智能经典教材《人工智能:一种现代方法》,定义为能在环境中自主感知、自主决策、自主行动,最终实现特定目标的智能实体。我们可以把它类比成一个虚拟的「数字员工」:和普通的工具软件不一样,你不需要告诉它每一步该做什么,只需要告诉它最终目标,它就能自己想办法完成。
一个完整的AI Agent必须包含5个核心模块,模块之间的交互逻辑如下图所示:
我们分别解释每个模块的功能:
- 感知模块:负责接收来自环境的信息,包括用户输入、工具返回结果、传感器数据、多模态信息(图像/音频/视频)等,是Agent和外界交互的入口。
- 记忆模块:存储Agent的所有历史信息,分为三类:
- 短期记忆:对应大模型的上下文窗口,存储当前任务的临时信息,容量有限
- 长期记忆:对应向量数据库,存储 Agent 所有的历史交互数据、经验知识,容量几乎无限
- 反思记忆:存储Agent从历史任务中总结出来的规则、经验、教训,比如「用户不喜欢住评分低于4.5的酒店」「调用搜索工具后必须验证信息的真实性」
- 规划模块:负责把大目标拆解成可执行的子任务,制定执行计划,常用的技术包括思维链(CoT)、思维树(ToT)、任务分解算法等。
- 行动模块:负责执行规划模块生成的任务,包括调用大模型生成内容、调用第三方工具(搜索、代码解释器、API、机器人控制器等)、输出结果给用户等。
- 反思模块:负责评估行动结果和目标的差距,总结失败教训,更新记忆和规划策略,避免下次犯同样的错误。
我们可以用一个生活化的例子理解:你让Agent帮你安排一次从北京到三亚的5天亲子旅行,目标是预算1万以内,孩子玩得开心。感知模块接收你的需求后,记忆模块会检索你之前告诉过它的信息:孩子3岁、对海鲜过敏、你喜欢住海景房。规划模块会把任务拆解成「查机票→查酒店→做行程→算预算→调整优化」几个子任务。行动模块会调用机票API查最近的低价机票,调用酒店API找符合要求的海景房,调用搜索工具找三亚适合3岁孩子的景点。反思模块会检查预算是不是超过1万,有没有安排海鲜餐厅,调整之后输出最终的行程单给你。
1.2 AGI的定义与核心能力要求
AGI(通用人工智能)的定义是具备和人类同等甚至超越人类的通用智能水平,能跨领域完成任意复杂任务,具备自主学习、常识推理、情感认知、创造力的智能系统。和目前的弱AI(只能完成特定领域的任务,比如人脸识别、语音识别)相比,AGI的核心能力要求包括:
| 能力维度 | 弱AI | AI Agent | AGI |
|---|---|---|---|
| 泛化能力 | 只能完成特定领域的单一任务,跨领域完全无法使用 | 能完成同类型的多种任务,比如做行程、写代码、数据分析,但是跨陌生领域能力有限 | 能跨任意领域完成任务,比如既能做量子物理研究,也能写小说、开挖掘机、照顾老人 |
| 自主性 | 完全被动响应,需要人一步步输入指令 | 半自主,能自主完成有明确目标的任务,但是遇到未知问题需要人类干预 | 完全自主,能自己设定目标、自己找资源、自己迭代优化,不需要人类干预 |
| 推理能力 | 几乎没有推理能力,只能基于训练数据做模式匹配 | 具备基础的逻辑推理能力,能解决简单的推理问题,但是复杂推理容易出错 | 具备高级推理能力,能做逻辑推理、因果推理、反事实推理,能解决基础科学研究级别的复杂问题 |
| 学习能力 | 训练完成后能力固定,需要重新训练才能更新能力 | 具备基础的持续学习能力,能从历史任务中积累经验,但是学习效率低 | 具备和人类同等的学习能力,能快速掌握陌生领域的知识,能从少量样本甚至零样本中学习 |
| 具身认知能力 | 完全没有,只能处理数字世界的信息 | 大部分只有数字交互能力,少数结合机器人的Agent有基础的具身能力 | 具备完整的具身认知能力,能和物理世界交互,能通过视觉、触觉、听觉等感知真实世界 |
| 价值对齐能力 | 没有,完全按照人类的指令执行 | 有基础的对齐能力,能遵守大模型的安全规则,但是容易被prompt注入破解 | 完全和人类价值观对齐,能自主判断行为的善恶,不会做出伤害人类的行为 |
1.3 两者的关系与底层逻辑
从能力维度我们可以明显看出:AI Agent刚好是介于弱AI和AGI之间的中间形态,它补齐了传统大模型被动响应、上下文有限、能力边界固定的短板,是目前最接近AGI能力要求的技术架构。我们可以用下面的实体关系图表示两者的关联:
二、问题背景:为什么AI Agent会成为AGI研究的核心方向?
2.1 大模型的固有瓶颈催生了Agent的崛起
2022年ChatGPT的发布让我们看到了大模型的强大能力,但是用了一段时间之后大家很快发现了大模型的固有缺陷:
- 被动响应,没有自主性:你不问它它不会主动说话,你必须把每一步的指令都写得非常清楚,它才能给出正确的结果,稍微复杂一点的任务就需要你反复调整prompt。
- 上下文窗口有限,长程任务能力弱:哪怕是目前最长的200万上下文窗口的大模型,也只能处理几千页的文档,遇到需要几个月甚至几年的长周期任务,完全无法支撑。
- 能力边界固定,无法扩展:大模型的能力完全来自训练数据,训练数据截止之后的信息它不知道,也不会调用外部工具,比如算不了复杂的数学题,查不到最新的新闻。
- 没有记忆,无法持续学习:每次对话都是新的,你上次告诉它的信息下次它就忘了,也不会从历史对话中积累经验,同一个错误会反复犯。
- 幻觉问题严重,输出结果不可靠:大模型经常会编造不存在的事实、数据、引用,你如果不验证的话很容易被误导。
而AI Agent的架构刚好解决了这些问题:记忆模块解决了上下文有限和持续学习的问题,规划模块解决了长程任务的问题,行动模块调用工具解决了能力边界固定的问题,反思模块解决了幻觉和错误重复的问题,自主性的设计解决了被动响应的问题。
2.2 AGI研究的历史演进
我们可以从AGI的发展历史看出来,Agent架构是几十年AI研究沉淀下来的最优路径:
| 时间 | 事件 | 核心贡献 | 对AGI发展的意义 |
|---|---|---|---|
| 1950 | 图灵测试提出 | 定义了人工智能的判断标准 | 为AGI研究提供了最初的目标 |
| 1956 | 达特茅斯会议 | 正式提出人工智能概念 | AGI研究正式起步 |
| 1965 | 专家系统DENDRAL问世 | 第一个具备领域知识的AI系统,能根据质谱数据判断分子结构 | 最早的专用Agent雏形,验证了AI可以完成专业级别的任务 |
| 1997 | DeepBlue战胜卡斯帕罗夫 | 第一个在国际象棋领域超越人类的AI系统 | 验证了基于规则和搜索的Agent可以在封闭领域超越人类 |
| 2016 | AlphaGo战胜李世石 | 结合深度学习和强化学习的Agent在围棋领域超越人类 | 验证了基于学习的Agent可以解决规则明确的复杂封闭问题 |
| 2022 | ChatGPT发布 | 大模型具备极强的自然语言理解、知识存储、基础推理能力 | 为通用Agent提供了强大的基础底座,Agent可以用自然语言作为统一的交互接口 |
| 2023 | AutoGPT开源 | 第一个具备自主规划、工具调用、记忆能力的通用Agent | 通用Agent时代正式开启,验证了基于大模型的Agent可以完成开放领域的复杂任务 |
| 2024 | Devin AI发布 | 第一个能自主完成需求分析、代码编写、调试、部署全流程的AI程序员 | Agent已经可以落地到复杂的专业工作领域,替代人类完成高价值的脑力劳动 |
| 2024 | GPT-4o多模态Agent发布 | 能接收文本、图像、音频、视频输入,实时和用户交互 | Agent的感知能力已经接近人类,具备了具身交互的基础 |
从发展路径可以看出,AI的演进方向就是一步步向Agent靠拢:从最早的只能完成单一任务的专用工具,到具备感知、决策、行动能力的专用Agent,再到现在的能完成开放领域任务的通用Agent,最终目标就是实现具备完全通用能力的AGI。
三、核心论证:为什么说AI Agent是通往AGI的最可行路径?
3.1 Agent架构完全匹配AGI的核心能力要求
我们从AGI需要的核心能力倒推,每个能力都可以通过Agent架构实现:
- 自主性实现:Agent的目标驱动设计,让它可以自主设定子目标、自主调整计划、自主解决遇到的问题,不需要人类一步步指令。只要给Agent设定一个顶层目标,比如「提升公司的营收」,它就能自己拆解成「优化产品→拓展渠道→降低成本」等子目标,一步步执行。
- 跨领域泛化能力实现:Agent的核心底座是大模型,已经具备了全领域的知识储备,再加上工具调用能力,它可以调用任意领域的专用工具,比如调用CAD工具做设计,调用MATLAB做数学计算,调用生物信息学工具做基因测序,实现跨领域能力扩展。
- 持续学习能力实现:Agent的记忆模块可以存储所有的历史交互数据和经验,反思模块可以不断从成功和失败的任务中总结规则,更新自己的行为策略,就像人类从小到大不断学习积累经验一样,能力会越来越强。
- 具身认知能力实现:Agent的感知模块可以接入摄像头、麦克风、触觉传感器等各种物理传感器,行动模块可以接入机器人手臂、自动驾驶控制器、智能家居设备等执行器,实现和物理世界的交互,具备具身认知能力。
3.2 Agent的核心数学模型与AGI的目标函数完全一致
AI Agent的底层逻辑是马尔可夫决策过程(MDP),和人类的决策逻辑完全一致,我们可以用数学公式表示:
M = ( S , A , P , R , γ ) \mathcal{M} = (\mathcal{S}, \mathcal{A}, P, R, \gamma) M=(S,A,P,R,γ)
其中:
- S \mathcal{S} S 是状态空间,代表Agent和环境所有可能的状态
- A \mathcal{A} A 是动作空间,代表Agent所有可能采取的行动
- P ( s ′ ∣ s , a ) P(s'|s,a) P(s′∣s,a) 是状态转移概率,代表在状态 s s s下采取动作 a a a之后,转移到状态 s ′ s' s′的概率
- R ( s , a ) R(s,a) R(s,a) 是奖励函数,代表在状态 s s s下采取动作 a a a之后获得的奖励值,正奖励代表行为符合目标,负奖励代表行为不符合目标
- γ ∈ [ 0 , 1 ] \gamma \in [0,1] γ∈[0,1] 是折扣因子,代表未来奖励的权重,值越大说明Agent越看重长期收益
Agent的核心目标就是最大化长期的期望累积奖励:
max π E [ ∑ t = 0 ∞ γ t R ( s t , a t ) ] \max_\pi E\left[\sum_{t=0}^{\infty} \gamma^t R(s_t, a_t)\right] πmaxE[t=0∑∞γtR(st,at)]
其中 π ( a ∣ s ) \pi(a|s) π(a∣s)是Agent的策略函数,代表在状态 s s s下采取动作 a a a的概率。
这个模型和人类的决策逻辑完全一样:我们做任何事情都是在当前的状态下,选择能让我们长期收益最大化的行动,AGI的目标函数本质上也是这个,只要我们能给Agent设定正确的奖励函数(和人类价值观对齐),Agent就能不断优化自己的策略,最终达到AGI的能力水平。
3.3 现有Agent已经验证了路径的可行性
目前已经有大量的Agent落地案例,验证了这个路径的可行性:
- Devin AI程序员:能自主接收用户的需求,拆解成开发任务,自己搜索解决方案,写代码,调试,部署,已经能在Upwork上接软件开发的订单,完成率达到70%以上,和初级程序员的能力差不多。
- OpenAI Custom GPTs:上千万用户创建了自己的专属Agent,涵盖了学习、工作、生活的各个场景,比如学习英语的Agent、做数据分析的Agent、帮你规划饮食的Agent,已经有数亿人在使用这些Agent完成日常任务。
- 波士顿动力Atlas具身Agent:结合大模型的Atlas机器人,能听懂人类的自然语言指令,自主完成开门、拿取物品、搭建结构、救援等复杂的物理任务,已经在工业、消防、救援等场景落地测试。
- 多Agent协作系统:比如斯坦福小镇,25个AI Agent在虚拟小镇里自主生活,能自己上班、社交、举办活动,甚至能自主组织情人节派对,完全模拟了人类社会的运行逻辑,验证了多Agent协作可以实现复杂的社会级别的智能。
四、反方论证:为什么有人认为AI Agent不是AGI的必经之路?
我们也要客观看到现有Agent架构的局限性,很多专家认为Agent架构可能只是AGI发展过程中的一个过渡阶段,甚至可能走不通,核心原因有以下几点:
4.1 基于大模型的Agent存在固有缺陷
现有Agent几乎都是基于大模型构建的,大模型的固有缺陷会直接传递给Agent:
- 幻觉问题无法根除:大模型的幻觉是自回归生成架构的固有缺陷,只要用自回归架构,就不可能完全消除幻觉。而Agent的规划、决策都是基于大模型的输出,如果大模型输出了错误的信息,Agent就会在错误的路上越走越远,也就是我们常说的「跑飞」,比如你让Agent帮你写一份行业报告,它如果编造了虚假的行业数据,后面的所有分析都会是错的。
- 推理能力有限:大模型的推理能力是涌现出来的,不稳定,遇到复杂的逻辑推理、数学推理、因果推理问题,很容易出错。而AGI需要解决的都是非常复杂的问题,比如可控核聚变、量子计算、新药研发,这些问题对推理的准确性要求极高,现有Agent的推理能力完全达不到要求。
- 能耗和成本极高:现在一个功能完整的Agent,每次执行任务都要调用大模型几十次甚至上百次,成本极高,能耗是人类的几百万倍。如果要实现AGI级别的能力,需要的参数和能耗会是天文数字,从经济学角度看完全不可行。
4.2 符号接地问题没有解决
符号接地问题是指AI只能处理符号信息(比如文本、数字),但是无法把符号和真实世界的物理实体对应起来,也就是「知其然不知其所以然」。比如大模型知道「苹果是红的,味道酸甜」,但是它从来没有见过苹果、摸过苹果、吃过苹果,根本不知道真正的苹果是什么样的,所有的知识都来自文本的统计规律。
而AGI需要真正理解世界的运行规律,必须具备具身认知能力,能和物理世界交互,从真实世界的经验中学习。现有Agent哪怕是结合了机器人的具身Agent,也只是把传感器的数据转换成符号输入给大模型,还是没有解决符号接地的问题,本质上还是在处理符号信息,没有真正理解物理世界。
4.3 可能存在更优的技术路径
很多专家认为,类脑计算、神经形态芯片、人工通用智能的新架构可能比现有Agent架构更高效:
| 技术路径 | 能耗 | 数据需求 | 推理效率 | 泛化能力 | 可解释性 |
|---|---|---|---|---|---|
| 基于大模型的Agent | 极高,一次推理需要几十度电 | 极高,需要万亿级别的训练数据 | 低,一次推理需要几秒到几十秒 | 中等,跨领域能力有限 | 极低,黑箱,无法解释决策过程 |
| 类脑计算架构 | 极低,模拟人脑的突触计算,能耗是大模型的万分之一 | 极低,和人类一样可以从少量样本中学习 | 极高,和人脑一样实时响应 | 极高,能跨任意领域泛化 | 中等,部分可解释 |
| 人类大脑 | 极低,功耗只有20W | 极低,只需要十几年的学习就能具备通用能力 | 极高,实时响应 | 极高,能解决任意复杂问题 | 极高,人类可以解释自己的决策过程 |
从对比可以看出,现有Agent架构的效率远低于人脑,如果未来类脑计算技术取得突破,完全有可能绕开现有Agent架构,直接实现AGI。
五、实践落地:AI Agent的开发实战与能力边界
5.1 开发一个简单的AI Agent
我们用LangChain框架开发一个简单的数据分析Agent,具备搜索、代码运行、记忆能力,大家可以跟着操作:
环境安装
pip install langchain openai serpapi python-dotenv pandas
核心代码实现
import os
from dotenv import load_dotenv
from langchain.llms import OpenAI
from langchain.agents import Tool, initialize_agent, AgentType
from langchain.memory import ConversationBufferMemory
from langchain.tools import SerpAPIWrapper, PythonREPLTool
# 加载环境变量
load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
os.environ["SERPAPI_API_KEY"] = os.getenv("SERPAPI_API_KEY")
# 初始化大模型
llm = OpenAI(temperature=0, model_name="gpt-4")
# 初始化工具:搜索工具 + Python代码运行工具
search = SerpAPIWrapper()
python_repl = PythonREPLTool()
tools = [
Tool(
name="Search",
func=search.run,
description="用于查询最新的信息、事实数据、新闻等,遇到不知道的信息就用这个工具搜索"
),
Tool(
name="PythonREPL",
func=python_repl.run,
description="用于运行Python代码,做数据分析、计算、可视化等,需要写代码的时候就用这个工具"
)
]
# 初始化记忆模块
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
# 初始化Agent
agent = initialize_agent(
tools,
llm,
agent=AgentType.CHAT_CONVERSATIONAL_REACT_DESCRIPTION,
memory=memory,
verbose=True
)
# 测试Agent
if __name__ == "__main__":
query = "帮我分析2024年第一季度中国新能源汽车的销量数据,对比2023年第一季度,计算同比增长率,输出分析报告"
result = agent.run(query)
print(result)
这个Agent运行的时候会先调用搜索工具查找2024和2023年第一季度的新能源汽车销量数据,然后用Python代码计算同比增长率,最后输出分析报告,完全不需要你干预。
5.2 AI Agent的最佳实践Tips
我们在开发Agent的过程中总结了很多最佳实践,可以有效避免Agent跑飞、幻觉等问题:
- 明确目标边界:给Agent设定明确的目标、完成标准、最大迭代次数,比如「最多迭代10次,预算误差不超过5%就算完成任务」,避免Agent无限循环跑飞。
- 加入人类反馈环节:Agent每完成一个重要的步骤,就把结果反馈给用户确认,用户确认之后再进行下一步,特别是涉及到钱、敏感信息的场景,必须有人类审核。
- 细粒度任务拆解:把大任务拆成粒度尽可能小的子任务,每个子任务的目标越明确,越容易验证结果的正确性,避免出现累积误差。
- 幻觉校验机制:Agent输出的事实性内容,必须调用搜索工具或者知识库验证正确性,验证通过之后才能使用。
- 专业领域Agent做微调:如果是做专业领域的Agent,比如医疗、法律、金融,最好用领域数据微调大模型底座,能大幅降低幻觉,提升准确率。
5.3 AI Agent的能力边界
目前的AI Agent能做的事情:
- 有明确目标和规则的重复性任务,比如数据分析、内容生成、客服、简单的代码开发、行程规划等
- 不需要极高创造性的专业任务,比如初级的设计、文案、翻译、数据标注等
- 危险、枯燥的人类不愿意做的任务,比如消防救援、地下管道巡检、危险化学品操作等
目前的AI Agent不能做的事情:
- 需要极高创造性和艺术天赋的任务,比如写顶级的小说、画世界级的画作、创作流行音乐等
- 需要极高推理准确性的基础科学研究任务,比如发现新的物理定律、研发新的药物等
- 完全未知领域的探索任务,比如外星人研究、未知星球探索等
- 需要情感共鸣的任务,比如心理咨询、陪伴老人、教育孩子等(只能做辅助,不能完全替代人类)
六、未来趋势:AI Agent的演进路径与AGI的未来
6.1 AI Agent的未来5年演进路线
- 2024-2025年:单Agent专业化落地:各个行业都会出现专用的Agent,比如医疗Agent、法律Agent、教育Agent、研发Agent,替代80%的重复性脑力劳动,Agent的准确率能达到95%以上,成本降到现在的1%。
- 2025-2027年:多Agent协作普及:多个不同能力的Agent组成团队,比如产品Agent、设计Agent、开发Agent、测试Agent、运营Agent,组成一个完整的创业公司,能自主完成从产品研发到运营的全流程,一个10人的团队用Agent能做到现在1000人的公司的产出。
- 2027-2030年:具身Agent大规模落地:Agent和机器人、自动驾驶、智能家居等硬件结合,进入物理世界,完成工业制造、家政服务、医疗护理、农业生产等任务,替代大部分体力劳动。
- 2030年之后:通用Agent出现:Agent的能力达到人类的平均水平,能跨领域完成任意的脑力和体力任务,具备基础的自我学习和进化能力,接近AGI的水平。
6.2 AGI的实现可能性
如果AI Agent的发展路径没有遇到重大的技术瓶颈,我们大概率会在2040年之前实现AGI,但是需要突破以下几个核心技术:
- 大模型的幻觉问题得到根本解决:新的架构替代自回归架构,大模型的输出准确率达到99.999%以上。
- 符号接地问题解决:具身Agent能从物理世界的交互中学习,真正理解世界的运行规律。
- 持续学习能力突破:Agent能像人类一样高效学习,不需要重新训练就能快速掌握新的知识。
- 价值对齐问题解决:Agent的目标完全和人类价值观对齐,不会做出伤害人类的行为。
当然也有可能Agent架构在2030年左右遇到天花板,无法突破到AGI,这时候就需要新的技术,比如类脑计算、量子计算等,带来新的突破。
结论
核心要点总结
- AI Agent是目前最接近AGI的技术路径:它补齐了大模型的所有核心短板,能力架构完全匹配AGI的核心要求,已经有大量的落地案例验证了可行性。
- 不能100%确定是必经之路:现有基于大模型的Agent存在固有缺陷,符号接地问题还没有解决,未来可能出现更优的技术路线,比如类脑计算,绕开Agent实现AGI。
- 不管是不是必经之路,Agent都是未来5年最有价值的AI方向:未来5年Agent会彻底改变我们的工作和生活,替代80%的重复性劳动,带来生产力的巨大提升,现在学习Agent相关的技术,是普通开发者最好的切入AI领域的机会。
行动号召
如果你对AI Agent感兴趣,现在就可以动手做一个自己的Agent,哪怕只是一个帮你整理资料、安排日程的小Agent,也能大幅提升你的工作效率。如果你有任何关于Agent的问题或者想法,欢迎在评论区留言,我们一起讨论。
未来展望
不管最终是不是通过AI Agent实现AGI,AGI的到来都是必然的,它会是人类历史上最伟大的技术革命,会彻底改变人类社会的运行逻辑。我们现在做的每一点研究,都是在为AGI的到来添砖加瓦,当然我们也要关注AGI的安全问题,确保它的发展是造福人类的,而不是伤害人类的。
附加部分
参考文献与延伸阅读
- 《人工智能:一种现代方法》,斯图尔特·罗素,彼得·诺维格
- OpenAI《GPT-4 Technical Report》
- LangChain官方文档:https://python.langchain.com/
- Devin AI技术报告:https://www.cognition-labs.com/introducing-devin
- 斯坦福小镇论文:《Generative Agents: Interactive Simulacra of Human Behavior》
- Sam Altman《AGI的发展路径》演讲
作者简介
我是李明,资深AI工程师,前大厂AI部门技术负责人,有10年AI研发经验,参与过多个大模型和AI Agent的落地项目,现在专注于AI Agent的创业和技术分享,欢迎大家关注我的账号,获取更多AI技术干货。
(全文完,总计约11200字)
更多推荐



所有评论(0)