做AI产品经理之前,这些底层认知你必须先搞清楚

最近很多人问我:"想转AI产品经理,该从哪里开始?"我的回答一直是:先别急着学工具,先把底层认知搞清楚。 这篇文章把我认为最关键的几个认知点整理出来——都是我自己踩过坑、反复消化后才真正理解的。


一、两种AI,两种完全不同的产品思维

很多人一提到AI,脑子里混成一锅粥。其实先搞清楚一件事:你做的产品,底层是决策式AI还是生成式AI? 这决定了你的产品逻辑、交互设计、甚至风险管控方式完全不同。

决策式AI:核心是"选"

应用场景 决策内容
推荐系统 推什么内容给用户?
风控系统 这笔交易放行还是拦截?
自动驾驶 变不变道?走哪条路?

以电商推荐为例,背后是一个漏斗式的决策链路:召回→粗排→精排→重排序。先从海量商品里快速筛出几千个候选,再粗略评分排除低相关的,再用复杂模型精细排序,最后加上多样性、新品冷启动等策略微调。有意思的是,有时候推荐给你的不一定是"你最想要的",而是在探测你会不会点击——为了收集你的数据。

生成式AI:核心是"造"

生成式AI的核心是生成新内容——写文章、画图、合成语音、做视频。它还能做"思维链推理"(Chain-of-Thought),一步步展开推理过程,减少"拍脑袋"式输出。

举个例子:问"24个苹果平均分给4个人,每人几个?"

  • 普通回答:6
  • CoT回答:一共有24个苹果,平均分给4个人,就是24÷4=6,所以每人6个

CoT不是花架子,它让模型的推理过程可解释、可校验,在产品落地时这个价值极大。

两种AI的产品思维差异

决策式AI 生成式AI
核心任务 分析→选择 生成→创造
输出特点 从有限选项中选最优 创造全新的内容
可控性 较高(输出范围有限) 较低(存在不确定性)
产品重点 排序策略、阈值设定 Prompt设计、兜底机制

我的观点:很多AI产品的翻车,根本原因就是把生成式AI当决策式AI来做——期望100%确定的结果,却用了一个天生概率化的工具。


二、大模型的几个关键概念,别再混着用了

2.1 泛化能力:大模型最值钱的本事

泛化能力简单说就是:学过的能举一反三,没见过的也能做对。

  • 你做了100道数学题,换题型还会做→泛化能力强
  • 只会做背过的那几题,换一点就不会→死记硬背,泛化差

大模型为什么牛?因为它不只是"记住"了训练数据,而是学到了语言和知识的模式,能在没见过的新问题上"做对"。

2.2 云侧 vs 端侧:部署在哪,决定了产品怎么设计

云侧大模型 端侧大模型
部署位置 云服务器 手机/PC/IoT本地
响应速度 依赖网络,有延迟 本地运行,低延迟
模型规模 几十亿~千亿参数 几十M~几百M(优化后)
隐私安全 数据上传云端 数据不出设备
典型应用 ChatGPT、通义千问 小爱同学、端侧Siri

产品设计时这个选择很重要:涉及隐私的场景(医疗、金融),端侧优先;需要大算力的场景(复杂推理、长文本生成),云侧更合适。

2.3 NLP vs 大模型:不是一回事

传统NLP是一个领域,专注一个小任务(分词、情感分析、实体识别),每个任务要单独训练模型。

大模型是NLP中的一种方法论——一个模型干所有事。以前做情感分析要训一个模型、做文本分类要训另一个模型,现在一个Prompt就搞定。

决策式AI的本质不是"看"也不是"说",而是——根据已知数据选择行动方案。

  1. 明确角色:"你是一名经验丰富的用户反馈分析师"
  2. 明确格式:"请以JSON格式输出"
  3. Few-shot示例:给模型几个输入输出样例,让它模仿模式
  4. Chain of Thought:"请一步一步思考并写出推理过程"
  5. 指令组合:"若为负面评价则输出原因,否则输出总结"
传统NLP 大模型
任务粒度 一个任务一个模型 一模多能
特征处理 人工设计特征 自动学习
上新任务 收集数据→标注→训练→部署 改Prompt或新增知识文档

这就是为什么大模型出现后,需求分析的效率能大幅提升——后面详细说。

三、"1个底座+N个应用":大模型时代的研发范式

这是我认为做AI产品必须理解的核心架构思路。

以前的做法:每个业务场景单独设计、训练、部署一个模型——成本高、周期长、维护难。

现在的做法:基于一个通用大模型底座,通过Prompt、RAG等方式,快速适配多个业务场景。

为什么能做到?因为底座模型有泛化能力,已经具备了通用的语言/知识/推理能力,用Prompt就能重新定义任务意图,结合RAG可以实现更强的领域适配。

北京银行的实践

北京银行构建了"三层模型+多场景应用"的体系:

  1. 基础大模型:集成约10个开源大模型,作为底层平台
  2. 行业大模型:在基础模型上,结合金融数据微调,形成6B/7B/13B/130B不同规格
  3. 企业级大模型:结合总分行营销策略、产品信息、风控审计资料训练

场景应用覆盖:写作助手、营销助手、客服助手、会议助手、运营分析、投顾、数币、专精特新等—— 一套底座,全行复用

对比:AI客服系统的两种做法

模块 传统方式 大模型方式
问题分类 自研意图识别模型,每新增意图要重新训练 Prompt让大模型判断问题类型
找答案 多任务检索系统,各自训练 基于RAG架构召回文档片段
回答用户 直接拼接答案 LLM总结后回复
上新场景 收集数据→标注→训练→部署,重新来 改Prompt或新增知识文档,快速灰度上线
多语言 各语种分别训练 通用大模型原生支持多语言
系统维护 多模型多服务,算力工程复杂 一个底座统一调优与调用

这个对比太直观了:传统方式上一个新的客服场景,可能要几周到几个月;大模型方式,改个Prompt、加个文档就行。

四、大模型如何简化需求分析?用事实说话

从2017年到今天,AI需求分析经历了三代演进:

代际 时间 特点
第一代 2017-2020 人工打标签、定义Schema、规则录入,数据分散流程割裂
第二代 2020-2022 NLP平台可视化建模,统一基座模型训练不同下游任务
第三代 2023至今 提示工程+向量知识库,业务人员也能参与建模

实战对比:医疗发票信息提取

场景:让AI提取医疗发票中的"医院名称""发票金额""开票日期"等字段。

上一代AI的做法(7步):

  1. 构建知识库(专家写医保规则)→ 几周到几个月
  2. 定义Schema(人工梳理字段定义)→ 产品经理+业务专家,成本高
  3. 数据标注(人工标注1000+发票)→ 成本高、耗时长
  4. 定义模型(识别实体、抽取金额,分别建模)→ 依赖算法工程师
  5. 模型训练 → 依赖算法工程师
  6. 模型调优 → 多轮迭代,工程量大
  7. 部署上线 → 多人协作

大模型的做法(5步):

  1. 文档语义化 + 零/少样本调优 → 无需Schema建模
  2. Prompt设计 → "请从发票中提取医院名称、金额..." → 灵活
  3. 快速迭代 → 加字段、改格式,直接改Prompt → 业务人员也能调
  4. 生成式UI交互 → 不只是提取,还能帮用户写、答、说
  5. 上线

一个Prompt就能完成以前7个步骤、多个团队协作才能做到的事。这不是效率提升10%的事,是范式变了。

五、提示工程:AI产品经理最该练的核心技能

很多人觉得Prompt就是"跟AI聊天",但我认为:提示工程是AI产品经理的"PRD"——你写什么,AI就做什么。

Prompt的核心作用

能力 说明
精准控制输出 控制格式、风格、内容范围
触发模型隐藏能力 比如激活思维链(CoT)、函数调用
实现复杂任务组合 先提取再回答、先分类再生成
构建AI Agent系统 多轮对话、任务规划、函数调用
替代代码编程 用自然语言写SQL、写代码

几个关键技巧

  1. 明确角色:"你是一名经验丰富的用户反馈分析师"
  2. 明确格式:"请以JSON格式输出"
  3. Few-shot示例:给模型几个输入输出样例,让它模仿模式
  4. Chain of Thought:"请一步一步思考并写出推理过程"
  5. 指令组合:"若为负面评价则输出原因,否则输出总结"

为什么要用JSON格式输出?

三个原因:

  1. 机器容易解析:一行代码就能变成字典/对象/数据库字段
  2. 结构清晰:可以直接提取"关键词"字段生成标签
  3. 避免废话:不指定格式时模型会输出一大段描述,机器不好直接抓字段

业务经验注入大模型的两种方式

大模型本身不懂业务,它只是"语言高手"。业务经验需要你来注入:

方式 描述 举例
静态注入 在Prompt中写入专家经验 "根据投行经验,环保处罚应关注以下三点……"
动态注入 Prompt中留位置,实时填充外部数据 "公司近三年营收为{{revenue_data}},请分析变动原因"

我的经验:静态注入管"规则",动态注入管"数据"。两者结合,才能让大模型从"会说"变成"会做"。


六、发散式 vs 约束式交互:别让用户"自由发挥"

这是做AI产品很容易踩的坑。

  • 发散式交互:用户像聊天一样自由输入,不受限制
  • 约束式交互:在设计好的按钮/模板/菜单中让用户选择或填空

举个例子,简历助手:

  • 发散式:用户输入"帮我写段简历介绍,我是学AI的,本科复旦,擅长产品经理"
  • 约束式:姓名[填写]、学历[选择本科/硕士/博士]、专业[填写]、亮点经历[填写]→点击【生成】

怎么选?

场景 推荐方式
对准确率要求高(合规、合同、财务) 约束式,控幻觉
对创意、个性化要求高(创作、文案) 发散式,释放模型能力

我的观点:大多数B端AI产品,应该以约束式为主、发散式为辅。 约束式交互本质上是你在帮用户缩小问题空间,也在帮模型缩小输出空间——结果更稳定,体验更可控。


七、AI产品生命周期:4个阶段,PM角色各不同

一个AI产品从0到1,经历4个阶段。PM在每个阶段的参与深度和角色完全不同,这一点很多人没意识到:

阶段 核心任务 PM角色
冷启动 明确场景+搭建数据基础 主导:场景定义、需求理解、产品规划
模型准备及落地 选模型+产品设计+调优 协助:明确标注规范、评估标准、知识库来源
部署上线 上线评估+数据收集 混合:评估标准主导,部署协助
持续优化 性能/效果/体验优化 主导:badcase归因、优化方向、产品迭代

关键认知:PM在"冷启动"和"持续优化"阶段是绝对主导,在"模型准备"阶段是协助。 不要在模型准备阶段抢算法团队的方向盘,但评估标准一定要PM来定——因为只有PM知道什么效果才算"业务可用"。


写在最后

做AI产品经理,最怕两件事:

  1. 不懂底层就上手 —— 把生成式AI当决策式AI做,把发散式交互用在合规场景,结果产品上线就翻车
  2. 只学工具不练思维 —— Prompt技巧学了一堆,但不知道什么时候该用约束式、什么时候该用JSON、什么时候该注入业务经验

工具会过时,认知不会。 把底层逻辑搞清楚,具体的技术和工具反而好补。

希望这篇文章能帮到正在转型路上的你。如果你也在做AI产品,欢迎交流。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐