Agents 融入产品¶

insightureAI 产品的 AI 能力升级路线图。本文回答三个问题：我们有什么 AI 能力可用、该优先做什么（ROI 排序）、具体怎么做（架构 + Workflow）。

读者：产品负责人、后端工程师、Tech Lead。读完后能判断每个集成机会的优先级和技术可行性。

前置阅读：AI 工具体系指南 — 理解 Built-in Tools / MCP / Skills / CLI 的分层模型和 Host/Client/Server 架构。

一、出发点：能不能在产品里嵌入 Claude Code？¶

"能不能在我们的产品里跑一个类似 Claude Code 的 Host，连上我们自己的 MCP Server（DynamoDB、Neon、RingCentral），自动拥有 tool-calling + MCP + context management 的全套能力？"

方向对，但 Claude Code 本身不是正确的载体。

为什么不嵌入 Claude Code（点击展开）

Claude Code 不开源。 它是 Anthropic 的商业产品（CLI 工具），代码不公开。

更重要的是，Claude Code 的 Built-in Tools 是给程序员写代码用的，不是给健身房老板用的：

Claude Code 的 Built-in Tools	insightureAI 需要的 Tools
Read / Write / Edit — 编辑源代码文件	`search_leads` — 按状态/温度查 PhoneBook
Grep / Glob — 搜索代码库	`get_call_analysis` — 查通话 AI 分析结果
LSP — 跳转定义、查引用	`get_sms_thread` — 查 SMS 对话历史
Bash — 跑 git、npm、aws cli	`create_campaign` — 创建营销活动
Task / Team — 多 agent 协作	`diagnose_churn` — 流失诊断

Claude Code 的 Read/Write/Grep 对 gym owner 毫无用处。我们需要的是健身房业务领域的 tools。

Anthropic Agent SDK（TypeScript + Python）是开源的，但定位是给开发者做内部工具（SRE 机器人、代码审查、oncall 助手）。对客户产品来说，直接用 Claude API tool-calling 更简单、更可控。

二、我们实际拥有什么能力¶

Claude Code 里让人觉得"很厉害"的能力——tool-calling、多轮推理、自动选择工具——不是 Claude Code 的能力，是 Claude API 的能力。 直接调 API 就有。

Claude Code 的架构可以拆解为 6 层（参见 AI 工具体系指南 §3.2）。每一层我们都能自己实现：

Claude Code 的层	做什么	insightureAI 的对应实现
System Prompt	教 AI 怎么做	健身房领域 prompt（Skills 内容编译进来）
Tool-calling	AI 选工具执行	6 个业务 tools（见§四）
Agentic Loop	多轮自动调用	`while (stop_reason === "tool_use")` 循环
MCP Client	连外部系统	不需要。直接在代码里写 tool 函数更简单
Context Management	防止超长	对话历史裁剪
Permission	人类确认	审批工作流（Campaign 发送前确认）

核心 loop 代码只有 30 行：

async function agenticChat(userMessage: string, tenantId: string) {
  const messages = [{ role: "user", content: userMessage }];

  let response = await anthropic.messages.create({
    model: "claude-opus-4-6",
    system: GYM_SYSTEM_PROMPT,  // Skills 内容编译进来
    tools: GYM_TOOLS,           // 业务 tools
    messages,
  });

  // Agentic loop: AI 自己决定调几次 tool
  while (response.stop_reason === "tool_use") {
    const toolCall = response.content.find(b => b.type === "tool_use");
    const result = await executeTool(toolCall.name, toolCall.input, tenantId);

    messages.push({ role: "assistant", content: response.content });
    messages.push({ role: "user", content: [{
      type: "tool_result", tool_use_id: toolCall.id, content: result
    }]});

    response = await anthropic.messages.create({
      model: "claude-opus-4-6",
      system: GYM_SYSTEM_PROMPT,
      tools: GYM_TOOLS,
      messages,
    });
  }

  return response.content.filter(b => b.type === "text");
}

这个 while 循环就是 Claude Code 的核心。AI 工具体系指南 §3.7 描述的 7 步流程，在这段代码里全部体现。

三、正确的产品架构¶

不需要 MCP、不需要 Agent SDK、不需要嵌入 Claude Code。我们要的是在 Vue 前端加一个 AI Chat 面板，背后是 Hono API 调 Claude API。

┌─────────────────────────────────────────────────────────────┐
│  apps/web (Vue 3)                                            │
│  ├── Dashboard（已有）                                       │
│  ├── AI Chat Panel（新）← 老板在这里跟 AI 对话               │
│  └── Campaign Wizard（新）← AI 推荐 + 人工审批               │
└──────────────────────┬──────────────────────────────────────┘
                       │ HTTP
┌──────────────────────▼──────────────────────────────────────┐
│  apps/api (Hono + Lambda)                                    │
│  ├── /api/ai/chat     ← 接收用户消息                         │
│  ├── agenticLoop()    ← while(tool_use) 循环                 │
│  ├── GYM_TOOLS:                                              │
│  │   ├── search_leads()        → DynamoDB PhoneBook          │
│  │   ├── get_call_analysis()   → DynamoDB call-analysis      │
│  │   ├── get_sms_thread()      → DynamoDB MessageStore       │
│  │   ├── query_metrics()       → Neon PostgreSQL             │
│  │   ├── create_task()         → DynamoDB Tasks              │
│  │   └── generate_campaign()   → 模板验证 + 返回预览          │
│  └── GYM_SYSTEM_PROMPT:                                      │
│      ← docs/skills/gym-domain/*.md 的内容编译进来             │
└─────────────────────────────────────────────────────────────┘
                       │
              Anthropic API (Claude Opus 4.6)

为什么不需要 MCP¶

MCP 是给"多个不同 AI client 连同一个 server"的场景设计的（参见 AI 工具体系指南 §3.1）。我们的产品只有一个 AI backend（Hono API），直接在代码里写 tool 函数就行。

Tool-calling 本身就是结构化的（JSON schema）、安全的（tenant 隔离）、可扩展的。

为什么不需要 Agent SDK¶

我们的 agentic loop 就是一个 while 循环 + 6 个 tool 函数。Agent SDK 解决的是更复杂的场景（多 agent 编排、文件系统操作、长时间会话）。

Skills 怎么用¶

不是给客户用的产品功能，而是两用：

开发时 — Claude Code 加载 Skills，理解健身房业务逻辑
生产环境 — Markdown 内容编译进 GYM_SYSTEM_PROMPT

// 构建时把 Skill 内容注入 system prompt
import { readFileSync } from "fs";

const OBJECTION_SKILL = readFileSync(
  "docs/skills/gym-domain/objection-framework.md", "utf8"
);

const GYM_SYSTEM_PROMPT = `你是一个健身房销售和客户留存 AI 助手。

## 异议分类框架
${OBJECTION_SKILL}
`;

知识随代码库演进。更新 Markdown，所有 AI 分析自动使用新版本。

四、ROI 排序：TOP 10 集成机会¶

知道了能力边界后，按 ROI 排优先级。

排名	集成项	ROI	难度	周期	技术方案
1	AI 诊断对话	⭐⭐⭐⭐⭐	中	4-6 周	Claude API tool-calling
2	Dashboard 文字洞察	⭐⭐⭐⭐⭐	低	2-4 周	Claude API + Neon SQL
3	Campaign Engine	⭐⭐⭐⭐⭐	高	8-12 周	Orchestrator/Specialist 多 agent
4	Staff Coaching	⭐⭐⭐⭐	中	4-6 周	Per-Call AI 增强（已设计）
5	内部 Skills	⭐⭐⭐⭐	低	1-2 周	Markdown Skills 文件
6	Churn 预测模型	⭐⭐⭐⭐	高	8-12 周	ML 模型 + Claude 解读
7	自动 Task 生成	⭐⭐⭐	中	4-6 周	Tool-calling + 模板验证
8	MCP Server（合作伙伴）	⭐⭐⭐	中	3-5 周	Streamable HTTP MCP
9	自动 SMS 发送	⭐⭐	很高	12-16 周	审批工作流 + TCPA 合规
10	Agent SDK 内部工具	⭐⭐	低	2-3 周	TypeScript Agent SDK

五、详细 Workflow¶

#1 AI 诊断对话¶

ROI 最高，改变用户体验。

老板在 Dashboard 点击一个 lead/member，问 "为什么这个人流失了？"。AI 自动拉取通话记录、SMS 历史、付款记录、到访频率，综合诊断原因并推荐行动。

老板点击 "Diagnose" 按钮
→ 前端发送 { member_id, question } 到 Hono API
→ API 调用 Claude Opus 4.6 + 4 个 tools:
    ├─ get_member_history (PhoneBook)
    ├─ get_call_analysis (call-analysis 表)
    ├─ get_sms_thread (MessageStore)
    └─ get_payment_history (外部/DDB)
→ Claude 自动选择需要的 tools，多轮调用
→ 返回结构化诊断: 根因 + 贡献因子 + 推荐行动
→ 前端展示卡片式结果

为什么 ROI 最高： 直接回答老板最核心的问题——"我的钱去哪了？"。目前老板要自己翻 3 个不同的页面去拼凑答案，AI 把这变成一次点击。

技术选型： Claude API tool-calling。不是 Bedrock Agents，不是 Agent SDK。

所有数据已在 DynamoDB + Neon
每次请求约 $0.003，成本极低
延迟 2-5 秒，可接受

核心挑战： 定义好 4-5 个 tools 的 JSON schema，做好 tenant 隔离（每个 query 必须带 tenantId）。

#2 Dashboard 文字洞察¶

最快见效。

Dashboard 顶部加一段 AI 生成的文字总结：

"本周转化率下降 5%，主要原因是周三的 3 个高意向 lead 爽约。建议：给这 3 人发 SMS 重新预约。"

Daily Batch Job (06:00 UTC，已设计好)
→ 查询 Neon: 关键指标 vs 上周/上月对比
→ Claude 生成 3-5 句自然语言总结
→ 存入 DDB summary 表
→ 前端 Dashboard 加载时显示

为什么 ROI 高： 实现最简单（2-4 周），但对老板感知价值巨大。从看数字变成看"AI 在说话"。这是 Level 1 Describe，也是产品从"工具"变成"顾问"的第一步。

技术选型： 复用已有的 Daily Batch 架构（AI 分析插入点设计 Layer 2），加一个 summary generation 步骤。

#3 Campaign Engine¶

最大的产品差异化。 详见 Campaign Engine 设计。

关键技术决策：自研 tool-calling，不用 Bedrock Agent。

维度	Bedrock Agents	Claude API Tool-Calling
模型版本	落后 Anthropic API 2-4 周	始终最新
复杂度	IAM / VPC / Quota 配置	API key + 代码
控制力	Agent 框架控制循环	我们控制整个循环
适用场景	需要 VPC 隔离	客户产品（我们的场景）

Workflow 使用 Orchestrator/Specialist 模式：

老板: "给这个月到期的会员做个召回活动"

Campaign Orchestrator (Claude Opus 4.6)
├── 调用 tool: search_expiring_members → 找到 47 人
├── 调用 tool: analyze_churn_risk → 筛出 12 个高风险
├── 调用 tool: get_interaction_history → 了解每人情况
├── 生成个性化 SMS 文案（基于通话记录中的兴趣点）
├── 调用 tool: validate_campaign → 模板合规检查
└── 返回: 活动方案 + 12 条个性化 SMS 预览

老板审核 → 点击确认 → 批量发送

竞品对标： Keepme（健身房 AI）用 Random Forest 预测流失，准确率 95%。但 Keepme 是事后预测（predict churn），我们是事中干预（influence outcome during call + proactive outreach）。这是核心差异。

#4 Staff Coaching¶

已设计好，直接落地。

Per-Call AI 分析出 coaching 建议，告诉 manager "这个员工在处理价格异议时错过了 3 个机会"。

已有能力：

Deepgram 转录 ✅
Bedrock AI 分析 ✅（AI 分析插入点设计 Layer 1）
call-analysis 表 ✅

缺什么：结构化的 coaching 输出 schema（异议类型分类、评分、改进建议）。

Workflow：复用 Per-Call 管道，在 Prompt A 里增加 coaching 输出字段。

#5 内部 Skills¶

投入最小，持续回报。

不是客户产品功能，而是给团队用的领域知识库。

docs/skills/
├── gym-call-analysis/
│   ├── objection-framework.md    # 异议分类: 价格/时间/健身水平/承诺
│   ├── coaching-patterns.md      # 销售技巧模板
│   └── churn-risk-signals.md     # 流失信号定义
├── campaign-engine/
│   ├── campaign-templates.md     # 活动模板库
│   └── compliance-rules.md       # TCPA 合规规则
└── data-pipeline/
    └── troubleshooting.md        # 管道故障排查

双重用途：

Claude Code 加载 — 开发时自动理解业务逻辑
注入 system prompt — 生产环境把 Markdown 内容嵌入 AI 的系统提示词（见§三代码示例）

ROI：投入 1-2 周整理现有知识 → 永久提升所有 AI 分析的质量。

#6 Churn 预测模型¶

需要 ML 基础设施。

Claude 不是统计预测器，它是推理引擎。需要混合架构：

ML 模型（RandomForest / XGBoost）
→ 每日 batch 对所有活跃会员评分
→ 输出: (member_id, churn_probability, top_3_factors)

Claude
→ 接收预测结果 + 会员历史
→ 生成自然语言解读 + 推荐行动

前提条件：2 年以上历史数据 + 模型训练。Neon PostgreSQL 可以存储特征数据，Lambda 跑 batch scoring。

#7 自动 Task 生成¶

AI 根据通话结果自动创建跟进任务。

Per-Call AI 分析完成
→ 判断: 需要跟进吗？什么类型？
→ 调用 tool: create_task
    ├─ lead_id
    ├─ employee_id
    ├─ task_type: "call" | "sms" | "appointment"
    ├─ description: "客户表达价格顾虑，建议 3 天内跟进提供分期方案"
    └─ due_date: 3 天后
→ Tasks 表写入
→ 员工端看到待办

关键：使用模板验证。AI 推荐的 task 必须匹配预定义模板，不允许自由发挥。

#8 MCP Server¶

面向生态，不面向终端用户。

MCP 不是给 gym owner 用的。Gym owner 不会装 Claude Desktop。

正确定位：MCP Server 是面向合作伙伴、顾问、集成商的 AI-native API。

场景示例：

健身房顾问在 Claude.ai 里问 "Show me gym ABC's conversion funnel this month" → Claude 通过 MCP server 查询
竞品分析师用 AI 工具对比多家健身房数据

现在值得做吗？ 不急。等有 10+ 合作伙伴客户再考虑。优先做 #1-#4。

#9 自动 SMS 发送¶

Level 5 自动化。暂不建议。

风险	说明
治理风险	100 条 SMS 未经审批 → 垃圾短信 + 品牌损害
合规风险	TCPA（美国电话营销法）要求可追溯的决策依据
无回滚	SMS 发出去就收不回来

前提条件：实时监控、Kill-switch（5 秒内暂停）、审计日志、A/B 测试框架、法律审查。

过渡方案（Level 4.5）：AI 生成推荐 → 批量审批 → 人工确认后执行。

#10 Agent SDK 内部工具¶

用 Claude Agent SDK（TypeScript）给团队做内部辅助工具。

适用场景：

数据管道故障诊断
跨仓库代码影响分析
自动化 on-call runbook

不适用于客户产品。优先级低。

六、5 级自动化金字塔¶

Level	能力	现在能做？	前提条件	定价参考
L1 Describe	AI 文字总结、趋势描述	✅ 今天就能	Neon SQL + Claude API	$50-100/月
L2 Diagnose	根因分析、异常诊断	✅ 今天就能	Tool-calling + 多表查询	$150-250/月
L3 Predict	流失预测、转化预测	⚠️ 需要 ML	2 年历史数据 + 模型训练	$300-500/月
L4 Recommend	AI 推荐行动方案	✅ 今天就能	模板验证 + 审批工作流	$500-800/月
L5 Execute	自动发 SMS、自动建 Task	❌ 暂不建议	TCPA 合规 + 监控 + 回滚	$800-1000+/月

不需要按顺序走。可以跳过 L3 先做 L4（用规则代替预测模型）。

详见产品本质 / North Star 与五层能力金字塔(L1 Describe → L5 Execute)。

七、关键技术决策¶

决策	推荐	原因
Bedrock Agent vs Claude API	Claude API	更简单、模型更新、不需要 VPC 隔离
Agent SDK vs Tool-calling	Tool-calling	Agent SDK 是给开发工具用的，不是客户产品
MCP vs REST API	先 REST	客户是 gym owner 不是开发者
单 agent vs 多 agent	单 agent + 多 tools	先简单做，Campaign Engine 再升级多 agent
Skills 嵌入方式	Markdown → System Prompt	最务实，团队 + 生产环境双重受益
模型选择	Opus 4.6 推理 + Haiku 4.5 分类	Opus 做复杂诊断，Haiku 做简单标签（成本低 10x）

八、推荐执行顺序¶

Phase 1 (当前 → 4 周):   L1 Dashboard 洞察 + 内部 Skills 整理
Phase 2 (4-10 周):       L2 AI 诊断对话 + Staff Coaching 增强
Phase 3 (10-20 周):      L4 Campaign Engine MVP (AI 推荐 + 人工审批)
Phase 4 (20-32 周):      L3 Churn 预测模型 + L4.5 半自动执行
Phase 5 (32 周+):        L5 全自动化 + MCP 生态开放

成本估算¶

Phase	核心工作	团队	估算成本
Phase 1	Dashboard 文字洞察 + Skills	1 后端，4 周	~$5K
Phase 2	AI 诊断对话 + Coaching	1 后端 + 1 QA，6 周	~$15K
Phase 3	Campaign Engine MVP	1 后端 + 1 前端，10 周	~$30K
Phase 4	Churn 预测 + 半自动化	+ 1 数据科学家	~$40K
Phase 5	全自动化 + MCP	+ 法律顾问	~$50K

Claude API 使用成本：每月约 500K-2M tokens，$15-60/月。在总成本中可忽略。

附录：竞品 AI 能力对标¶

健身房 AI 竞品（点击展开）

Keepme（健身房 AI 留存）

Keepme Score：Random Forest 算法，100 万+ 决策树，流失预测准确率 95%
追踪指标：到访频率、课程多样性、续费行为、会员互动
自动化：对分群后的高风险会员自动触达

insightureAI vs Keepme：

维度	Keepme	insightureAI
数据信号	到访 + 行为	通话 + SMS + 到访 + 跟进
分析时机	事后预测（churn risk）	事中干预（通话中 coaching + 主动触达）
行动方式	自动邮件/SMS	AI 推荐 + 人工审批 + 个性化文案

通话中心 AI Coaching 竞品

产品	能力
AmplifAI	语音 + 情感分析 + 自动 QA + coaching 工作流
Convin	对话智能 → 模式检测 → 自动 coaching 建议
Level AI	实时情感 + 合规检查 + coaching

这些产品验证了 AI coaching 的市场需求。insightureAI 的差异在于垂直行业（健身房）+ 全链路数据（通话 + Lead + SMS + 到访）。