CI 对话智能知识体系
一、CI 核心架构(技术层)
通话/对话 → 录音采集 → 语音转录 → NLP分析 → AI洞察 → 业务行动
| 层级 |
说明 |
典型技术/工具 |
| 数据采集 |
电话录音、视频会议、在线聊天、邮件 |
RingCentral, Twilio, Zoom, Teams |
| 语音转录 (ASR) |
自动语音识别,将音频转为文字 |
Deepgram, AWS Transcribe, Google STT, Whisper |
| 说话人分离 (Diarization) |
区分对话中不同说话人 |
Deepgram Diarization, pyannote, AWS Transcribe |
| NLP 分析 |
意图识别、实体提取、关键词检测 |
spaCy, Hugging Face, AWS Comprehend |
| 情感分析 |
判断说话人情绪和语气 |
声学特征分析、文本情感模型、多模态融合 |
| LLM 深度分析 |
结构化摘要、话题分类、质量评分、建议生成 |
Claude, GPT-4, Kimi K2, Bedrock Converse API |
| 集成与行动 |
分析结果回写 CRM,触发工作流 |
Salesforce, HubSpot, Slack, 自定义 Webhook |
二、CI 分析框架
1. 分析维度(由浅到深)
| 层次 |
核心问题 |
方法 |
| 转录层 |
说了什么? |
ASR 转录、说话人分离、时间戳对齐 |
| 理解层 |
什么意思? |
意图识别、实体提取、话题分类 |
| 评估层 |
做得怎么样? |
沟通质量评分、合规检查、流程遵循度 |
| 洞察层 |
为什么这样? |
情感分析、异议模式识别、成功/失败归因 |
| 行动层 |
接下来怎么做? |
AI 建议生成、实时话术提示、自动跟进触发 |
2. 通话分析指标体系(以 Retaintive 产品为例)
通话分析指标
├── 基础指标:通话时长、接通率、等待时间、挂断率
├── 内容指标:话题分类、客户意图、关键词命中率
├── 质量指标:沟通评分、流程遵循度、话术合规率
├── 情感指标:客户情绪变化、满意度信号、异议频率
├── 效能指标:有效沟通比、问题解决率、下一步明确率
└── 业务指标:Lead 温度判定、预约转化信号、流失风险信号
3. CI 与 BI 的协同关系
CI(对话智能) BI(商业智能)
┌─────────────────────┐ ┌─────────────────────┐
│ 通话录音 │ │ │
│ ↓ │ │ │
│ 转录 + 说话人分离 │ 数据 │ KPI 仪表盘 │
│ ↓ │ ──────→ │ 转化漏斗分析 │
│ AI 结构化分析 │ 喂入 │ 团队绩效对比 │
│ ↓ │ │ 预警与决策建议 │
│ 沟通质量 / 客户意图 │ │ │
└─────────────────────┘ └─────────────────────┘
CI 回答:这通电话发生了什么?质量如何?
BI 回答:这些通话数据汇总后,业务表现如何?趋势如何?
CI + BI:从单通电话洞察 → 全局业务决策的完整闭环
4. 传统 CI vs 我们的 CI:从分析到决策
传统 CI 产品的边界是"分析完这通电话"就停了。我们的系统把 CI 的输出接入了策略引擎和生命周期管理,形成 CI + 策略 + BI 三者联动:
| 模块 |
职责 |
回答什么 |
| CI(沟通分析) |
分析每次对话的内容 |
这通电话发生了什么?客户是什么态度? |
| 策略引擎 |
定义判断规则和行动阈值 |
接下来应该怎么做?什么时候触发状态变更? |
| BI(商业智能) |
汇总展示业务指标 |
整体转化如何?团队表现怎么样? |
CI 是眼睛 策略是大脑 BI 是仪表盘
(看到了什么) (怎么判断、怎么做) (全局怎么样)
每通电话 ──→ CI 分析 ──→ 结构化输出 ──→ 策略引擎 ──→ 业务行动
│ │ │
│ 情绪/态度识别 │ 跟进策略调整 │ KPI 仪表盘
│ 关键词/话题提取 │ 隐性拒绝判断 │ 转化漏斗
│ 客户顾虑识别 │ 状态变更触发 │ 团队绩效
│ 沟通质量评分 │ 温度重新计算 │ 预警建议
▼ ▼ ▼
单通电话洞察 客户生命周期推进 全局业务决策
典型联动场景:隐性拒绝判断
当客户多次跟进都能联系到,但始终无法推进时(不拒绝也不行动),系统需要判断是否视为拒绝:
每次跟进后
│
CI 沟通分析 → 提取:客户情绪、顾虑关键词、互动积极度
│
策略引擎检查 → 是否达到"S 次跟进无果"阈值?
│
├── 未达到 → 继续按策略跟进
│
└── 达到阈值 → 触发隐性拒绝判断
│
综合 CI 历史数据 + 客户画像
│
├── 有具体顾虑记录(CI 提取到价格/时间/距离等关键词)
│ → 条件性拒绝(冻结),等待条件变化后重新激活
│
└── 无具体顾虑记录(CI 历次分析均显示态度冷淡、无实质内容)
→ 绝对拒绝(终态),结束全部跟进
| CI 提供的判断依据 |
倾向条件性拒绝(冻结) |
倾向绝对拒绝(终态) |
| 沟通内容 |
提到过具体顾虑(价格、时间、距离) |
从未给出具体理由 |
| 互动态度 |
愿意沟通,只是暂时不行动 |
敷衍、冷淡、越来越短 |
| 客户画像 |
符合目标客户特征 |
不太符合目标客户特征 |
| 历史行为 |
曾经主动询问过细节 |
从未主动发起任何互动 |
三、2025-2026 CI 行业趋势
| 趋势 |
说明 |
| 实时 Agent Assist |
从"事后分析"到"通话中实时提示",AI 在通话过程中提供话术建议和异议处理 |
| Agentic CI |
对话智能从被动分析进化为主动执行——自动触发跟进、分配任务、更新 CRM |
| 多模态分析 |
不仅分析文字,还结合语音语调(声学特征)和视频表情进行综合判断 |
| Generative AI 深度集成 |
LLM 生成通话摘要、自动填写 CRM 字段、生成个性化跟进邮件 |
| 合规自动化 |
AI 自动检测通话中的合规风险(PII 泄露、误导性承诺、监管违规) |
| 嵌入式 CI |
CI 能力嵌入 CRM/拨号器/客服工具内部,而非独立产品 |
| 隐私与数据主权 |
GDPR/CCPA 合规、本地化部署、PII 自动脱敏成为标配 |
关键统计
- 76% 的企业已将 CI 嵌入超过一半的客户互动场景(2025)
- 使用 CI 的销售团队 win rate 平均提升 15%
- 客服场景中,CI 使服务质量评分提升 69%
- 手动记录工作量减少 90%
四、市场规模
- 2025年全球 CI 软件市场约 $285亿
- 预计2026年达 $322亿(CAGR 13.0%)
- 预计2035年达 $557亿(CAGR 8.2%)
- 更广义的对话式 AI 市场:2025年 $148亿 → 2034年 $825亿(CAGR 21.0%)
- CI 是对话式 AI 中增长最快的细分赛道之一
五、竞争格局
1. 按场景分类
| 类别 |
代表产品 |
核心场景 |
价格区间 |
| 销售对话智能 |
Gong, Chorus(ZoomInfo), Clari |
销售通话分析、Deal Intelligence、预测 |
$100-250/用户/月 |
| 客服/呼叫中心 |
CallMiner, Observe.AI, Level AI |
质检、合规、Agent 绩效 |
企业定价 |
| 通话追踪+归因 |
CallRail, Invoca, CallTrackingMetrics |
营销归因、来电追踪 |
$45-150/月 |
| 会议智能 |
Otter.ai, Fireflies, Avoma |
会议记录、自动摘要 |
$10-40/用户/月 |
| 全渠道 CI |
Twilio CI, RingCentral RingSense |
跨渠道对话分析 |
按用量计费 |
| 垂直行业 |
Retaintive (我们) |
教育/服务行业 Lead 跟进 + 留存 |
- |
2. 头部玩家详细对比
| 能力 |
Gong |
CallMiner |
Observe.AI |
Retaintive (我们) |
| 通话录音/转录 |
✅ |
✅ |
✅ |
✅ |
| 情感分析 |
✅ |
✅ (深度) |
✅ |
✅ |
| 实时 Agent Assist |
部分 |
✅ |
✅ |
规划中 |
| Deal Intelligence |
✅ (强) |
❌ |
❌ |
规划中 |
| 合规监控 |
部分 |
✅ (强) |
✅ |
基础 |
| BI 仪表盘 |
基础 |
基础 |
基础 |
✅ (角色化) |
| Lead 生命周期管理 |
❌ |
❌ |
❌ |
✅ (核心) |
| 垂直行业深耕 |
❌ (通用) |
❌ (通用) |
❌ (通用) |
✅ (教育/服务) |
| 定价模式 |
高 ($250+/用户) |
企业级 |
企业级 |
中小企业友好 |
六、CI 技术栈选型
语音转录 (ASR) 对比
| 服务 |
价格 |
优势 |
劣势 |
| Deepgram Nova-3 |
$0.0043/min |
高精度、低延迟、说话人分离、PII 脱敏 |
非大厂 |
| AWS Transcribe |
$0.024/min |
AWS 生态集成、异步批量 |
贵5倍、异步延迟 |
| Google STT |
$0.016/min |
多语言强 |
说话人分离需额外付费 |
| OpenAI Whisper |
开源/自部署 |
免费、可定制 |
需要 GPU、无实时 |
| AssemblyAI |
$0.015/min |
LeMUR 集成、功能全 |
中等价格 |
LLM 分析对比
| 模型 |
输入价格 |
输出价格 |
优势 |
劣势 |
| Kimi K2 |
$0.15/1M |
$0.60/1M |
极低成本、Thinking mode |
稳定性待验证 |
| Claude Sonnet 4 |
$3.00/1M |
$15.00/1M |
结构化输出可靠 |
成本高 |
| GPT-4o |
$2.50/1M |
$10.00/1M |
生态成熟 |
中高成本 |
| Claude Haiku |
$0.25/1M |
$1.25/1M |
低成本、快速 |
分析深度有限 |
七、Retaintive CI 定位分析
定位:垂直型 CI + BI 融合平台,专注教育/服务行业的通话分析与客户留存
与纯 CI 公司的差异
| 维度 |
纯 CI 公司 (Gong 等) |
Retaintive |
| 核心价值 |
分析通话内容 |
通话分析 → 业务决策闭环 |
| 分析终点 |
通话报告和指标 |
角色化仪表盘 + 可执行建议 |
| 业务理解 |
通用销售流程 |
深度理解教育/服务行业获客→留存全链路 |
| 数据流向 |
CI 数据停在 CI 平台 |
CI 数据直接喂入 BI 指标体系 |
| 目标用户 |
销售VP、RevOps |
Owner / Manager / Staff 三层角色 |
| 定价策略 |
企业级高价 |
中小企业可负担 |
CI 核心能力路线图
Phase 1 (当前) ✅
├── 通话录音自动采集 (RingCentral/Twilio)
├── AI 转录 (Deepgram 主 + AWS 备)
├── LLM 结构化分析 (Kimi K2 主 + Claude 备)
└── 分析结果存储 (DynamoDB + S3)
Phase 2 (规划中)
├── 沟通质量评分模型
├── Lead 温度自动判定
├── 客户意图/异议识别
└── 跟进建议自动生成
Phase 3 (远期)
├── 实时 Agent Assist (通话中提示)
├── 自动 CRM 回写
├── 多语言支持
└── 预测性分析 (流失预警、转化预测)
八、CI + BI 融合:我们的独特价值
市场上绝大多数公司只做其中一个方向:
┌──────────────────────────────────────────────────────────┐
│ 市场格局 │
├──────────────────────────────────────────────────────────┤
│ │
│ 纯 CI 公司 纯 BI 公司 │
│ ┌─────────────┐ ┌─────────────┐ │
│ │ Gong │ │ Tableau │ │
│ │ Chorus │ │ Power BI │ │
│ │ CallMiner │ │ Looker │ │
│ │ Observe.AI │ │ ThoughtSpot │ │
│ └─────────────┘ └─────────────┘ │
│ ↓ ↓ │
│ 懂对话内容 懂数据分析 │
│ 不懂业务全局 不懂对话内容 │
│ │
│ Retaintive / CloudAudioAI │
│ ┌─────────────────────────┐ │
│ │ CI + BI 垂直融合 │ │
│ │ │ │
│ │ 通话 → 理解 → 指标 → │ │
│ │ 仪表盘 → 决策 → 行动 │ │
│ └─────────────────────────┘ │
│ ↓ │
│ 在垂直行业做到端到端闭环 │
│ │
└──────────────────────────────────────────────────────────┘
大厂做通用 CI,大厂做通用 BI,我们在垂直行业做 CI + BI 的深度融合。
参考资料