Stream 3 · Apple 授权店差评主题分析

从 332 条差评
到 23 个负向模式

0Reviews

0QEC Events

0Scenarios

0Coverage %

Boundary

研究边界先于结论

样本是极端负向视角，不能外推渠道整体满意度

差评样本限定

结论刻画的是客户感知表达，不是事实裁定与根因归责

ADR-007 边界

P-01 元数据闸门未完成，不能做门店/城市分层

仅可输出通用模式

这保证了结论“诚实可用”：宁可收敛，不做过度声明。

Phase 0

数据治理：先把噪音关掉

原始语料

332 条有效差评，文本中位长度 102 字符。

短文本 + 情绪驱动

脱敏

全部 user_id 匿名化，保持可追溯同时保护隐私。

Phase 0 完成项

伪重复标记

输出 A/B 双版本频次，检验组织化评论污染。

ADR-008

稳健性

A/B 最大差异 1.86pp，无主题受影响超过 10pp。

通过敏感性检查

Phase 1-2

QEC 三元结构：Q + E + C

Q · Quote（原文片段）

必须是评论原文可定位子串
用于保证“可追溯”与证据真实性
支持后续人工抽检与复核

→

E · Explanation（三层拆分）

E1：感知事实（发生了什么）
E2：客户归因（为什么会这样）
E3：研究边界（能说/不能说）

→

C · Code（主题标签）

将事件单元映射到可聚合主题
支持 BERTopic 与 LLM 双路归纳
服务后续频次统计与管理动作

332 评论 → 1,070 QEC avg 3.22 QEC/评论 quote 幻觉过滤 100% κ=0.6407（有条件冻结）

Phase 3 Evolution

方法演进：从单路失败到双路互证

Step 1 · 单路 BERTopic

topic_0 占比 97.93%，聚类崩溃。

负向语料词汇同质化

Step 2 · 多路 BERTopic

按 Route A/B1/B2/B3 分路，形成 T1-T4。

覆盖 389 QEC（36.4%）

Step 3 · Route B 语义归纳

LLM 独立盲读 9 批次，再与 BERTopic 交叉验证。

双路互证规则形成

Coverage

覆盖率是这次最大的改进指标

4BERTopic Themes

36.4%Single/Multi Route

23Unified Scenarios

54%Final Coverage

从”算法能聚出的结构”转向”业务真正关心的事件覆盖”——双路互证统一框架。

Unified Framework · 23 Scenarios

四层结构 · 23 个负向模式

T1 人员互动与能力 ~175 QEC · 16.4%

T1-A店员主动回避接触

~90

T1-B询问时以语气/反问伤人

~60

T1-C店员专业知识缺失

~25LLM

T2 销售操控行为 ~79 QEC · 7.4%

T2-1捆绑配件强制加价

~20

T2-2以旧换新价格先高后低

~10

T2-3虚假技术信息推销附件

~8

T2-4售后维权渠道主动阻断

~7

T2-5针对老年客户专项欺骗

~6

T2-6授权店与直营身份混淆

~9

T2-7人为制造库存稀缺拒售

~4LLM

T2-8购买流程扫码任务绑架

~15LLM

T3 承诺执行落差 ~124 QEC · 11.6%

T3-1预约服务到店无法受理

~35

T3-2库存确认后到店落空

~12

T3-3国补信息误告/操作被拒

~16

T3-4同店员工说法前后矛盾

~8

T3-5促销活动到店条件变更

~6

T3-6线上展示产品到店拒绝提供

~7

T3-7质保/退换政策拒绝适用

~40LLM

T4 产品品质与服务交付 ~67 QEC · 6.3%

T4-1第三方配件冒充原装出售

~15

T4-2原装缺货强推第三方

~8

T4-3配件短期质量失效

~8

T4-4主机短期品控问题

~6

T4-5维修操作引发二次损坏

~30LLM

Business Implications

面向管理动作的三条落地建议

1) 先控高风险触点

优先治理 T2/T4 高争议行为：捆绑、身份混淆、真伪风险。

2) 建立承诺一致性机制

把预约、库存、国补口径放到统一 SOP，减少 T3 异常。

3) 以证据包驱动复盘

用 QEC + quote 作为门店培训和整改的“最小证据单元”。

Closing

结论一句话

Stream 3 给出的不是“谁对谁错”的裁决，而是在差评样本中反复出现、可被追溯、可被行动化的负向体验模式。

下一步：补齐 P-01 元数据后，进入门店/渠道分层对比。

从 332 条差评到 23 个负向模式