1 / 9

Stream 3 · Apple 授权店差评主题分析

332 条差评
23 个负向模式

0Reviews
0QEC Events
0Scenarios
0Coverage %

研究边界先于结论

样本是 极端负向视角,不能外推渠道整体满意度
差评样本限定
结论刻画的是 客户感知表达,不是事实裁定与根因归责
ADR-007 边界
P-01 元数据闸门未完成,不能做门店/城市分层
仅可输出通用模式

这保证了结论“诚实可用”:宁可收敛,不做过度声明。

数据治理:先把噪音关掉

原始语料

332 条有效差评,文本中位长度 102 字符。

短文本 + 情绪驱动

脱敏

全部 user_id 匿名化,保持可追溯同时保护隐私。

Phase 0 完成项

伪重复标记

输出 A/B 双版本频次,检验组织化评论污染。

ADR-008

稳健性

A/B 最大差异 1.86pp,无主题受影响超过 10pp。

通过 敏感性检查

QEC 三元结构:Q + E + C

Q · Quote(原文片段)
  • 必须是评论原文可定位子串
  • 用于保证“可追溯”与证据真实性
  • 支持后续人工抽检与复核
E · Explanation(三层拆分)
  • E1:感知事实(发生了什么)
  • E2:客户归因(为什么会这样)
  • E3:研究边界(能说/不能说)
C · Code(主题标签)
  • 将事件单元映射到可聚合主题
  • 支持 BERTopic 与 LLM 双路归纳
  • 服务后续频次统计与管理动作
332 评论 → 1,070 QEC avg 3.22 QEC/评论 quote 幻觉过滤 100% κ=0.6407(有条件冻结)

方法演进:从单路失败到双路互证

Step 1 · 单路 BERTopic

topic_0 占比 97.93%,聚类崩溃。

负向语料词汇同质化

Step 2 · 多路 BERTopic

按 Route A/B1/B2/B3 分路,形成 T1-T4。

覆盖 389 QEC(36.4%)

Step 3 · Route B 语义归纳

LLM 独立盲读 9 批次,再与 BERTopic 交叉验证。

双路互证 规则形成

覆盖率是这次最大的改进指标

4BERTopic Themes
36.4%Single/Multi Route
23Unified Scenarios
54%Final Coverage

从”算法能聚出的结构”转向”业务真正关心的事件覆盖”——双路互证统一框架。

四层结构 · 23 个负向模式

T1 人员互动与能力 ~175 QEC · 16.4%
T1-A店员主动回避接触
~90
T1-B询问时以语气/反问伤人
~60
T1-C店员专业知识缺失
~25LLM
T2 销售操控行为 ~79 QEC · 7.4%
T2-1捆绑配件强制加价
~20
T2-2以旧换新价格先高后低
~10
T2-3虚假技术信息推销附件
~8
T2-4售后维权渠道主动阻断
~7
T2-5针对老年客户专项欺骗
~6
T2-6授权店与直营身份混淆
~9
T2-7人为制造库存稀缺拒售
~4LLM
T2-8购买流程扫码任务绑架
~15LLM
T3 承诺执行落差 ~124 QEC · 11.6%
T3-1预约服务到店无法受理
~35
T3-2库存确认后到店落空
~12
T3-3国补信息误告/操作被拒
~16
T3-4同店员工说法前后矛盾
~8
T3-5促销活动到店条件变更
~6
T3-6线上展示产品到店拒绝提供
~7
T3-7质保/退换政策拒绝适用
~40LLM
T4 产品品质与服务交付 ~67 QEC · 6.3%
T4-1第三方配件冒充原装出售
~15
T4-2原装缺货强推第三方
~8
T4-3配件短期质量失效
~8
T4-4主机短期品控问题
~6
T4-5维修操作引发二次损坏
~30LLM

面向管理动作的三条落地建议

1) 先控高风险触点

优先治理 T2/T4 高争议行为:捆绑、身份混淆、真伪风险。

2) 建立承诺一致性机制

把预约、库存、国补口径放到统一 SOP,减少 T3 异常。

3) 以证据包驱动复盘

用 QEC + quote 作为门店培训和整改的“最小证据单元”。

结论一句话

Stream 3 给出的不是“谁对谁错”的裁决,而是在差评样本中反复出现、可被追溯、可被行动化的负向体验模式。

下一步:补齐 P-01 元数据后,进入门店/渠道分层对比。