1 / 10

Stream 3 · Apple 授权店差评主题分析

332 条差评
24 个负向模式

0Reviews
0QEC Events
0Core Scenarios
0Coverage %

研究边界先于结论

样本是 极端负向视角,不能外推渠道整体满意度
差评样本限定
结论刻画的是 客户感知表达,不是事实裁定与根因归责
ADR-007 边界
P-01 元数据闸门未完成,不能做门店/城市分层
仅可输出通用模式

这保证了结论“诚实可用”:宁可收敛,不做过度声明。

数据治理:先把噪音关掉

原始语料

332 条有效差评,文本中位长度 102 字符。

短文本 + 情绪驱动

脱敏

全部 user_id 匿名化,保持可追溯同时保护隐私。

Phase 0 完成项

伪重复标记

输出 A/B 双版本频次,检验组织化评论污染。

ADR-008

稳健性

A/B 最大差异 1.86pp,无主题受影响超过 10pp。

通过 敏感性检查

QEC 三元结构:Q + E + C

Q · Quote(原文片段)
  • 必须是评论原文可定位子串
  • 用于保证“可追溯”与证据真实性
  • 支持后续人工抽检与复核
E · Explanation(三层拆分)
  • E1:感知事实(发生了什么)
  • E2:客户归因(为什么会这样)
  • E3:研究边界(能说/不能说)
C · Code(主题标签)
  • 将事件单元映射到可聚合主题
  • 支持 BERTopic 与 LLM 双路归纳
  • 服务后续频次统计与管理动作
332 评论 → 1,070 QEC avg 3.22 QEC/评论 quote 幻觉过滤 100% κ=0.6407(有条件冻结)

方法演进:从单路失败到双路互证

Step 1 · 单路 BERTopic

topic_0 占比 97.93%,聚类崩溃。

负向语料词汇同质化

Step 2 · 多路 BERTopic

按 Route A/B1/B2/B3 分路,形成 T1-T4。

覆盖 389 QEC(36.4%)

Step 3 · Route B 语义归纳

LLM 独立盲读 9 批次,再与 BERTopic 交叉验证。

双路互证 规则形成

覆盖率是这次最大的改进指标

4BERTopic Themes
36.4%Single/Multi Route
18Cross-Validated
54%Final Coverage

从“算法能聚出的结构”转向“业务真正关心的事件覆盖”。

四层结构 + 18 子场景(完整)

T1 人员互动态度(2)

~150 QEC · 14.0%

  • T1-A 店员主动回避接触
  • T1-B 询问时以语气/反问伤人
T2 销售操控行为(6)

~60 QEC · 5.6%

  • T2-1 捆绑配件强制加价
  • T2-2 以旧换新价格先高后低
  • T2-3 虚假技术信息推销附件
  • T2-4 售后维权渠道主动阻断
  • T2-5 针对老年客户专项欺骗
  • T2-6 授权店与直营身份混淆
T3 承诺执行落差(6)

~64 QEC · 6.0%

  • T3-1 预约服务到店无法受理
  • T3-2 库存确认后到店落空
  • T3-3 国补信息误告/操作被拒
  • T3-4 同店员工说法前后矛盾
  • T3-5 促销活动到店条件变更
  • T3-6 线上产品/服务到店拒绝
T4 真伪与品质疑虑(4)

~37 QEC · 3.4%

  • T4-1 第三方配件冒充原装出售
  • T4-2 原装缺货强推第三方
  • T4-3 配件短期质量失效
  • T4-4 主机短期品控问题

补充模式(LLM 独立发现)

质保/退换政策拒执行
~40 QEC
维修二次损坏
~30 QEC
店员专业知识缺失
~25 QEC
预约形同虚设 + 扫码任务绑架 + 人为制造稀缺
~39 QEC

补充模式不一定有算法互证,但每条都有 quote 支撑。

面向管理动作的三条落地建议

1) 先控高风险触点

优先治理 T2/T4 高争议行为:捆绑、身份混淆、真伪风险。

2) 建立承诺一致性机制

把预约、库存、国补口径放到统一 SOP,减少 T3 异常。

3) 以证据包驱动复盘

用 QEC + quote 作为门店培训和整改的“最小证据单元”。

结论一句话

Stream 3 给出的不是“谁对谁错”的裁决,而是在差评样本中反复出现、可被追溯、可被行动化的负向体验模式。

下一步:补齐 P-01 元数据后,进入门店/渠道分层对比。