Stream 3 · Apple 授权店差评主题分析
IPP · 2025 GMBA · v1 收口版
这保证了结论“诚实可用”:宁可收敛,不做过度声明。
332 条有效差评,文本中位长度 102 字符。
短文本 + 情绪驱动
全部 user_id 匿名化,保持可追溯同时保护隐私。
Phase 0 完成项
输出 A/B 双版本频次,检验组织化评论污染。
ADR-008
A/B 最大差异 1.86pp,无主题受影响超过 10pp。
通过 敏感性检查
topic_0 占比 97.93%,聚类崩溃。
负向语料词汇同质化
按 Route A/B1/B2/B3 分路,形成 T1-T4。
覆盖 389 QEC(36.4%)
LLM 独立盲读 9 批次,再与 BERTopic 交叉验证。
双路互证 规则形成
从“算法能聚出的结构”转向“业务真正关心的事件覆盖”。
~150 QEC · 14.0%
~60 QEC · 5.6%
~64 QEC · 6.0%
~37 QEC · 3.4%
补充模式不一定有算法互证,但每条都有 quote 支撑。
优先治理 T2/T4 高争议行为:捆绑、身份混淆、真伪风险。
把预约、库存、国补口径放到统一 SOP,减少 T3 异常。
用 QEC + quote 作为门店培训和整改的“最小证据单元”。
Stream 3 给出的不是“谁对谁错”的裁决,而是在差评样本中反复出现、可被追溯、可被行动化的负向体验模式。
下一步:补齐 P-01 元数据后,进入门店/渠道分层对比。
Stream 3 · Presentation Draft v1