# 验证活动：评审评分

## 洞察

QA 要验证的只有一件事：系统揭示的风格和标注的好/坏，是否和人类的感觉对齐。写得好的人看了觉得"对，我就是这样"，写得差的人看了觉得"原来问题在这里"。

## 验证项

### 好文章揭示

写得好的人把文章放进去，系统揭示叙事结构。结果是否正确不看数据指标，看本人的感受。

- 创始人看自己文章的评审结果 → 他说"对，我就是这样写的"——风格被揭示，感觉准确
- 创始人连续看多篇自己的评审 → 他说"原来我习惯这么写"——稳定的个人模式被看见
- 助理看好文章的评审结果 → 他说"我懂了，之前只是感觉，现在能说出来"——理解了而不是眼熟了

### 坏文章评审

写得差的人把草稿放进去，系统标出好/坏对照。验证的不是"标对了多少"，而是"感觉对不对"。

- 新媒体看自己稿子的评审结果 → 她说"原来问题在这，不是措辞问题"——理解了根因而非症状
- 新媒体按照好示范改了一版，再评审 → 她说"这次好多了"——修改方向是对的
- 创始人看同一篇评审结果 → 他说"对，这就是我想说但说不出来的"——评审替代了创始人自己的点评

### 标准共识

不同的人看同一篇评审结果，是否能得出一致判断。

- 创始人和助理各自看一篇坏文章的评审 → 两人的修改优先级判断一致——标准从个人变成共享
- 助理用评审结果向新成员解释"为什么不对" → 新成员能理解——不用"跟久了自然就会"