AI写作合规技术拆解：从平台检测机制到合规Workflow实战

原创于 2026-07-02 09:32:00 发布 · 280 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

话题

#AtomGit「码动四季·开源同行」夏季征稿活动

搞技术的人都懂一个道理：不理解检测原理，就谈不上绕过或合规。 本文从平台检测的技术架构出发，拆解AI写作的合规边界，给出可落地的技术方案。

1. 背景：7月1日的技术信号

2026年7月1日，三个技术事件同日发生，释放了明确的信号：

事件	技术细节	信号
Claude Fable 5解禁	被禁不到3周后恢复访问	最强能力模型的监管让步于产业需求
Claude Sonnet 5发布	输入2美元/M Token，输出10美元/M Token	代理能力提升+成本下降
GPT-5.6 Terra发布	价格比上代便宜约2倍	模型能力通胀持续加速

对开发者/作者的含义：调用最强模型的成本越来越低，但——

平台的回应：番茄小说2026年5月单月拒绝签约低质AI网文 11.27万本，下架违规书籍超 4万本。

这是一个典型的攻防不对称场景：攻击方（AI生成）的成本在降，防御方（平台检测）的能力在升。创作者夹在中间。

2. 平台检测机制技术拆解

2.1 三级检测架构

主流平台的AI检测不是单一模型判分，而是 200+维度的三级级联检测：

输入文本
    │
    ▼
┌─────────────────────┐
│  Level 1: 文本表层检测  │  ← 词汇/句式/标点级特征
│  维度数: ~80          │
│  输出: 表层AI概率 P1   │
└──────────┬──────────┘
           │
           ▼
┌─────────────────────┐
│  Level 2: 叙事结构检测  │  ← 情节/冲突/伏笔级特征
│  维度数: ~70          │
│  输出: 结构AI概率 P2   │
└──────────┬──────────┘
           │
           ▼
┌─────────────────────┐
│  Level 3: 长篇一致性检测 │  ← 人设/设定/世界观级特征
│  维度数: ~50+         │
│  输出: 一致性冲突率 P3  │
└──────────┬──────────┘
           │
           ▼
  综合判定 = f(P1, P2, P3)

2.2 各级检测的关键特征

Level 1 - 文本表层检测（~80维度）

# 伪代码：表层特征提取示例
def extract_surface_features(text):
    return {
        "vocab_richness": len(set(tokens)) / len(tokens),     # 词汇丰富度
        "sentence_length_var": np.std(sentence_lengths),       # 句长标准差（AI偏低）
        "punctuation_pattern": punctuation_distribution(text), # 标点习惯分布
        "transition_density": count_transitions(text) / len(sents),  # 转折词密度
        "avg_clause_depth": mean_parse_depth(text),           # 从句嵌套深度
        "emotion_volatility": emotion_score_variance(text),    # 情绪波动率（AI偏低）
        # ... 70+ more features
    }

AI生成的文本在表层有几个显著特征：句长方差小（每句差不多长）、转折词密度高（"然而、不过、此外"扎堆出现）、情绪波动率低（整篇情绪曲线太平）。

Level 2 - 叙事结构检测（~70维度）

这一层看的是"故事是怎么讲的"：

情节推进节奏是否过于均匀（AI倾向于等间隔推进事件）
冲突设置密度是否符合自然创作规律
伏笔-回收的时间间隔分布（AI的伏笔回收太快或太规整）
章节间的叙事视角稳定性

Level 3 - 长篇一致性检测（~50+维度）

这一层是AI长篇创作的致命伤。核心检测逻辑：

def consistency_check(novel_chapters):
    conflicts = []
    for i, ch_a in enumerate(novel_chapters):
        for j, ch_b in enumerate(novel_chapters[i+1:], i+1):
            # 检测人设漂移
            if character_drift(ch_a, ch_b) > THRESHOLD:
                conflicts.append(("character_drift", i, j))
            # 检测设定冲突
            if setting_conflict(ch_a, ch_b) > THRESHOLD:
                conflicts.append(("setting_conflict", i, j))
            # 检测世界观不一致
            if worldview_inconsistency(ch_a, ch_b) > THRESHOLD:
                conflicts.append(("worldview", i, j))
    return conflicts

实测数据：通用大模型写到10万字时，设定冲突率超过60%。这意味着Level 3检测几乎不需要复杂的算法——光是比对设定冲突就能判定。

2.3 检测结果的综合判定

# 综合判定逻辑（简化版）
def final_verdict(p1, p2, p3, conflict_rate):
    # 加权融合
    ai_score = 0.3 * p1 + 0.3 * p2 + 0.2 * p3 + 0.2 * conflict_rate

    if ai_score > 0.75:
        return "AI_GENERATED"    # 判定AI生成，下架/降权
    elif ai_score > 0.45:
        return "SUSPICIOUS"      # 可疑，人工复审
    else:
        return "HUMAN_LIKELY"    # 判定人类创作，正常通过

3. 合规边界：AI辅助 vs AI代写

平台的技术界定很清晰：

类别	定义	平台态度	检测特征
AI辅助创作	AI参与非正文环节（大纲/人设/检查/润色）	允许	正文P1低，P2正常，P3低
AI生成内容	正文主体由AI生成	禁止/降权	正文P1高，P2异常，P3高

技术上的分界线是正文部分的AI特征浓度。你的大纲让AI写了没问题，但正文如果大段都是AI生成的，那不管前面做了多少"辅助"，综合判定都会走到 AI_GENERATED。

4. 合规Workflow实战

4.1 错误Workflow（会被检测）

AI生成大纲 → AI生成正文 → 人工微调 → 投稿
                ↑
            这里P1/P2/P3都会爆

星月写作2人团队就是这么干的，月入百万之后被番茄下架封禁，全军覆没。

4.2 合规Workflow

┌──────────────────┐    ┌──────────────────┐    ┌──────────────────┐    ┌────────┐
│ Step 1: 结构辅助  │ →  │ Step 2: 人工正文  │ →  │ Step 3: AI复查   │ →  │ 投稿   │
│                  │    │                  │    │                  │    │        │
│ · 大纲梳理       │    │ · 按大纲手写正文  │    │ · 设定冲突检查    │    │        │
│ · 人设管理       │    │ · 情节/对话/描写  │    │ · 人设漂移检测    │    │        │
│ · 节奏规划       │    │ · 保持个人风格   │    │ · AI味检测       │    │        │
│                  │    │                  │    │ · 节奏诊断       │    │        │
│ AI参与度: 高     │    │ AI参与度: 零     │    │ AI参与度: 高     │    │        │
│ 正文产出: 无     │    │ 正文产出: 100%人 │    │ 正文产出: 无     │    │        │
└──────────────────┘    └──────────────────┘    └──────────────────┘    └────────┘

这个Workflow的技术原理：Step 1和Step 3中AI只做检查和管理，不产生正文。Step 2的正文完全由人写。因此：

P1（表层）：人工写作，词汇丰富度和句长方差自然，AI特征低
P2（结构）：有AI辅助做大纲，但叙事节奏由人控制，特征正常
P3（一致性）：Step 3的AI复查专门解决设定冲突问题，提交前已修复

4.3 工具链参考

以茄子写作助手为例，它的功能设计完全匹配上述合规Workflow：

Step1_结构辅助:
  - 大纲梳理: 检查逻辑矛盾、建议节奏调整
  - 人设管理: 维护人物属性表，标注性格弧线

Step3_AI复查:
  - 千章连贯: 10万字+级别的一致性检查
  - 去AI味检测: 检测正文中的AI特征并标注
  - 节奏诊断: 分析叙事节奏是否异常

关键约束:
  - 不生成正文: 所有功能都是分析/检查/标注，不产出创作内容
  - 域名: https://qziai.cn

核心原则：AI做编辑和质检员，不做代笔。 你的正文是你写的，只是用工具做了质控。这跟用ESLint查代码风格、用CI跑测试没有本质区别。

5. 开发者视角：自检AI味的技术方案

即使不用现成工具，开发者也可以自建一套轻量级AI味检测：

import numpy as np

def ai_taste_score(text):
    """轻量级AI味评分，0=纯人类，1=纯AI"""
    sentences = split_sentences(text)

    # 特征1：句长方差（AI偏低）
    lengths = [len(s) for s in sentences]
    length_cv = np.std(lengths) / np.mean(lengths)  # 变异系数
    f1 = 1 - min(length_cv / 0.5, 1)  # CV<0.3偏向AI

    # 特征2：转折词密度（AI偏高）
    transitions = ["然而", "不过", "此外", "同时", "值得注意的是",
                   "首先", "其次", "最后", "综上", "总的来说"]
    trans_count = sum(text.count(t) for t in transitions)
    trans_density = trans_count / len(sentences)
    f2 = min(trans_density / 0.3, 1)  # 密度>0.2偏向AI

    # 特征3：段落长度均匀度（AI偏向等长段落）
    para_lengths = [len(p) for p in text.split("\n\n") if len(p) > 20]
    if len(para_lengths) > 3:
        para_cv = np.std(para_lengths) / np.mean(para_lengths)
        f3 = 1 - min(para_cv / 0.4, 1)
    else:
        f3 = 0.5

    # 加权综合
    score = 0.35 * f1 + 0.35 * f2 + 0.30 * f3
    return score