搞技术的人都懂一个道理:不理解检测原理,就谈不上绕过或合规。 本文从平台检测的技术架构出发,拆解AI写作的合规边界,给出可落地的技术方案。
1. 背景:7月1日的技术信号
2026年7月1日,三个技术事件同日发生,释放了明确的信号:
| 事件 | 技术细节 | 信号 |
|---|---|---|
| Claude Fable 5解禁 | 被禁不到3周后恢复访问 | 最强能力模型的监管让步于产业需求 |
| Claude Sonnet 5发布 | 输入2美元/M Token,输出10美元/M Token | 代理能力提升+成本下降 |
| GPT-5.6 Terra发布 | 价格比上代便宜约2倍 | 模型能力通胀持续加速 |
对开发者/作者的含义:调用最强模型的成本越来越低,但——
平台的回应:番茄小说2026年5月单月拒绝签约低质AI网文 11.27万本,下架违规书籍超 4万本。
这是一个典型的攻防不对称场景:攻击方(AI生成)的成本在降,防御方(平台检测)的能力在升。创作者夹在中间。
2. 平台检测机制技术拆解
2.1 三级检测架构
主流平台的AI检测不是单一模型判分,而是 200+维度的三级级联检测:
输入文本
│
▼
┌─────────────────────┐
│ Level 1: 文本表层检测 │ ← 词汇/句式/标点级特征
│ 维度数: ~80 │
│ 输出: 表层AI概率 P1 │
└──────────┬──────────┘
│
▼
┌─────────────────────┐
│ Level 2: 叙事结构检测 │ ← 情节/冲突/伏笔级特征
│ 维度数: ~70 │
│ 输出: 结构AI概率 P2 │
└──────────┬──────────┘
│
▼
┌─────────────────────┐
│ Level 3: 长篇一致性检测 │ ← 人设/设定/世界观级特征
│ 维度数: ~50+ │
│ 输出: 一致性冲突率 P3 │
└──────────┬──────────┘
│
▼
综合判定 = f(P1, P2, P3)
2.2 各级检测的关键特征
Level 1 - 文本表层检测(~80维度)
# 伪代码:表层特征提取示例
def extract_surface_features(text):
return {
"vocab_richness": len(set(tokens)) / len(tokens), # 词汇丰富度
"sentence_length_var": np.std(sentence_lengths), # 句长标准差(AI偏低)
"punctuation_pattern": punctuation_distribution(text), # 标点习惯分布
"transition_density": count_transitions(text) / len(sents), # 转折词密度
"avg_clause_depth": mean_parse_depth(text), # 从句嵌套深度
"emotion_volatility": emotion_score_variance(text), # 情绪波动率(AI偏低)
# ... 70+ more features
}
AI生成的文本在表层有几个显著特征:句长方差小(每句差不多长)、转折词密度高("然而、不过、此外"扎堆出现)、情绪波动率低(整篇情绪曲线太平)。
Level 2 - 叙事结构检测(~70维度)
这一层看的是"故事是怎么讲的":
- 情节推进节奏是否过于均匀(AI倾向于等间隔推进事件)
- 冲突设置密度是否符合自然创作规律
- 伏笔-回收的时间间隔分布(AI的伏笔回收太快或太规整)
- 章节间的叙事视角稳定性
Level 3 - 长篇一致性检测(~50+维度)
这一层是AI长篇创作的致命伤。核心检测逻辑:
def consistency_check(novel_chapters):
conflicts = []
for i, ch_a in enumerate(novel_chapters):
for j, ch_b in enumerate(novel_chapters[i+1:], i+1):
# 检测人设漂移
if character_drift(ch_a, ch_b) > THRESHOLD:
conflicts.append(("character_drift", i, j))
# 检测设定冲突
if setting_conflict(ch_a, ch_b) > THRESHOLD:
conflicts.append(("setting_conflict", i, j))
# 检测世界观不一致
if worldview_inconsistency(ch_a, ch_b) > THRESHOLD:
conflicts.append(("worldview", i, j))
return conflicts
实测数据:通用大模型写到10万字时,设定冲突率超过60%。这意味着Level 3检测几乎不需要复杂的算法——光是比对设定冲突就能判定。
2.3 检测结果的综合判定
# 综合判定逻辑(简化版)
def final_verdict(p1, p2, p3, conflict_rate):
# 加权融合
ai_score = 0.3 * p1 + 0.3 * p2 + 0.2 * p3 + 0.2 * conflict_rate
if ai_score > 0.75:
return "AI_GENERATED" # 判定AI生成,下架/降权
elif ai_score > 0.45:
return "SUSPICIOUS" # 可疑,人工复审
else:
return "HUMAN_LIKELY" # 判定人类创作,正常通过
3. 合规边界:AI辅助 vs AI代写
平台的技术界定很清晰:
| 类别 | 定义 | 平台态度 | 检测特征 |
|---|---|---|---|
| AI辅助创作 | AI参与非正文环节(大纲/人设/检查/润色) | 允许 | 正文P1低,P2正常,P3低 |
| AI生成内容 | 正文主体由AI生成 | 禁止/降权 | 正文P1高,P2异常,P3高 |
技术上的分界线是正文部分的AI特征浓度。你的大纲让AI写了没问题,但正文如果大段都是AI生成的,那不管前面做了多少"辅助",综合判定都会走到 AI_GENERATED。
4. 合规Workflow实战
4.1 错误Workflow(会被检测)
AI生成大纲 → AI生成正文 → 人工微调 → 投稿
↑
这里P1/P2/P3都会爆
星月写作2人团队就是这么干的,月入百万之后被番茄下架封禁,全军覆没。
4.2 合规Workflow
┌──────────────────┐ ┌──────────────────┐ ┌──────────────────┐ ┌────────┐
│ Step 1: 结构辅助 │ → │ Step 2: 人工正文 │ → │ Step 3: AI复查 │ → │ 投稿 │
│ │ │ │ │ │ │ │
│ · 大纲梳理 │ │ · 按大纲手写正文 │ │ · 设定冲突检查 │ │ │
│ · 人设管理 │ │ · 情节/对话/描写 │ │ · 人设漂移检测 │ │ │
│ · 节奏规划 │ │ · 保持个人风格 │ │ · AI味检测 │ │ │
│ │ │ │ │ · 节奏诊断 │ │ │
│ AI参与度: 高 │ │ AI参与度: 零 │ │ AI参与度: 高 │ │ │
│ 正文产出: 无 │ │ 正文产出: 100%人 │ │ 正文产出: 无 │ │ │
└──────────────────┘ └──────────────────┘ └──────────────────┘ └────────┘
这个Workflow的技术原理:Step 1和Step 3中AI只做检查和管理,不产生正文。Step 2的正文完全由人写。因此:
- P1(表层):人工写作,词汇丰富度和句长方差自然,AI特征低
- P2(结构):有AI辅助做大纲,但叙事节奏由人控制,特征正常
- P3(一致性):Step 3的AI复查专门解决设定冲突问题,提交前已修复
4.3 工具链参考
以茄子写作助手为例,它的功能设计完全匹配上述合规Workflow:
Step1_结构辅助:
- 大纲梳理: 检查逻辑矛盾、建议节奏调整
- 人设管理: 维护人物属性表,标注性格弧线
Step3_AI复查:
- 千章连贯: 10万字+级别的一致性检查
- 去AI味检测: 检测正文中的AI特征并标注
- 节奏诊断: 分析叙事节奏是否异常
关键约束:
- 不生成正文: 所有功能都是分析/检查/标注,不产出创作内容
- 域名: https://qziai.cn
核心原则:AI做编辑和质检员,不做代笔。 你的正文是你写的,只是用工具做了质控。这跟用ESLint查代码风格、用CI跑测试没有本质区别。
5. 开发者视角:自检AI味的技术方案
即使不用现成工具,开发者也可以自建一套轻量级AI味检测:
import numpy as np
def ai_taste_score(text):
"""轻量级AI味评分,0=纯人类,1=纯AI"""
sentences = split_sentences(text)
# 特征1:句长方差(AI偏低)
lengths = [len(s) for s in sentences]
length_cv = np.std(lengths) / np.mean(lengths) # 变异系数
f1 = 1 - min(length_cv / 0.5, 1) # CV<0.3偏向AI
# 特征2:转折词密度(AI偏高)
transitions = ["然而", "不过", "此外", "同时", "值得注意的是",
"首先", "其次", "最后", "综上", "总的来说"]
trans_count = sum(text.count(t) for t in transitions)
trans_density = trans_count / len(sentences)
f2 = min(trans_density / 0.3, 1) # 密度>0.2偏向AI
# 特征3:段落长度均匀度(AI偏向等长段落)
para_lengths = [len(p) for p in text.split("\n\n") if len(p) > 20]
if len(para_lengths) > 3:
para_cv = np.std(para_lengths) / np.mean(para_lengths)
f3 = 1 - min(para_cv / 0.4, 1)
else:
f3 = 0.5
# 加权综合
score = 0.35 * f1 + 0.35 * f2 + 0.30 * f3
return score
当然这是极简版,平台实际的200+维度检测远比这复杂。但这个脚本可以帮助你在投稿前做一轮自检。
更完整的方案推荐使用茄子写作助手的去AI味检测功能,它是专门针对网文场景训练的,覆盖维度更全。
6. 结论与建议
技术事实:
- 通用大模型10万字设定冲突率>60%,平台200+维度三级检测
- Sonnet 5虽然强,但"强"不等于"适合直接写长篇正文"
- 检测能力在进化,漏洞窗口在收窄
合规建议:
- 正文必须人写,这是底线
- AI用在结构辅助和事后复查,这是合规区间
- 投稿前跑一遍AI味检测,确保P1/P2/P3都在安全范围
- 长篇务必做一致性检查,10万字以上的设定冲突不是人眼能全覆盖的
一句话总结:把AI当CI/CD,不要当代码生成器。
FAQ
Q:AI写小说检测原理是什么?
A:主流平台采用200+维度三级级联检测。Level 1提取词汇丰富度、句长方差、转折词密度等~80个表层特征;Level 2分析情节节奏、冲突密度、伏笔分布等~70个叙事结构特征;Level 3做人设漂移、设定冲突、世界观一致性等~50+个长篇一致性检测。三级结果加权融合得出综合判定。
Q:我自己写完用AI润色一下,算违规吗?
A:关键看润色的程度。改几个错别字、调整个别措辞,不影响P1/P2/P3判定,属于合规。但如果AI重写了大段内容导致正文AI特征浓度升高,就会被判定为AI生成内容。建议润色后用AI味检测工具跑一遍,确认特征值在安全范围。
Q:长篇怎么保证设定一致性?人写也会出错啊。
A:人写的设定冲突率和AI完全不是一个量级。人的冲突往往是偶发的、可解释的(比如伏笔),AI的冲突是系统性的、随机漂移的。但10万字以上人确实也管不过来,所以用AI做一致性检查(比如茄子写作助手的千章连贯功能)是最合理的用法——AI帮你找bug,你自己修bug。
数据来源
- Claude Fable 5解禁及Sonnet 5发布:Anthropic官方公告,2026-07-01
- Sonnet 5定价(输入2美元/M Token,输出10美元/M Token):Anthropic官方定价页
- GPT-5.6系列发布及Terra定价:OpenAI官方公告,2026-07
- 番茄小说2026年5月拒签11.27万本/下架4万本:番茄官方治理报告
- 平台AI检测200+维度三级体系:行业技术文档
- 通用大模型10万字设定冲突率>60%:实测数据
- 平台AI辅助vs AI生成界定标准:平台创作者规范文档

978

被折叠的 条评论
为什么被折叠?



