kimi 编写提示词和重新校准排版,gemini 读取 pdf 文件输出 markdown 文件。
大 PDF 容易出错,借助 wps 等进行拆分和将 PDF 文件改为 OCR PDF,上传 Drive 后直接提要求。


多本书挨个处理即可;
请根据附件OCR 扫描文档: 1. 识别全部内容2. 修复 OCR 错误(错别字、断句、格式混乱) 3. 输出为标准 Markdown 格式 4. 保留原文结构层次 5. 将表格类内容转换为 Markdown 表格
可直接下载 MD 格式文件;但存在乱码和换行错误等情况。

这个markdown 内容换行排版有问题,部分错别字,按原文内容检查并重新输入。
kimi 可处理校准工作,等待复制结果即可。
gemini 的“思考”模式也可输出结果:
请对附件 Markdown 文档进行以下处理:
1. 换行修复
- 识别原文中因 OCR 或转换导致的错误断行(如句中无故换行、段落被拆碎)
- 按语义重新合并为完整段落
- 保持原文的章节层级结构(# ## ###)
2. 错别字修正
- 根据上下文语境,修正明显的错别字和乱码
- 保留原文的专业术语和作者用语风格
- 不确定的地方标记 [待确认] 而非擅自改动
3. 格式规范
- 统一标题层级(一级#、二级##、三级###)
- 表格用标准 Markdown 表格语法
- 引用块 > 用于金句/作者原话
- 列表项保持层级对齐
4. 输出要求
- 完整输出修复后的全文,不要省略
- 不要添加原文没有的总结或评论
- 保持作者原意和语气不变
输出 markdown 文件方便我下载。
待解决问题
1

gemini 用 por 模型校准,内容会变少,乱七八糟的。用“思考”模式类似 kimi 输出结果复制即可。
3 同一个源文件 markdown,gemini 和 kimi 整理后文件字数差一倍

上面 gemini 生成的 3 万多字;

下面 kimi 生成的 7 万多字;
综上: kimi 没法处理复杂、长上下文文件,gemini 更擅长;
处理完结果 kimi 老老实实逐行整理输出,gemini 老溜奸耍滑,要么就“降级”封控。
564

被折叠的 条评论
为什么被折叠?



