AI整理电子书

kimi 编写提示词和重新校准排版,gemini 读取 pdf 文件输出 markdown 文件。
大 PDF 容易出错,借助 wps 等进行拆分和将 PDF 文件改为 OCR PDF,上传 Drive 后直接提要求。
在这里插入图片描述
在这里插入图片描述
多本书挨个处理即可;

请根据附件OCR 扫描文档: 1. 识别全部内容2. 修复 OCR 错误(错别字、断句、格式混乱) 3. 输出为标准 Markdown 格式 4. 保留原文结构层次 5. 将表格类内容转换为 Markdown 表格

可直接下载 MD 格式文件;但存在乱码和换行错误等情况。
在这里插入图片描述

这个markdown 内容换行排版有问题,部分错别字,按原文内容检查并重新输入。

kimi 可处理校准工作,等待复制结果即可。

gemini 的“思考”模式也可输出结果:

请对附件 Markdown 文档进行以下处理:



1. 换行修复

- 识别原文中因 OCR 或转换导致的错误断行(如句中无故换行、段落被拆碎)

- 按语义重新合并为完整段落

- 保持原文的章节层级结构(# ## ###)



2. 错别字修正

- 根据上下文语境,修正明显的错别字和乱码

- 保留原文的专业术语和作者用语风格

- 不确定的地方标记 [待确认] 而非擅自改动

3. 格式规范

- 统一标题层级(一级#、二级##、三级###)

- 表格用标准 Markdown 表格语法

- 引用块 > 用于金句/作者原话

- 列表项保持层级对齐



4. 输出要求

- 完整输出修复后的全文,不要省略

- 不要添加原文没有的总结或评论

- 保持作者原意和语气不变

输出 markdown 文件方便我下载。

待解决问题

1

在这里插入图片描述
gemini 用 por 模型校准,内容会变少,乱七八糟的。用“思考”模式类似 kimi 输出结果复制即可。

3 同一个源文件 markdown,gemini 和 kimi 整理后文件字数差一倍

在这里插入图片描述
上面 gemini 生成的 3 万多字;
在这里插入图片描述
下面 kimi 生成的 7 万多字;

综上: kimi 没法处理复杂、长上下文文件,gemini 更擅长;
处理完结果 kimi 老老实实逐行整理输出,gemini 老溜奸耍滑,要么就“降级”封控。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值