转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/43527755
我们从网上下载的PDF文件有的是加密处理过的,无法复制其中的内容,对于这类文件的内容提取可以通过该工具实现
PDF加密
PDF文件经过加密处理之后是无法简单的复制的,PDF文件的属性也如下图所示:
工具的使用方法
软件的目录结构如下图:
lib文件夹下是程序的运行环境和代码;
pdf文件夹是需要转化的pdf文件所在的文件夹;
txt文件夹是转化后生成的txt文件所在的文件夹;
run.bat是

该博客介绍了一种工具,用于提取加密PDF文件中的文本信息。PDF加密后的文件无法直接复制内容,但通过这个工具,用户可以将PDF文件放入指定文件夹,运行批处理脚本,生成TXT文本。源代码需要JDK环境,作者计划在个人网站上发布。
3308

被折叠的 条评论
为什么被折叠?



