PaddleOCRwindows下报错解决方案

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 文档版面分析模型v1.0

PaddlePaddle
OCR
PDF

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

PaddleOCRwindows下报错解决方案

PaddleOCR 官方链接 https://github.com/PaddlePaddle/PaddleOCR

运行环境

  • Windows 10 操作系统
  • Python -version Python 3.10.11
  • pip install paddlepaddle==2.4.2 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
  • pip install paddleocr==2.7.3

目前paddleocr最新版本是2.7.3

测试代码

# -*- coding: utf-8 -*-

# __ author:Jack
# date: 2024-06-16

from paddleocr import PaddleOCR
import paddle.fluid

paddle.fluid.install_check.run_check()


def show():
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")   
    image_path = f'example.jpg'
    result = ocr.ocr(image_path, cls=True)
    for idx in range(len(result)):
        res = result[idx]
        for line in res:
            print(line)


if __name__ == '__main__':
    show()

抛出异常 numpy.core.multiarray failed to import

RuntimeError: module compiled against ABI version 0x1000009 but this version of numpy is 0x2000000
Traceback (most recent call last):
  File "test.py", line 6, in <module>
    from paddleocr import PaddleOCR
  File "lib\site-packages\paddleocr\__init__.py", line 14, in <module>
    from .paddleocr import *
  File "lib\site-packages\paddleocr\paddleocr.py", line 25, in <module>
    import cv2
  File "lib\site-packages\cv2\__init__.py", line 181, in <module>
    bootstrap()
  File "lib\site-packages\cv2\__init__.py", line 153, in bootstrap
    native_module = importlib.import_module("cv2")
  File "importlib\__init__.py", line 126, in import_module
    if sys.path[0] == BASE_DIR or os.path.realpath(sys.path[0]) == BASE_DIR:
ImportError: numpy.core.multiarray failed to import

解决方案

pip install -U numpy==1.26.4

您可能感兴趣的与本文相关的镜像

PP-DocLayoutV3 文档版面分析模型v1.0

PP-DocLayoutV3 文档版面分析模型v1.0

PaddlePaddle
OCR
PDF

PP-DocLayoutV3 是飞桨(PaddlePaddle)开源的先进文档版面分析模型。该模型能够精准识别文档中的正文、标题、表格、图片、页眉页脚等十余类版面区域,并输出像素级坐标定位。针对中文文档优化设计,支持论文、合同、书籍、报纸等复杂版式的高精度分析。作为OCR前置引擎,可有效划分文字区域与图表区域,提升后续文字识别准确率;同时支持版面还原与结构化输出,广泛应用于档案数字化、智能文档处理

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jack_software

感谢打赏,我努力提供优质内容~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值