Skip to content

mxr-vector/mxr-ocr-scan

Repository files navigation

ocr_scan

环境与依赖

使用 Python 3.11,采用 uv 管理依赖:

uv sync --extra cpu
uv sync --extra cu128
uv sync --extra gui

运行

# 单张
uv run main.py --input assets/front.jpg

# 批量
uv run main.py --input-dir assets --output-dir output

技术栈

  • PaddleOCR 2.x(文本识别)
  • PyQt6(手动框选证件区域)
  • OpenCV + ReportLab(预处理与 PDF 生成)

项目结构

|-- LICENSE
|-- README.md
|-- assets
|   |-- back.jpg
|   `-- front.jpg
|-- config.py            # 运行与模型配置
|-- roi_selector.py      # Qt6 手动框选
|-- ocr_engine.py        # PaddleOCR 封装
|-- parser.py            # 字段解析
|-- pdf_generator.py     # PDF 生成
|-- preprocess.py        # 图像预处理
|-- validator.py         # 身份证校验
|-- main.py              # CLI 入口
|-- pyproject.toml
`-- uv.lock

About

身份证扫描件,由gitee维护

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages