AgentOCR

简介

AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目
本项目目前包含如下子项目：
- Python Package 【AgentOCR】
- OCR 标注软件 【AgentOCRLabeling】
- 中国车牌检测识别系统 【AgentCLPR】

效果展示

多语言 OCR：

中英文

  [[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.971377968788147]]
  [[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.9922086596488953]]
  [[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤，100公斤起订）', 0.9619097709655762]]
  [[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元，1000瓶起订）', 0.9908633828163147]]
  [[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】：代加工方式/OEMODM', 0.9834667444229126]]
  [[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】：纯臻营养护发素', 0.9786152243614197]]
  [[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】：YM-X-3011', 0.9821851849555969]]
  [[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.8878258466720581]]
  [[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】：220ml', 0.9954416155815125]]
  [[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】：适合所有肤质', 0.9606326818466187]]
  [[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】：鲸蜡硬脂醇、燕麦-葡聚', 0.9720807671546936]]
  [[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油酰胺内基甜菜碱、泛醇', 0.8544049859046936]]
  [[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['（成品包材）', 0.9908912777900696]]
  [[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['（主要功能】：可紧致头发磷层，从而达到', 0.9463475942611694]]
  [[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果，给十燥的头', 0.9470974802970886]]
  [[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.997718095779419]]

韩文：

  [[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.7852867245674133]]
  [[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가 잔깐 좋아하는 사람이 생겨서 혼과 공공', 0.8225479125976562]]
  [[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가 죽어어릴것안 같아서 여기를 한다', 0.8644148707389832]]
  [[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈 앞이 아른아른 거리는 잘 생긴 얼굴 자꾸', 0.8839521408081055]]
  [[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에 냄도는 크의 측촉한 옥소리 예', 0.8728228211402893]]

使用指南

Python Package：

快速安装：

# 安装 AgentOCR
$ pip install agentocr 

# 根据设备平台安装合适版本的 ONNXRuntime

# CPU 版本（推荐非 win10 系统，无 CUDA 支持的设备安装）
$ pip install onnxruntime

# GPU 版本（推荐有 CUDA 支持的设备安装）
$ pip install onnxruntime-gpu

# DirectML 版本（推荐 win10 系统的设备安装，可实现通用的显卡加速）
$ pip install onnxruntime-directml

# 更多版本的安装详情请参考 ONNXRuntime 官网

简单调用：

# 导入 OCRSystem 模块
from agentocr import OCRSystem

# 初始化 OCR 模型
ocr = OCRSystem(config='ch')

# 使用模型对图像进行 OCR 识别
results = ocr.ocr('test.jpg')

服务器部署：

启动 AgentOCR Server 服务
```
$ agentocr server
```

Python 调用

import cv2
import json
import base64
import requests

# 图片 Base64 编码
def cv2_to_base64(image):
    data = cv2.imencode('.jpg', image)[1]
    image_base64 = base64.b64encode(data.tobytes()).decode('UTF-8')
    return image_base64

# 读取图片
image = cv2.imread('test.jpg')
image_base64 = cv2_to_base64(image)

# 构建请求数据
data = {
    'image': image_base64
}

# 发送请求
url = "http://127.0.0.1:5000/ocr"
r = requests.post(url=url, data=json.dumps(data))

# 打印预测结果
print(r.json())

Jupyter Notebook：【快速使用】
更多安装使用细节请参考：【Package 使用指南】

预设配置选项

多语言模型配置：

语言	缩写	检测模型	分类模型	识别模型
简体中文	ch	ch_mul_m_det / ch_mul_s_det / ch_mul_v2_c_det(default)	ch_mul_m_cls(default)	ch_m_rec / ch_s_rec / ch_v2_c_rec(default)
繁体中文	cht	ch_mul_m_det / ch_mul_s_det / ch_mul_v2_c_det(default)		cht_m_rec(default)
英文	en	en_mul_m_det(default)		en_m_rec(default)
法文	fr			fr_m_rec(default)
德文	ger			ger_m_rec(default)
韩文	kr			kr_m_rec(default)
日文	jp			jp_m_rec(default)
卡纳达文	ka			ka_m_rec(default)
泰卢固文	te			te_m_rec(default)
泰米尔文	ta			ta_m_rec(default)
拉丁文	la			la_m_rec(default)
西里尔文	cy			cy_m_rec(default)
梵文	de			de_m_rec(default)

Contact us

Email : [email protected]
QQ Group : 1005109853

Name		Name	Last commit message	Last commit date
Latest commit History 217 Commits
.github/workflows		.github/workflows
AgentCLPR @ e36bf52		AgentCLPR @ e36bf52
AgentOCRLabeling @ 7d153e0		AgentOCRLabeling @ 7d153e0
agentocr		agentocr
docs		docs
examples		examples
ocrjs		ocrjs
ocrjsplugin		ocrjsplugin
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
_config.yml		_config.yml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AgentOCR

简介

效果展示

使用指南

预设配置选项

更多功能

Contact us

About

Releases 7

Packages

Contributors 3

Languages

License

AgentMaker/AgentOCR

Folders and files

Latest commit

History

Repository files navigation

AgentOCR

简介

效果展示

使用指南

预设配置选项

更多功能

Contact us

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 7

Packages 0

Contributors 3

Languages

Packages