tesseract-ocr
文書の過去の版を表示しています。
tesseract ocr
参考
Tesseract OCRで文字認識をする https://gihyo.jp/admin/serial/01/ubuntu-recipe/0577
7セグメント読み取り ssocr
Pythonで書くTesseract 4の基本的な使い方。APIとCLIからOCRを実行する方法 https://valmore.work/how-to-use-tesseract4-with-python/
インストール
sudo apt install gimageReader tesseract-ocr sudo apt install tesseract-ocr-jp
使い方
tesseract imagename outputbase [-l lang] [–oem ocrenginemode] [–psm pagesegmode] [configfiles…]
tesseract infile outfile --psm 6 -l jpn
日本語を認識させる
https://github.com/tesseract-ocr/langdata/tree/master/jpn
apt install tesseract-ocr-jp で以下の場所に日本語データがインストールされる
/usr/share/tesseract-ocr/4.00/tessdata /usr/local/Cellar/tesseract/4.1.0/share/tessdata
tesseract-ocr.1583898494.txt.gz · 最終更新: 2020/03/11 12:48 by nabezo