OCRリーダープロトタイプ作成 - CyberChaos（さいばかおす）

OCRリーダープロトタイプ作成

2024-01-23 22:04:23 | python

Tesseractのインストールパスを次のように指定するだけで動くようになった。環境構築とか環境変数とかパスがどうのこうのとか難しいことは抜きにして、Tesseractをインストールするだけで済むようになっている。

C:Program FilesTesseract-OCR esseract.exe

各自Tesseractをどこにインストールしたか覚えておいて、上記の部分を書き換えれば良い。もちろんPyQt5とかライブラリのインストールもpip install ライブラリ名で忘れずに。

import sys

from PyQt5.QtWidgets import QApplication, QMainWindow, QVBoxLayout, QWidget, QPushButton, QLabel, QTextEdit, QFileDialog

from PyQt5.QtGui import QPixmap, QImage, QFont

from PIL import Image as PilImage

import pytesseract

class OCRApp(QMainWindow):

def __init__(self):

super().__init__()

self.image_path = None

# Tesseractのインストールパスを指定

tesseract_path = r'C:Program FilesTesseract-OCR esseract.exe'

pytesseract.pytesseract.tesseract_cmd = tesseract_path

self.central_widget = QWidget()

self.setCentralWidget(self.central_widget)

self.init_ui()

def init_ui(self):

layout = QVBoxLayout()

self.image_label = QLabel("画像がここに表示されます")

layout.addWidget(self.image_label)

file_button = QPushButton("ファイルを選択", self)

file_button.clicked.connect(self.select_file)

layout.addWidget(file_button)

ocr_button = QPushButton("OCR実行", self)

ocr_button.clicked.connect(self.perform_ocr)

layout.addWidget(ocr_button)

self.result_text = QTextEdit("OCR結果がここに表示されます")

layout.addWidget(self.result_text)

self.central_widget.setLayout(layout)

def select_file(self):

options = QFileDialog.Options()

options |= QFileDialog.ReadOnly

file_path, _ = QFileDialog.getOpenFileName(self, "ファイルを選択", "", "Images (*.png *.jpg *.jpeg);;All Files (*)", options=options)

if file_path:

self.image_path = file_path

self.display_selected_image()

def display_selected_image(self):

try:

pil_image = PilImage.open(self.image_path)

pil_image = pil_image.resize((300, 300)) # サイズを適当に変更

qimage = self.pil_image_to_qimage(pil_image)

pixmap = QPixmap.fromImage(qimage)

self.image_label.setPixmap(pixmap)

except Exception as e:

self.result_text.setPlainText(f"Error: {str(e)}")

def pil_image_to_qimage(self, pil_image):

width, height = pil_image.size

bytes_per_line = 3 * width

image = QImage(pil_image.tobytes("raw", "RGB"), width, height, bytes_per_line, QImage.Format_RGB888)

return image

def perform_ocr(self):

if self.image_path:

try:

image = PilImage.open(self.image_path)

text = pytesseract.image_to_string(image, lang='jpn')

self.result_text.setPlainText(text)

except Exception as e:

self.result_text.setPlainText(f"Error: {str(e)}")

else:

self.result_text.setPlainText("ファイルが選択されていません.")

if __name__ == "__main__":

app = QApplication(sys.argv)

# フォントをMS Gothicに設定

font = QFont("MS Gothic", 12)

app.setFont(font)

window = OCRApp()

window.setWindowTitle("OCR Reader")

window.setGeometry(100, 100, 500, 500)

window.show()

sys.exit(app.exec_())

結果は上々、後はディープラーニングでチューニングできるように改造するだけ。

最新の画像［もっと見る］

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

goo blog お知らせ

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】今年の「バレンタイン」どうだった？
	訪問者数に応じてdポイント最大1,000pt当たる！
	dポイントが当たる！無料『毎日くじ』

プロフィール

自己紹介: 未経験からフリーランスアプリ開発エンジニアを目標としている。

goo blog おすすめ

	おすすめブログ
	【コメント募集中】今年の「バレンタイン」どうだった？

お客さまのご利用端末からの情報の外部送信について

カレンダー

最新記事

>> もっと見る

カテゴリー

最新コメント

nichikon2/残業代請求訴訟のやり方　訴状の4ページ目
Unknown/残業代請求訴訟のやり方　訴状の4ページ目
供養マニア/日本霊能者連盟(理事長通名:山本隆雄)は北朝鮮荒らし連盟崔バカ雄と改名せよ！
Unknown/日本霊能者連盟(理事長通名:山本隆雄)は北朝鮮無能者連盟崔バカ雄と改名せよ！
Unknown/日本霊能者連盟(理事長通名:山本隆雄)は北朝鮮無能者連盟崔バカ雄と改名せよ！
小さなちんちん大きくなあれ、ちんぽに効く朝鮮人参食べ放題に挑戦/日本霊能者連盟(理事長通名:山本隆雄)は北朝鮮無能者連盟崔バカ雄と改名せよ！
Unknown/日本霊能者連盟(理事長通名:山本隆雄)は北朝鮮無能者連盟崔バカ雄と改名せよ！
原告/日本霊能者連盟じゃなくて北朝鮮法螺吹き連盟詐欺師崔バカ雄(通名:山本隆雄)
Unknown/日本霊能者連盟じゃなくて北朝鮮法螺吹き連盟詐欺師崔バカ雄(通名:山本隆雄)
Unknown/キチガイスカトロマニアの日本霊能者連盟詐欺師崔バカ雄(通名:山本隆雄)

バックナンバー

2025年02月

2025年01月

2024年12月

2024年11月

2024年10月

2024年09月

2024年08月

2024年07月

2024年06月

2024年05月

2024年04月

2024年03月

2024年02月

2024年01月

2023年12月

2023年11月

2023年10月

2023年09月

2023年08月

2023年07月

2023年06月

2023年05月

2023年04月

2023年03月

2023年02月

2023年01月

2022年12月

2022年11月

2022年10月

2022年09月

2022年08月

2022年07月

2022年06月

2022年05月

2022年04月

2022年03月

2022年02月

2022年01月

2021年12月

2021年11月

2021年10月

2021年09月

2021年08月

2021年07月

2021年04月

2021年03月

2021年02月

2021年01月

2020年11月

2020年08月

2020年06月

2020年05月

2020年04月

2020年03月

2020年02月

2020年01月

2019年12月

2019年10月

2019年09月

2019年08月

2019年05月

2019年04月

2019年03月

2019年02月

2019年01月

2018年12月

2018年11月

2018年10月

2018年09月

2018年08月

2018年07月

2018年06月

2018年05月

2018年04月

2018年03月

2018年02月

2018年01月

2017年12月

2017年11月

2017年10月

2017年09月

2017年08月

2017年07月

2017年06月

2017年05月

2017年04月

2017年03月

2017年02月

2017年01月

2016年12月

2016年11月

ブックマーク

最初はgoo
gooブログトップ
スタッフブログ