それではProgramListOCRやGoogleのOCRのテストで使用したBASICリストを読み取ってみます。easyocr_reader.pywのラジオボタンは"英語"と"カナなし"を選択しています。
↓
イコールが誤変換されていたりカンマが欠落したりしています。でも数字は1をI(アイ)に誤変換したくらいでほぼ正確に読み取っていますね。 . . . 本文を読む
前回、EasyOCRを利用できる環境を作ったので今度はマイコン雑誌のリストを読み取るプログラムを作成します。プログラムにはPythonを使います。EasyOCRをPythonから利用するのは数行のプログラムで書けるので簡単ですが、ネットによくあるコマンドラインからの利用では使い勝手が悪いので、tkinterを使ったGUIプログラムにしようと思います。また、以前OCR検証に使ったWindows標準の . . . 本文を読む
せっかくなので前回に引き続き、EasyOCRを使ってマイコン雑誌のプログラムリストを読み取ってみることにしました。
EasyOCRはPyTorchというPythonベースのディープラーニング・ライブラリを利用しています。そのためEasyOCRを動作させるためにはPythonをインストールする必要があります。また、NVIDIAのGPUを使った並列演算処理を行うためのCUDAも利用します。したがって . . . 本文を読む
DumpFormater.exeのマシン語ダンプリスト修正機能について説明します。
マシン語ダンプリストを修正するときは右側の項目の"I/O"~"ASCII"を選択します。それぞれ前回説明のダンプリストタイプに対応しています。「OCRエンジン選択」の項目はProgramListOCRなら"Tesseract"を、GoogleドライブのOCRなら"Google"を選択します。次に「OPEN」ボ . . . 本文を読む
今度はマシン語ダンプリストの読み取りについてテストしてみます。
マシン語のダンプリストには幾つかフォーマットがあります。前回説明したDumpFormater.exeは次の4種類のフォーマットに対応しています。
1.I/O
工学社の月刊I/Oでよく使われていた形式で、縦・横16バイトと256バイトのチェックサムがついているタイプです。
DumpListEditorでチェックするときは「横 . . . 本文を読む