仕事から帰ってきて何やってるんでしょうね・・・私は。
眠い頭でこの文章打ったのでちょっとテンション変。
でもそのまま載せちゃうよ。
実家で埃をかぶっていた文庫本を切り離し、
ドキュメントスキャナで読み込んでPDFに。
普通はここで終わる。
そのあとタブレットなり、スマホなり、PCなりで読むのだが、
私はここから無謀なことに、OCRでテキストを抽出し
リフローで電子書籍にしてみようかと。
※リフロー:文字情報をもっているため、リーダーの設定で文字を大きくしたり小さくしたりすることが出来る電子書籍。
~CASE 1~
最初、アドビのAcrobatPROのOCR機能でテキストを搾り出してみた。
ひらがなはまぁまぁいける。
しかし漢字がっっ。
「刀」が「万」という字として認識される。
あと、ルビもご丁寧なことで認識してくれるんだけども、
文章の前後お構いなしに挿入される。
あと行の折り返しは改行として処理される。
だから変なところで改行されている。
ちゃんと意味の通る文章にするには
校正しなくちゃならないという・・・。
校正しながら読んでたら、それはもう本としては読む気無くすよ・・・
お腹いっぱいですよ。
~CASE 2~
PDFをgoogleドライブに読み込み、OCRで書き出してもらう。
すっげーグーグル!!
改行は無視されるけど!
ルビも全部すっ飛ぶけど!!
でもAcrobatよりはだいぶマシな精度で認識してくれる!!!
しかも無料。マーベラス!!!!!
・・・だけど、やはり常用漢字以外の文字(人名だとか知名だとか普段使わない単語とか)
は難しいらしく、別の言葉で書き出される。
「奸物!」が「好物!」になっていたり・・・。
意味としては間逆だ・・・しかもよく見ないと気づけないよ・・・。
結局やっぱり見直しは必要。
言い忘れていたけど時代小説を自炊しています。
時代かかった言い回しが多いからなぁ・・・。
意味の通るテキストファイルが出来たら、
SigilというEPUBソフトで作っていく。
雰囲気はHTMLエディターと同じ感じ。
・・・この後EPUBとして文章にCSSのスタイルを適用したり、
ルビを設定していくのだけど、
も う 限 界。
電子書籍として作ったところで散々校正まがいのことして
読み込んだ本をまた読むか?!と思ってしまいました・・・。
おとなしく固定レイアウトにして読むよ・・・。
※固定レイアウト:画像を表示させる電子書籍。文字情報は持ってない。拡大するとジャギる。
眠い頭でこの文章打ったのでちょっとテンション変。
でもそのまま載せちゃうよ。
実家で埃をかぶっていた文庫本を切り離し、
ドキュメントスキャナで読み込んでPDFに。
普通はここで終わる。
そのあとタブレットなり、スマホなり、PCなりで読むのだが、
私はここから無謀なことに、OCRでテキストを抽出し
リフローで電子書籍にしてみようかと。
※リフロー:文字情報をもっているため、リーダーの設定で文字を大きくしたり小さくしたりすることが出来る電子書籍。
~CASE 1~
最初、アドビのAcrobatPROのOCR機能でテキストを搾り出してみた。
ひらがなはまぁまぁいける。
しかし漢字がっっ。
「刀」が「万」という字として認識される。
あと、ルビもご丁寧なことで認識してくれるんだけども、
文章の前後お構いなしに挿入される。
あと行の折り返しは改行として処理される。
だから変なところで改行されている。
ちゃんと意味の通る文章にするには
校正しなくちゃならないという・・・。
校正しながら読んでたら、それはもう本としては読む気無くすよ・・・
お腹いっぱいですよ。
~CASE 2~
PDFをgoogleドライブに読み込み、OCRで書き出してもらう。
すっげーグーグル!!
改行は無視されるけど!
ルビも全部すっ飛ぶけど!!
でもAcrobatよりはだいぶマシな精度で認識してくれる!!!
しかも無料。マーベラス!!!!!
・・・だけど、やはり常用漢字以外の文字(人名だとか知名だとか普段使わない単語とか)
は難しいらしく、別の言葉で書き出される。
「奸物!」が「好物!」になっていたり・・・。
意味としては間逆だ・・・しかもよく見ないと気づけないよ・・・。
結局やっぱり見直しは必要。
言い忘れていたけど時代小説を自炊しています。
時代かかった言い回しが多いからなぁ・・・。
意味の通るテキストファイルが出来たら、
SigilというEPUBソフトで作っていく。
雰囲気はHTMLエディターと同じ感じ。
・・・この後EPUBとして文章にCSSのスタイルを適用したり、
ルビを設定していくのだけど、
も う 限 界。
電子書籍として作ったところで散々校正まがいのことして
読み込んだ本をまた読むか?!と思ってしまいました・・・。
おとなしく固定レイアウトにして読むよ・・・。
※固定レイアウト:画像を表示させる電子書籍。文字情報は持ってない。拡大するとジャギる。