dak ブログ

python、rubyなどのプログラミング、MySQL、サーバーの設定などの備忘録。レゴの写真も。

epub 形式のファイル内の html を出力する方法

2020-07-08 22:56:23 | python
epub 形式のファイル内の html を出力する方法のメモ。

import lxml.html
import ebooklib
from ebooklib import epub

book = epub.read_epub("xxx.epub")

for item in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
    dom = lxml.html.fromstring(item.get_content())
    xhtml = lxml.html.tostring(dom, encoding='unicode')
    print(xhtml)