epub 形式のファイル内の html を出力する方法のメモ。
import lxml.html import ebooklib from ebooklib import epub book = epub.read_epub("xxx.epub") for item in book.get_items_of_type(ebooklib.ITEM_DOCUMENT): dom = lxml.html.fromstring(item.get_content()) xhtml = lxml.html.tostring(dom, encoding='unicode') print(xhtml)