国立国会図書館が「国立国会図書館資料デジタル化の手引 2011年版」を公開しました。(サイトは、こちら。)
近代デジタルライブラリーなどは、時々利用しています。目次データはテキスト化しているので、検索をかけることができます。このテキスト化の際は、A:OCRソフト+校正、B:手入力の2つの方法があるとのことで、手入力の場合は、同一テキストを別々の作業者が入力し突き合わせる、とあって、なるほどと思いました。
また、この手引の巻末には、「図書の原資料からの電子化仕様書」のサンプルが掲載されています。