「HTML文書を青空文庫形式に変換」
HTML文書を、青空文庫形式のルビ付き文書に変換する Ruby スクリプトを作りました。それ以外のタグはすべて削除します。
変換前:
狼犬(ウルフ・ドッグ)がダイリスを追いつめている
変換後: 狼犬《ウルフ・ドッグ》がダイリスを追いつめている
後方参照するとか、フォルダ内のファイルを全て読み込むとか、そういう細かいところで苦労したけれど、使い物になるのができて良かった良かった。使い方は、テキストファイルの入ったフォルダに突っ込んで実行するだけ。! output !というフォルダが作られて、変換されたファイルが入ります。
なお、スクリプトは Ruby をインストール してないと動きません。面倒くせーって人のために exe 形式に変換したものも置いておきます。
実行ファイル: Html2Txt.exe