「HTML文書を青空文庫形式に変換」

HTML文書を、青空文庫形式のルビ付き文書に変換する Ruby スクリプトを作りました。それ以外のタグはすべて削除します。

変換前: 狼犬(ウルフ・ドッグ)がダイリスを追いつめている
変換後: 狼犬《ウルフ・ドッグ》がダイリスを追いつめている

後方参照するとか、フォルダ内のファイルを全て読み込むとか、そういう細かいところで苦労したけれど、使い物になるのができて良かった良かった。使い方は、テキストファイルの入ったフォルダに突っ込んで実行するだけ。! output !というフォルダが作られて、変換されたファイルが入ります。

なお、スクリプトRuby をインストール してないと動きません。面倒くせーって人のために exe 形式に変換したものも置いておきます。

スクリプトHtml2Txt.rb

実行ファイル: Html2Txt.exe