青空UTF
青空文庫のxhtmlファイルのSJIS文字コードをUTF-8に変換します。
ビュアーとしての目的ではなく、素材として利用することを想定しています。
- 画像として埋め込まれているJIS X 0213文字を、Unicode文字に置き換えます。
- JIS X 0213に無いUnicode指定文字も置き換えて注釈を残します。
- ダッシュ―(U+2015)を—(U+2014)に置換します。
- ~(U+FF5E)を〜(U+301C)に置換します。
- rpタグを削除します
- 外字以外の画像は、絶対パスに変換します。
- 置換した外字と注釈をcssで色付け強調します。
縦書モード
- /\で表されるくの字点を、〳〵 (U+3033,34,35)に置換します。
- “” を 〝〟に変換します。
- 縦書で回転が必要な記号にuprightクラスをつけて90度回転させます。
- -webkit-writing-modeで縦書指定にします。
※ChromeではUnicode2面(U+2xxxx)の文字が縦書で文字化けします。
青空文庫のページから以下のブックマークレットを利用すると、直接変換できます。
javascript:location.href='http://wakufactory.jp/densho/font/aozorautf.php?url='+escape(location.href);