ホチキス先生の「プログラマーと呼ばれたい」

InfoPath & SQL Server !

Kindle2利用レポート(10)Windowsのメモ帳で作ったテキストファイルをKindle2に入れるときは文字コードを「UTF-8」にするのが良い。

leave a comment »

いままでPDF形式をKindle2に読み込ませる、ということばかりやっていたが、実は英語のテキストファイルなら、そのまま送り込んでKindle2で読めるのだ。さらにテキストファイルなら文字の大きさも変えることができるし、Text-to-Speech機能も使うことができる。英文をKindle2が読み上げてくれるのだ。

ロック・バンドの歴史を調べるには、日本のWikipediaよりも米Wikipediaのほうがいい。とても詳しい歴史や、様々な逸話が紹介されている。そこでサンプルに米Wikipediaでロックバンド「ディープ・パープル Deep Purple」を調べ、テキスト形式にしたものをKindle2で読むことをやってみた。


(Fig.1 米WikipediaからDeep PurpleについてのテキストをWindows XP SP3のメモ帳に読み込んだ)

やり方は簡単だ、米WikipediaでDeep Purpleを検索し、ページの本文を選択してコピーする。そしてWindowsの「メモ帳」を起動し、テキストを貼り付ける。ただそれだけだ。ただし、保存するときに注意が必要だ。文字コードの違いによってはKindle2で表示したときに文字化けがする場合がある。

例えばWindows XP SP3で「メモ帳」を起動したときには、4つの異なる保存形式を利用できる。「ANSI」、「Unicode」、「Unicode big endian」、「UTF-8」である。「メモ帳」で保存するとき、「文字コード」のオプションでこれら4つの形式を変えることができる。


(Fig.2 Windows XP SP3のメモ帳で保存する文字コードを選択する)

ファイル名は「半角英語」あるいは「直接入力」で英語のファイル名にする。ファイル名が日本語では、Kindle2に送り込んだときにメニュー画面に表示される文書名がわからなくなるからだ。同じテキストを4つの異なる文字コードで保存し、それぞれ文字コード形式がわかるように「wp_deep_purple_ansi.txt」、「wp_deep_purple_unicode.txt」、「wp_deep_purple_unicode_big_endian.txt」、「wp_deep_purple_utf8.txt」というファイル名にした。

ファイル名は英語フォントでなければならないが、Kindle2の「documents」フォルダの中に自分でフォルダを作って入れることもできる。ファイルが多くなると収拾がつかなくなるので、自分なりにフォルダを作って整理するのがいいだろう。このとき、フォルダ名は日本語を使っても差し支えない。


(Fig.3 Kindle2のdocumentsフォルダに作成した日本語名のフォルダ)


(Fig.4 Kindle2に保存したテキストファイル)


(Fig.5 Kindle2のHOMEメニューに表示されたテキストファイルのファイル名)

まず本文の中から文字化けの具合が比べられる部分を選んでみる。違いがわかったのは、「-(ハイフン)」のように見える記号の表示と改行の具合だった。ちなみに他の部分の「-(ハイフン)」のように見えるところで文字化けしていないところもあるし、改行も全ての行でおかしくなるのではないようだ。

違いを比べるために、まずコンピュータの画面で正しい表示具合を確認しておく。本文中にバンドの歴史を時代ごとに箇条書きにまとめた部分があり、行の最後に括弧書きで(1967-68)といった記述のある部分があった。この部分で文字化けと改行の不具合が出ることがわかった。

まず「ANSI」コードで保存されたものは、年号の間をつなぐ「-(ハイフン)」のように見える記号が全く表示されず、スペースとして表示される。次に「Unicode」と「Unicode big endian」で保存されたものは、いずれも「-(ハイフン)」のように見える記号が全く表示されず、スペースとして表示されるとともに、これらの行だけ2行分に改行されて見える。そして「UTF-8」コードで保存したものは、PCの画面上のテキスト表示と同じように表示された。


(Fig.6 ANSIで保存したテキストファイルをKindle2で表示した)


(Fig.7 Unicodeで保存したテキストファイルをKindle2で表示した)


(Fig.8 Unicode big endianで保存したテキストファイルをKindle2で表示した)


(Fig.9 UTF-8で保存したテキストファイルをKindle2で表示した)

これらのテキストファイルは、文字コードの違いによって一部の文字に文字化けがおこり、改行の具合がおかしくなることがわかった。そして最も正しく表示されるコード形式は「UTF-8」であるようだ。だがどの文字コード形式であっても、基本的なアルファベットはちゃんと読むことができる。そのために違いがわかるまでは、どの形式で保存しても同じではないか、と思ったくらいだ。したがってここで得られた知見は、ある文書を試験的にKindle2で保存した経験的なものであって、技術的な裏づけを持っているわけではないが、これらの結果からはWindowsの「メモ帳」で保存する文字コード形式としては「UTF-8」を選ぶべきだ、と言っていいだろう。

テキストファイルとしてKindleに保存したファイルは、「AA」ボタンをクリックしてフォントの大きさを変えることもできるし、Text-to-Speechも使うことができる。テキスト形式のドキュメント保存は、Kindle2でドキュメントを扱う方法として、簡単でしかも実用的な使い方だと思う。


(Fig.10 Kindle2に保存したテキストファイルを開き文字の大きさを変えたりText-to-Speechを試す)

またKindle2で当該のファイルを表示すると、documentフォルダにドキュメントファイル名と同じ名前で拡張子が「.mbp」というファイルが自動的に生成する。これはドキュメントを読んでいる場所を記録したり、Kindle2が利用するためのファイルであると思われる。


(Fig.11 Kindle2のdocumentsフォルダに生成した.mbpファイル)

Written by Yoshio Matsumoto

2010年5月30日 @ 12:08 PM

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。