[Contents]   [Back]   [Prev]   [Up]   [Next]   [Forward]  


電子メールと地域化

1982年、互換性を保証するために、電子メールの規格 RFC822 が記述されました。 電子メールはアメリカ育ちであったため、残念ながら本文やヘッダには、ASCII 文字列しか格納できない規格でした。

しかし、英語以外の言語を母国語としている人達にはとても不便です。そこで、 配送に関わるヘッダはともかく、本文に母国語を格納するため RFC822 はさまざ まな国で拡張されました。

ヨーロッパ諸国では、ウムラウト(アクセント)文字を表す8ビット1文字のコード Latin 1 がよく使われるようになりました。Latin 1 は ISO-8859-1 と呼ばれる ことがあります。

日本では、7ビット2文字の JIS コード、UNIX でよく使われる 8ビット2文字の EUC コード、パソコンで使われている 8ビット2文字の SJIS コードが存在しま した。日本のインターネットの前身である JUNET の先駆者達は、配送のための コードとして JIS コードを ESC シーケンスで切り替える、いわゆる JUNET コー ドを選びました。

JUNET コードは ISO-2022-JP と呼ばれることがあります。ISO-2022-JP を使え ば、複数の文字コードを切り替えるだけでなく、使われている文字コードが何か という情報を得られます。

Latin 1 や ISO-2022-JP に見られる本文の拡張は、あくまで地域に限定された 紳士協定です。RFC822 を使う限り、地域間を越えてメッセージをやりとりする には、結局英語を使うしかないのです。

RFC822 は記述が曖昧なので、ヘッダや本文に 7 ビット文字である ISO-2022-JP を入れてもよいように読めます。たぶん、この説明を読めば誤解が解けるでしょ う。「RFC822 は、ヘッダと本文のシンタックス(構文)を7ビット、それらのセマ ンティックス(意味)を US-ASCII と定めています。ISO-2022-JP のシンタックス は RFC822 に従っていますが、セマンティックスは RFC822 に違反しています。」


[Contents]   [Back]   [Prev]   [Up]   [Next]   [Forward]