RFC2237 日本語訳
2237 Japanese Character Encoding for Internet Messages. K. Tamaru. November 1997. (Format: TXT=11628 bytes) (Status: INFORMATIONAL)
プログラムでの自動翻訳です。
英語原文
Network Working Group K. Tamaru Request for Comments: 2237 Microsoft Corporation Category: Informational November 1997
Tamaruがコメントのために要求するワーキンググループK.をネットワークでつないでください: 2237年のマイクロソフト社カテゴリ: 情報の1997年11月
Japanese Character Encoding for Internet Messages
メッセージをインターネットにコード化する日本のキャラクター
Status of this Memo
このMemoの状態
This memo provides information for the Internet community. It does not specify an Internet standard of any kind. Distribution of this memo is unlimited.
このメモはインターネットコミュニティのための情報を提供します。 それはどんな種類のインターネット標準も指定しません。 このメモの分配は無制限です。
Copyright Notice
版権情報
Copyright (C) The Internet Society (1997). All Rights Reserved.
Copyright(C)インターネット協会(1997)。 All rights reserved。
1. Abstract
1. 要約
This memo defines an encoding scheme for the Japanese Characters, describes "ISO-2022-JP-1", which is used in electronic mail [RFC- 822], and network news [RFC 1036]. Also this memo provides a listing of the Japanese Character Set that can be used in this encoding scheme.
このメモが日本のキャラクターのコード化計画を定義する、説明、「ISO2022JP、1インチ、どれが電子メール[RFC822]、およびネットニュース[RFC1036]で使用されるか、」 また、このメモは計画をコード化しながらこれで使用できる日本の文字コードのリストを提供します。
2. Requirements Notation
2. 要件記法
This document uses terms that appear in capital letters to indicate particular requirements of this specification. Those terms are "MUST", "SHOULD", "MUST NOT", "SHOULD NOT", and "MAY". The meaning of each term are found in [RFC-2119]
このドキュメントはこの仕様の特定の要件を示すように大文字で見える用語を使用します。 それらの用語が“MUST"、“SHOULD"、「必須NOT」である、「」 「5月。」であるべきです 用語が見つけられるそれぞれの意味[RFC-2119]
3. Introduction
3. 序論
RFC 1468 defines the way Japanese Characters are encoded, likewise what this memo defines. It defines the use of JIS X 0208 as the double-byte character set in ISO-2022-JP text.
RFC1468は、このメモが何を定義するかを日本のキャラクターが同様にコード化される方法と定義します。 それは2022年のISO JPテキストでJIS X0208の使用を二重バイト文字の組と定義します。
Today, many operating systems support proprietary extended Japanese characters or JIS X 0212, This includes the Unicode character set, which does not conform to JIS X 0201 nor JIS X 0208. Therefore, this limits the ability to communicate and correspond precise information because of the limited availability of Kanji characters. Fortunately JIS (Japanese Industry Standard) defines JIS X 0212 as "code of the
今日多くのオペレーティングシステムが独占拡張日本人のキャラクタかJIS X0212を支持して、Thisはユニコード文字の組を含んでいます、JIS X0201に従わないもの。または、JIS X0208。 したがって、これは交信して、相当する能力を制限します。漢字の限られた有用性による正確な情報。 幸い、JIS(日本のIndustry Standard)がJIS X0212を定義する、「コード、」
Tamaru Informational [Page 1] RFC 2237 Japanese Character Encoding November 1997
1997年11月をコード化するTamaruの情報[1ページ]のRFC2237の日本のキャラクター
supplementary Japanese graphic character set for information interchange". Most Japanese characters which are used in regular electronic mail in most cases can be accommodated in JIS X 0201, JIS X 0208 and JIS X 0212.
「補っている日本の図形文字は情報交換のためにセットしました。」 多くの場合、JIS X0201、JIS X0208、およびJIS X0212に通常の電子メールで使用されるほとんどの日本人のキャラクタは収容できます。
Also it is recognized that there is a tendency to use Unicode, however, Unicode is not yet widely used and there is a certain limitation with old electronic mail system. Furthermore, the purpose of this comment is to add the capability of writing out JIS X 0212.
また、しかしながら、ユニコードを使用する傾向があって、ユニコードがまだ広く使用されていないと認められて、古い電子メール・システムがある、ある制限があります。 その上、このコメントの目的はJIS X0212を書き上げる能力を加えることです。
This comment does not describe any representation of iso-2022-jp-1 version information in addition to JIS X 0212 support.
このコメントはJIS X0212サポートに加えたiso-2022-jp-1バージョン情報の少しの表現についても説明しません。
4. Description
4. 記述
In "ISO-2022-JP-1" text, the initial character code of the message is in ASCII. The "double-byte-seq"(see "Format Syntax" section) (ESC "$" "B" / ESC "$" "@" / ESC "$" "(" "D") is the only designator that indicates that the following character is double-byte, and it is valid until another escape sequence appears. It is very discouraged to use (ESC "$" "@") for double byte character encoding, new implementation SHOULD use only (ESC "$" "B") for double byte encoding instead.
「ASCIIにはISO2022のJPの1インチのテキスト、メッセージの初期のキャラクタコードがあるところ」で。 以下のキャラクタは二重バイトです、そして、別のエスケープシーケンスが現れるまで、それは有効です。「seqにバイトを倍にする」(「形式構文」セクションを見る)、(ESC「$」ESC「$」「B」/"@"/ESC「$」、「(「「D」) キャラクタのコード化していて、新しい実現が代わりにコード化される二重バイトだけに使用するべきである二重バイトに(ESC「$」"@")を使用するのが非常に妨げているのを示す唯一の指示子がそうです」
The end of "ISO-2022-JP-1" text MUST be in ASCII. Also it is strongly recommended to back up to the ASCII at the end of each line rather than JIS X 0201-Roman if there is any none ASCII character in middle of a line.
「ASCIIにはISO2022のJPの1インチのテキストがあるに違いない」終わり。 また、あればJIS Xよりむしろそれぞれの行の終わりでASCIIに0201ローマで戻ることが強く勧められる、いくらかなにも、ASCII文字、線の中央で。
Since "ISO-2022-JP-1" is designed to add the capability of writing out JIS X 0212, if the message does not contain none of JIS X 0212 characters. "ISO-2022-JP" text MUST BE used.
以来、「ISO2022JP、1インチがそう、メッセージがJIS X0212キャラクタのなにもを含んでいないならJIS X0212を書き上げる能力を加えるように設計されている、」 「ISO2022JP」というテキストを使用しなければなりません。
JIS X 0201-Roman is not identical to the ASCII with two different characters.
0201JIS Xのローマンは2つの異なったキャラクタと共にASCIIと同じではありません。
The following list are the escape sequences and character sets that can be used in "ISO-2022-JP-1" text. The registered number in the ISO 2375 Register which allow double-byte ideographic scripts to be encoded within ISO/IEC 2022 code structure is indicated as reg# below.
それを使用できるエスケープシーケンスと文字の組が「ISO2022のJPの1インチのテキスト」であるという以下のリスト。 二重バイト表意文字が2022年のISO/IECコード構造の中でコード化されるのを許容するISO2375Registerの登記番号はreg#として以下で示されます。
reg# character set ESC sequence designated to 6 ASCII ESC 2/8 4/2 ESC ( B G0 42 JIS X 0208-1978 ESC 2/4 4/0 ESC $ @ G0 87 JIS X 0208-1983 ESC 2/4 4/2 ESC $ B G0 14 JIS X 0201-Roman ESC 2/8 4/10 ESC ( J G0 159 JIS X 0212-1990 ESC 2/4 2/8 4/4 ESC $ ( D G0
reg# character set ESC sequence designated to 6 ASCII ESC 2/8 4/2 ESC ( B G0 42 JIS X 0208-1978 ESC 2/4 4/0 ESC $ @ G0 87 JIS X 0208-1983 ESC 2/4 4/2 ESC $ B G0 14 JIS X 0201-Roman ESC 2/8 4/10 ESC ( J G0 159 JIS X 0212-1990 ESC 2/4 2/8 4/4 ESC $ ( D G0
Tamaru Informational [Page 2] RFC 2237 Japanese Character Encoding November 1997
1997年11月をコード化するTamaruの情報[2ページ]のRFC2237の日本のキャラクター
Other restrictions are given in the Formal Syntax below.
Formal Syntaxで他の制限を以下に与えます。
5. Formal Syntax
5. 正式な構文
The notational conventions used here are identical to those used in STD 11, RFC 822 [RFC822].
ここで使用された記号法のコンベンションはSTD11、RFC822[RFC822]で使用されるものと同じです。
The * (asterisk) convention is as follows: l*m something meaning at least l and at most m something, with l and m taking default values of 0 and infinity, respectively.
*(アスタリスク)コンベンションは以下の通りです: l*m、それぞれlとmが0と無限のデフォルト値を取っていて少なくともlと大部分のmで何かを意味する何か。
iso-2022-jp-1-text = *( line CRLF ) [line]
iso-2022-jp1テキストは*と等しいです(線CRLF)。[線]
line = (*single-byte-char *segment single-byte-seq *single-byte-char) / *single-byte-char
*単一のバイトは線=(バイトseqを選抜している*単一のバイト炭セグメント*単一のバイト*炭)/焦げます。
segment = single-byte-segment / double-byte-segment
セグメントは二重バイトただ一つのバイトセグメント/セグメントと等しいです。
single-byte-segment = single-byte-seq *single-byte-char double-byte-segment = double-byte-seq *(one-of-94 one-of-94)
バイトseqを選抜している*単一のバイト炭の二重バイトただ一つのバイトセグメント=セグメントはバイトseqが倍増している*と等しいです。(94の94の1つ1つ)
reset-seq = ESC "(" ( "B" / "J" ) single-byte-seq = ESC "(" ( "B" / "J" ) double-byte-seq = (ESC "$" ( "@" / "B" )) / (ESC "$" "(" "D" )
リセット-seqがESCと等しい、「(「バイトseqを選抜している(「B」/「J」)=ESC、「(「seqにバイトが倍増している(「B」/「J」)が/と等しい、(ESC「$」("@"/「B」))(ESC「$」、」、」(「「D」)」
CRLF = CR LF;( Octal, Decimal.) ESC = <ISO 2022 ESC, escape>;( 33,27.) SI = <ISO 2022 SI, shift-in>;( 17,15.) SO = <ISO 2022 SO, shift-out>;( 16,14.) CR = <ASCII CR, carriage return>;( 15,13.) LF = <ASCII LF, linefeed>;( 12,10.) one-of-94 = <any one of 94 values>;(41-176,33.-126.) one-of-96 = <any one of 96 values>;(40-177,32.-127.) 7BIT = <any 7-bit value>;(0-177,0.-127.) single-byte-char = <any 7BIT, including bare CR & bare LF, but NOT including CRLF, and not including ESC, SI, SO>
CRLFはCR LFと等しいです; (8進、小数。) ESCは<ISO2022ESC、エスケープ>と等しいです; (33、27) SIは<ISO2022SI、シフトイン>と等しいです; (17、15) SOは<ISO2022SO、外で移行する>と等しいです; (16、14) CRは<ASCII CR、復帰>と等しいです; (15、13) LFは<ASCII LF、ラインフィード>と等しいです; 94の(10の12)1つは<94値の>のどれか; 96の(33.-126の41-176)1つ=<と等しいです。96値の>のどれか; (40-177と、32.-127。) どんな7ビットの値の>も; (0.-127の0-177)単一のバイト炭は<と等しいです。7BITが<と等しい、どんな7BIT、包含もCRとむき出しのLFを剥き出す、CRLFを含んでいなくて、またESC、SI、SO>を含んでいないこと。
6. Security Considerations
6. セキュリティ問題
This memo raises no known security issues.
このメモは知られている安全保障問題を全く提起しません。
Tamaru Informational [Page 3] RFC 2237 Japanese Character Encoding November 1997
1997年11月をコード化するTamaruの情報[3ページ]のRFC2237の日本のキャラクター
7. MIME Considerations
7. MIME問題
The name to be used for the Japanese encoding scheme in content is "ISO-2022-JP-1". When this name is used in the MIME message form, it would be:
内容での計画をコード化する日本人に使用されるべき名前がそうである、「ISO2022JP、1インチ、」 この名前がMIMEメッセージフォームで使用されるとき、それは以下の通りでしょう。
Content-Type: text/plain; charset=iso-2022-jp-1
コンテントタイプ: テキスト/平野。 charset=iso-2022-jp-1
Since the "ISO-2022-JP-1" is 7bit encoding, it will be unnecessary to encode in another format by specifying the "Content-Transfer- Encoding" header. Also applying Based64 or Quoted-Printable encoding MAY cause today's software to fail to decode the message.
以来、「ISO2022JP、1インチがそう、7ビットのコード化、「満足している転送をコード化している」ヘッダーを指定する別の形式でコード化するために不要になる、」 また、Based64を適用するか、Quoted印刷可能なコード化で、今日のソフトウェアはメッセージを解読しないかもしれません。
"ISO-2022-JP-1" can be used in MIME headers. Also "ISO-2022-JP-1" text can be used with Base64 or Quoted-Printable encoding.
「ISO2022JPが何1インチもそうすることができる、MIMEヘッダーで使用されてください、」 「Base64か引用されて印刷可能なコード化と共にISO2022のJPの1インチのテキストを使用できます。」も
8. Additional Information
8. 追加情報
As long as mail systems are capable of writing out Unicode, it is recommended to also write out Unicode text in addition to "ISO- 2022-JP-1" text. Also writing out "ISO-2022-JP" text in addition to "ISO-2022-JP-1" is strongly encouraged for backward compatibility reasons.
メールシステムがユニコードを書くことがなくならせることができる限り、また、「ISOの2022年のJPの1インチのテキスト」に加えたユニコードテキストを書き上げるのはお勧めです。 に加えてまた、「ISO2022JP」というテキストが書くことがなくなる、「ISO2022JP、1インチがそう、後方の互換性理由で強く奨励される、」
Some mail systems write out 8bits characters in 'parameter' and 'value' defined in [RFC 822] and [RFC 1521]. All 8bit characters MUST NOT be used in those fields. The implementation of future mail systems SHOULD support those only for interoperability reasons.
いくつかのメールシステムが[RFC822]と[RFC1521]で定義された'パラメタ'と'値'で8ビットのキャラクタを書き上げます。 それらの分野ですべての8ビットのキャラクタを使用しなければならないというわけではありません。 メールシステムSHOULDが相互運用性のためだけにものを支持する未来の実現は推論します。
9. References
9. 参照
[ISO2022] International Organization for Standardization (ISO), "Information processing -- ISO 7-bit and 8-bit coded character sets -- Code extension techniques", International Standard, Ref. No. ISO 2022-1986 (E).
[ISO2022]国際標準化機構(ISO)、「情報処理--ISOの7ビットの、そして、8ビットのコード化文字集合--コード拡張のテクニック」、国際規格(Ref)。 いいえ ISO2022-1986(E)。
[ISOREG] International Organization for Standardization (ISO), "International Register of Coded Character Sets To Be Used With Escape Sequences".
[ISOREG]国際標準化機構(ISO)、「エスケープシーケンスと共に使用されるべきコード化文字集合の国際レジスタ。」
[RFC-822] Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, August 1982.
[RFC-822] クロッカー、D.、「アルパインターネットテキスト・メッセージの形式の規格」、STD11、RFC822、1982年8月。
Tamaru Informational [Page 4] RFC 2237 Japanese Character Encoding November 1997
1997年11月をコード化するTamaruの情報[4ページ]のRFC2237の日本のキャラクター
[RFC-1468] Murai, J., Crispin, M., and E. van der Poel, "Japanese Character Encoding for Internet Messages", RFC 1468, June 1993.
[RFC-1468] 村井、J.、クリスピン、M.、およびE.は1993年6月にderポール、「メッセージをインターネットにコード化する日本のキャラクター」、RFC1468をバンに積みます。
[RFC-1766] Alvestrand, H., "Tags for the Identification of Languages", RFC 1766, March 1995.
[RFC-1766]Alvestrand、H.、「言語の識別のためのタグ」、RFC1766、1995年3月。
[RFC-2045] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies", RFC 2045, December 1996.
解放された[RFC-2045]、N.、およびN.Borenstein、「マルチパーパスインターネットメールエクステンション(MIME)は1つを分けます」。 「インターネットメッセージ本体の形式」、RFC2045、1996年12月。
[RFC-2046] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types", RFC 2046, December 1996.
解放された[RFC-2046]、N.、およびN.Borenstein、「マルチパーパスインターネットメールエクステンション(MIME)は2を分けます」。 「メディアタイプ」、RFC2046、1996年12月。
[RFC-2047] Moore, K., "Multipurpose Internet Mail Extensions (MIME) Part Three: Representation of Non-ASCII Text in Internet Message Headers", RFC 2047, December 1996.
[RFC-2047]ムーア、K.、「マルチパーパスインターネットメールエクステンション(MIME)は3を分けます」。 「インターネットメッセージヘッダーの非ASCIIテキストの表現」、RFC2047、1996年12月。
[RFC-2048] Freed, N., Klensin, J. and J. Postel, "Multipurpose Internet Mail Extensions (MIME) Part Four: MIME Registration Procedures", RFC 2048, December 1996.
解放された[RFC-2048]、N.、Klensin、J.、およびJ.ポステル、「マルチパーパスインターネットメールエクステンション(MIME)は4を分けます」。 「MIME登録手順」、RFC2048、1996年12月。
[RFC-2049] Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part Five: Conformance Criteria and Examples", RFC 2049, December 1996.
解放された[RFC-2049]、N.、およびN.Borenstein、「マルチパーパスインターネットメールエクステンション(MIME)は5を分けます」。 「順応評価基準と例」、RFC2049、12月1996日
[RFC-2119] Bradner, S., "Key words for use in RFCs to Indicate Requirement Levels", RFC 2119, March 1997.
[RFC-2119] ブラドナー、S.、「Indicate Requirement LevelsへのRFCsにおける使用のためのキーワード」、RFC2119、1997年3月。
Author's Address
作者のアドレス
Kenzaburo Tamaru Microsoft Corporation One Microsoft Way Redmond, WA 98052-6399
Kenzaburo Tamaruマイクロソフト社1マイクロソフト道、レッドモンド、ワシントン98052-6399
EMail: kenzat@microsoft.com
メール: kenzat@microsoft.com
Tamaru Informational [Page 5] RFC 2237 Japanese Character Encoding November 1997
1997年11月をコード化するTamaruの情報[5ページ]のRFC2237の日本のキャラクター
Full Copyright Statement
完全な著作権宣言文
Copyright (C) The Internet Society (1997). All Rights Reserved.
Copyright(C)インターネット協会(1997)。 All rights reserved。
This document and translations of it may be copied and furnished to others, and derivative works that comment on or otherwise explain it or assist in its implementation may be prepared, copied, published and distributed, in whole or in part, without restriction of any kind, provided that the above copyright notice and this paragraph are included on all such copies and derivative works. However, this document itself may not be modified in any way, such as by removing the copyright notice or references to the Internet Society or other Internet organizations, except as needed for the purpose of developing Internet standards in which case the procedures for copyrights defined in the Internet Standards process must be followed, or as required to translate it into languages other than English.
それに関するこのドキュメントと翻訳は、コピーして、それが批評するか、またはそうでなければわかる他のもの、および派生している作品に提供するか、または準備されているかもしれなくて、コピーされて、発行されて、全体か一部広げられた実現を助けるかもしれません、どんな種類の制限なしでも、上の版権情報とこのパラグラフがそのようなすべてのコピーと派生している作品の上に含まれていれば。 しかしながら、このドキュメント自体は何らかの方法で変更されないかもしれません、インターネット協会か他のインターネット組織の版権情報か参照を取り除くのなどように、それを英語以外の言語に翻訳するのが著作権のための手順がインターネットStandardsの過程で定義したどのケースに従わなければならないか、必要に応じてさもなければ、インターネット標準を開発する目的に必要であるのを除いて。
The limited permissions granted above are perpetual and will not be revoked by the Internet Society or its successors or assigns.
上に承諾された限られた許容は、永久であり、インターネット協会、後継者または案配によって取り消されないでしょう。
This document and the information contained herein is provided on an "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.
このドキュメントとそして、「そのままで」という基礎とインターネットの振興発展を目的とする組織に、インターネット・エンジニアリング・タスク・フォースが速達の、または、暗示しているすべての保証を放棄するかどうかというここにことであり、他を含んでいて、含まれて、情報の使用がここに侵害しないどんな保証も少しもまっすぐになるという情報か市場性か特定目的への適合性のどんな黙示的な保証。
Tamaru Informational [Page 6]
Tamaru情報です。[6ページ]
一覧
スポンサーリンク