RFC1815 日本語訳

1815 Character Sets ISO-10646 and ISO-10646-J-1. M. Ohta. July 1995. (Format: TXT=11823 bytes) (Status: INFORMATIONAL)
プログラムでの自動翻訳です。
英語原文

Network Working Group                                            M. Ohta
Request For Comments: 1815                 Tokyo Institute of Technology
Category: Informational                                        July 1995

コメントを求めるワーキンググループM.太田の要求をネットワークでつないでください: 1815年の東京工業大学カテゴリ: 情報の1995年7月

               Character Sets ISO-10646 and ISO-10646-J-1

文字コードのISO-10646とISO-10646-J-1

Status of this Memo

このMemoの状態

   This memo provides information for the Internet community.  This memo
   does not specify an Internet standard of any kind.  Distribution of
   this memo is unlimited.

このメモはインターネットコミュニティのための情報を提供します。 このメモはどんな種類のインターネット標準も指定しません。 このメモの分配は無制限です。

Abstract

要約

   Though the ISO character set standard of ISO 10646 is specified
   reasonably well about European characters, it is not so useful in an
   fully internationalized environment.

ISO10646のISO文字の組規格はヨーロッパ人のキャラクタに関して合理的によく指定されますが、それは完全に国際化している環境でそれほど役に立ちません。

   For the practical use of ISO 10646, a lot of external profiling such
   as restriction of characters, restriction of combination of
   characters and addition of language information is necessary.

ISO10646の実用に、キャラクタの制限や、キャラクタの組み合わせの制限や言語情報の添加などのような多くの外部のプロフィールが必要です。

   This memo provides information on such profiling, along with charset
   names to each profiled instance.

このメモは、charsetと共にそれぞれの輪郭を描かれた例に名前の輪郭を描きながら、そのようなものの情報を提供します。

   Though all the effort is done to make the resulting charset as useful
   10646 based charset as possible, the result is not so good.  So, the
   charsets defined in this memo are only for reference purpose and its
   use for practical purpose is strongly discouraged.

役に立つとしての結果として起こるcharsetを可能であるとしての10646のベースのcharsetにするようにすべての努力をしますが、結果はそれほど良くはありません。 それで、このメモで定義されたcharsetsは参照目的のためだけのものです、そして、実用的な目的の使用は強くお勧めできないです。

Introduction

序論

   This memo describes two text encoding schemes based on ISO 10646
   [10646].

このメモはISO10646[10646]に基づく2つのテキストコード化計画について説明します。

   As ISO 10646 specifies too little about how text is visualized, to
   practically use ISO 10646, it is necessary to restrict the standard
   minimally and then add some amount of profiling information.

ISO10646が少ししかテキストが実際にISO10646を使用するためにどう想像されるかに関して指定し過ぎるというわけではないとき、規格を最少量で制限して、次に、いくらかの量のプロフィール情報を加えるのが必要です。

   For ISO 2022 [ISO2022] based national standards, sufficient profiling
   information is provided by national standardization bodies, but, for
   ISO 10646, such a profiling is not yet provided.

ISO2022の[ISO2022]ベースの国家規格において、国家の標準化本体で十分なプロフィール情報を提供しますが、ISO10646において、そのようなプロフィールはまだ提供していません。

   As the profiling of ISO 10646 largely affects which character or
   combination of characters could be properly displayed, changes of
   profiling of ISO 10646 are as significant as additions of new
   character sets of ISO 2022.

ISO10646のプロフィールが、適切にキャラクタのどのキャラクタか組み合わせを見せることができたかに主に影響するので、ISO10646のプロフィールの変化はISO2022の新しい文字の組の追加と同じくらい重要です。

M. Ohta                      Informational                      [Page 1]

RFC 1815       Character Sets ISO-10646 and ISO-10646-J-1      July 1995

M。 太田情報[1ページ]のRFC1815文字コードISO-10646とISO-10646-J-1995年7月1日

   That is, it's impractical to support the entirety of ISO 10646 (new
   restriction or profiling can always be added), so a client needs to
   know whether some restriction or profiling is being used before it
   can decide whether to display the body part. Thus, it is necessary to
   provide multiple charset names to each variation of ISO 10646.

すなわち、クライアントが、身体の部分を表示するかどうか決めることができる前にいくつかの制限かプロフィールが使用されているかどうかを知る必要があるので、ISO10646の全体を支持するのは非実用的です(いつも新しい制限かプロフィールを加えることができます)。 したがって、ISO10646の各変化に複数のcharset名を提供するのが必要です。

   For example, in Japan with Japanese windows NT, only those Han
   characters already supported by MS Kanji code (mostly equivalent to
   JIS X 0208 [JISX0208]) can be displayed, because no other font
   pattern is commonly provided.

例えば、日本のウィンドウNTがある日本では、MS Kanjiコード(JIS X0208[JISX0208]にほとんど同等な)によって既に支持されたそれらのハンキャラクタだけは見せることができます、一般的に他の字体パターンを全く提供しないので。

   The other problem of ISO 10646 for Han characters is that, to display
   them in quality required for daily plain text processing in
   China/Japan/Korea, it is necessary to add profiling information on
   which one of Chinese/Japanese/Korean the text is using.  It should be
   noted that this feature makes multilingual mixed
   Chinese/Japanese/Korean text with ISO 10646 impractical.

ハンキャラクタのためのISO10646のもう片方の問題は中国/日本/韓国に毎日のプレーンテキスト処理に必要である品質で彼らを表示するのに、加えるのがテキストが中国語/日本語/韓国語のどれに関する使用であるかという情報の輪郭を描きながら必要であるということです。 ISO10646が非実用的な状態でこの特徴が多言語複雑な中国か日本の、または、韓国のテキストを作ることに注意されるべきです。

   Also, just as [RFC1521] was unclear about how bi-directionality
   should be supported with "ISO-8859-6" and "ISO-8859-8" which was
   corrected by [RFC1556], it is also unclear how bi-directionality
   could be supported with ISO 10646.  There are too much ways to
   support bi- directionality.  So, until some bi-directionality
   mechanism(s) becomes widely supported, it is necessary to exclude
   characters for languages which requires bi-directionality support
   from the minimal variation.  It should be noted that, though ISO
   10646 is intended to be free from long term states, save for some
   profiling information, introduction of bi-directionality with ISO
   10646 do requires the long term states.

そして、[RFC1521]がおよそどれくらい双方向性であるかが支持されるべきであるのがまた、ただ不明瞭であった、「ISO8859、6インチ、「ISO8859、8インチ、どれ、修正されて、また、それもISO10646と共にどれくらい双方向性であるか支持できたのが不明瞭であるということであったか、」 両性愛者の方向性を支持するあまりに多くの方法があります。 それで、何らかの双方向性なメカニズムが広く支持されるようになるまで、言語のためにキャラクタを除くのが必要です(最小量の変化から双方向性なサポートを必要とします)。 ISO10646が長期州から自由であることを意図しますが、何かが情報の輪郭を描くのを除いて、双方向性の10646がするISOと共に導入が長期州を必要とすることに注意されるべきです。

   Combining characters also cause problems. In many countries where
   combining characters based on [ISO2022] is used, there are
   restrictions on how combining characters are ordered [TIS].  Without
   such restriction, the result of combination is completely meaningless
   which is the current state of ISO 10646.  That is, if some
   combination is allowed in some implementation while the other does
   not support it, communication between them is difficult unless ISO
   10646 is profiled to be least common set of widely supported
   combinations.  So, again, until combination restriction will be
   developed for each language, it is necessary to exclude characters
   for such languages from the minimal variation.

また、結合したキャラクタは問題を起こします。[ISO2022]に基づくキャラクタを結合するのが使用されている多くの国に、キャラクタを結合するのがどう注文されているかに関する[TIS]制限があります。 そのような制限がなければ、組み合わせの結果は完全に無意味です(ISO10646の現状です)。 すなわち、もう片方がそれを支持していない間、何らかの組み合わせが何らかの実現で許されていて、ISO10646が最も一般的でない広く支持された組み合わせであることのようになるように輪郭を描かれない場合、それらのコミュニケーションは難しいです。 それで、一方、組み合わせ制限が各言語のために開発されるまで、そのような言語のためのキャラクタを最小量の変化に入れないようにするのが必要です。

   Conjoining characters also, may or may not be supported, which
   requires another profiling.

キャラクタも結合して、支持されるかもしれない、別のプロフィールを必要とする。

   According to those considerations, this memo defines two variations
   of ISO 10646. They are "ISO-10646" as the minimal basic variation and
   "ISO-10646-J-1" as the variation which could be useful in Japan.

それらの問題によると、このメモはISO10646の2回の変化を定義します。 そして、それらが最小量の基本的な変化として"ISO-10646"である、「ISO-10646-J-1インチ、日本で役に立つかもしれない変化、」

M. Ohta                      Informational                      [Page 2]

RFC 1815       Character Sets ISO-10646 and ISO-10646-J-1      July 1995

M。 太田情報[2ページ]のRFC1815文字コードISO-10646とISO-10646-J-1995年7月1日

   Finally, this memo, by no means, promotes the use of ISO 10646 on the
   Internet.  It's use is strongly discouraged, when there are other
   charsets which can encode the same information, Families of ISO 10646
   based charsets, like ISO 2022 based charsets, only forms set of
   mutually incompatible encoding systems and, unlike ISO 2022 based
   charsets [2022INT], they can not be merged together to be the single
   world wide charset.

最終的に、このメモはインターネットにおけるISO10646の使用を決して促進しません。 使用は強くお勧めできないです、同じ情報をコード化できる他のcharsetsがあるときことです、そして、ISO10646のFamiliesはフォームだけがISOの2022のベースのcharsetsのように設定する互いに両立しないコード化システムのcharsetsを基礎づけました、そして、ISOの2022のベースのcharsets[2022INT]と異なって、それらは、単一の世界的なcharsetになるように結合できません。

Description of "ISO-10646"

"ISO-10646"の記述

   ISO-10646 is profiled to be the most basic part of the family of
   encodings based on ISO 10646 and contains the following minimal
   graphic characters:

ISO-10646はISO10646に基づくencodingsの家族の最も基本的な部分になるように輪郭を描かれて、以下の最小量の図形文字を含んでいます:

      collection number and name      positions      further restriction
      ------------------------------------------------------------------
      1 BASIC LATIN                   0020-007E
      2 LATIN-1 SUPPLEMENT            00A0-00FF

収集番号と名前位置は制限を促進します。------------------------------------------------------------------ 1 0020-007 2Eの基本的なラテン語のラテン-1補足00A0-00FF

   C0 and C1 control characters may also be used as specified in the
   section 16 of ISO 10646.

また、C0とC1制御文字はISO10646のセクション16で指定されるように使用されるかもしれません。

   The text with "ISO-10646" encodes text in 16 bit big endian form.

"ISO-10646"があるテキストは16ビットのビッグエンディアンフォームのテキストをコード化します。

   As no combining characters are included, "ISO-10646" can be used with
   applications at implementation level 1.

キャラクタを結合しないのが含まれているので、実現レベル1におけるアプリケーションと共に"ISO-10646"を使用できます。

   Left-to-right directionality should be used.

左から右への方向性は使用されるべきです。

   The encoding is implemented by Windows/NT.

コード化はWindows/NTによって実行されます。

   For practical communication, use of "ISO-10646" is discouraged.
   "ISO-8859-1" [RFC1345] should be used instead.

実際的なコミュニケーションに関しては、"ISO-10646"の使用はお勧めできないです。 「ISO8859、1インチ、[RFC1345]が代わりに使用されるべきである、」

M. Ohta                      Informational                      [Page 3]

RFC 1815       Character Sets ISO-10646 and ISO-10646-J-1      July 1995

M。 太田情報[3ページ]のRFC1815文字コードISO-10646とISO-10646-J-1995年7月1日

Description of "ISO-10646-J-1"

「ISO-10646-J-1インチ」の記述

   ISO-10646-J-1 is profiled to be useful for Japanese PC users who use
   Japanese version of Windows/NT and contains the following graphic
   characters:

ISO-10646-J-1は日本版Windows/NTを使用する日本人のPCユーザの役に立つように輪郭を描かれて、以下の図形文字を含んでいます:

      collection number and name         positions  further restrictions
      ------------------------------------------------------------------
      1 BASIC LATIN                      0020-007E
      2 LATIN-1 SUPPLEMENT               00A0-00FF
      8 BASIC GREEK                      0370-03CF
      10 CYRILLIC                        0400-04FF
      32 GENERAL PUNCTUATION             2000-206F  See note 1, below.
      39 MATHEMATICAL OPERATORS          2200-22FF  See note 1, below.
      44 BOX DRAWING                     2500-257F
      49 CJK SYMBOLS AND PUNCTUATION     3000-303F  See note 1, below.
      50 HIRAGANA                        3040-309F
      51 KATAKANA                        30A0-30FF
      60 CJK UNIFIED IDEOGRAPHS          4E00-9FFF  See note 1, below.
      62 CJK COMPATIBILITY IDEOGRAPHS    F900-FAFF  See note 1, below.
      66 CJK COMPATIBILITY FORMS         FE30-FE4F
      69 HALFWIDTH AND FULLWIDTH FORMS   FF00-FFEF

収集番号と名前位置は制限を促進します。------------------------------------------------------------------ 1 ラテン語のBASICの0020-007 2Eのラテン語-1SUPPLEMENT 00A0-00FF8BASICギリシアの0370-03CF10キリール文字0400-04FF32GENERAL PUNCTUATION2000-206F Seeは1未満に注意します。 39MATHEMATICAL OPERATORS2200-22のFF Seeは1未満に注意します。 44 BOX DRAWING2500-257F49CJK SYMBOLS AND PUNCTUATION3000-303F Seeは1未満に注意します。 50 HIRAGANA3040-309F51KATAKANA 30A0-30FF60CJK UNIFIED IDEOGRAPHS4E00-9FFF Seeは1未満に注意します。 62 CJK COMPATIBILITY IDEOGRAPHS F900-FAFF Seeは1未満に注意します。 66 CJKの互換性はFE30-FE4F69HALFWIDTHを形成します、そして、FULLWIDTHはFF00-FFEFを形成します。

   Note 1: Most of the characters are excluded.  That is, only those
   characters of JIS X 0208 [JISX0208] are included. The reason is that
   the Japanese version of Windows/NT have fonts for them only and most
   of the users can not read messages which contains other characters.

注意1: キャラクタの大部分は除かれます。 すなわち、JIS X0208[JISX0208]のそれらのキャラクタだけが含まれています。 理由はWindows/NTの日本語版にはそれらだけのための字体があるということです、そして、ユーザの大部分はメッセージを読むことができません(他のキャラクタを含んでいます)。

   C0 and C1 control characters may also be used as specified in the
   section 16 of ISO 10646.

また、C0とC1制御文字はISO10646のセクション16で指定されるように使用されるかもしれません。

   The text with "ISO-10646-J-1" encodes text in 16 bit big endian form.

「16ビットのビッグエンディアンフォームのISO-10646-J-1インチのエンコードテキスト」でのテキスト。

   Shapes of Han characters should be of Japanese Han, that is, those of
   column "J" in section 26 of ISO 10646.

日本人のハン(すなわち、ISO10646のセクション26のコラム「J」のもの)にはハンキャラクタの形があるべきです。

   As no combining characters are included, "ISO-10646-J-1" can be used
   with applications at implementation level 1.

ISO-10646-J-1インチは使用できます。キャラクタを結合しないのが含まれている、「実現レベル1インチにおけるアプリケーションと共に使用されてください。

   Characters in "HALFWIDTH AND FULLWIDTH FORMS" compared to be
   different characters to the normal width characters.

「HALFWIDTHとFULLWIDTH用紙」のキャラクターは、普通の幅のキャラクタへの異なったキャラクタになるように比較されました。

   When text is displayed horizontally, left-to-right directionality
   should be used.

水平にテキストを表示するとき、左から右への方向性を使用するべきです。

   For practical communication, use of "ISO-10646-J-1" is discouraged.
   ISO-2022-JP" [2022JP] should be used instead.

実際的なコミュニケーション、使用、「ISO-10646-J-1インチがそうである、妨げ、」 「ISO2022JP」[2022JP]は代わりに使用されるべきです。

M. Ohta                      Informational                      [Page 4]

RFC 1815       Character Sets ISO-10646 and ISO-10646-J-1      July 1995

M。 太田情報[4ページ]のRFC1815文字コードISO-10646とISO-10646-J-1995年7月1日

MIME Considerations

MIME問題

   The names given to the character encoding methods described in this
   memo are, respectively, "ISO-10646" and "ISO-10646-J-1".  This name
   is intended to be used in MIME messages as follows:

このメモで説明された方法をコード化するキャラクタに与えられた名前はそれぞれ"ISO-10646"です、そして、「ISO-10646-J-1インチ。」 以下のMIMEメッセージでこの名前が使用されることを意図します:

                Content-Type: text/plain; charset=iso-10646

コンテントタイプ: テキスト/平野。 charset=iso-10646

   The ISO-10646 and ISO-10646-J-1 encoding are in 16-bit form, so it is
   often necessary to use a Content-Transfer-Encoding header.  Base64
   should be useful.

ISO-10646とISO-10646-J-1コード化が16ビットのフォームにあるので、Contentがコード化を移しているヘッダーを使用するのがしばしば必要です。 Base64は役に立つべきです。

   The ISO-10646 and ISO-10646-J-1 may also be used in MIME Part 2
   headers [RFC1522].  The "B" encoding should be used with them.

また、ISO-10646とISO-10646-J-1はMIME Part2ヘッダー[RFC1522]で使用されるかもしれません。 「B」コード化はそれらと共に使用されるべきです。

References

参照

   [10646]     International Organization for Standardization (ISO),
               "Universal Multiple-Octet Coded Character Set (UCS)",
               International Standard, Ref. No. ISO/IEC 10646-1:1993
               (E).

[10646]国際標準化機構(ISO)、「普遍的な複数の八重奏コード化文字集合(UCS)」、国際規格、審判。 いいえ ISO/IEC10646-1: 1993(E)。

   [2022INT]   (An Internet Draft "draft-ohta-text-encoding-*.txt" may
               be available).

[2022INT] (インターネットDraft「草稿-ohtaテキストをコード化する*の.txt」は利用可能であるかもしれません。)

   [2022JP]    Murai, J., Crispin, M., and E. van der Poel, "Japanese
               Character Encoding for Internet Messages", RFC 1468, June
               1993.

[2022JP] 村井、J.、クリスピン、M.、およびE.は1993年6月にderポール、「メッセージをインターネットにコード化する日本のキャラクター」、RFC1468をバンに積みます。

   [ISO2022]   International Organization for Standardization (ISO),
               "Information processing -- ISO 7-bit and 8-bit coded
               character sets -- Code extension techniques",
               International Standard, Ref. No. ISO 2022-1986 (E).

[ISO2022]国際標準化機構(ISO)、「情報処理--ISOの7ビットの、そして、8ビットのコード化文字集合--コード拡張のテクニック」、国際規格(Ref)。 いいえ ISO2022-1986(E)。

   [JISX0208]  Japanese Standards Association, "Code of the Japanese
               graphic character set for information interchange", JIS X
               0208-1990.

[JISX0208]日本規格協会、「日本の図形文字のコードは情報交換のためにセットした」JIS X0208-1990。

   [RFC1345]   Simonsen, K., "Character Mnemonics & Character Sets",
               RFC-1345, Rationel Almen Planlaegning, June 1992.

[RFC1345] シモンセン、K.、「キャラクターニーモニックと文字コード」、RFC-1345、Rationel Almen Planlaegning、1992年6月。

   [RFC1521]   Borenstein, N., and Freed, N., "MIME  (Multipurpose
               Internet Mail Extensions) Part One: Mechanisms for
               Specifying and Describing the Format of Internet Message
               Bodies", RFC 1521, September 1993.

Borenstein、[RFC1521]N.とフリード、N.、「パート1をまねてください(マルチパーパスインターネットメールエクステンション)」 「インターネットメッセージ本体の形式を指定して、説明するためのメカニズム」、RFC1521、1993年9月。

M. Ohta                      Informational                      [Page 5]

RFC 1815       Character Sets ISO-10646 and ISO-10646-J-1      July 1995

M。 太田情報[5ページ]のRFC1815文字コードISO-10646とISO-10646-J-1995年7月1日

   [RFC1522]   Moore, K., "MIME (Multipurpose Internet Mail Extensions)
               Part Two: Message Header Extensions for Non-ASCII Text",
               RFC 1522, September 1993.

[RFC1522]ムーア、K.、「パートTwoをまねてください(マルチパーパスインターネットメールエクステンション)」 「非ASCIIテキストのためのメッセージヘッダー拡張子」、RFC1522、1993年9月。

   [RFC1556]   Nussbacher, H., "Handling of Bi-directional Texts in
               MIME" RFC 1556, Israeli Inter-University Computer Center,
               December 1993.

[RFC1556]Nussbacher、H.、「MIMEにおける双方向のテキストの取り扱い」RFC1556、イスラエルの相互大学コンピュータセンター、1993年12月。

   [TIS]       Thai Industrial Standard for Thai Character Code for
               Computer, TIS 620-2533:1990.

1990年のコンピュータ、TIS620-2533:タイのキャラクターコードのための[TIS]タイ工業規格。

Security Considerations

セキュリティ問題

   Security issues are not discussed in this memo.

このメモで安全保障問題について議論しません。

Author's Address

作者のアドレス

   Masataka Ohta
   Tokyo Institute of Technology
   2-12-1, O-okayama, Meguro-ku,
   Tokyo 152, JAPAN

Masataka太田東京工業大学2-12-1、大岡山、目黒区、日本東京152

   Phone: +81-3-5499-7084
   Fax: +81-3-3729-1940
   EMail: mohta@cc.titech.ac.jp

以下に電話をしてください。 +81-3-5499-7084 Fax: +81-3-3729-1940 メールしてください: mohta@cc.titech.ac.jp

M. Ohta                      Informational                      [Page 6]

M。 太田Informationalです。[6ページ]

一覧

 RFC 1〜100  RFC 1401〜1500  RFC 2801〜2900  RFC 4201〜4300 
 RFC 101〜200  RFC 1501〜1600  RFC 2901〜3000  RFC 4301〜4400 
 RFC 201〜300  RFC 1601〜1700  RFC 3001〜3100  RFC 4401〜4500 
 RFC 301〜400  RFC 1701〜1800  RFC 3101〜3200  RFC 4501〜4600 
 RFC 401〜500  RFC 1801〜1900  RFC 3201〜3300  RFC 4601〜4700 
 RFC 501〜600  RFC 1901〜2000  RFC 3301〜3400  RFC 4701〜4800 
 RFC 601〜700  RFC 2001〜2100  RFC 3401〜3500  RFC 4801〜4900 
 RFC 701〜800  RFC 2101〜2200  RFC 3501〜3600  RFC 4901〜5000 
 RFC 801〜900  RFC 2201〜2300  RFC 3601〜3700  RFC 5001〜5100 
 RFC 901〜1000  RFC 2301〜2400  RFC 3701〜3800  RFC 5101〜5200 
 RFC 1001〜1100  RFC 2401〜2500  RFC 3801〜3900  RFC 5201〜5300 
 RFC 1101〜1200  RFC 2501〜2600  RFC 3901〜4000  RFC 5301〜5400 
 RFC 1201〜1300  RFC 2601〜2700  RFC 4001〜4100  RFC 5401〜5500 
 RFC 1301〜1400  RFC 2701〜2800  RFC 4101〜4200 

スポンサーリンク

SELECT INTO SELECT命令からテーブルを作成する

ホームページ製作・web系アプリ系の製作案件募集中です。

上に戻る