Comments
Description
Transcript
情報科学
情報科学 情報 科学 学 ー文字・文字列ー 文字 文字列 小棹 理子 2-1 コンピュータで扱う文字 z キャラクタ(character)という。 キャラクタ(character)という z 文字には、番号(文字コード)が付与さ れている。 •例 例:文字コード(ASCII)で 文字コ ド(ASCII)で 0101 1111(2) は W を表す。 z 文字コード(character 文字コ ド( h code)は2進数 d )は2進数 z 文字コードの違いによって、表示する文 字が異なる。 ASCII文字コード y プログラムやデ タなどを統 的に扱うために、共 プログラムやデータなどを統一的に扱うために 共 通コードを取り決めた。 y ASCII【American national Standard Code for g アスキ 】 Information Interchange:アスキー】 米国ANSI(American National Standards Institute)が 策定した 7 ビットコード [演習2]] [演習 1.ASCIIコードでは何種類の文字を表すことができる か。 2.“Waseda”をASCIIコードで表せ(16進、10進) 文字コード y PC上で用いられる文字 ◦ 日本語にはカナ文字 日本語にはカナ文字、漢字があるため、7ビッ 漢字があるため 7ビ トでは足りない ◦ 全角文字 vs 半角文字 早 J1 ◦ 2バイト(16ビット)で表す y y JISコード ド Shift-JIS(シフトJIS)コード [演習2] 3. 2バイトでは何通りの文字を表せるか? 文字コード y JISコード ◦ 1978年、1983年、1990年、1997年、 2000年、2004年と5回改訂されて いる。 る ◦ 1983年版で採用されている範囲の 文字について1997年に改訂を行っ 文字について1997年に改訂を行 た「JIS X 0208:1997」に基づく文 字コ ドが現在の標準 字コードが現在の標準 ◦ 国際標準化機構(ISO)による文字 コ ドの国際標準の つである コードの国際標準の一つである 「ISO-2022」の日本語部分にも採 用されており、「ISO-2022-JP」と も呼ばれる。 棹(5c2a) JISコード JJIS コード 「かな漢字変換システム」 MS-IME(Input M h d Editor:マイクロソフト)、ATOK Method Ed マイクロソフト) ATOK (ジャストシステム) キーボードから かな を入力すると、PC で利用する文字コ ドに変換してくれる。 で利用する文字コードに変換してくれる。 Shift--JIS Shift 棹(9ea8) 文字コード 文字 コード y Unicode(ユニコード) ◦ すべての文字を16ビット(2バイト)で表現し、1つ の文字コ ド体系で多国語処理を可能にしよう の文字コード体系で多国語処理を可能にしよう とするもの。世界の主要な言語のほとんどの文 字を収録している。 字を収録している ◦ 1980年代にユニコードコンソーシアム(ゼロック ス社が提唱、マイクロソフト、アップル、IBM、サン ス社が提唱 マイクロソフト アップル IBM サン・マ マ イクロシステムズ、ヒューレット・パッカード、ジャス トシステムが参加)が提唱 ◦ 1993年に国際標準化機構(ISO)でISO/IEC 10646の 一部(UCS-2)として標準化された文字コード体 ( ) 系。 文字コード y EUC-JP(Extended EUC JP(Extended UNIX Code Packed Format for Japanese、日本語EUC) ◦ EUCのエンコード方式上にASCIIとJIS ド方式 X 0208文字集合を配置したもの。 ◦ 半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212)) も含むことができる。 ◦ 半角カナと補助漢字を使用しない場合は、 JJISS X 0208で規定されている符号化方式 0 08で規定されている符号化方式 「国際基準版・漢字用8ビット符号」と同 一となる。ISO/IEC となる。 2022に適合。 に適合。 文字コード y EBCDIC (Extended Binary Coded Decimal Interchange Code;エビシディック) ◦ IBMにより定義された文字コード 式 数を ◦ ゾーン形式2進化10進数をベースにした二進 化十進数(BCD、Binary-coded decimal) メ ンフレ ムコンピュ タに使われてい ◦ メーンフレームコンピュータに使われてい た。 演習22 演習 5. 「稲」のJISコードとShift-JISコードを 5 「稲」のJISコ ドとShift JISコ ドを 調べよ。 6.「東」「西」「南」「北」をShift-JISで 昇順並 替えを行うと、どのような順 昇順並べ替えを行うと、どのような順 になるか。 7 Webページが文字化けをしている。 7. W bペ ジが文字化けをしている どこを変更すればよいか。 実戦問題 各国の文字を一つの体系で表現する文字 各国の文字を つの体系で表現する文字 コードセットとして、PCでのデータ交換 が円滑にできるように制定されたコード 体系 体系はどれか。 。 (あ)EBCDIC (い)Unicode (う)JIS漢字符号 (え)シフトJISコード (え)シフトJISコ ド y