Comments
Description
Transcript
2進数による表現
はじめに 情報科学 第04回 前半 2進数と様々なデータ 計算機はすべでのデータを2進数で表現しています。 画像や音声、文字などは、どのように2進数で表現され るデータとして持っているのでしょうか? 画像 文字 音 文字 音データ(1):音とは アナログとデジタル 自然界 連続量のものが多い。その変化等もなめらか。 計算機が扱えるもの 離散値。その変化等も0,1単位で表現される。 音は空気などを伝わる波。 ざっくりと言えば、波の振幅が音の強さに、形が音色に、 周波数が音の高さに関係する。 振幅 時間 波をデジタルデータとして扱うには どうしたらよいでしょうか? この間の差は、どうやって埋めるのでしょうか? 音データ(2):標本化 音データ(3):量子化 一定時間毎に、その波の強さを測定します。 振幅 波の振幅も、離散値で近似します。 振幅 時間 これで、時間方向は離散化されました。 時間 これで、波の振幅も離散化されました。 音データ(4):デジタルデータ 量子化してサンプリングすると、以下のようになります。 画像データ(1):画素 今のパソコンのディスプレイは、(多くの場合、)細かい 点の集合。ビットマップ画像。 個々の点が何色かを指定する。 振幅 時間 量子化が細かく、 標本化する回数が多いと、 よりよいデータ化が行える。 例: 16bit 441000Hz 画像データ(2):光の3原色 原色: 混ぜ合わせると "すべての色" を表現できる色 人間の目だと、3色であることが多い 色材の三原色: シアン、マゼンダ、イエロー(CMY) 絵の具とか。 光の三原色: 赤、青、黄色(RGB) PCとか 画像データ(3):色の表現 文字と文字コード RGB:赤緑青の混合による色の表現方法。 24bitカラー RGBそれぞれに8bit。 人の目には十分。 32bitカラー 人の目には24bitと 大差ない。 32が2の累乗で あるため扱いやすい。 おわりに 各文字は文字コードというコードにより、計算機内部で は扱われている。 さまざまなコードの割り当て方が存在している SHIFT_JIS :94 4c ISO-2022-JP(JIS) :47 2d EUC-JP :c7 ad UTF-8 :e7 8c ab ”猫”という文字は、 このように表現。 さまざまなものが計算機内部でどのように扱われてい るか、その基礎的な部分を扱いました。 実際には、多くの方式・技術があります。 動画を扱う データを圧縮する。可逆圧縮、不可逆圧縮。