Comments
Description
Transcript
エンコードとデコード
「情報科学概論」 映像1年 前期・選択 担当:浦谷 則好 http://uratani-n.com/info-science/ [email protected] 第5回 エンコードとデコード エンコード (encode) 符号化 と同義 アナログ信号やデジタルデータに特定の方法で、 後に元の(あるいは類似の)信号またはデータに 戻せるような変換を加えること 広義には「暗号化」も含まれる エンコーダ エンコードするための機器・回路・プログラム デコード (decode) 復号化 と同義 エンコードした情報(データや信号)を元に戻すこと デコーダ デコードするための機器・回路・プログラム コンピュータ内で機械語を内部表現として解釈す ることもデコードと呼んでいる(CPUの機能) コーディック (通信装置、記憶装置で使用) エンコーダとデコーダの両方を備え、双方向の変 換を行う機能あるいは変換装置、プログラム アナログ信号のエンコード/デコード(1) ドルビーノイズリダクションシステム(ドルビーB) ヒスノイズが耳につく高い周波数の入力音声信号を、 テープに記録する際にレベルを上げて記録(エンコード) し、再生するときには元のレベルに戻して再生(デコー ド)する。これにより、聴感上ヒスノイズが低減される ただし、飽和を避けるため、圧縮記録の考え方を用いて 入力レベルに応じて倍率を変えている 150Hz付近からレベル上昇させ、5kHz付近でのS/N 比が約10dB改善される テープや装置の周波数特性が悪いと音が劣化 40 アナログ信号のエンコード/デコード(2) dbxノイズリダクション 音声信号の大きさによって増幅率が変化する特殊な 増幅器を用いて、音量の変化を(対数で)1/2に抑えて 録音し、再生時にそれを2倍にすることでノイズを抑制 ドルビーと比べ、可聴域全帯域幅のノイズを抑圧でき るという特長がある ドルビーと違い簡易な方法で再生することができない 似た原理の雑音低減装置がHiFiビデオやカセット レコーダに広く用いられた (デジタルデータの)エンコード(1) デジタルデータを一定の規則(=符号化方式) に従って、目的に応じた符号に変換すること コンピュータにおいてはファイルの圧縮あるいは 暗号化のことを指す場合もある 符号の性質 忠実性 1つの対象は1つの符号だけが割り当てられる 完全性 どの対象も符号で表現できる 浮動小数点表現では絶対値が大きすぎたり小さ すぎたり(アンダーフロー)すると表現できない 拡張性 対象が増えても今までの符号を変更しないで新対 象の符号を定めることができること 符号化方式 情報源符号化 文字・画像・音声などの元情報の符号化 対象となる情報の性質に応じて符号化方式を選択 サンプリング周波数の選択;量子化ビット数の選択 伝送路符号化 情報を送る伝送路の帯域、雑音や妨害などの性質 に応じて、すでに情報源符号化された情報を再度符 号化するもの 誤り検出、誤り訂正符号 エンコード(2) 文字・音・画像の基本的な符号化については すでに第2回で講義 数(整数、小数)の符号化については 第3回で講義 画像の符号化(1) 可逆符号化 圧縮した符号から原画像を歪なしに復元できる符号化 不可逆符号化 符号から原画像を歪なしには復元することができない 符号化 人間の視覚特性を利用して、人間にとって知覚しにく い歪をある程度許容することにより、冗長な情報成分 の抑圧し、圧縮を行う 画像信号の圧縮符号化はなぜ必要か? 人間の視覚特性 空間周波数の高い歪は目立ちにくい 歪は画像が明るいほど目立ちにくい 歪は画像の平坦部に比して輪郭部では目立ちにく い 明るさ(輝度)に対する周波数帯域は広く、色度 (色差信号)の帯域は狭い フリッカは約50フレーム/秒以上で認知されなくなる 映画24フレーム×2; TV30フレーム/60フィールド 画像の符号化(2) カメラやモニタは、基本的には赤(R)、緑(G)、青(B) の 3原色で画像を表現 R G B の各信号を輝度信号(Y)と2つの色差信号(U, V)に変換し、輝度信号については細かく、色差信号は 粗くサンプリングすれば、符号の圧縮が可能 画像の符号化(3) RGB信号と、 輝度信号(Y) 色差信号(U,V) の関係 画像の符号化(4) 符号化方式の分類 SN比 信号量 (signal) と雑音量 (noise) の比 信号対雑音比 (signal-to-noise ratio) の略 信号雑音比、S/N比、SNR、S/Nとも記す P:パワー(エネルギー) A:振幅(電流値等) 演習1 画像を8ビットで符号化するとき、SN比は 原理的にいくつといえるか? 解答 8ビットだからレベルは0~255である。 つまり、1/255×1/2 までの誤差を 許容している したがって 1 20 log 10 20 log 10 510 54.15 1 510 (dB) ADPCM (adaptive differential pulse code modulation、適応差分PCM) DPCMは信号間の差分を PCM 符号化する方式 PCMは信号の大きさを整数データとし、それを一組のパ ルス列として出力する方式 差分が大きくなっていく場合は 量子化幅を広げ、差分が小さ くなっていく場合は量子化幅を 狭めることで、より広い範囲の 差分を少ないビット数で効率 よく表現するDPCM方式 演習2-1 左下の4×4の画素ブロックを 右のようなADPCMで符号化 することを考える。 画素の量子化レベルは 0~63 とする。 入力 コード 出力 111 -40 -28~-13 110 -20 ~-29 -12~-5 101 -8 -4~ -1 100 -2 0~ 4 000 2 5~ 12 001 8 60 58 61 62 43 49 54 49 22 39 47 60 13~ 28 010 20 35 28 53 29~ 011 40 9 演習2-2 画素Xの値は X‘=(A+B)/2 だと予測され、実際の値 との差(X-X’)が符号化されるとする。 (例えば、第2行 第2列ならば、X‘=(58+43)/2=50 と実際の値49 と の差(-1)が表より 100 と符号化され(意味は-2) 50-2=48 を意味することになる。 ただし、実際には予測に使われる値(A,B,Cなど)は 真の値ではなく、符号化によって決定された値である。 つまり、Yを予測するのに使う A C Y’=(X+C)/2 のXは実際の値(49) B X Y ではなく上で符号化された(48)である。 演習2-3 第1行目や第1列目のときはAまたはCが得られ ないので、A=Cとしてないほうの情報を補う 第1行、第1列(最上最左)の画素の予測値は 32とする(つまりA=C=32とする) 問題1: 4×4の画素ブロックの符号を求めよ 問題2: この符号化のSN比を求めよ (ただし、原信号はノイズを含まないと仮定する) (直流レベルは31.5 とし、パワー(2乗和)で比較)する) 解答 予測誤差より 010001000000101100100101 110000000001001110100001 SN比 信号:6758 ノイズ:137 より 16.93 (dB) 予測誤差 複号化 誤差 1 0 52 60 62 63 8 -9 -3 -2 -8 44 50 54 50 -22 2 1 11 24 39 48 11 -26 -3 10 32 15 29 28 6 -2 -1 -1 -1 -1 0 -1 57 -2 0 -1 3 51 3 -6 -1 2 画像符号化の規格と主な用途 画像の符号化(5) JPEG方式による画像の符号化 画像の符号化(6) フレーム間符号化 連続する2フレームの画像信号を比較すると、 背景は変わらないことが多いし、動くものも 位置がずれても似ていることが多い。 → 伝送済みのフレームの中から、最も近似度の 高い画像をブロック単位で探し出し、そのずれ を動きベクトルとして伝送。 差分信号は(DCTなどで)符号化 ブロックの切り出し 差分の符号化 動きベクトルの決定 MPEG方式の ブロック構成 ※MPEGでは、速送り 等の機能を実現するた め、定期的に単独で復 号できる基準フレーム( フレーム内符号化)が 挿入されている 変換符号化 画像データを空間周波数領域に変換 低域周波数領域に変換係数を偏らせ、データ圧縮 KL変換が理想だが ・計算量が多い ・予め確率分布 を知ることができない ことからDCTが使われる ことが多い! 離散コサイン変換(DCT) DCTの基底は右図 DCTの変換式は下式 F(0,0)は直流成分になる 静止2値画像(ファクシミリ)の符号化 ランレングス符号化 文字などの黒画素と背景の白画素は、それぞれ 連続して出現する傾向 その連続長(ランレングス)に 対して符号を割り当てる ※右図の場合、そのまま送ると 22ビット、ランレングスなら (3ビットで示すとして)18ビット 伝送路符号化 第7回で! 次回(第6回:5/26)の予定 二分探索,互除法