Comments
Description
Transcript
講義資料
インターネット概論 2006年度春学期授業日程 第6回(2006年5月25日) 論理的なネットワークの構成 データ構造とインターネットの関係 慶應義塾大学 環境情報学部 村井 純・南 政樹 04/13(木) 04/20(木) 04/27(木) 05/11(木) 05/18(木) 05/25(木) 06/01(木) 06/08(木) 06/15(木) 06/22(木) 06/29(木) 07/06(木) 07/13(木) 「インターネットを理解するために」 「デジタルコミュニケーションの仕組みと歴史」 「通信インフラストラクチャ 」 「インターネットアプリケーション」 「モーバイルアプリケーション 」 「論理的なネットワークの構成 」 ←今日はココ 「セキュリティとプライバシー」 「メディアと政策」 「教育とその情報化」 「インターネットビジネス環境とその制度基盤」 「グローバルガヴァナンス」 「実空間インターネット」 「最終試験」 • 課題(2回)は〆切済み → まだの人も早く出しましょう! • 最新情報はSOI*で確認すること! – *SOI (School of Internet)については http://www.soi.wide.ad.jp/を参照 ニュースヘッドライン 前回の復習 今回はお休みです FIND/GENIの話 by Peter A. Freeman “Research for Future Network” Issues with the Internet Digital Living 2010 Tomorrow’s users will be surrounded by pervasive devices, embedded sensors and systems… all connected to the Internet. User User Games Photography Inventory/Sales tracking Entertainment Systems Health/Medical Home Computer Home Appliances Banking and Commerce User Surveillance and Security (at home, work, or in public) PDA Telephone • Security • Robustness Communications • Scaling • Mobile wireless and sensor networks • New technologies There are fundamental issues with the current architecture and many of its mechanisms that cannot be fixed incrementally and with additional Car Building Automation engineering workarounds. User Thanks to David Kotz at Dartmouth 1 Future Internet? GENI (Global Environment for Networking Investigations) Project Distributed Systems and Services? Network and Protocol Architectures? • Research -- Refocus existing programs – NeTS => FIND focus area New Paradigms? – Cyber Trust (CT) – Computer Systems Research (CSR) Applications & User Requirements – Computing Research Infrastructure (CRI) – … Enabling Technologies • GENI Experimental Facility – Not funded yet Internet Arch. Limitations & Erosion Network Capabilities – Exploring different possibilities – Planning activities underway Need a clean-slate approach Facility Design Concepts Sensor Network GENI is an advanced, flexible, programmable instrument for networking and distributed systems research. Sensor Network Edge Site Mobile Wireless Network Mobile Wireless Network Edge Site Slicing, Virtualization, Programmability Case for GENI Looking Ahead Applications Need for large experimental testbed/infrastructure Shared Deployable Infrastructure Capabilities This chasm represents a major barrier to realization of GENI Small Scale Testbeds Critical Infrastructures Networked Sensors Data Grid Networked Embedded E-science Digital Living Service Oriented Evolvability Security Robustness Mobility Ubiquity Wireless SoC Research Prototypes Optical Foundations Research Funded by CISE Programs Actuators Technologies Autonomicity Capabilities Sensors Time 2 Issues with the Internet GENI (Global Environment for Networking Investigations) Project • Security • Research -- Refocus existing programs • Robustness – NeTS => FIND focus area • Scaling – Cyber Trust (CT) • Mobile wireless and sensor networks – Computer Systems Research (CSR) • New technologies – Computing Research Infrastructure (CRI) – … There are fundamental issues with the current • GENI Experimental Facility architecture and many of its mechanisms that cannot – Not funded yet be fixed incrementally and with additional – Exploring different possibilities engineering workarounds. – Planning activities underway 情報化の変遷:表現方法の確立 • 様々な情報を「数字」で表現 – 文字を数字化 → 文字コード – 音声を数字化 → 音の強さ – 画像を数字化 → 色の要素(赤緑青etc) – 映像を数字化 → 複数の画像 • すべて情報は「bit 数字の羅列」で表現できる ASCIIコード 0x41(65) JPEG形式の画像 0xFF8D,0xFF1E ・・・, 0xFF9D 様々な文字コード • 日本語でよく使われる文字コード – EUC-JP • Extended UNIX Code – ISO-2022-JP • ISO(International Organization for Standardization)に基づく国際規格 – Shift-JIS 文字コード(復習) • 文字には数値が割り当てられている – 文字コード 0x41 0x61 – ASCII (American Standard Code for Information Interchange) – 大文字を小文字に変換したければ、文字に 0x20 を足せばよい 文字コード(復習) • 文字には数値が割り当てられている – 文字コード 0x41 0x61 • Microsoftが策定したコード – UTF-8 • UCS-2やUCS-4で定義される文字集合を用いて記述された文字列をバイト列 に変換する方式の一つ – ASCII (American Standard Code for Information Interchange) – 大文字を小文字に変換したければ、文字に 0x20 を足せばよい 3 様々な文字コード 文字コードの変換 • 日本語でよく使われる文字コード • 各文字コードで“あ”を表現する – EUC-JP • Extended UNIX Code EUC-JP – ISO-2022-JP • ISO(International Organization for Standardization)に基づく国際規格 – Shift-JIS A4A2 • Microsoftが策定したコード ISO2022-JP 2422 Shift-JIS UTF-8 82A0 E38182 – UTF-8 • UCS-2やUCS-4で定義される文字集合を用いて記述された文字列をバイト列 に変換する方式の一つ • ある文字コードから任意の文字コードへ変換するためには・・・ – 変換のための文字コード対応表を持つ必要がある キャリアによって異なる絵文字(1/2) 携帯電話と文字コード • 各社の端末で • 絵文字の正体 – 文字コードで表現される • Shift-JISコード : F89F(16進数) 63647(10進数) • Unicode : E63E • 各社の絵文字対応状況 – DoCoMo – au : • 基本絵文字176種類+拡張絵文字76種類 • KDDI絵文字用Shift-JISコード:F660 • Unicode : E488 • Eメール送出用JISコード : 7541 – au • 828種類 – Vodafone – Vodafone • Vアプリ作成用Unicode : E04A • ボーダフォンライブ!WEBコード : $Gj • 474種類,V8シリーズは477種類 キャリアによって異なる絵文字(2/2) interoperability • 異キャリア間で絵文字を送ると・・・ • 情報のやり取りができる理由 – 〓への変換,絵文字の削除が起きる DoCoMo → au を表現すると・・・ – DoCoMo : – 全てのコンピュータで「同じように表現」できる – 全てのコンピュータが情報を識別できる au → DoCoMo • 「同じように表現」 – 例)文字 • どのコンピュータを使ってもメールのやり取りが可能 – たまに起きる困ったこと • 絵文字が携帯キャリアごとに異なる (文字化け) • 海外から送られてきた日本語のメールなのに、中国語で表示される (言語の認識ミス) 4 情報化の変遷:永続的な保存方法 • デジタル化した情報(データ)は「ファイル」として保存 – ファイル=bit(数字)の羅列を一まとめにしたもの – 種類 • • • • テキストファイル(cf. 文字コード、改行コード etc…) 画像ファイル(cf. JPEG, PNG, TIFF etc…) 音声ファイル(cf. MP3, AAC, etc…) 動画ファイル(cf. MPEG2, AVI, QuickTime etc…) – 名前 • 人間は「名前」でファイル • コンピュータは数字(識別子)でファイル ・・・ ファイルシステム – 中身(コンテンツ) 携帯電話と文字コード • 絵文字の正体 – 文字コードで表現される • 各社の絵文字対応状況 – DoCoMo • 基本絵文字176種類+拡張絵文字76種類 – au • 828種類 – Vodafone • 474種類,V8シリーズは477種類 • 画像ファイルには画像を表現するbitの列 • 音声ファイルには音を表現するbitの列 キャリア間の絵文字変換 • キャリアをまたいだ絵文字のやり取りには対応 表を基にした変換が必要 – 宛先に応じて文字を変換する – 例:docomoからauに を送る 1. 2. 3. 4. 5. F89Fが入力される docomoの のようだ 宛先はau auの はf660だ f89fをf660に置換して送信 情報化の変遷:永続的な保存方法 • デジタル化した情報(データ)は「ファイル」として保存 – ファイル=bit(数字)の羅列を一まとめにしたもの – 種類 • • • • テキストファイル(cf. 文字コード、改行コード etc…) 画像ファイル(cf. JPEG, PNG, TIFF etc…) 音声ファイル(cf. MP3, AAC, etc…) 動画ファイル(cf. MPEG2, AVI, QuickTime etc…) – 名前 • 人間は「名前」でファイル • コンピュータは数字(識別子)でファイル ・・・ ファイルシステム interoperability • 情報のやり取りができる理由 – 全てのコンピュータで「同じように表現」できる – 全てのコンピュータが情報を識別できる • 「同じように表現」 – 例)文字 • どのコンピュータを使ってもメールのやり取りが可能 – たまに起きる困ったこと • 絵文字が携帯キャリアごとに異なる (文字化け) • 海外から送られてきた日本語のメールなのに、中国語で表示される (言語の認識ミス) 情報化の変遷:属性情報 • ファイルシステム – 「ファイル」を管理するためのシステム – 「名前」「作成日」などの情報と合わせて情報(データ)を保持 UNIXの例 minami@minami:~$ ls -l total 1536 drwxr-xr-x 3 minami rg 31 Sep -rw-r--r-- 1 minami rg 1518 Nov drwxr-xr-x 9 minami rg 4096 May -rw-r--r-- 1 minami rg 14344 Dec drwxr-xr-x 4 minami rg 47 Mar drwxr-xr-x 9 minami rg 4096 May -rw-r--r-- 1 minami rg 1540407 Oct drwxr-xr-x 3 minami rg 74 May 10 18 1 28 8 24 16 15 2005 2005 03:54 01:22 14:52 18:12 2005 13:11 Desktop beluga.plugin.tar.gz geeklog jphoto-0.1.zip project public_html pukiwiki-1.4.5plus-i18n-u2.tar.gz tmp – 中身(コンテンツ) • 画像ファイルには画像を表現するbitの列 • 音声ファイルには音を表現するbitの列 アクセス権限 所有者・グループ サイズ 最終更新日 名前 5 C:¥Documents and Settings¥minami>dir /a /n /q ドライブ C のボリューム ラベルは IBM_PRELOAD です ボリューム シリアル番号は 64EF-CB7D です ファイルの種類 C:¥Documents and Settings¥minami のディレクトリ 2006/05/23 2006/05/23 2006/04/14 2006/05/23 2006/05/23 2006/04/26 属性 09:57 09:57 02:01 09:59 14:21 17:44 最終更新日 <DIR> <DIR> <DIR> <DIR> <DIR> <DIR> BUILTIN¥Administrators . BUILTIN¥Administrators .. TP42P¥minami Application Data TP42P¥minami Contacts TP42P¥minami Cookies TP42P¥minami dsc 種類 2003/02/28 13:24 <DIR> 2006/05/10 14:34 <DIR> 9 個のファイル 20 個のディレクトリ 持ち主 • 情報は全てbit(数字)の列! – 情報(データ)を再現するときに「どんな記録方法」で保存されているか を知る必要がある • 違うフォーマットでは正しくファイルを読めない サイズ:10KB 作成日時:06/5/25 作者:概論 太郎 データ: It is fine today. 名前 TP42P¥minami スタート メニュー TP42P¥minami デスクトップ 5,254,760 バイト 705,445,888 バイトの空き領域 … C:¥Documents and Settings¥minami> サイズ:10KB 作成日時:06/5/25 作者:概論 太郎 データ: It is fine today. … サイズ:? 作成日時:? 作者:? データ: ? … 復習:画像の数値化(の原理) 例)画像ファイルの場合:様々な画像フォーマッ ト • 非圧縮 – Bitmap • 小さな升目 • マイクロソフトとIBMが作った画像ファイルフォーマット • 正確には「圧縮形式」も指定できるが多くの場合は非圧縮 – 画像を小さな升目に分割 – TIFF • マイクロソフトとAldus(現在のAdobe)が作った画像ファイルフォーマット • タグと呼ばれる識別子を使うことによって、様々なデータを柔軟に表現することができる • 色の3原色 • – 赤・緑・青 – この3色の強さを変化させ ることで全ての色を再現 できる – RGB(Red, Green, Blue) 圧縮 – JPEG • 静止画のデジタルデータを圧縮する方法 • JFIFが事実上の標準ファイルフォーマット • デジカメでよく使われている → EXIFフォーマット – PNG • インターネットでの画像配信の効率と高い編集・表現力を実現するために作られた フォーマット • 48bit階調での表現も可能 – GIF 出典: President 2000年10月16日号 新世紀の風貌 第14回 村井純 “インターネットを支える「獰猛なる純情」 ” 復習:画像の数値化(の原理) • 256色以下の色を利用できる可逆圧縮形式のファイルフォーマット • 圧縮の形式上「同じ色が連続する」画像の場合、圧縮率が高くなるので、イラストやボタ ン画像などで用いると効率化が狙える JPEGファイルフォーマット • JFIFフォーマット • 小さな升目 – 静止画像データ – 属性 – 画像を小さな升目に分割 • 色の3原色 • Exifフォーマット( JFIFの拡張) – 赤・緑・青 – この3色の強さを変化させ ることで全ての色を再現 できる – RGB(Red, Green, Blue) – 静止画像データ – 属性 – 付加情報 出典: President 2000年10月16日号 新世紀の風貌 第14回 村井純 “インターネットを支える「獰猛なる純情」 ” 6 Exifフォーマット(1) JFIFフォーマット • 属性 – 大きさ:150x173 – 解像度:72DPI – 色数:24BitsPerPixel –… SOI JPEG JPEG FILE FILE SOI JPEG共通ヘッダ JPEG JPEG FILE FILE JPEG共通ヘッダ Exifデータ ・属性、付加情報 画像データ • 静止画像データ EOI SOI EOI Start Of Image End Of Image 画像データ EOI Exifフォーマット(2) JFIFフォーマット • デジタルカメラで使われるフォーマット • カメラの情報を付加できるようJFIFを拡張 – カメラメーカ – 撮影日時 – 撮影時のカメラ設定 • シャッタースピード等 SOI JPEG共通ヘッダ Exifデータ ・属性、付加情報 JPEG JPEG FILE FILE • 属性 – 大きさ:150x173 – 解像度:72DPI – 色数:24BitsPerPixel –… SOI JPEG共通ヘッダ • 静止画像データ JPEG JPEG FILE FILE 画像データ EOI 画像データ EOI Google Desktop Search Exifフォーマット(2) • デジタルカメラで使われるフォーマット • カメラの情報を付加できるようJFIFを拡張 – カメラメーカ – 撮影日時 – 撮影時のカメラ設定 • シャッタースピード等 SOI JPEG共通ヘッダ Exifデータ ・属性、付加情報 • ローカルPCのファイル検索ツール – メール – Word文書、PowerPoint – Web閲覧履歴 – AOLチャットログ JPEG JPEG FILE FILE 画像データ EOI http://desktop.google.com/ 7 ftp: File Transfer Protocol 15年前のインターネットアプリケーション • サーバ・クライアントモデル • 情報(データ)のありか • ファイル転送 – サービスを提供する側と受ける側に役割を分担 – 情報(データ)は「提供する側」に存在 – ファイル=データ – インターネット上に存在するデータの送受信 – 情報(データ)が格納されているサーバは「何らかの方法」で探し出す • archie プログラム – サーバ数が多くない上、有名なサーバには様々な種類の情報(データ)が大量に存在 • 情報(データ)の集まり方 • サーバ・クライアントモデル – 情報(データ)が一箇所に集まるので、利用者も一箇所に集中してアクセスする ソフトウェアファイル サーバAから ソフトウェアを ダウンロードしよう – 受動的にリクエストを待つサーバ ドキュメントファイル • 固定的な「置き場所」として利用 サーバAから ドキュメントを ダウンロードしよう 巨大なサーバ: A – 能動的にリクエストを送るクライアント • 必要なときにサーバにアクセスしファイルを送受信 インターネット インターネット 利用者 クライアント クライアント 利用者 サーバ・クライアントモデル • サーバ :サービスを提供する側 • クライアント :サービスを要求する側 10年~5年前のインターネットアプリケーション 情報の保持 • サーバ・クライアントモデル • 情報の分散化 – – – 「置き場所」としてのサーバは変化せず 能動的なクライアントも変化せず 情報(データ)は、「リンク」が含むようになり、分散したサーバ間で情報が有機的に結びつけられるようになった • • 情報提供者はリンクを意識して情報(データ)を作成 情報利用者はリンクを辿り新たな情報(データ)を取得 • 情報(データ)のありか: • 情報(データ)の集まり方 – 情報(データ)が格納されているサーバは「何らかの方法」で探す – サーバの数が多く、大量の情報(データ)が分散して存在 • – サーバ cf. 検索エンジン、ディレクトリサービス インターネット中に分散して存在するが、利用者の増加に伴い人気のある情報(データ)を持つサーバにアクセスは集中 1.リクエストの送信 アドレスを指定 アドレスを指定 リンク ク リン 2.情報の配信 Webサーバ Webサーバ インターネット インターネット アドレスを指定 Webサーバ アドレスを指定 クライアント Webサーバ World Wide Web(WWW) インターネットの歴史: trafficの推移 トラフィックの推移 100% • 情報と情報を結びつける 90% – 分散したサーバ上に存在するデータ – 「リンク」による相互参照 70% • サーバクライアントモデル • 情報(データ)のありかを示す情報 – URI(Uniformed Resource Identifier) – 「どのサーバ」の「なんという名前のファイル」 • データ転送とURI 60% データ量(%) – 受動的にリクエストを待つサーバ – 能動的に情報(データ)にアクセスするクライアント ポート番号からサービス 特定がしにくい時代 80% Others Napster SMTP HTTP/HTTPS FTP P2P登場 50% 40% WWW全盛 30% 20% 出典: WIDE報告書(1994-1999) 2000-2005はdaily sampling 10% – HTTP(Hyper Text Transfer Protocol) 0% 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 年 8 Atalanta.olympic.org 1996 Atlanta Olympic JAPAN US 1 US 2 UK Germany Internet 9