Comments
Description
Transcript
事前に頂いた質問への回答 と模擬授業
宇都宮高校 首都圏進路研修 質問事項 (Q1—Q4) 2014年12月2日(火) Q1. 早稲田大学では様々な留学プログラムが組まれてい ますが、理系の学生として海外に留学するメリットはあり ますか? 事前に頂いた質問への回答 と模擬授業 Q2. 研究をするうえで、国立大学よりも私立大学の方が いい点はどのようなところでしょうか? Q3. ネットワークの測定には、様々な測定ツールを使うわ けですが、その測定はどのような過程があり、どれくらい 時間がかかるのでしょうか? 早稲田大学 理工学術院 情報理工学科 後藤滋樹 Q4. 今後10年間・20年間のうちにどのような面でネットワー クの世界は発展していくでしょうか? 1 2 質問事項 (Q5—Q8) 質問事項 (Q9—Q12) Q5. 全世界の人々が携帯やパソコンなどの情報通信機器 を手にし、使う事ができるようになるためにはどのくらいの 年数がかかるでしょうか? Q9. ネットワーク測定に関して、不正侵入やウイルスなど の発見のための観測網の整備は途方もない作業のように 思われますが、どのように進めていくものなのですか? Q6. コンピューターネットワークの発展は人間にとって、 善いことも悪いこともあると思われますが、その均衡は どのように保つのでしょうか? Q10. アドホックネットワークというのはどういうものなので しょうか?従来のネットワークとの違いはなんでしょうか? Q7. ここ10数年の間でのコンピューターネットワークの 発展とはどのようなものなのでしょうか? Q8. spam対策において、ベイズ判定の弱点とはなんでしょ うか?そしてこれからどんなシステムが必要になってくるで 3 しょうか? Q1: 理系の学生が留学するメリット • 留学する学生(=元気の良い学生)は歓迎される 留学は奨励されている。メリットはあります(後述) • ただし早稲田大学の中でも学部によって制度が異なる 例:理工学部(3学部)には卒業論文着手条件がある 以下の説明は詳細に過ぎて、まるで分からないと思いますが、実例を書いておきます。 右側に意味を説明します。2014年4月の4年生に情報理工学科で適用した条件 1. A群については22単位以上(うち英語8単位以上)を修得している 2. B群については31単位すべてを修得している 3. C群については2年次までの専門必修科目をすべて修得している 2年生までに 取得できる 4. 総修得単位が104単位以上である (注:卒業必要単位は136) 5. 専門選択必修科目を11単位以上修得し、かつ1コース以上完了している 3年生科目 • 留学先の海外大学での取得単位が早稲田大学の3年 生の科目の単位として認定されないと条件を満たさない5 Q11. サイバー攻撃についてです。情報セキュリティー 従業者の方は普段具体的にどのような仕事をしているの でしょうか?またそれに求められる能力とはどのような ものでしょうか? Q12. ネットワーク本来の能力を失うことなく、サイバー攻撃 を防ぐことはできるのですか? 4 • 卒論着手条件を満たさないと、早稲田大学の卒業が 半年ないし1年間遅れる(卒業論文には1年間が必要) • 留学に、いつ出発するか? 期間は半期か一年か? 1. 語学の習熟には若い頃に留学する方が効果的か? 2. 専門分野で活動したい場合には大学院で留学すると いう選択肢もある • ちなみに私は大学院修士課程を修了後にNTT研究所に就職した 後に35歳でスタンフォード大学に1年間滞在し、当時の日本には 無いものを持ち帰りました。その体験が私の研究の専門分野を 転換する契機となりました • 自分の大学の制度を調べる。クラス担任の先生に相談 A群、B群、C群、クラス担任などの意味は「学部要項」参照 6 1 大学の在学生向けの情報 Q2: 研究をする上で国立と私立 • 「研究」を学生の立場で考えるか、教員の立場か? • 国立大学と私立大学の差よりも、大学ごとの差が大 • (参考)研究大学強化促進事業 参照したのは2011年度版、最新は2014年度版 http://www.sci.waseda.ac.jp/students/guidebook/ http://ja.wikipedia.org/wiki/研究大学強化促進事業 http://www.mext.go.jp/a_menu/kagaku/sokushinhi/ • 国立大学 {北海道大学, 東北大学, 筑波大学, 東京大学, 東京医科歯科大学, 東京工業大学, 電気通信大学, 名古 屋大学, 豊橋技術科学大学, 京都大学, 大阪大学, 神戸大 学, 岡山大学, 広島大学, 九州大学, 熊本大学, 奈良先端 科学技術大学院大学} • 私立大学 {慶應義塾大学, 早稲田大学} • 大学共同利用機関法人 {自然科学研究機構, 高エネル ギー加速器研究機構, 情報・システム研究機構} 7 8 高校時代に研究分野を決められるか 研究は社会的活動です • 三つ子の魂(たましい)百まで • 研究成果を評価するのは自分自身ではなくて他人 • 研究者の仲間との議論を通じて切磋琢磨する (学会で発表するのは「公開」する意味があるが、他人 にアイデアを教えてしまうことになる。公知の事実) • ただし現実には 高校の科目と研究分野は必ずしも一致しない 研究分野にも栄枯盛衰がある • どのような先生、先輩、研究室で活動するのか 人気の研究室に配属される時の競争あり • これまでの日本の大学は特徴がない(ように見える) 先生や先輩、友人との出会いの幸運と不運 • これからの日本の大学は各々特徴を出す (実は昔から特徴がある) • ちなみに私は東京大学理学部数学科の学生として微分方程式 をコンピュータで解く研究に従事した。京都大学には、その方程 式の専門家がいたので仁義を切るために京都に出張した 9 • 私の大学時代のフランス語の先生である西本晃二先生は 「自分はフランスに留学させてもらうつもりだった。結局、一年 上の先輩がフランスに行き、私は先生に言われてカナダに 留学することになった」 • それでも、問題意識を持つことは非常に大切 「人間は歩く問題意識である」 10 Q3: 測定ツールの過程と所要時間 Q4: 今後10年、20年間の発展 • 一般に理工系の実験は所要時間が長いと思う • ネットワークの世界を語るには、コンピュータと人間の 両方を考える必要があります • コンピュータの発展 ビッグデータという用語には多様な意味がある • 従来の情報処理 英語の例文 → 文法・辞書 → 翻訳 音声データ → 標準パタン → 音声認識・合成 将棋の棋譜 → 定石 → 対局 • ネットワークの測定の基本はパケットを収集する これは自動的に行うので立ち会う必要はない データが膨大になるのでサンプリングをするか あるいはフィルタにより注目するデータのみ収集 • この回答を利用して模擬授業を行う予定ですが 昨年度の首都圏進路研修においても、模擬授業を想定した 内容の説明が時間切れとなってしまいました(スライド後述) 11 • ビッグデータ 英語の膨大な例文 → 翻訳 膨大な音声データ → 音声認識・合成 膨大な将棋の棋譜 → 対局 12 2 コンピュータの発展と人間の利用 Q5:全世界の人が使うまで 利用者の数を直接に測定するのは難しい。接続しているホストを数える。 • コンピュータの発展(続) 人間から物へ, Internet of Things (IoT) Internet of Everything (IoE) 世の中は情報に溢れている(例:電車、部屋) 放送(単方向)と通信(双方向) July 2014 現在の 全世界の総数 1,028,544,414 (10億台) その中のJPドメイン 75,627,790 (全体の約7.35%) • 人間の利用 これまでは省力化(電子文房具のレベル) これからは人間の頭脳の延長として利用 (ほんの少し先の)未来を(ある程度まで)予測できる 「すでに始まっている未来」 デジタル社会 その本格的な利用法を提示するのは諸君 この測定方法: http://www.isc.org/services/survey/ www.isc.orgで「ドメインサーベイ」を調べる 上のグラフが不鮮明で不満な諸君は、ぜひISCを調べてみてください 13 情報通信機器を使うために 14 Q6: 善いことと悪いことの均衡 • 科学技術は両刃の剣(もろはのつるぎ)? 自動車は便利だが交通事故があり、環境負荷も重い 飛行機は旅行を手軽にしたが、戦争にも使われた 原子力は平和利用もあり、兵器にもなる • 電力の供給が必要 • 利用者が携帯電話を使う場合でも基地局の 間の回線は、ある程度の帯域を確保する • 経済的な合理性が必要(ビジネス モデル) • 均衡と平衡 equilibrium 例: 需要と供給の均衡(ゲームの理論) • 政策として推進する国がある一方、機器が揃 っても情報に自由にアクセスできない国もある • 悪い人のコストを高くする必要がある 法律による刑罰 セキュリティを簡単に破れないようにする 逃げられないようにする(本人認証) 関連質問 Q12 • 真に世界中の人が利用するのは難しい デジタル時代は言語時代であることに注意 話し言葉と書き言葉は、どちらが難しいか 16 15 Q7: ここ10年間の発展 Q8: ベイズ判定の弱点 • ここ10年間とは、過去の10年間か、未来の10年間か 関連質問 Q4 (今後10年間・20年間) • spam対策としてのベイズ判定 現在のところ100%正確なspam判定はできません ベイズ判定の有名な例 spamassassinは使用していると 次第に処理速度が低下しました • 過去10年間と仮定するならば 2004年 2月 mixi, Flickr, Facebook誕生 2004年 7月 Skype 1.0発表 2005年 2月 YouTube設立 2006年 6月 Twitter設立 2006年12月 ニコニコ動画サービス開始 2007年 3月 Ustreamサービス開始 2008年 4月 Twitter日本語版公開 2008年 7月 Appleが App Store開始 2008年10月 Android Market開始 • インターネット歴史年表(JPNIC) https://www.nic.ad.jp/timeline/ • spam判定に役に立つ情報 ヘッダに含まれる中継ノードのドメイン名とIPアドレス subject, 本文に含まれる言葉 本文に含まれるURL SPFなどのドメイン認証 (*) sender policy framework 17 後藤研究室とNTTが共同出願した 特許第5147078号の特許証 18 3 Q9: 観測網の整備は途方もない (参考)分割統治の例 • それほどでもないのです 理由: インターネットは分散処理です インターネットはネットワークの相互接続 • 1から8までの数字を書いたカードがある 現在は順番が揃っていない • これを番号の小さい順番に並べたい(ソート) 8 4 3 7 6 5 2 1 8 4 3 7 6 5 2 1 8 4 3 7 6 5 2 1 4 8 3 7 5 6 1 2 3 4 7 8 1 2 5 6 1 2 3 4 5 6 7 8 • それぞれの組織、企業、通信事業者(ISP)が自分の ネットワークを観測すれば良い 具体的な技術: 侵入検知(IDS), 侵入防止(IPS), ファイアウォール アンチ・ウィルス • 分割統治(divide and rule, divide and conquer) 古代ローマ帝国 コンピュータにおける基本原理の一つ 19 20 Q10: アドホック ネットワーク 悪性通信のデータ(研究用) • ad hoc 自立分散型、自己構成型 • 一つの例:Windows 7 のパソコンの設定 http://windows.microsoft.com/ja‐ jp/windows/set‐computer‐to‐computer‐adhoc‐ network#1TC=windows‐7 • 情報処理学会の研究会が提供するデータ • CCC DATAset 2008~2011 • CCC DATAset 2012~2013 • D3M(Drive‐by‐Download Data by Marionette)2010~ 2014 • FFRI dataset 2014(含む2013) • PRACTICEデータセット2013 無線LAN アクセス ポイント • 政府「情報セキュリティ研究開発戦略(2014)」 データの研究者への提供 パソコン • むしろ良性の通信データの収集がネックになる パソコン 21 アド ホック ネットワークの課題 インフラストラクチャ モード アド ホック モード 22 Q11: 情報セキュリティに従事する人 • 仕事の例 マルウェアの検知と解析(静的、動的) ハニーポットの巡回 ダークネットによる観測 統計的、あるいは機械学習による弁別 攻撃を遮断する機構の研究 • 予め経路(ルート)を決めておくか、必要にな る度に経路を計算するか • 中継するノード(パソコン)に何らかの報酬(イ ンセンティブ)を与えるか • 全体として省電力を実現するための工夫 • 必要な情報の所在を探索するための工夫 • 要素技術は存在する • 自動車同士のネットワーク(車車間通信) 軍事的には意味がある(例:落下傘で降下し た兵士が相互に連絡を取ることができる) 23 • 求められる能力 情報通信技術の全般に通じていること マシン語、オペレーティングシステム、各種のソフトウェ ア(word, excel, Acrobat)、Webサーバ、ブラウザ、ネッ トワークのプロトコル 24 4 (参考)来年度に使用予定の教科書 Q12: サイバー攻撃を防ぐ • ネットワーク本来の能力を失うことなく ネットワーク本来の利便性を犠牲にする 次の技術を記述している 1. ポートスキャン 2. 脆弱性スキャン 3. マルウェア感染 4. 遠隔操作 5. 情報漏洩 6. DDoS攻撃 7. DNS攻撃 8. Webサイトへの攻撃 完璧なセキュリティ機能が実現できない理由 • コンピュータはロボットのようなもので、命令(プログラ ム)に忠実に従って動作する • 正当な利用者の命令と、悪い人の命令の区別がつか ない(署名付のプログラムというアイデアは有り) • 悪い人は逃げる(昔のARPAnetでは逃げることができ なかった) 25 アナライザ パケットを収集 科目の紹介 「情報ネットワーク」 • 信頼できる仲間だけのネットワークを作ろうという動き はある 26 アナライザ • 通常のホストは自分宛(全員宛を含む)のパケットを 受信する。アナライザは他人宛のパケットも受信する。 • Ethereal (Wireshark) フリーのソフトウェア • Astec Eyes (商品) http://www.asteceyes.com/ • ClearSight (商品) http://www.toyo.co.jp/clearsight/ • 情報理工学科3年後期選択科目 「情報理工学実験C 」 コンピュータネットワークⅠ,Ⅱ 測定用のマシン 通信 27 WEB (HTTP)の記録例 2番目のRequestを見ると、画像のファイルを要求している (ポート番号 80) organization.web.waseda.ac.jp 28 Name: organization.web.waseda.ac.jp Address: 133.9.4.217 Aliases: www.waseda.ac.jp RequestとResponseが幾つか並んでいる 29 30 5 TELNETの例(ポート番号23) 理工UNIX muse01.mse.waseda.ac.jp WILL, DO などが並び、その後にデータが送られている DATAの最初を見ると… オプションの交渉: WILL 自分はオプションを有効にしたい DO 相手側にオプションを有効にしてもらいたい オプションの例: エコー、ターミナル速度など 31 FTPの例(ポート番号21) FTPは二つのコネクションを使う 32 173,148は次の意味 173×256+148=44436 ちなみに44441は次のように 表される: 173,153 ポート番号 44436、44441は何だろう 33 34 科学の発展は可視化がもたらす • • • • • • • • • 時計のない時代に「時間」を議論した哲学者 写真のない時代に「表象」を議論した哲学者 磁石(磁針) 温度、湿度、気圧 電圧、電流 速度、加速度 株価の変動 人間の所在地(ビッグデータの分析) ネットワークの変動 35 6