Comments
Description
Transcript
低遅延環境を実現するカットスルーおよびストアアン ドフォワード
ホワ イ ト ペーパー 低遅延環境を実現す る カ ッ ト スルーお よ びス ト ア ア ン ド フ ォ ワー ド イ ーサネ ッ ト ス イ ッ チ ング 概要 こ の ド キ ュ メ ン ト のテーマは、 デー タ セ ン タ ーにおける遅延に関する要件です。 レ イ ヤ 2 パ ケ ッ ト 転送を実行す る2つの イ ーサネ ッ ト ス イ ッ チ ン グ パ ラ ダ イ ムであ る カ ッ ト スルー と ス ト ア ア ン ド フ ォ ワー ド の遅延特性を取 り 上げます1。 こ れ ら 2 つのス イ ッ チ ン グ方式の機 能上の説明を行い、 各ス イ ッ チ タ イ プについて、 デー タ セ ン タ ーにおいて どのよ う な条件が 導入に適 し ているかを全般的に評価 し ます。 また、 レ イ ヤ 2の一般的なパケ ッ ト 処理アーキテ ク チ ャ について も説明 し ます。 こ れは、 エ ン ド ツーエ ン ド の遅延要件に関係 し ます。 製品の具体的な機能は取 り 上げませんが、 必要に 応 じ て、 シ ス コ のイ ーサネ ッ ト ス イ ッ チ ン グ プ ラ ッ ト フ ォ ームを ソ リ ュ ーシ ョ ンの例 と し て紹介 し ます。 低遅延デー タ セ ン タ ー ソ リ ュ ーシ ョ ン を選択する際は、 以下の要点を考慮 し ます。 • 適切な遅延特性を備えた LAN ス イ ッ チ を判断する際には、 エ ン ド ツーエ ン ド のア プ リ ケーシ ョ ン遅延要件が主要な条件です。 • カ ッ ト スルー と ス ト ア ア ン ド フ ォ ワー ド のど ち らの LAN ス イ ッ チ ング テ ク ノ ロ ジー も、 ほ と んどのデー タ セ ン タ ー環境に も それ以外のネ ッ ト ワーキング環境に も 適 し ています。 • 真の超低遅延性が必要 と さ れる まれなケースでは、 カ ッ ト スルー ス イ ッ チ ング テ ク ノ ロ ジー と 特定の ク ラ スのス ト ア ア ン ド フ ォ ワー ド 低遅延ス イ ッ チの併用を検 討する必要があ り ます。 この場合の低遅延または超低遅延ソ リ ュ ーシ ョ ン と は、 エ ン ド ツーエ ン ド 遅延が 10 マ イ ク ロ秒程度のものを指 し ます。 • 3 マ イ ク ロ 秒未満のエ ン ド ツ ーエ ン ド ア プ リ ケ ーシ ョ ン 遅延を 実現する には、 InfiniBand の機能を 検討する 必要があり ま す。 • ス イ ッ チの選択に際 し て真のア プ リ ケーシ ョ ン遅延要件を理解 し た ら、 その他の重 要な条件 と し て、 機能、 パフ ォ ーマ ン ス、 ポー ト 密度、 および コ ス ト を検討 し ます。 イ ーサネ ッ ト ス イ ッ チ ン グ パ ラ ダ イ ムの概要 1980 年代、 企業では、 自社ネ ッ ト ワー ク でパフ ォ ーマ ン ス低下の兆候が現れ始める と 、 イ ー サネ ッ ト ブ リ ッ ジ (透過型または学習型) を導入 し て コ リ ジ ョ ン ド メ イ ン を抑えま し た。 1 レ イ ヤ 2 ス イ ッ チ ング と は異な り 、 レ イ ヤ 3 IP フ ォ ワーデ ィ ン グでは、 送出 さ れる各デー タ パケ ッ ト の内容が RFC 1812 の規定に従っ て変更 さ れます。ス イ ッ チが IP ルー タ と し て適切に動作する ためには、 送信元お よび宛先 MAC ヘ ッ ダーの書き換え を行い、 time-to-live (TTL; 存続可能時間) フ ィ ール ド をデ ク リ メ ン ト し 、 IP ヘ ッ ダー チ ェ ッ クサムを再計算する必要があ り ます。 さ ら に、 イ ーサネ ッ ト チ ェ ッ ク サム も 再計算する必要があ り ます。 ルー タ がパケ ッ ト 内の関連 フ ィ ール ド を変更 し なか っ た場合は、 各 フ レームに IP エ ラ ー と イ ーサネ ッ ト エ ラ ーが含まれます。レ イ ヤ 3 のカ ッ ト スルー実装でパケ ッ ト の再 循環に よ っ て必要な操作が実行 さ れる場合を除き、 レ イ ヤ 3 ス イ ッ チ ン グはス ト ア ア ン ド フ ォ ワー ド 機 能で なければな り ません。 再循環に よ り 、 カ ッ ト スルー ス イ ッ チ ングの遅延上の利点はな く な り ます。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 1 of 13 ホワ イ ト ペーパー 1990 年代に入る と 、 集積回路テ ク ノ ロ ジーの進化によ り 、 ブ リ ッ ジ ベン ダーはレ イヤ 2 の フ ォ ワーデ ィ ング決定を CISC (Complex Instruction Set Computing) および RISC (Reduced Instruction Set Computin g) プ ロ セ ッ サか ら ASIC (特定用途向け集積回路) お よ び FPGA (Field Programmable Gate Array ) に移行する こ と が可能にな り ま し た。 その結果、 ブ リ ッ ジ内でのパケ ッ ト 処理時間 (遅延) が数十マ イ ク ロ秒に短縮 さ れる と 同時に、 パフ ォ ーマ ン ス を 損なわずに さ ら に多 く のポー ト を 処理す る こ と がで き る よ う に な り ま し た。 「イ ーサ ネ ッ ト ス イ ッ チ」 と い う 言葉が一般的にな っ たのは この頃です。 レ イヤ 2 デー タ パケ ッ ト 転送の初期の方式は、 「ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グ」 と 呼ばれていま し た。 1990 年代初頭に カ ッ ト スルー パケ ッ ト 転送方式のために作られた言葉 と 区別する ためです。 レ イヤ 2 フ ォ ワーデ ィ ング ス ト ア ア ン ド フ ォ ワー ド および カ ッ ト スルー レ イ ヤ 2 ス イ ッ チはど ち ら も、 デー タ パケ ッ ト の destination MAC (DMAC; 宛先 MAC) ア ド レ スに基づいて フ ォ ワーデ ィ ング決定を行 います。 また、 各ス テーシ ョ ンがネ ッ ト ワー ク上の他の ノ ー ド と 通信する際に、 パケ ッ ト の source MAC (SMAC; 送信元 MAC) フ ィ ール ド を調べて MAC ア ド レ ス を学習 し ます。 レ イヤ 2 イ ーサネ ッ ト ス イ ッ チで フ ォ ワーデ ィ ング決定を開始する と き、パケ ッ ト を転送す るか破棄するかを判断する ために行われる一連の手順の違いが、 カ ッ ト スルー方式 と ス ト ア ア ン ド フ ォ ワー ド 方式の違いです。 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チでは、 フ レーム全体を受信 し 、 その整合性を チ ェ ッ ク し て か ら デー タ パケ ッ ト の フ ォ ワーデ ィ ン グ決定を行 う のに対 し て、 カ ッ ト スルー ス イ ッ チ で は、 着信フ レームの DMAC を調べる と す ぐ に転送処理に移 り ます。 カ ッ ト スルー ス イ ッ チは、 理論上、 DMAC ア ド レ スが格納 さ れている フ レームの先頭 6 バ イ ト だけ を受信 し てア ド レ ス を調べます。ただ し 、後で紹介するい く つかの理由によ り 、カ ッ ト スルー ス イ ッ チはフ レームの さ ら に数バイ ト 分の評価が終わるのを待っ てから、パケ ッ ト を転送するか破棄するかを判断 し ます。 ス ト ア ア ン ド フ ォ ワー ド イ ーサネ ッ ト ス イ ッ チ ン グの特性 こ こ では、 ス ト ア ア ン ド フ ォ ワー ド イ ーサネ ッ ト ス イ ッ チの機能の概要を示 し ます。 エラー チ ェ ッ ク 図 1 は、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チで 1 つのイ ーサネ ッ ト フ レーム全体を受信 し て いる様子を表 し ています。 フ レームの末尾部分で、 ス イ ッ チはデー タ グ ラ ムの最終フ ィ ール ド を自身の frame-check-sequence (FCS; フ レーム チ ェ ッ ク シーケ ン ス) 計算 と 照合 し て、 パケ ッ ト に物理エ ラ ーやデー タ リ ン ク エ ラ ーがない こ と を確認 し ます。 エ ラ ーがなければ、 転送処理を実行 し ます。 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チは無効なパケ ッ ト を破棄 し ますが、 カ ッ ト スルー デバイ スは転送 し ます。 カ ッ ト スルー デバイ スでは、 パケ ッ ト を転送する前に FCS を評価する機 会がないためです。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 2 of 13 ホワ イ ト ペーパー 図1 ス ト ア ア ン ド フ ォ ワー ド ブ リ ッ ジ ま たはス イ ッ チに入る イ ーサネ ッ ト フ レーム (左から右へ) 自動バ ッ フ ァ リ ング フ レ ーム全体を い っ たん格納 し てか ら 転送する プ ロ セス では、 こ の動作方式の性質 と し て、 い く つ も のネ ッ ト ワーキング状況を処理で き ます。 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チが実行する入力バ ッ フ ァ リ ング処理では、10 Mbps を下限 と す る複数の イ ーサネ ッ ト 速度が混在す る状態に柔軟に対応で き ます。 た と えば、 1 Gbps イ ーサネ ッ ト ポー ト に着信 し た フ レームを 10 Gbps イ ン タ ー フ ェ イ スから 送出する こ と も 、 かな り 単純な方法で処理で き ます。 パケ ッ ト 全体を格納する アーキテ ク チ ャ のス イ ッ チなの で、 転送処理が簡略化 さ れます。 Access Control List (ACL; ア ク セス コ ン ト ロール リ ス ト ) ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チはパケ ッ ト 全体をバ ッ フ ァ に格納するので 2、 パケ ッ ト を ACL と 照合 し て評価する ための追加の ASIC ま たは FPGA コ ー ド を実行する必要があ り ま せん。 パケ ッ ト が既に存在する ため、 適切な部分を チ ェ ッ ク し て フ レームを許可または拒否 で き ます。 カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ン グの特性 こ こ では、 カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ングについて説明 し ます。 カ ッ ト スルー ス イ ッ チ ン グはス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グ と 比べてあま り 広 く 理解 さ れていない ため、 ス ト ア ア ン ド フ ォ ワー ド テ ク ノ ロ ジーよ り も詳 し く 説明 し ます。 無効パケ ッ ト カ ッ ト スルー ス イ ッ チ ン グでは、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グ と 異な り 、 無効な パケ ッ ト に フ ラ グ を設定 し ますが、 それを 破棄す る機会はあ り ません。 物理レ イ ヤま たは デー タ リ ン ク レ イヤのエ ラ ーを含むパケ ッ ト は、ネ ッ ト ワー ク の他のセグ メ ン ト に転送 さ れ ます。 受信側のホス ト では、 パケ ッ ト の FCS が無効 と さ れ、 パケ ッ ト が破棄 さ れます。 2 実際には、 多 く のス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グ実装で、 ヘ ッ ダ ー (Ethernet II フ レ ームの EtherType 値に基づ く 一定のサイ ズ) と パケ ッ ト 本体は メ モ リ 内で別の場所に格納 さ れます。 ただ し 、 パ ケ ッ ト 処理お よび フ ォ ワーデ ィ ン グ決定の観点か ら する と 、 パケ ッ ト の各部分がどのよ う な方法で ど こ に格納 さ れるかは意味を持ち ません。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 3 of 13 ホワ イ ト ペーパー カ ッ ト スルー転送の タ イ ミ ング 図 2 に示す と お り 、 カ ッ ト スルー ス イ ッ チは理論上、 デー タ パケ ッ ト の DMAC ア ド レ ス を 調べる と す ぐ に フ ォ ワーデ ィ ング決定を行 う こ と がで き ます。 パケ ッ ト の残 り 部分を待つ必 要はあ り ません。 ただ し 、 新 し い カ ッ ト スルー ス イ ッ チは この方法を採用 し ていない こ と があ り ます。 カ ッ ト スルー ス イ ッ チによ っ ては、 フ レームの内容から必要な情報を収集する ま で、 着信パケ ッ ト の解析を続けます。 こ れに よ り 、 よ り 高度な フ ォ ワーデ ィ ン グ決定を行 う こ と がで き ます。 こ れは、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チが過去 15 年にわた っ て提供 し て き た豊富なパ ケ ッ ト 処理機能に匹敵 し ます。 図2 カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ング : 理論上、 フ レームはス イ ッ チが DMAC ア ド レ ス を 受信する と 同時に転送 さ れますが、実際には、 さ ら に数バイ ト 読み取ら れてから転送が開始 さ れ ます。 EtherType フ ィ ール ド カ ッ ト スルー ス イ ッ チは、 フ ォ ワーデ ィ ン グ決定を す る際、 ス イ ッ チが調べる必要のあ る フ ィ ール ド の数 と は無関係に、 EtherType フ ィ ール ド の値に基づいて一定のバイ ト 数を取得 する こ と がで き ます。 た と えば、 着信パケ ッ ト が IPv4 ユニキ ャ ス ト デー タ グ ラ ムである と 認識す る と 、 イ ン タ ー フ ェ イ ス上の フ ィ ル タ リ ン グ設定の有無を調べ、 設定があ る場合は、 あ と 数マ イ ク ロ秒ま たは数ナ ノ 秒待 っ て、 IP ヘ ッ ダーお よ び ト ラ ン スポー ト レ イ ヤ ヘ ッ ダー (標準的な IPv4 ヘ ッ ダーの場合は 20 バイ ト 、 TCP セ ク シ ョ ンの場合は さ ら に 20 バイ ト 。 ト ラ ン スポー ト プ ロ ト コ ルが UDP の場合は 8 バイ ト ) を受信 し ます。 ト ラ フ ィ ッ ク の 照合先 と な る ACL がイ ン タ ー フ ェ イ スで設定 さ れていない場合は、 IP ヘ ッ ダーだけを待 っ てから 転送処理に移 り ます。 よ り 単純な ASIC 実装の場合は、設定に関係な く IPv4 ヘ ッ ダー および ト ラ ン スポー ト レ イヤ ヘ ッ ダー全体を取得する ため、 その時点ま でで合計 54 バイ ト を受信 し ます。 次に、 ACL や QoS (Quality-of-Service) 設定 と の照合を行 う ポ リ シー エ ン ジ ンによ っ てパケ ッ ト を チ ェ ッ ク で き ます。 待ち時間 最新の MAC コ ン ト ロー ラ、 ASIC、 および TCAM (Ternary Content Addressable Memory) に よ り 、 カ ッ ト スルー ス イ ッ チはパケ ッ ト ヘ ッ ダーの他の部分を調べる必要があ るかど う かをすばや く 判断で き ます。 先頭の 14 バイ ト (SMAC、 DMAC、 EtherType) を解析 し てか All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 4 of 13 ホワ イ ト ペーパー ら 、 た と えば IPv4 レ イヤ 3 ヘ ッ ダーおよびレ イヤ 4 ヘ ッ ダーに関する よ り 高度な機能を実 行す る ために追加の 40 バ イ ト を処理で き ます。 10 Gbps では、 IPv4 ヘ ッ ダー と ト ラ ン ス ポー ト ヘ ッ ダーの 40 バイ ト を受信する ために、約 100 ナ ノ 秒多 く かかる可能性があ り ます。 タ ス ク 間 (またはプ ロ セス間、 場合によ っ てはア プ リ ケーシ ョ ン間) の遅延要件のコ ン テキ ス ト では、 要件の範囲が広 く 、 大半のア プ リ ケーシ ョ ン では 10 マ イ ク ロ秒程度ま で要求 さ れるので、この追加待ち時間は無視で き ます。IP フ レームの ト ラ ン スポー ト レ イ ヤ ヘ ッ ダー ま で解析する場合の ASIC コ ー ド パスはそれほど複雑ではな く 、 遅延の増大も 深刻ではあ り ません。 カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ン グの利点 カ ッ ト スルー ス イ ッ チの主な利点は、パケ ッ ト の転送を開始する ま でにかかる時間(「ス イ ッ チの遅延」) が、 パケ ッ ト サイ ズに関係な く 数マ イ ク ロ秒程度である と い う こ と です。 9,000 バイ ト のフ レームを使用する ア プ リ ケーシ ョ ンの場合、カ ッ ト スルー ス イ ッ チがフ レームを 転送する ま での時間は (そのデー タ グ ラ ムについて適切な判断である と 仮定 し て) 、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ よ り も 数マ イ ク ロ秒~数 ミ リ 秒早 く な り ます (10 Gbps イ ーサ ネ ッ ト の場合は数マ イ ク ロ秒)。 また、 カ ッ ト スルー ス イ ッ チは、 10 マ イ ク ロ秒未満のプ ロ セス間遅延が要求 さ れる きわめ て要件の厳 し い high-performance computing (HPC; ハイパフ ォ ーマ ン ス コ ン ピ ュ ーテ ィ ン グ) ア プ リ ケーシ ョ ンに向いています。 ただ し 、 状況によ っ ては、 カ ッ ト スルー ス イ ッ チの利点が失われる場合も あ り ます。 ウ ィ ン ド ウ化 さ れたプ ロ ト コ ル と 応答時間の増加 カ ッ ト スルー方式を利用で き る場合であ っ て も 、 ウ ィ ン ド ウ化 さ れた プ ロ ト コ ル (TCP な ど) ではエ ン ド ツーエ ン ド の応答時間が増加する可能性があ り 、 カ ッ ト スルー ス イ ッ チ ング の低遅延効果が相殺 さ れて、ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チの遅延 と 実質的に変わら な く な り ます。 ユーザが体感する ア プ リ ケーシ ョ ン応答時間 ほ と んどの企業環境では、 デー タ セ ン タ ーを含め、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ または カ ッ ト スルー ス イ ッ チのど ち らが使用 さ れていて も、ユーザが応答時間の違いに気が付 く こ と はあ り ません。 た と えば、 サーバのフ ァ イルを要求するユーザが (FTP や HTTP で) フ ァ イルの受信開始が 数百マ イ ク ロ秒遅れたかど う かに気が付 く こ と はあ り ません。 また、 ほ と んどのア プ リ ケー シ ョ ンのエ ン ド ツーエ ン ド 遅延は数十 ミ リ 秒の範囲です。 た と えば、 カ ッ ト スルーまたはス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ で約 20 ミ リ 秒のア プ リ ケーシ ョ ン遅延が発生 し てい る場 合、 ス イ ッ チ自体の遅延が 20 マ イ ク ロ秒であれば (ア プ リ ケーシ ョ ン遅延の 1000 分の 1)、 無視する こ と がで き ます。 よ り 多 く のフ ィ ール ド のチ ェ ッ ク ス イ ッ チがカ ッ ト スルーおよびス ト ア ア ン ド フ ォ ワー ド の 「動作モー ド 」 を備えている と は 限 り ません。 前述の と お り 、 カ ッ ト スルー ス イ ッ チは通常、 着信パケ ッ ト の タ イ プに応 じ て 一定のバイ ト 数を受信 し てから 、 フ ォ ワーデ ィ ング決定を行います。 設定、 速度の違い、 輻 輳、 または他の条件に応 じ てモー ド を切 り 替え る こ と は し ません。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 5 of 13 ホワ イ ト ペーパー た と えば、 IPv4 TCP ポー ト が特定の範囲にあるパケ ッ ト を許可または拒否する設定の場合、 カ ッ ト スルー ス イ ッ チは 54 バイ ト 分調べてから フ ォ ワーデ ィ ング決定を行います。非 IP パ ケ ッ ト では、 フ レーム先頭の 16 バイ ト を受信する場合があ り ます。 こ れは、 type-of-service (ToS; サービ ス タ イ プ) バイ ト 内の IP 優先ビ ッ ト または differentiated services code point (DSCP; DiffServ コ ー ド ポ イ ン ト ) ビ ッ ト に基づいて何ら かの QoS ポ リ シーが設定 さ れて いる場合です。 図 3 に、 イ ーサネ ッ ト ARPA フ レーム内の標準的な IPv4 パケ ッ ト 構造を示 し ます。 カ ッ ト スルー ス イ ッ チは、 イ ーサネ ッ ト ヘ ッ ダーから 54 バイ ト 分を読み取 り ます (プ リ ア ン ブル の 8 バイ ト はカ ウン ト し ません。 この部分の役割は ト ラ ン シーバのウ ェ イ ク ア ッ プおよび フ レーム到達の通知のみです)。 そ し て、 ベン ダーの設計によ っ ては、 IPv4 ヘ ッ ダー内の関連 フ ィ ール ド に対 し てポ リ シー エ ン ジ ン を実行 し て、 TCP 宛先ポー ト が ACL に一致 し ている かど う かや、 送信元 IP ア ド レ スが ACL の範囲に収ま っ てい るかど う かな ど を判断 し ます。 図3 カ ッ ト スルー フ ォ ワーデ ィ ング決定は、 適切な決定のために必要なバイ ト 数を ス イ ッ チが受信 する と す ぐ に実行 マルチパス分散 一部の高機能レ イヤ 2 ス イ ッ チでは、 送信元および宛先 MAC ア ド レ ス以外のフ ィ ール ド を 使用 し て、 PortChannel を通 し てパケ ッ ト を送信する際の物理イ ン タ ー フ ェ イ ス を決定 し ま す。 カ ッ ト スルー ス イ ッ チは、 SMAC お よび DMAC 値のみ、 または IP お よび ト ラ ン スポー ト ヘ ッ ダーのみを取得 し てハ ッ シ ュ値を生成 し 、 こ の値に基づいて、 PortChannel を通 し て フ レームを転送する物理イ ン タ ー フ ェ イ ス を決定 し ます。 特定のス イ ッ チにおける PortChannel サポー ト のレ ベルを把握する こ と は重要です。 適切に 設計 さ れた カ ッ ト スルー ス イ ッ チであれば、 IP ア ド レ ス と ト ラ ン スポー ト レ イヤのポー ト 番号を利用 し て、 PortChannel 全体でのパケ ッ ト の分散を よ り 柔軟に行 う こ と がで き ます。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 6 of 13 ホワ イ ト ペーパー IP ACL 適切に設計 さ れた カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チは、 ACL をサポー ト し 、 送信元およ び宛先 IP ア ド レ ス と 、送信元および宛先 TCP/UDP ポー ト 番号に基づいてパケ ッ ト を許可ま たは拒否 し ます。 ス イ ッ チはレ イヤ 2 で動作 し ますが、 OSI (Open System Interconnection) プ ロ ト コ ル ス タ ッ クのレ イ ヤ 3 およびレ イ ヤ 4 に基づいてパケ ッ ト を フ ィ ル タ リ ングで き ます。 ASIC の場合は、 数ナ ノ 秒の間にパケ ッ ト を解析 し て数多 く の命令を並列処理ま たはパイ プ ラ イ ン 処理で き る ので、 特定の イ ン タ ー フ ェ イ ス で入力ま たは出力 ACL を 適用 し て も パ フ ォ ーマ ン スの低下は発生 し ません。実際に、よ り 柔軟で単純な ASIC コ ー ド パスでは、IPv4 または IPv6 パケ ッ ト は一定のバイ ト 数がポ リ シー エ ン ジ ンに送信 さ れて、すべての ACL 設 定の結果が非常に短い時間で評価 さ れます。 ACL の有無にかかわら ず、 また、 構成に PortChannel が含まれるかど う かにかかわら ず、 パ ケ ッ ト サイ ズが数千バイ ト ある場合は、カ ッ ト スルー ス イ ッ チ ングの方がス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グ よ り も 遅延上の優位性があ り ます。 パケ ッ ト サイ ズが数千バイ ト に満 たない場合、 カ ッ ト スルー ス イ ッ チ ン グ と ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グは非常に 似通っ たパフ ォ ーマ ン ス特性を示す可能性があ り ます。 イ ーサネ ッ ト の速度 ス イ ッ チに フ ァ ブ リ ッ ク アーキテ ク チ ャが採用 さ れている場合、 1 Gbps で動作するポー ト はフ ァ ブ リ ッ ク と 比較 し て低速である と 見な さ れます。 フ ァ ブ リ ッ クは、それよ り も 高速に、 通常はワ イ ヤ レ ー ト でい く つ も の イ ン タ ー フ ェ イ ス を処理する こ と が前提にな っ てい る た めです。 また、 適切に設計 さ れたス イ ッ チ フ ァ ブ リ ッ ク には 「ス ピー ド ア ッ プ」 機能が組み 込まれてお り 、 こ れに よ っ て競合を軽減 し 、 内部ス イ ッ チ ヘ ッ ダーに対応 し ます。 た と え ば、 ス イ ッ チ フ ァ ブ リ ッ ク が 12 Gbps で動作 し ている場合、 それよ り も遅い 1 Gbps の入力 ポー ト では、 通常、 着信フ レームをバ ッ フ ァ に入れてから、 フ ァ ブ リ ッ ク 全体のスケジ ュ ー リ ングによ っ て適切な宛先ポー ト に転送 し ます。 こ の状況の場合、 カ ッ ト スルー ス イ ッ チは ス ト ア ア ン ド フ ォ ワー ド デバイ スのよ う に機能 し ます。 さ ら に、 ス イ ッ チのフ レーム受信速度が転送速度よ り も 遅い場合、 ス イ ッ チはア ン ダー ラ ン の状態にな り 、 転送ポー ト はレ シーバが処理で き る以上の速度で動作する こ と にな り ます。 10 Gbps 出力ポー ト は、1 ビ ッ ト のデー タ を 1 Gbps 入力イ ン タ ー フ ェ イ スの 10 分の 1 の時 間で転送で き ます。 転送 イ ン タ ー フ ェ イ ス側では、 1 Gbps 入力イ ン タ ー フ ェ イ スか ら の次 のビ ッ ト が到達する前に、 9 ビ ッ ト 分の時間 (0.9 ナ ノ 秒) 待たなければな り ません。 カ ッ ト スルー ス イ ッ チ で出力側のビ ッ ト の 「ギ ャ ッ プ」 が生 じ ない よ う にす る ために、 低速な イ ーサネ ッ ト LAN か ら フ レ ームを受信する場合は、 フ レ ーム全体を受信 し てか ら 転送を行 う 必要があ り ます。 それ と は逆の状況で、 入力イ ン タ ー フ ェ イ スが出力ポー ト よ り も 高速な場合、 カ ッ ト スルー ス イ ッ チ ング を実行する ためには、 フ レームを フ ァ ブ リ ッ ク 全体でスケジ ュ ー リ ング し 、 必 要なバ ッ フ ァ リ ング を出力側で行います。 出力ポー ト の輻輳 カ ッ ト スルー ス イ ッ チでは、 輻輳の状態によ っ て も、 フ レーム全体を格納 し てから 転送を行 わなければな ら ない場合があ り ます。 カ ッ ト スルー ス イ ッ チ で特定のポー ト か ら 送出す る フ ォ ワーデ ィ ング決定を行っ た と き、 そのポー ト が他のイ ン タ ー フ ェ イ スから の着信フ レー ムの転送によ っ て ビ ジー状態だ っ た場合は、 転送対象のパケ ッ ト をバ ッ フ ァ に入れる必要が All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 7 of 13 ホワ イ ト ペーパー あ り ます。 バ ッ フ ァ リ ン グは、 カ ッ ト スルー ス イ ッ チのアーキテ ク チ ャ に応 じ て、 入力イ ン タ ー フ ェ イ スに関連付け ら れているバ ッ フ ァ またはフ ァ ブ リ ッ ク バ ッ フ ァ で行われます。 こ の場合、 フ レームの転送はカ ッ ト スルー方式ではあ り ません。 適切に設計 さ れたネ ッ ト ワー ク であれば、ク ラ イ ア ン ト から 届 く ア ク セス レ イ ヤ ト ラ フ ィ ッ ク がサーバへ向か う 出力ポー ト ま たは PortChannel の容量を超え る こ と は原則 と し てあ り ません。 ポー ト 競合の発生する可能性が高い場所は、 ネ ッ ト ワー ク のデ ィ ス ト リ ビ ュ ーシ ョ ン (アグ リ ゲーシ ョ ン) レ イヤです。 一般的に、 アグ リ ゲーシ ョ ン ス イ ッ チは多数の低速な ユーザ イ ン タ ー フ ェ イ ス を ネ ッ ト ワー ク コ アに接続 し ます。ネ ッ ト ワー ク コ アの設計には、 許容範囲内のオーバーサ ブ ス ク ラ イ ブ係数 を 組み込む必要があ り ま す。 こ の よ う な場合、 カ ッ ト スルー ス イ ッ チはス ト ア ア ン ド フ ォ ワー ド デバイ ス と 同 じ よ う に機能 し ます。 IEEE 802.1D ブ リ ッ ジ ング仕様 カ ッ ト スルー ス イ ッ チ ングで フ レームのチ ェ ッ クサムが検証 さ れない場合は、 IEEE 802.1D ブ リ ッ ジ ン グ仕様に違反す る可能性があ り ま すが、 実際的な影響は大 き く あ り ません。 エ ラ ーを含む フ レームは受信ホス ト によ っ て破棄 さ れるから です。ホス ト のネ ッ ト ワー ク イ ン タ ー フ ェ イ ス カ ー ド (NIC) ハー ド ウ ェ アが破棄機能を実行するので、 ホス ト の CPU 利用 率には影響 し ません (1980 年代には影響が及んでいま し た)。 また、 過去 5 年以内、 または それよ り も 前に設置 さ れた も ので も 、イ ーサネ ッ ト の新 し いワ イヤ リ ングおよび コ ネ ク タ イ ン フ ラ ス ト ラ ク チ ャ であれば、 破棄 し なければな ら ない無効なパケ ッ ト がホス ト によ っ て数 多 く 検出 さ れる こ と は考え ら れません。 ネ ッ ト ワー ク モ ニ タ リ ングの観点から見る と 、 レ イ ヤ 2 カ ッ ト スルー ス イ ッ チは、 検出 さ れた イ ーサネ ッ ト チ ェ ッ クサム エ ラ ーを追跡 し ている こ と にな り ます。 それに対 し て レ イ ヤ 3 IP ス イ ッ チ ン グは、 転送する必要のあ る各パケ ッ ト が変更 さ れる た め、 RFC 1812 で規定 さ れてい る IP ルーテ ィ ング要件に違反する こ と はあ り ません。 ルー タ はパケ ッ ト に対 し て必要な変更を行 う 必要があ り ます。 変更を行わなかっ た場合、 ルー タ か ら 送信 さ れる各 フ レ ームには IP レ ベルのエ ラ ーお よ び イ ーサネ ッ ト レ イ ヤ エ ラ ーが含ま れ、 エ ン ド ホス ト で破棄 さ れます。 カ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ン グの復活 1990 年代初頭、 「最良の」 ス イ ッ チ ング パラ ダ イ ムに関する議論が巻き起こ り 、 専門家た ち は 1 つの方式の も う 一方に対する優位性を強調 し ていま し た。 やがて、 注目はカ ッ ト スルー ス イ ッ チ ングから ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ングに移 り ま し た。 そ し て今、 シ ス コ は 強化 さ れた カ ッ ト スルー ス イ ッ チ ング モデルを復活 さ せよ う と し ています。 Cycle Redundancy Check (CRC; 巡回冗長検査) エ ラ ーの伝播 1990 年代、 企業のイ ーサネ ッ ト ネ ッ ト ワー ク では、 セグ メ ン ト を拡張する ためにハブ (ま たは リ ピー タ ) を使用 し た こ と で衝突の発生率が高ま り 、 結果的に フ ラ グ メ ン ト の発生も 増 え ま し た。 さ ら に、 イ ーサネ ッ ト コ ネ ク タ 、 ケーブル配線イ ン フ ラ ス ト ラ ク チ ャ、 NIC ハー ド ウ ェ ア で品質上およびエ ン ジ ニア リ ング上の問題が発生 し た結果、 半二重接続で多 く の無 効パケ ッ ト が発生 し ま し た。ハブ と 同様に カ ッ ト スルー ス イ ッ チ も そのよ う な無効パケ ッ ト を転送 し 、 CRC 問題を深刻化 さ せていま し た。 また、 ホスト ま たはホスト グループ 宛てのパケッ ト はレ シーバによ っ て処理さ れ、 その際に 行われる ソ フ ト ウェ ア割り 込みによ っ て宛先ホスト のプ ロ セッ サ パフ ォ ーマン スが影響を 受 けていたため、 パケッ ト にチェ ッ ク サム エラ ーが含ま れる 場合は、 ホスト の CPU 利用率が 増大し 、場合によ っ てはホスト 上のアプ リ ケーショ ン パフ ォ ーマン スにも 影響し ていま し た。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 8 of 13 ホワ イ ト ペーパー 機能パ リ テ ィ 1990 年代の中盤から 後半にかけて、 企業は、 第 1 世代のカ ッ ト スルー ス イ ッ チの限ら れた 機能では満足 し ていませんで し た。 よ り 高度な機能が提供 さ れる限 り は、 ど ち ら のス イ ッ チ ング パ ラ ダ イム も前向き に検討する姿勢を見せていま し た。 企業がス イ ッ チに求めていたのは、 ACL 機能、 QoS 機能、 Cisco EtherChannel® における一 層の細分化、 そ し て PortChannel 機能で し た。 当時は ASIC および FPGA に制限があ っ たた め、 カ ッ ト スルー ス イ ッ チ ン グの開発者た ちは、 こ れらの高度な レ イ ヤ 2 機能の組み込みに おいて大き な課題を抱えていま し た。ネ ッ ト ワーキング業界はカ ッ ト スルー ス イ ッ チ ングか ら 遠ざか り ま し た。 企業がよ り 多 く の機能を求める よ う にな っ た結果、 こ の転送方式が さ ら に複雑に3 な っ たから です。 こ の複雑 さ の増大は、 遅延お よびジ ッ タ の一貫性の面での進歩 で相殺する こ と はで き ませんで し た。 また、 ASIC および FPGA が改善 さ れた こ と で、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チの遅延特 性はカ ッ ト スルー ス イ ッ チのそれ と あま り 変わら な く な り ま し た。 こ のよ う な理由に よ り 、 カ ッ ト スルー ス イ ッ チ ン グは徐々に姿を消 し 、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チがイ ーサネ ッ ト の世界で標準にな り ま し た。 シ ス コ がカ ッ ト スルー イ ーサネ ッ ト ス イ ッ チ ン グを復活 さ せた理由 1980 年代および 1990 年代、ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チは、余裕を持っ てア プ リ ケー シ ョ ン、 ホス ト OS、 および NIC の要件を満たす こ と がで き ま し たが、 時代は変わ り 、 今日 のデー タ セ ン タ ー では カ ッ ト スルー ス イ ッ チ ン グの低遅延性の恩恵 を 受け る ア プ リ ケー シ ョ ンが多 く な り ま し た。 それ以外のア プ リ ケーシ ョ ンに と っ て も、 カ ッ ト スルー ス イ ッ チ ングには、 パケ ッ ト サイ ズに関係のない一貫性のある配信 と い う メ リ ッ ト があ り ます。 カ ッ ト スルー ス イ ッ チ ン グお よ び低遅延ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ ン グの実装にお け る シ ス コ の数年間にわた る成功体験 と 、 ASIC 設計におけ る柔軟性 と パ フ ォ ーマ ン スの進 歩 と が相ま っ て、 1990 年代前半当時よ り も さ ら に高度な カ ッ ト スルー ス イ ッ チ ン グ機能が 実現 し ま し た。 た と えば、 最新のカ ッ ト スルー ス イ ッ チには PortChannel での負荷分散を よ り 効果的に行 う ための機能が備わっ てお り 、パケ ッ ト 深部の フ ィ ール ド に基づいてデー タ パ ケ ッ ト を許可または拒否 し ます (た と えば、 IP ア ド レ スおよび TCP/UDP ポー ト 番号を使用 する IP ACL があ り ます。以前は、IP ACL をハー ド ウ ェ アで実装 し て カ ッ ト スルー フ ォ ワー デ ィ ング を行 う こ と は困難で し た)。 ま た、 シ ス コ ス イ ッ チ では、 virtual output queue (VOQ; 仮想出力キ ュ ー) の機能に よ り 、 head-of-line (HOL; ヘ ッ ド オブ ラ イ ン) ブ ロ ッ キング を軽減で き ます。 VOQ が実装 さ れてい れば、 使用可能な出力ポー ト から ホス ト 宛てに送出 さ れるパケ ッ ト は、 HOL パケ ッ ト がスケ ジ ュ ールによ っ て送出 さ れる ま で待機する必要がな く な り ます。 こ れら の要因を背景に、 シ ス コ は Cisco Nexus 5000 シ リ ーズ ス イ ッ チ を発表する こ と がで き ま し た。 こ のス イ ッ チは、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チに比肩する機能を備えた、 低 遅延のカ ッ ト スルー ス イ ッ チです。 3 カ ッ ト スルー ス イ ッ チ ングに関する セ ク シ ョ ン で説明 し た と お り 、複雑 さ は主に、両方の タ イ プのイ ー サネ ッ ト ス イ ッ チ ング を実行 し なければな ら ない こ と に起因 し ます。 カ ッ ト スルー ス イ ッ チは、 あ る条 件下ではス ト ア ア ン ド フ ォ ワー ド デバイ スのよ う に動作 し 、 別の条件下では 2 つのパラ ダ イ ムの中間的 な動作を行います。 出力ポー ト で輻輳が発生 し てい る と きは、 パケ ッ ト 全体を い っ たん格納 し 、 その後 で出力イ ン タ ー フ ェ イ スか ら スケジ ュ ール送出する必要があ り ます。 し たが っ て、 カ ッ ト スルー ス イ ッ チのソ フ ト ウ ェ ア と ハー ド ウ ェ アは、 ス ト ア ア ン ド フ ォ ワー ド ス イ ッ チの ものよ り も複雑にな る傾向が あ り ま し た。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 9 of 13 ホワ イ ト ペーパー 今日のデー タ セ ン タ ーにおけ る カ ッ ト スルー ス イ ッ チ ン グ 前述の と お り 、 ASIC の機能 と パ フ ォ ーマ ン ス特性の進歩に よ り 、 さ ら に高度な機能を備え た カ ッ ト スルー ス イ ッ チ を復活する こ と がで き ま し た。 ア プ リ ケーシ ョ ン開発が進歩 し 、 オペ レーテ ィ ン グ シ ス テム と NIC の機能が強化 さ れた こ と で、 すべての必要条件が揃い、 ア プ リ ケーシ ョ ン間または タ ス ク 間でのパケ ッ ト 処理時間 を 10 マ イ ク ロ秒未満に短縮する こ と が可能にな り ま し た。 RDMA (Remote Direct Memory Access) 4 やホス ト OS のカ ーネル バイパス 5 な どのツールは、 一部の企業ア プ リ ケーシ ョ ン環境で確実な効果を発揮 し ます。 具体的には、 遅延時間が約 2、 3 マ イ ク ロ秒のカ ッ ト ス ルー ス イ ッ チの機能およびパフ ォ ーマ ン ス特性を活用で き る環境です。 低遅延特性を備えた イ ーサネ ッ ト ス イ ッ チは、 HPC 環境において特に重要です。 遅延要件 と ハイパフ ォ ーマ ン ス コ ン ピ ュ ーテ ィ ング HPC はテ ク ニ カル コ ン ピ ュ ーテ ィ ング と し て も 知ら れ、 コ モデ ィ テ ィ サーバを ク ラ ス タ 化 し て、 エ ン ジニア リ ング、 製造、 研究、 およびデー タ マ イ ニ ング用ア プ リ ケーシ ョ ンのため の大規模な仮想マシ ン を形成 し ます。 HPC 設計は、 並列処理アルゴ リ ズムおよび ソ フ ト ウ ェ アの開発に利用 さ れます。 使用する プ ログ ラ ムは小 さ な コ ー ド 断片に分割で き、 それを複数のサーバに分散する こ と で、 各コ ー ド 断片を同時に実行で き ます。 こ のコ ン ピ ュ ーテ ィ ング パラ ダ イムでは、 タ ス ク と デー タ を個 別のサブ タ ス ク に分割 し 、 複数のプ ロ セ ッ サに分散 し ます。 並列 コ ン ピ ュ ーテ ィ ングの中核は メ ッ セージ パ ッ シ ングであ り 、 こ れによ っ て各プ ロ セスは 情報を交換で き ます。 デー タ は計算のために個々のプ ロ セ ッ サに分散 さ れ、 その後、 各計算 結果がま と め ら れて最終結果が算出 さ れます。 通常、 本来の意味での HPC を行 う ためには、 ア プ リ ケーシ ョ ン間の遅延特性が 10 マ イ ク ロ 秒前後である必要があ り ます。遅延が 3 マ イ ク ロ秒の適切に設計 さ れた カ ッ ト スルー レ イヤ 2 ス イ ッ チおよび一部のス ト ア ア ン ド フ ォ ワー ド レ イヤ 2 ス イ ッ チは、 こ の要件を満たす こ と がで き ます。 環境によ っ ては、 エ ン ド ツーエ ン ド 遅延が通常 2 マ イ ク ロ秒以内 と い う 超低遅延要件のア プ リ ケーシ ョ ン を使用する こ と があ り ます。 こ のよ う な特殊な状況では、 InfiniBand テ ク ノ ロ ジーを検討 し ます。 こ のテ ク ノ ロ ジーは実稼働ネ ッ ト ワー ク で使用 さ れてお り 、 非常に厳 し いア プ リ ケーシ ョ ン要件を満た し ています。 HPC ア プ リ ケーシ ョ ンは次のいずれかのカ テ ゴ リ に分類 さ れます。 4 RDMA プ ロ ト コ ルは、 サーバ OS および NIC の実装です。 こ れに よ り 、 通信プ ロ セスが変更 さ れ、 実 行 さ れるほ と んどの作業が OS カ ーネルではな く ネ ッ ト ワーキン グ ハー ド ウ ェ ア で処理 さ れます。 基本 的にすべてのサーバ処理サイ クルが解放 さ れ、通信の代わ り にア プ リ ケーシ ョ ンに処理が集中 し ます。ま た、 RDMA プ ロ ト コ ルを使用する と 、 ある 1 つのサーバで稼働 し ている ア プ リ ケーシ ョ ンはネ ッ ト ワー ク を経由 し て別のサーバ上の メ モ リ にア ク セスで き、通信オーバーヘ ッ ド も最小限に抑え ら れます。ネ ッ ト ワー ク 遅延も わずか 5 マ イ ク ロ秒に短縮 さ れます。 対照的に、 RDMA プ ロ ト コ ルを使用 し ない従来の TCP/IP 通信では、 数十または数百マ イ ク ロ秒のネ ッ ト ワー ク遅延が発生 し ます。 HPC 環境内の各サーバ は、 低遅延ス イ ッ チ (理想的には) を介 し て同一ク ラ ス タ 内の他のサーバの メ モ リ にア ク セス で き ます。 5 カ ーネル バイパスがあれば、 ア プ リ ケーシ ョ ンはホス ト マ シ ンの OS カ ーネルをバイパス し てハー ド ウ ェ アに直接ア ク セスで き るので、 ア プ リ ケーシ ョ ン コ ン テキス ト の切 り 替えが大幅に削減 さ れます。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 10 of 13 ホワ イ ト ペーパー • 密結合ア プ リ ケーシ ョ ン : これらのア プ リ ケーシ ョ ンの特徴は、 コ ン ピ ュ ーテ ィ ング ノ ー ド 間でのプ ロ セ ッ サ間通信 (IPC) メ ッ セージ交換の多 さ にあ り ます。 密 結合ア プ リ ケーシ ョ ンの一部は、 遅延に対 し て非常に敏感 (2 ~ 10 マ イ ク ロ秒の 範囲) です。 • 疎結合ア プ リ ケーシ ョ ン : こ の カ テ ゴ リ のア プ リ ケーシ ョ ンの場合、 コ ン ピ ュ ー テ ィ ン グ ノ ー ド 間での IPC ト ラ フ ィ ッ ク は、 ほ と んどあるいはま っ た く 発生 し ま せん。 低遅延性は必要 と さ れません。 • パラ メ ト リ ッ ク実行ア プ リ ケーシ ョ ン : こ れら のア プ リ ケーシ ョ ンの場合、 IPC ト ラ フ ィ ッ クは発生せず、 遅延の影響は受けません。 密結合ア プ リ ケーシ ョ ンのカ テ ゴ リ では、 超低遅延特性を備えたス イ ッ チが必要です。 HPC を必要 と する企業は、 以下の業種および分野に存在 し ます。 • 石油 : 原油および天然ガスの探査 • 製造 : 自動車および航空宇宙 • バイ オサイ エ ン ス • 金融 : デー タ マ イ ニ ングおよびマーケ ッ ト モデ リ ング • 大学および政府関連の研究機関および研究所 • 気候および天気シ ミ ュ レーシ ョ ン : National Oceani c an d Atmosphe ric Administration (NOAA; 米国海洋大気庁)、 Weather Channel な ど 図 4 に、 複数の業界で使用 さ れている HPC ア プ リ ケーシ ョ ンの例を紹介 し ます。 図4 HPC ア プ リ ケーシ ョ ンの例 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 11 of 13 ホワ イ ト ペーパー ス イ ッ チ選択のためのその他の条件 デー タ セ ン タ ー、 特に HPC 環境における イ ーサネ ッ ト ス イ ッ チの遅延特性を確認する こ と は、 適切なス イ ッ チ ング プ ラ ッ ト フ ォ ームを選択する際の最初の重要なス テ ッ プ です。 イ ー サネ ッ ト ス イ ッ チ を選択する う えで重要なその他の条件を以下に簡単にま と めます。 • 機能 : ス イ ッ チ ン グ プ ラ ッ ト フ ォ ームの必要な機能を特定 し た ら、 検討対象のス イ ッ チ が機能上および運用上のすべての要件が満たす こ と 、およびパフ ォ ーマ ン スの低下 や遅延の増加が発生 し ない こ と を確認する必要があ り ます。 た と えば、 IGMPv3 (Internet Group Management Protocol Version 3) ス ヌ ーピ ン グの機能が必要な場合は、パフ ォ ーマ ン スの低下を伴 う こ と な く サポー ト さ れなけ ればな り ません。 同様に、 ス イ ッ チが PortChannel 全体に負荷を分散で き る よ う に IP ア ド レ スおよび TCP/UDP ポー ト 番号をサポー ト し ているかど う か、十分に調査 し て く だ さ い。 IP ア ド レ スや UDP/TCP ポー ト 番号のフ ィ ル タ リ ン グな ど、 MAC レ ベルの ACL を超え るパケ ッ ト フ ィ ル タ リ ングが必要にな る場合があ り ます。 高度な モ ニ タ リ ン グ ツ ールや ト ラ ブルシ ュ ー テ ィ ン グ ツ ールな どがベ ン ダーに よ っ てサポー ト さ れている こ と も 確認 し て く だ さ い。 た と えば、 ス イ ッ チ内部でパ ケ ッ ト をデバ ッ グする機能や、ラ イ ブ ネ ッ ト ワー ク でオン ラ イ ン状態にある ス イ ッ チのソ フ ト ウ ェ アおよびハー ド ウ ェ ア機能を チ ェ ッ ク する ツールがあ り ます。ハー ド ウ ェ アおよび ソ フ ト ウ ェ ア コ ンポーネ ン ト を監視 し て、 重要な シス テム イ ベン ト を電子 メ ールで通知する機能も 必要にな る場合があ り ます。 • パ フ ォ ーマ ン ス : 接続およびア プ リ ケーシ ョ ンの要件を満たすために、 ス イ ッ チは、 必要な機能構成 によ っ てすべてのポー ト でワ イヤレー ト のパフ ォ ーマ ン ス をサポー ト するか、 オー バーサブ ス ク ラ イ ブ し てパ フ ォ ーマ ン ス し き い値を下げる必要があ り ます。 後者 は、 パ フ ォ ーマ ン ス制限について理解が得られ、 その制限が許容範囲内である場合 に限 っ て実行可能な選択肢です。 • ポー ト 密度 : 必要最低限のス イ ッ チ で機能上お よ びパ フ ォ ーマ ン ス上の要件を コ ス ト 効率よ く 満たす こ と が重要です。 特に、 低遅延 HPC 環境では、 1 台のス イ ッ チ (理想的に は) に収容 さ れる複数のサーバでア プ リ ケーシ ョ ン を実行 し ます。 • コス ト : デー タ セ ン タ ーでのス イ ッ チの稼働お よ びサポー ト に要す る総 コ ス ト を考慮す る 必要があ り ます。 コ ス ト には、 ス イ ッ チ自体の価格だけでな く 、 エ ン ジニア リ ング ス タ ッ フや運用ス タ ッ フの ト レーニ ングにかかる経費も含める必要があ り ます。 ま た、事前対応型および事後対応型の高度な モニ タ リ ング ツールを利用で き るかど う かや、 発生 し た問題の ト ラ ブルシ ュ ーテ ィ ングおよび解決に要する時間を短縮する う えでのそれらのツールの全般的な効果について も考慮する必要があ り ます。 シ ス コ の低遅延レ イヤ 2 ス イ ッ チの例 Cisco Nexus 5000 シ リ ーズ ア ク セス レ イ ヤ ス イ ッ チは、 カ ッ ト スルー方式によ る低遅延単 一ス テージ フ ァ ブ リ ッ ク 実装の一例で、 超低遅延ア プ リ ケーシ ョ ン を除 く すべてのア プ リ ケーシ ョ ンの要件を満た し ます。 Cisco Nexus 5000 シ リ ーズでは、 VOQ を使用 し てポー ト 競合を最小限に抑えています。 All contents are Copyright © 1992-2008 Cisco Systems, Inc. All rights reserved. This document is Cisco Public Information. Page 12 of 13 ホワ イ ト ペーパー ほ と ん どの低遅延ア プ リ ケーシ ョ ンの要件 を 満たす も う 1 つのプ ラ ッ ト フ ォ ーム と し て、 Cisco Catalyst® 4900M ス イ ッ チがあ り ます。 こ れは、ス ト ア ア ン ド フ ォ ワー ド 方式のス イ ッ チ で、 デー タ セ ン タ ーのア ク セス レ イ ヤお よびデ ィ ス ト リ ビ ュ ーシ ョ ン レ イ ヤで使用 し ま す。 Cisco Catalyst 4900M では、 共有 メ モ リ アーキテ ク チ ャ と 共に、 超低遅延 ASIC 設計が 採用 さ れています。 ま とめ ほ と んどのデー タ セ ン タ ー ア プ リ ケーシ ョ ン環境では、 採用する イ ーサネ ッ ト ス イ ッ チの 種類を決定する際、 ス イ ッ チの低遅延特性だけではな く 、 機能、 パフ ォ ーマ ン ス、 ポー ト 密 度、 および イ ン ス ト ール と 運用に必要な真のコ ス ト を考慮する必要があ り ます。 一部のア プ リ ケーシ ョ ン環境では、 機能上の要件 と し て、 10 マ イ ク ロ秒未満のエ ン ド ツーエ ン ド 遅延に対応する こ と が求め ら れます。 そのよ う な環境の場合は、 カ ッ ト スルー ス イ ッ チ および特定ク ラ スのス ト ア ア ン ド フ ォ ワー ド ス イ ッ チ を使用する こ と で、RDMA や OS カ ー ネル バイパスな どの OS お よび NIC ツールを補完 し て、 低遅延ア プ リ ケーシ ョ ンの要件を 満たす こ と がで き ます。 カ ッ ト スルーお よびス ト ア ア ン ド フ ォ ワー ド LAN ス イ ッ チは、 ほ と んどのデー タ セ ン タ ー ネ ッ ト ワーキング環境に適 し ています。 ア プ リ ケーシ ョ ンに よ っ て 10 マ イ ク ロ秒未満の応 答時間が要求 さ れる一部の環境では、 低遅延イ ーサネ ッ ト または InfiniBand ス イ ッ チが適切 な選択肢です。 関連情報 : Cisco Nexus 5000 シ リ ーズ ス イ ッ チ : http://www.cisco.com/jp/go/nexus5000/ Cisco Catalyst 4900M ス イ ッ チ : http://www.cisco.com/web/JP/product/hs/switches/cat4900/cat4900m/index.html Cisco Catalyst 4948 ス イ ッ チ : http://www.cisco.com/web/JP/product/hs/switches/cat4900/cat4948/index.html ©2008 Cisco Systems, Inc. All rights reserved. Cisco、 Cisco Systems、 および Cisco Systems ロ ゴ は、 Cisco Systems, Inc. またはその関連会社の米国およびその他の一定の国における登録商標または商標です。 本書類またはウェブサイトに掲載されているその他の商標はそれぞれの権利者の財産です。 「パートナー」 または 「partner」 という用語の使用は Cisco と他社との間のパートナーシップ関係を意味するものではありません。 (0805R) この資料に記載された仕様は予告なく変更する場合があります。 シスコシステムズ合同会社 08.07 〒 107-6227 東京都港区赤坂 9-7-1 ミッドタウン ・ タワー http://www.cisco.com/jp お問い合わせ先 ( シスコ コンタクト センター ) http://www.cisco.com/jp/go/contactcenter 0120-092-255 ( 通話料無料 ) 電話受付時間 : 平日 10:00 ~ 12:00, 13:00 ~ 17:00 お問い合せ先