Comments
Description
Transcript
先進のサーマルコントロール: 省電力対策と環境全体の最適化
先進のサーマルコントロール: 省電力対策と環境全体の最適化 このデルテクニカルホワイトペーパーは、ユーザ環境に適応し、運用費の削減に 貢献するデルの温度制御技術について説明します。 Paul Artman Chris E. Peterson 先進のサーマルコントロール: 省電力対策と環境全体の最適化 目次 要旨 ....................................................................................................................................................................... 3 はじめに .................................................................................................................................................................. 3 先進のサーマルコントロール.................................................................................................................................. 4 サポートするサーバ環境 ......................................................................................................................................... 5 広がる温度の幅 .............................................................................................................................................. 5 音に敏感な場所にも設置可能なサーバ ........................................................................................................... 5 温度設定 .................................................................................................................................................................. 7 サーマルベースアルゴリズム ......................................................................................................................... 8 ユーザオプション ........................................................................................................................................... 9 まとめ ................................................................................................................................................................... 10 本書は、情報提供のみを目的に執筆されており、誤字脱字や技術上の誤りには責任を負いません。 本書の内容は執筆時現在のものであり、明示的、暗示的を問わず、いかなる内容も保証いたしません。 © 2012 Dell Inc. ©2012 デル株式会社 All rights reserved.(版権所有) デルとその関連会社は、誤字、脱字、誤植や、図、写真の誤りや不備について一切の責任を負いません。 Dell、DELL のロゴマーク、PowerEdge は、米国 Dell Inc. の商標です。Intel、インテル、Xeon は、アメリカ合 衆国およびその他の国におけるインテルコーポレーションおよび子会社の登録商標または商標です。本書では、 マークや名前を届け出た実在のもの、もしくは、その製品のいずれかを参照するため、その他の商標、商号を使 用している可能性があります。デルは、その他のマークや名称について、商標上の利権に対する要求に一切に応 じません。 2012 年 2 月 | Rev 1.0 ii 先進のサーマルコントロール: 省電力対策と環境全体の最適化 要旨 昨今のサーバに搭載されるサーマルコントロール (温度制御) は、お客様の導入環境で最高の効率性 を発揮すべく進化を遂げてきました。その成果は、機能セットの拡充、システムの省電力化、稼働音 の低減など、様々な形で現れており、また、サポートする温度域も最高 45°C (113°F) にまで拡張さ れています。こうしたサーマルコントロールの強化は、お客様に多大な制御能力をもたらし、使用環 境に応じたカスタマイズ設定も可能となりました。 本書は、全編を通してサーマルコントロールを取り上げています。サーマルコントロールとは、ファ ンのスピード管理とシステムの電源管理を通して、消費電力/エアフロー/稼働音を極力抑えながら、 システムの高信頼性を維持するアクティブな冷却管理テクノロジーのことです。 はじめに 最先端サーバテクノロジーの導入は、多くのデータセンターに立ちふさがる対応能力の壁を次々と打 破してきました。このような状況のなか、データセンター管理者や IT 担当者は、サーバの電力要件 に応じて適切な電源と冷却を確保するという課題に直面しています。また、データセンター以外の、 より音に敏感な場所に導入されるサーバ数も増えており、稼働音も課題の 1 つとなっています。 サーバの冷却に使われる電力とエアフローは、データセンター全体の消費電力量に大きな影響を与え 得るため、デルエンジニアは、冷却による電力消費を極力抑えるためのサーマル (温度/熱) ソリュー ション設計に力を入れてきました。さらに、システムの音響設計についても長年取り組んでおり、 サーバがユーザのすぐそばに設置され得るオフィス空間でも、快適にお使いいただけるタワー型サー バ構成をサポートしています。現世代の Dell™ PowerEdge™ サーバには、革新的なサーマルコント ロール、綿密に設計されたコンポーネントの配置と隔離、エアフロー管理、省電力ファンが組み込ま れているため、高い能力を発揮します。 以下に、デルのサーマルデザイン/コントロールが誇る画期的な強化点をいくつかご紹介します。 サーバ (電力、温度、構成) の情報量が一段と増えました。その結果、次が可能になります。 システム全体の電力を最小限に抑えます。たとえば、コンポーネントの冷却ニーズに応 じて、ファン電力の消費量を調整することができます。 ファンの回転速度とエアフローを低減します。 旧世代のサーバに比べて、音響パワーが下がります。 高度な電源管理を組み込んだことで、より広範な周辺温度に対応できるようになり、信頼性 や性能への影響を最小限に抑えることができます。 各種のツールが強化されたことから、お客様は、ニーズに合わせてシステムの温度管理をカ スタマイズすることができます。たとえば: サーマルコントロール設定がチューニングできるようになり、また、システム性能を優 先させる設定や、ワット性能比を優先する設定も選べるため、ニーズに合わせて最適化 できます。 ハイパワー PCI カードの使用時に供給エアフロー量を増やす、または、排気温度を下げ る目的で、ファンをスピードアップすることができます。 3 先進のサーマルコントロール: 省電力対策と環境全体の最適化 先進のサーマルコントロール デルは、現行の製品群に対しても、サーマルコントロールの革新を図り続けています。たとえば、シ ステムとコンポーネントの冷却要件をもっと的確に満たすため、サーマルコントロールに提供するリ アルタイムなコンポーネント別フィードバック量を格段に増やしました。 ハードディスクドライブ (HDD)、PERC (PowerEdge Expandable RAID Controller) バッテリ、PERC ROC (RAID on Chip、オンボード RAID のこと)、GPU (Graphics Processing Unit、画像処理装置)、 Select Network Adapter (セレクトネットワークアダプタ) に対しては、温度モニタリングが追加され たうえ、多くのデル製アドイン I/O カードからも、温度情報が出力されます。また、一部のシステム では、排気温度を個別に監視、報告、制御することも可能です。従来どおり、周辺温度とプロセッ サー/メモリ/ボード/電源装置/チップセットの温度も、サーマルコントロールへのインプット情報とし てモニタリングしています。 デルのサーマルコントロールが監視するのは温度だけではありません。システム電力も監視・制御の 対象となっており、さらに、各コンポーネントの電力モニタリング情報も、システム全体の電力情報 と共に、プロセッサー、メモリ、I/O、HDD サブシステムのサーマルコントロールに提供されます。 デルは、システム電力の制御能力を活用し、幅広い構成と運用環境にわたってコンポーネントの温度 要件が満たせるようにしています。典型的な動作環境で稼働している限り、コンポーネントの電力管 理が発動されることは稀ですが、システムがデルのサポート範囲を超えた温度で稼働していると、シ ステム電力のキャッピングが発動される可能性があります。これは、システムのアップタイムを確保 するためであり、また、データセンターの冷却設備の停止時に「ライドスルー」する (持ちこたえる) ための措置でもあります。 従来からプロセッサーの冷却は、負荷のかかる運用でシステムのサーマルコントロール対応に最も関 与するため、デルの設計は、その影響を最小限に抑えることを重視しています。デルは、プロセッ サー温度が仕様 から逸脱しないようにするため、サーマルコントロール実装の一環としてプロセッ 1 サーの電力と温度をモニタリングしています。これにより、負荷が集中する間も、システムの電力消 費と稼働音を最小限に抑えることができます。 システム全体の電力を最小限に抑えるという共通のゴールはあるものの、プロセッサーの冷却設定値 は、各サーバで個別にカスタマイズされています。たとえば、一部のシステムは、わずかなファン電 力でも、プロセッサーの温度を大きく変えられるように特別設計されています。Dell PowerEdge R620 および R720 では、このデル設計を存分に活かす [Dell Solution Optimized CPU Cooling] (CPU 冷却を最適化するデルソリューション) 設定が可能です。この設定では、システム全体の電力消費を 削減しながらも、ファン電力をわずかに上げることでプロセッサー温度を下げることができます。そ の他のシステムでは、プロセッサー温度を少々下げるのに、ファン電力の大幅な増加が必要です。こ れらのシステムでは、プロセッサー温度を、新しいインテル DTS 2.0 仕様 (インテル Xeon プロ ® ® ® セッサー E5 ファミリ向けに、より高い温度とより多くの電力消費を許す仕様) レベルまで下げる、 という対応が考えられます。もし、プロセッサーを仕様温度より若干下げて稼働させることができれ ば、ファン速度が抑えられると同時に、システムの高信頼性も維持でき、ひいては、システムの電力 消費と音響パワーレベルを低減することができます。これは、PowerEdge M620 および T620 で採用 されているアプローチです。 『CPU Monitoring With DTS/PECI』 Michael Berktold、Tian Tian 著 (Intel Inc.、2010 年) http://download.intel.com/design/intarch/papers/322683.pdf 1 4 先進のサーマルコントロール: 省電力対策と環境全体の最適化 サポートするサーバ環境 デルは、従来型のデータセンターはもちろん、最近増えてきた新しい導入モデル、たとえば、フレッ シュエア (外気冷却) データセンター、温度・湿度制御のできないリモートインストール、小売店舗/ バックルーム/オフィス環境にも対応するため、サポートする環境範囲を広げました。周辺温度の対 応範囲が拡張され、システムの音響パワーレベルを低減したことから、今や、多種多様な環境や過酷 な環境でもサーバが運用できるようになっています。 広がる温度の幅 デルは、現世代の Dell PowerEdge サーバ設計で温度の対応範囲を広げており、特定の構成とシステ ムでは -5°C ~ 45°C (23°F ~ 113°F) の動作温度をサポートします。これは、ASHRAE (米暖房冷凍 2 空調学会) が定義した最新の温度クラス仕様「A3」と「A4」に適合し、『EU Code of Conduct (欧州 連合 CoC)』 の『Best Practices for Data Centres』 (データセンターのベストプラクティス) にも採択 されています。デルが温度の対応範囲を広げたことで、特定のデータセンター環境ではコンプレッ サー式冷却の必要性を減らすことができ、場合によっては、完全撤廃も可能です 。さらに、狭い場 3 所や温度管理の難しい場所、たとえば製造現場や工場内の一区画にもサーバを設置できるようになり、 柔軟性が大きく広がっています。 広い温度に対応できるデルサーバの能力は、一連のサーバの長期テストと分析を経て開発されたもの です。このサーバ群テストは、南ヨーロッパ (南部イタリアまたはギリシャ) の非常に過酷な気候環 境で 7 年間運用した状況をシミューレーションしました。この長期テストには、夏を想定した高温多 湿や、冷たく乾燥した冬の空気を再現する低温低湿を含み、さらに、温度を周期的に変えて、日々の 移り変わりや季節の移り変わりも再現しています。デルは、最悪の条件下で各サーバの活用期間一杯 にテストすることで、潜在的な問題を洗い出し、設計に改良を加え、これらを解消していくことがで きました。 PowerEdge R720 など、外気冷却対応となっているデルサーバは、いずれも、最も過酷な外気温と湿 度仕様に基づくカスタム環境チャンバーでの確認テストを通します。さらに、デルは、信頼性プロセ スにおけるデル設計の一環として、サーバ内の全コンポーネントにディレーティング分析を行い、信 頼性を長期間維持するようにしています。ディレーティングでは、たとえば、最悪の環境と負荷条件 のもとでコンポーネントの温度と電圧をチェックし、どんな使用条件/環境条件であってもコンポー ネントがデータシートに記載されているレーティング (定格) 内に十分収まることを確認しています。 音に敏感な場所にも設置可能なサーバ 静かなサーバを重視するお客様にとって、現世代の Dell PowerEdge サーバなら、新たな選択肢が広 がります。デルは、特定の構成の音響性能に自ら新しい要件を課しました。ファンの回転速度は、 サーバのノイズレベルに最も影響するため 、現世代のファンは、旧世代に比べて最低基準スピード 4 がはるかに低くなっており、この最低速度で、デルの新しい音響要件と冷却要件を同時に満たすこと ができます。 2 http:/www.dell.com/freshair 3 『Chiller-less Facilities: They May be Closer Than You Think』 John Fitch、David Moss、Paul Artman 著 (Dell Inc.、2011 年) 4 『Dell Enterprise Acoustics』、Chris E. Peterson 著 (Dell, Inc.、2011 年): http://www.dell.com/downloads/global/products/pedge/en/acoustical-education-dell-enterprise-white-paper.pdf 5 先進のサーマルコントロール: 省電力対策と環境全体の最適化 また、HDD およびファン周辺の振動や騒音を抑える厳密な機械設計は、現世代にも引き継がれてい ます。デルは、ファンを他のサーバ内蔵部品から隔離することで、ファンの回転時にファンモーター が引き起こす振動と、そこから派生する雑音 (トーン、唸り、カタカタ音) を低減しています。HDD も記録媒体の回転と共に振動するため、デルでは、HDD への振動を抑えるだけでなく、HDD からの 振動も低減できるようにシャーシを設計しました。 このような努力が実り、現世代の PowerEdge サーバは、最も一般的に出荷される構成 (以下、「典 型構成」)、または、ローエンド構成のときに、稼働音が前世代からおよそ半減しています。たとえ ば、タワー型サーバ T620 の最小構成 は、静寂な図書館に十分匹敵するほど静かです。実際、現世 5 代のタワー型サーバはすべて、典型構成/ローエンド構成時に、オフィス環境のデスクトップ製品と 同程度の稼働音しか出ません。たとえラック型の R620 サーバや R720 サーバであっても、典型構成 とローエンド構成であれば、オフィス環境で十分お使いいただける静音設計となっています。 表 1 は、音の大きさを示す基準点と音響出力について、最新世代の PowerEdge T620 と前世代の PowerEdge T610 を比較したものです。このときのシステムは、いずれも最小構成となっています。 表 1. 音の大きさを示す基準点と音響出力の比較 5 最小ビンのプロセッサー、小容量 DIMM、PCI カードなし、1 x SATA HDD で構成 6 先進のサーマルコントロール: 省電力対策と環境全体の最適化 デルは製品設計工程の早い段階で音響と振動をモデリングし、どのような設計アプローチが効果的か 評価しています。次に、製品開発中では、構成ごとの新しい音響要件に適合しているか確認するため、 ISO7779 、ECMA-74 、ISO9296 、その他の標準に従いながら、デルが調整した半無響テストチャ 6 7 8 ンバーで音質と音響パワーレベルを測定します。 コンポーネントによっては、他より高い熱負荷を発生するものがあり、これらをインストールすると 冷却の必要性がはるかに高まるため、それがノイズの増大につながります。「ハイパフォーマンスな 部品は音響測定値が大きくなる」と思われるかもしれませんが、コンポーネントによっては音に対す る影響がそれほど顕著に現れません。ハイパワーな拡張カード (PERC、GPU、一部の特定な PCI カードなど) をインストールすると、ノイズレベルの上昇原因となります。また、ハイパワーなプロ セッサーも使用時に冷却の必要性が増えることから、ノイズレベルが上がります。しかし、T620 タ ワー型サーバは、GPU のインストール時、および、アイドル状態のとき、オープンなオフィスレイ アウトの音響レベルを保つように特別設計されています。 先に述べたとおり、HDD も雑音の発生源となりますが、そのレベルは、回転速度に大きく依存しま す。たとえば、15,000 回転の HDD は、これより低速な HDD よりはるかに (30% 以上) 大音量とな り、プロミネンスレシオ (突出した離散周波数音の割合) の高いトーンを発生します。また、HDD 数 が増えれば増えるほど、音も大きくなります。したがって、音に敏感な環境では、一台の 7,200 回転 SATA HDD 構成が最適な選択となります。 温度設定 お客様は、固有の導入、環境、使用ニーズに合わせて、BIOS のシステムプロファイル設定を調整す ることができます 。デフォルトでは、[Thermal Base Algorithm] (サーマルベースアルゴリズム) が 9 [Auto] (自動) に設定されており、これがお客様の選択した各システムプロファイルに反映されます。 しかし、[iDRAC Settings] (iDRAC 設定)→[Thermals] (温度) メニューにアクセスすれば、BIOS シス テムプロファイルから独立して、サーマルコントロールをカスタム設定することができます。図 1 は、 iDRAC 用温度設定メニューの画面例です。 ISO 7779 第 3 版、Acoustics - Measurement of airborne noise emitted by information technology and telecommunications equipment, Geneva: International Organization for Standardization、2010 年 6 ECMA-74 第 11 版、Measurement of Airborne Noise Emitted by Information Technology and Telecommunications Equipment, Geneva: ECMA International、2010 年 7 8 ISO 9296:1988 (E) Acoustics - Declared noise emission values of computer and business equipment, Geneva: International Organization for Standardization、1988 年 9 『Power Efficiency “How To” for 12G PowerEdge Server Portfolio』、John Jenne 著 (Dell Inc.、2012 年) 7 先進のサーマルコントロール: 省電力対策と環境全体の最適化 図 1. [iDRAC Settings] の [Thermal] メニュー サーマルベースアルゴリズム [iDRAC Settings] の [Thermals] メニューから選択できるのは、[Auto] (自動)、[Maximum performance (Performance optimized)] (最大性能=パフォーマンスを最優先)、[Minimum power (Performance per watt optimized)] (最小電力=ワット性能比を最優先) です。[Auto] オプションは、BIOS システムプロ ファイルへのデフォルト設定となります。図 2 は、[Thermal Base Algorithm] メニューの各オプショ ンを表示した画面例です。 プロセッサーとメモリの冷却という観点から、[Maximum performance] オプションは、[Minimum power] オプションよりアグレッシブな温度設定となります。この設定のメリットは、厳しい温度制 御を避けることで性能低下を最小限に抑えられることであり、デメリットは、ファン電力が増えるこ とです。一方、[Minimum power] 設定は、コンポーネントの冷却要件、パフォーマンス、システム電 源の制約間でバランスを取ります。このどちらの設定でも、周辺温度が 18°C~30°C (64.4°F~86°F) に収まる一般的なデータセンターであれば、温度制御による性能低下はまず起こりません。しかし、 パフォーマンスを特に重視し、システム運用中に温度上昇も起こり得る環境であれば、[Maximum performance] 設定で性能向上が望めます。 8 先進のサーマルコントロール: 省電力対策と環境全体の最適化 図 2. iDRAC の [Thermal Base Algorithm] 設定画面 ユーザオプション [iDRAC Setting]→[Thermal] メニューの [User option] (ユーザオプション) では、[Default] (デフォル ト)、[Maximum Exhaust Temperature] (最大排気温度)、[Fan Speed Offset] (ファンスピードオフセッ ト) のいずれかから選択できます。これらは互いに排他的な設定となるため、このメニューからは 1 つのオプションしか選択できません。[Default] 設定は、温度設定に何ら影響を与えないのでご注意く ださい。 [Maximum Air Exhaust Temperature] 設定 最も効率の良いサーマル設計を追求すると、多くの場合、システムファンの速度を最小限に設定して も、温度および信頼性要件を満たせる設計に行き着きます。ファンのスピードを抑えることができれ ば、システムの電力と、サーバが消費するデータセンターのエアフロー量が削減できるうえ、CRAC (Computer Room Air Conditioner、コンピュータルーム用空調) の冷却コイルとの温度差が広がるこ とから、CRAC の稼働効率も高められます。 9 先進のサーマルコントロール: 省電力対策と環境全体の最適化 しかし、一部の環境では、この効率性の良さゆえに (排気温度が高めになるために)、PDU やスイッ チなどの隣接する機器とパフォーマンスに影響を与える可能性もあります。このような状況に対応す るため開発されたのが、[Maximum Air Exhaust Temperature] 設定です。本オプションは R600 クラ ス以上の Dell PowerEdge 製品でご利用いただける業界初のサーマルコントロール設定であり、お客 様は、排気温度を最大 50°C (122°F) までに制御することができます。この機能は、個別に用意され た複数の排気温度センサ、ファンのスピードコントロール、電源管理機能を連動させて、サーバ背後 の最大排気温度が 50°C 以内に収まるよう調整します。 [Fan Speed Offset] 設定メニュー 多くの現行デルサーバには、デルの温度制御アルゴリズムの演算結果に応じて、ファンの回転速度を 変えるファンスピードオフセット機能が取り入れられています。[Fan Speed] (ファンスピード) 設定 メニューからは、[Low Fan Speed Offset] と [High Fan Speed Offset] が選択可能です。[Low Fan Speed Offset] はオフセット時にファンの速度が中程度まで上がり、[High Fan Speed Offset] はフル スピードに近付きます。この設定は、カスタムハイパワー PCIe 用に動作温度範囲を広く取りたいと き、または、隣接する機器 (PDU やスイッチなど) のためにシステムの排気温度を下げたいときに有 用です。 まとめ 現世代の Dell PowerEdge サーバで採用されているサーマルコントロール設計は、新しい運用環境、 たとえば周辺温度を最高 45°C までサポートするような環境でも、的確に最適化することができます。 こうした先進の温度制御技術は、コンポーネントの温度および電力測定能力が強化されており、さら に、サブシステム電力の管理という新機能も追加されています。その結果、個々の構成や用途に合わ せたサーマルコントロール設定が可能になり、ひいては、システムの節電効果が向上し、静かなサー バ運用も可能になります。 また、飛躍的に進化したデルの設計技術により、サーバシステムの温度制御をお客様の導入ニーズに 合わせてきめ細かくチューニングすることもできます。たとえば、各種のサーマルコントロール設定 が調整可能となっており、性能あるいは省電力を重視した最適化オプションや、冷却ニーズが高まっ たときにファンをスピードアップする設定が選択可能です。 詳細は: 最新世代の Dell PowerEdge サーバの全容は、Dell.com をご覧ください。 10