Comments
Description
Transcript
多数台ディスク環境でのデータベース処理実行時における ストレージ省
DEIM Forum2015 C3-1 多数台ディスク環境でのデータベース処理実行時における ストレージ省電力手法の提案と評価 飯村 奈穂† 西川 記史†† 中野美由紀††† 小口 正人† † お茶の水女子大学 〒 112-8610 東京都文京区大塚 2-1-1 †† 日立製作所 横浜研究所 〒 224-0817 神奈川県横浜市戸塚区吉田町 292 番地 ††† 芝浦工業大学 〒 135-8548 東京都江東区豊洲 3-7-5 E-mail: †[email protected], ††[email protected], †††[email protected], ††††[email protected] あらまし 近年デジタル情報量は爆発的に増加しており,データセンタの大規模化が進んでいる.これにより,デー タセンタ内の管理運用コストも増加しており,その中でも電力コストの増加は見過ごせないものとなっている.そこ で本研究ではデータセンタの省電力化に向け,データセンタの電力消費の中で一定の割合を占めるストレージに注目 し,アプリケーションの性能劣化を最小限に抑えつつ,消費電力を抑えることを研究目的とする.本稿では業界標準 のデータベースベンチマークである TPC-H を利用し,TPC-H 実行時におけるストレージの省電力化に向けて,実行 時のシステム性能と消費電力量の解析を行った.さらに,大規模システム環境を想定し,TPC-H 実行時のシステム性 能評価,および本研究の提案手法のデータ配置制御手法の評価を多数台ディスク環境にて行った. キーワード 省電力,ストレージ,データインテンシブアプリケーション,性能評価,TPC-H The Proposal and Evaluation of Storage Power Saving Method in Run-Time Database Processing in Many HDDs Environment Naho IIMURA† , Norifumi NISHIKAWA†† , Miyuki NAKANO††† , and Masato OGUCHI† † Ochanomizu University 2-1-1 Otsuka, Bunkyou-ku, Tokyo, 112-8610 JAPAN †† Hitachi,Ltd. Yokohama Research Laboratory 292, Yoshida-cho, Totsuka-ku, Yokohama, 224-0817 JAPAN ††† Shibaura Institute of Technology 3-7-5 Toyosu, Koto-ku, Tokyo, 135-8548 JAPAN E-mail: †[email protected], ††[email protected], †††[email protected], ††††[email protected] 1. は じ め に データセンタのエネルギー消費量は 2050 年には 2010 年度の 日本の発電電力量の約 3 倍になると予測されており,社会全体 近年デジタル情報量は爆発的に急増しており,今後 10 年で での節電が求められる中でデータセンタの消費電力を削減する 約 44 倍になるとも言われている.これに伴いストレージの出 ことは急務になっている [1]. また,データセンタの消費電力割 荷容量も急増していることからストレージの管理運用コストは 合の中でストレージの消費電力比率は約 13%を占めていること 見過ごせないものとなっており,データの効率的管理に注目が から,ストレージの消費電力を削減することでデータセンタ全 集まっている. 体の省電力化が可能であると言える. —1— ストレージの省電力化を考える場合,読み書きが行われてい 案されてきた [8]- [10].特に [9] では,アプリケーション協調型 ないハードディスクをスタンバイ状態へ移行させれば,消費電 のストレージ省電力システムの構築を目指し,データインテン 力を削減する事ができる.しかしスタンバイ状態となっている シブアプリケーションの I/O 挙動特性を解析,評価して, スト ハードディスクに対しアクセスが行われると,まずアクティブ レージ電力制御モデルの提案を行っている.これらの研究では, 状態へ移行してから読み書きが行われるため,アプリケーショ 提案手法におけるストレージの消費電力削減を考慮した上で, ンの実行性能が劣化する.さらに,アクティブ状態とスタンバ アプリケーションの性能評価を行っている. イ状態間の移行には,アクティブ状態を継続するよりも多くの そこで,本研究では,データインテンシブアプリケーション 電力が消費されるため,スタンバイ状態への移行が頻繁に行わ の SLA(Service Level Agreement) に注目し,アプリケーション れると,かえって電力消費量が増大してしまう.従ってスタン の性能劣化を最小限に抑えつつ,ストレージの消費電力を削減 バイ状態への移行は適切なタイミングで行われる必要があり, し,性能評価を行っていくことを研究方針とする. その判断が省電力化実現のポイントとなる. これまでの研究で,データ配置制御によるストレージ省電力 データベース実行時のストレージ省電力化を考える場合,い 化が有効であるということが示されている [11].しかし,[11] の くつかの階層におけるアプローチが存在する.まず上位層のア 環境では評価に使用している HDD の台数や容量は少なく,大 プリケーションにおける判断に基づく省電力化が考えられる. 規模なデータを想定しているとは言い難い.そのため,データ アプリケーションはどのタイミングで I/O が発行され,どのタ の配置方法も単純なものに限られる.そこで本稿ではより大規 イミングで停止するかをわかっているため,アプリケーション 模な環境を想定し,提案手法の評価を行う. を解析し,その結果に基づいてハードディスクをスタンバイ状 ストレージにおける省電力を検討する場合,ハードディス 態へ移行させれば,省電力効果が期待できる.しかしこれを実 クを SSD (Solid State Drive) に変える方法も考えられ,SSD を 現するためには,実行するすべてのアプリケーションの I/O の 利用した様々な省電力手法が検討されてきた [12]- [14].ハード 解析を行わなければならず,現実的ではない.逆に最も下位層 ディスクを SSD に置き換えられるかどうかはコスト次第であ といえるストレージのレベルで I/O を観察する事もできる.I/O ると言えるが,将来的にはそのような方向へ進むものと予想さ が発行される時にはストレージをアクティブ状態に,発行され れる.本研究のアプローチは,ハードディスクが SSD に置き換 ない時にはスタンバイ状態に移行して,消費電力の削減を行う わってもそのまま適用できるものである.さらに,SSD はアク というものである.しかし,データベース実行時にストレージ ティブ状態とスタンバイ状態の切換えに,ハードディスクのよ レベルで I/O の発行を事前に予測する事は極めて難しく,これ うな電力消費を要しないので,SSD の時代になったら,より有 により省電力化を図る事は困難である. 望なアプローチであると言える. それに対し,ミドルウェアであるデータベース層ではアプ リケーションの最適化実行のための SQL 解析が行われており, 3. 提 案 手 法 データベース処理実行時にここで I/O の振舞いを把握する事が 本研究の提案手法は,データ配置制御を利用したストレージ 可能である.そこで本研究は,データベース実行時に,ミドル 省電力手法である.実環境においてアプリケーションを動かす ウェアであるデータベース層で I/O の振舞いを把握し,その情 場合,各ディスクに対する負荷が均等になるように (ディスクに 報に基づきストレージをアクティブ状態からスタンバイ状態へ 配置するデータ量が均等になるように),ディスクにデータを配 移行させる事によって,電力消費量の削減を図る. 置するのが一般的である.これをナイーブ手法と呼ぶ.しかし, 本研究ではデータの効率的管理という点からクラウド上の ナイーブ手法では各ディスクに対して均等に I/O が発行される データベースの省電力化を考え,アプリケーションの性能劣化 ため,効率的に省電力化を図ることは難しい.そこで,本研究 を抑えつつ,ストレージの消費電力を削減することを研究目的 の提案手法では,アプリケーション実行時における各データの とする.本稿ではデータベースベンチマークである TPC-H [2] 入出力状況に基づいて,ディスクへ発行される I/O 発行間隔が の省電力化に向けて,実行時のシステム性能と消費電力量の解 より長くなるようにデータ配置を変更する.そして,ディスク 析を行った.さらに,大規模システム環境を想定し,提案手法 への I/O が発行されていない期間にディスクを省電力 (Standby) であるデータ配置制御のための実装と評価に向けた TPC-H 実 状態へ移行させることによって ,消費電力量を削減する. 行時のシステム性能評価,および提案手法の評価を多数台ディ スク環境にて行った. 2. 関 連 研 究 これまでにも多くのストレージ省電力手法が提案されてき 実環境で使用されているデータベースにおいて,各データに は使用頻度のばらつきが生じていると考えられる.さらに,ど のデータがどの程度使用されているかということは,統計をと ればある程度把握することができる.そのため,実環境のデー タベースにおいて問い合わせの多い処理で使用されているデー た [3]- [7].これらの研究では,ストレージレベルの入出力頻度 タを調査し,その使用頻度に応じてデータの配置を変更する等, に従ってディスクを停止する等の手法が提案されている.しか によって実環境において本提案手法を一般化することができる. し,実際にストレージレベルでの入出力を予測することは必ず また,ストレージは CPU インテンシブなアプリケーション しも容易ではない. 省電力アプリケーション協調型のストレージ省電力手法も提 を動かす場合よりも,データインテンシブなアプリケーション を動かす場合に,消費電力や性能が重要とされている.そこで, —2— 表2 本研究では,データインテンシブなアプリケーションとして業 ディスクの遷移状態における消費電力とエネルギー量 Standby1(W) Standby2(W) Idle(W) Active(W) 界標準のデータベースベンチマークである TPC-H を使用し,本 提案手法の評価を行う. 1.05 まず,提案手法の評価のための準備としてディスクの消費電 0.88 5.22 Spindown(J) Spinup1(J) Spinup2(J) 力特性を調べるために,ディスクの各遷移状態における消費電 6.79 力を測定し,省電力化のための 1 つの指標となる Break-Even 108.5 7.25 105.5 Time を算出する. 5. 2 Break-Even Time 続いて,提案手法の評価方法を以下に示す.初めに,TPC-H 実行時における各データの入出力状況を調査する.次に,調査 ディスクの Spindown 及び Spinup により消費されるエネル した入出力頻度に基づいてディスクに対するデータ配置を変更 ギーと,ディスクを Standby 状態に移行し,その状態を維持す する.そして,TPC-H 実行時における提案手法の消費電力量と ることにより削減できるエネルギーが等しくなる Standby 状 システム性能をナイーブ手法と比較し,評価する. 態の持続時間を Break-Even Time と呼ぶ.これは Spindown に 必要なエネルギーを Ed ,Spinup2 に必要なエネルギーを Eu2 , 4. 測 定 環 境 Standby1 状態の消費電力を P s1 ,Standby2 状態の消費電力を 本研究で使用する実験環境のスペックを表 1 に示す.これら P s2 ,Idle 状態の消費電力を Pi ,Spindown と Spinup2 に必要な の測定環境は全て遠隔アクセスによる実験が可能である.電力 時間をそれぞれ T d ,T u2 ,Standby1,Standby2 状態の持続時間 計はサーバ PC の HDD に繋がれており,電力計は電力計操作 をそれぞれ T s1 ,T s2 とすると,Break-Even Time T be は, 用 PC で操作する.またサーバ PC,電力計,電力計操作用 PC は,ローカル PC と全てリモート接続されている. ( ) T be = Ed + Eu2 − P s2 × T d − P s2 × T u2 + T s1 × (P s1 − P s2 ) 表1 実験環境 OS CentOS 5.10 64bit CPU AMD Athlon 64 FX-74 @ 3GHz(4 cores) x2 Memory 8 GB HDD Seagate Barracuda 7200 series 3.5 inch SATA 6 Gb/s 3 TB 7200 rpm 64 MB 4K sector x 11 DBMS /(Pi − P s2 ) により求めることができる. 本研究では Standby を 2 種類の状態に区別するため,Break- Even Time の算出式は [15] を参考に作成した. 本研究で用いた HDD1,HDD2 では Break-Even Time はそれ HITACHI HiRDB Single Server Version 9 Power Meter YOKOGAWA WT1600 Digital Power Meter ぞれ約 24 秒であった.これより Standby 状態を利用して省電 力化を実行するためには,ディスクへの I/O 発行間隔が HDD1, HDD2 それぞれのディスクにおいて約 24 秒以上必要である. 5. ディスクの消費電力特性 ディスクの遷移状態の種類と,各状態における消費電力を 調査し,それに基づいて,省電力可能性の 1 つの指標となる, 図 1 は今回使用したディスクにおいて Idle 状態から Standby1 状態を経て,Standby2 状態に移行した後,再び Idle 状態に移行 した時の消費電力の推移を示している. Break-Even Time を算出する. 5. 1 ディスクの遷移状態と消費電力 本研究で使用したディスクの遷移状態は Standby1,Standby2, Idle,Active の 4 種類である.Idle/Active 状態から Standby1 状 態に移行することを Spindown,Standby1 状態から Idle/Active 状態に移行することを Spinup1,Standby2 状態から Idle/Active 状態に移行することを Spinup2 と呼ぶ [8]. [8] では使用するディスクの状態を Standby,Idle,Active の 3 種類としているが,本研究で使用するディスクの遷移状態を詳 細に調査したところ,Standby 状態時に消費電力が異なる 2 種 図1 ディスクの状態遷移における消費電力と Break-Even Time 類の期間がみられたため,本研究では 2 種類の状態を Stanby1, Standby2 と区別している. 6. 提案手法の評価 各状態におけるディスクの消費電力の測定を行った.測定対 象のディスクは,表 1 に記載のディスクである.Standby1 時, Standby2 時,Idle 時,Active 時の最大消費電力と,Spindown, Spinup1,Spinup2 に必要なエネルギーを表 2 に示す. 本節では,TPC-H 実行時の I/O 発行間隔を制御するという目 的のもと,TPC-H の各表と索引のバッファに対する I/O の状況 を調査し,提案手法であるデータ配置制御手法の評価を,多数 台ディスク環境において行う. 6. 1 節で TPC-H 実行時における各データの入出力状況を調査 —3— する.6. 2 節で TPC-H のデータの中でも約半分のデータ量を占 める LINEITEM 表および索引を 10 個に分割して,分割データ の配置方法について,議論する.6. 3 節で多数台環境での提案 手法の評価と,SLA を考慮した場合にナイーブ手法と比較して 本提案手法がパレート最適な曲線に近いことを示す. 6. 1 入出力状況の調査 本研究におけるストレージ省電力化のための提案手法である, データ配置制御の評価を行うために,TPC-H 実行時の各デー タに対する入出力状況を調査する.DB の規模を示す SF(Scale 図3 各配置方法における分割表の配置例 Factor) は 10 とし,1 秒毎に pdbufls(DBMS 付属のバッファ情報 表示ツール) を用いて入出力状況を取得する [17].調査の結果, 表3 データ配置方法の種類による I/O 発行間隔の長さと回数 LINEITEM を除いて,実行期間中に入出力が見られたデータは I/O 発行間隔 (秒) 0-24 25-100 101-200 201- 12 個,入出力が見られなかったデータは 9 個であった. (1) ラウンドロビン (回) 111 58 9 8 (2) 分割番号順 (回) 12 35 14 14 LINEITEM 表および索引は,ハッシュ関数を用いてそれぞれ 10 個に分割する.分割した LINEITEM 表の入出力頻度を調査 した結果を図 2 に示す.Lxx の xx が分割した表の番号を示し ている.図 2 より,分割した表は分割した番号順に読まれてい る.つまり,L1 から L10 まで周期的に繰り返し読まれている. このことから,分割した表と索引は,できるだけ番号が近いも のを同じディスクに配置することで,ディスクに対してより長 い I/O 発行間隔を得られるということがわかる. 2 種類の配置方法において,ディスク 3 台にスタンバイ状態 へ移行するタイムアウトを設定した場合 (省電力状態適用また は省電力ありと呼ぶ) と,そうでない場合の TPC-H 実行時にお ける消費電力量の削減率と実行時間について比較を行った.消 費電力量の比較を図 4 に,実行時間の比較を図 5 に示す.消費 電力量の削減率は,配置方法 (1) が約 15%であるのに対し,配 置方法 (2) では約 33%であった.また,実行時間の遅延率は配 置方法 (1) が約 22%であるのに対し,配置方法 (2) では約 8%で あった.以上から,より長い I/O 発行間隔が得られる (2) の方 が多くの消費電力を削減することができることがわかる.また, (2) の方がディスクをスタンバイ状態へ移行する際に生じる起 動オーバヘッドも少ないため,遅延率も小さいことがわかる. これらのことから,今回使用した TPC-H では,分割した表番 号を万遍なくラウンドロビンに配置するよりも,表番号が近い ものをできるだけ同じディスクに配置した方が,より効果的な 図2 分割表の I/O 頻度 ストレージ省電力化が可能であるということがわかる. 6. 2 分割表の配置方法 分割した LINEITEM 表と索引,およびその他の表と索引を ディスク 3 台に配置する.ここで,分割した表と索引に関して, 2 種類の配置方法を用意する. (1) 分割した表と索引をラウンドロビンに配置 (2) 分割した番号の近いものをできるだけ同じディスクに配置 の 2 種類である.その他のデータはディスク 3 台のデータ量が 均等になるように配置するものとする.上記 2 種類の配置方法 について,配置例を図 3 に示す.Lxx の xx は分割番号を示し 図4 表分割を用いた場合の各配置方法における消費電力量の比較 ている. 2 種類のデータ配置の方法において,TPC-H 実行時の各ディ スクに対する I/O 発行間隔の期間と回数を調査した.ディスク 3 台で調査した I/O 発行間隔の回数の合計値を表 3 に示す.表 3 より,ラウンドロビンに配置した (1) の方が Break-Even Time 未満の I/O 発行間隔の回数が多いことがわかる.つまり,今回 使用した TPC-H では,分割した表と索引をラウンドロビンに 配置して,ディスクを省電力状態に移行すると非効率であり, 6. 3 多数台ディスク環境での提案手法の評価 6. 1,6. 2 節の結果に基づき,ディスク 10 台を利用して提案 手法の評価を行う.ディスクの消費電力量と実行時間の関係を 調べるために,使用するディスク台数および提案手法に基づき I/O 有のデータのみを配置した Hot 状態のディスク台数を変化 させて評価を行う.今回用意したディスク環境は使用するディ スク台数が 10 台,5 台,2 台の 3 種類で,さらにそれぞれ「ナ 余計に電力を消費してしまうことがわかる. —4— 状態適用と呼ぶ.ディスク 2 台環境の提案手法では,HDD1 を Idle/Active 状態,HDD2 から HDD10 の 9 台に省電力状態を適 用する.ディスク 5 台環境の提案手法について,HDD4 以外に 省電力状態を適用したものを提案手法’(Hot4 台’) と呼ぶ.例と してディスク 5 台環境のナイーブ手法のデータ配置例を図 6 に, 提案手法のデータ配置例を図 7 に示す.ピンク色のディスクは Hot 状態を,水色のディスクは I/O が無データを配置した Cold 状態である,もしくは不使用のディスクであることを示してい 図5 表分割を用いた場合の各配置方法における実行時間の比較 る.灰色で網掛けされているディスクは,省電力状態を適用し ているディスクであることを表している. イーブ手法」と「提案手法」の 2 種類を用意する.ナイーブ手法 とは,提案手法であるデータ配置制御の対比となる単純なデー タ配置手法である.つまり,提案手法はデータに対する I/O に 基づいてデータを配置するのに対し,ナイーブ手法は,I/O の 頻度に関わらず,データがおおむね均等になるように配置する. 6. 3. 1 データの配置方法 図6 ディスク 5 台環境のナイーブ手法 (Hot 5 台) におけるデータ配置例 本評価において我々が用意したデータ配置は以下である. ( 1 ) ディスク 10 台環境 • ナイーブな手法 (Hot10 台) – データの利用頻度に関わらず,データ量が均等になるよ うにディスク 10 台に配置 • 提案手法 (Hot9 台) – 分割した LINEITEM 表を HDD1 から HDD3 に配置し, 図7 ディスク 5 台環境の提案手法 (Hot 4 台) におけるデータ配置例 I/O 有の残りのデータをスキーマ毎に 1 台のディスクに配置し (HDD4∼HDD9),HDD10 には I/O 無のデータを配置 ( 2 ) ディスク 5 台環境 • ナイーブな手法 (Hot5 台) – データの利用頻度に関わらず,データ量が均等になるよ うにディスク 5 台に配置,残りのディスク 5 台は使用しない • 提案手法 (Hot4 台) – 分割した LINEITEM 表を HDD1 から HDD3 に配置し, I/O 有の残りのデータを HDD4 に配置し,I/O 無のデータを HDD5 に配置,残りのディスク 5 台は使用しない ( 3 ) ディスク 2 台環境 • ナイーブな手法 (Hot2 台) – データの利用頻度に関わらず,データ量が均等になるよ うにディスク 2 台に配置,残りのディスク 8 台は使用しない • 提案手法 (Hot1 台) – I/O 有のデータを HDD1 に配置,I/O 無のデータを HDD2 に配置,残りのディスク 8 台は使用しない ディスク 10 台環境とディスク 5 台環境の提案手法において, 分割した LINEITEM 表は 6. 2 節の結果に基づいて,できるだ け近い番号の分割データを同じディスクに配置する.ここでは, L1, L2, L3, L4 を HDD1 に配置し,L5, L6, L7 を HDD2 に,L8, L9, L10 を HDD3 に配置する.ディスクの電力状態に関して,3 種類にディスク環境におけるすべてのナイーブ手法は,Hot な ディスク全てを Active/Idle 状態とする.ディスク 10 台環境と ディスク 5 台環境の提案手法では,10 台全てに Standby 状態へ 移行するためのタイムアウト (5 秒) を設定する.これを省電力 6. 3. 2 性 能 比 較 各配置方法において,TPC-H 実行時のディスク 10 台の消費 電力量とクエリの実行時間を測定した.また,本評価では SF を 30 とする.今回実験を行った TPC-H のデータ量 (SF=30,約 30GB) は,実際には 1∼2 台のディスクに格納することが可能 であるが,より大規模な DB を処理する場合を想定して,最大 で 10 台までのディスクを用いる実験を行った.各ディスク環 境におけるナイーブ手法と提案手法の TPC-H 実行時における ディスクの消費電力量と実行時間の比較を図 8,9 に示す.図 8 において,ディスク 5 台環境のみ提案手法’ として,Hot4 台’ の結果を示している.図 8 に示すように,提案手法を利用する ことにより,各ディスク環境において実行時間の遅延劣化を数 %に抑えつつ,TPC-H 実行時の消費電力量を削減することが できている.また,ディスク 10 台環境のナイーブ手法を基準 とした消費電力量の消費率と実行時間の遅延率を表 4 に示す. 表 4 にも示すように,消費率が最も低いのはディスク 2 台環境 の提案手法のときで,最も高いのはディスク 5 台環境のナイー ブ手法であった.ディスク 2 台環境の提案手法における消費率 が最も低いのは,I/O 有のデータを 1 台にまとめて配置し,そ の他のディスクに省電力状態を適用しているためである.また ディスク 5 台環境のナイーブ手法において消費率が最も高いの は,Hot なディスクが 5 台で,かつ省電力状態を適用しておら ず,常に Idle/Active 状態であるためである.一方,図 9 に示す ように,実行時間は各配置方法でそこまで大きな差は生じてい ないことがわかる.実行時間の遅延率に関しては,表 4 に示す ように,最も低いのはディスク 5 台環境のナイーブ手法のとき —5— で,最も高かったのはディスク 5 台環境の提案手法であった. 6. 3. 3 SLA を考慮した提案手法の評価 ディスク 5 台環境の提案手法では I/O があるデータを配置した 実行時の消費電力量と実行時間の相関について考察する.各 ディスクに省電力状態を適用したことにより起動オーバヘッド 配置方法における,消費電力量と実行時間の相関を図 10 に示 が頻繁に生じ,遅延率が増加したものと考えられる.ただし, す.図中の点線はこれ以上,電力消費率と遅延率を同時に低く ディスク 5 台環境の提案手法 (Hot4 台) において,HDD4 以外に することができないパレート最適な曲線が存在することを示し 省電力状態を適用したディスク 5 台環境の提案手法’(Hot4 台’) ている.各ディスク環境において提案手法を利用した配置方法 では,遅延率が格段に低くなっている.ディスク 5 台環境のナ (Hot9 台,Hot4 台’,Hot4 台,Hot1 台) では,それぞれ同じディ イーブ手法 (Hot5 台) では I/O 有のディスクに省電力状態を適 スク台数を用いたナイーブな手法に比べ,よりパレート最適に 用していないため,起動オーバヘッドの影響が無く,遅延率が 近づいていることがわかる.以上のことから,本測定における 低かったと考えられる.いずれの台数においても,遅延率はナ 本研究の提案手法を利用した配置方法はパレート最適に近い配 イーブな手法の方が提案手法より低いものの,数十%の削減が 置方法であると言える. 行われる電力消費率に対し,遅延率は高さ数%に留まっている. 以上より,この結果は妥当であり,提案手法は省電力化に有効 であることがわかる. 図 10 図8 消費電力量と実行時間の相関 7. まとめと今後の課題 各配置方法における消費電力量の比較 本研究では,データの効率的管理という点からストレージの 消費電力を削減することで,データセンタの省電力化が可能で あると考え,アプリケーションの性能劣化を最小限に抑えつつ 省電力の実現を目指す SLA を考慮したストレージ省電力手法 の提案を研究目的とした.本稿では,ディスクの省電力状態が 2 種類あることを考慮し,その時のディスクの消費電力から, Break-Even Time を詳細に算出した.さらに,提案手法の評価 として,TPC-H 実行時の各データに対する入出力状況に基づい てデータ配置を変更することにより実行時の消費電力が削減で きることを示した.それらの結果に基づき,SLA を考慮したス 図9 トレージ省電力手法として,ディスク 10 台を使用した提案手 各配置方法における実行時間の比較 法の評価を行った.ナイーブな手法と比較して,提案手法では 表4 ディスク環境 (台) 性能劣化を数%に抑えつつ,実行時のストレージ省電力化が可 電力消費率と遅延率 Hot ディスク台数 電力消費率 (%) 遅延率 (%) 能であることを示した. 10 10 100 0.0 今後の課題としては,以下の 3 点が考えられる.まず 1 つめ 10 9 43 4.4 の課題は,より詳細な提案手法の評価である.具体的には,Hot 5 5 66 1.1 5 4(Hot4 台’) 41 2.6 なディスクの台数を変化させた場合の性能測定や,他のデータ 5 4 37 9.4 配置での評価を行いたい.2 つめは,より大規模なデータでの 2 2 41 1.3 提案手法の評価である.今回は使用した TPC-H のデータがディ 2 1 31 4.0 スク 1 台に収まってしまう環境であったため,今後は,たとえ ば 1TB のデータなど,より大規模なデータを用いて提案手法の 評価を行いたい.3 つめは,TPC-H 以外でのベンチマークツー ルでの提案手法の評価である.以上,これらについての評価を 行い,本研究の提案手法がストレージ省電力化に有効であるこ とをより詳細に示したい. —6— 謝 man/smartd.conf.5.html 辞 本 研 究 は 一 部, 文 部 科 学 省 科 学 研 究 費 基 盤 研 究 課 題 番 号 24300034 によるものである. 文 献 [1] GIPC Survey and Estimation Committee Report FY2009 (Summary),http://www.greenit-pc.jp/activity/reporting /100707/index.html,2009 [2] TPC-H: http://www.tpc.org/tpch/default.asp [3] Jorge Guerra, Himabindu Pucha, Joseph Glider, Wendy Belluomini, Raju Rangaswami. Cost Effective Storage using Extent Based Dynamic Tiering. In 9th USENIX Conference on File and Storage Technologies, pp.1-14, 2011. [4] Dushyanth Narayanan, Austin Donnelly, Antony Rowstron. Write Off-Loading: Practical Power Management for Enterprise Storage. In 6th USENIX Conference on File and Storage Technologies, pp.253267, 2008. [5] Athanasios E Papathanasiou and Michael L Scott. Energy Efficient Prefetching and Caching. In Proceedings of the annual conference on USENIX Annual Technical Conference, 2004. [6] Akshat Verma, Ricardo Koller, Luis Useche, and Raju Rangaswami. SRCMap : Energy Proportional Storage using Dynamic Consolidation. In Proceedings of the 8th USENIX Conference on File and Storage Technologies, 2010. [7] Charles Weddle, Mathew Oldham, Jin Qian, An-I Andy Wang, Peter Reiher, and Geo Kuenning. PARAID: A Gear-Shifting Power-Aware RAID. In 5th USENIX Conference on File and Storage Technologies, Vol. 3, pp. 245-260, October 2007. [8] 西川記史,中野美由紀,喜連川優:アプリケーション協調型大規 模ストレージ省電力システムの開発と評価,DEIM Forum 2012, D6-1,2012 年 3 月 [9] 西川記史,中野美由紀,喜連川優:アプリケーション処理の I/O 挙動特性を利用したディスクの実行時省電力手法とその評価: オ ンライントランザクション処理における省電力効果, 電子情報通 信学会論文誌, Vol.J95-D, No.3, pp.447-459, 2012 年 3 月 [10] Norifumi Nishikawa, Miyuki Nakano, and Masaru Kitsuregawa. Energy Efficient Storage Management Cooperated with Large Data Intensive Applications, 28th IEEE International Conference on Data Engineering (IEEE ICDE 2012), pp.126-137, 2012.04 [11] 飯村奈穂,西川記史,中野美由紀,小口正人:システム性能とスト レージ省電力を考慮した TPC-H 実行時におけるデータ配置法の 評価,DICOMO シンポジウム 2014,p.1818-1825,8C-3,2014 年7月 [12] Jian Ouyang, Shiding Lin, Zhenyu Hou, Peng Wang, Yong Wang, and Guangyu Sun. Active SSD design for energy-efficiency improvement of web-scale data analysis, IEEE International Symposium on Low Power Electronics and Design (ISLPED 2013), pp.286-291, September 2013. [13] Peng Li, Gomez, K., Lilja, D.J. Exploiting free silicon for energyefficient computing directly in NAND flash-based solid-state storage systems, IEEE High Performance Extreme Computing Conference (HPEC 2013), pp.1-6, September 2013. [14] Devesh Tiwari, Sudharshan S. Vazhkudai, Youngjae Kim, Xiaosong Ma, Simona Boboila, and Peter J. Desnoyers. Reducing Data Movement Costs Using Energy-Efficient, Active Computation on SSD, USENIX Workshop on Power-Aware Computing and Systems (HotPower ’12), October, 2012. [15] Y.H. Lu, G.D.Micheli: Comparing System-Level Power Management Policies, IEEE Design & Test of Computers, 2010 [16] Alan D. Brunelle: btrecord and btreplay User Guide, http://www.cse.unsw.edu.au/ aaronc/iosched/doc/btreplay.html, 2007 [17] pdbufls: http://www.hitachi.co.jp/Prod/comp/soft1/ manual/pc/d635540/W3550027.HTM [18] pdobils: http://133.145.224.19/Prod/comp/soft1/ manual/pc/d635540/W3550089.HTM [19] smartd.conf: http://smartmontools.sourceforge.net/ —7—