CPU Measurement Facility z/OS Hardware Instrumentation
by user
Comments
Transcript
CPU Measurement Facility z/OS Hardware Instrumentation
CPU Measurement Facility z/OS Hardware Instrumentation Services を用いたプロセッサーキャパシティ いたプロセッサーキャパシティ見積 プロセッサーキャパシティ見積もり 見積もり手法 もり手法 2012年5月18日 System zテクニカル・セールス © 2012 IBM Corporation 当資料について 当資料は、2012年5月時点で入手可能であった資料や、当方で実際にテストを行った結果などを基にして、 十分な注意を払い作成しておりますが、必ずしも記述内容を保証するものではありません。実際にお客 様環境でご使用になられる場合には、必要に応じて正規のマニュアルによる確認、修正情報の調査、 および事前のテストなどを十分に行なわれるようお願い致します。 トレードマーク S/390, OS/390, z/OS, zSeries, System z, zEnterprise, z/VM, IBMは IBM Corporationの商標。その他の会社名、製品名およびサービス名等はそれぞれ各社の商標. なお、当資料の著作権はIBM Corporationに帰属するものであり、使用または抜粋・転用については、使用 者の責任と良識の範囲内にて行われるべきものです。 © 2012 IBM Corporation 目次 CPUキャッシュデザインの キャッシュデザインの変遷 LSPRワークロードの ワークロードの新しい指標 しい指標 CPUMF, z/OS HIS 概要 セットアップ手順 セットアップ手順 データ取得方法 データ取得方法 CPUMF, z/OS HIS取得データ 取得データの データの活用方法 CP3KEXTRを用いたSMF Type 113レコードの レコードの加工 zPCRでのLSPRワークロード選択 ワークロード選択 参考資料 © 2012 IBM Corporation プロセッサーキャッシュトポロジーの変遷 © 2012 IBM Corporation System z プロセッサー - キャッシュ・トポロジー (1) 階層キャッシュの更なる拡張 – z900 からはデータ用と命令用のキャッシュを 256KB ずつ独立して効率化 – z990 / z9 EC ではブック間の L2 キャッシュ・アクセスのためにデュアル・リング・トポロジーを採用 z900以降 L1 の 命令キャッシュとデー タ・キャッシュが独立 他のブックのL2へ (リング・トポロジー) L1 他のブックのL2へ (リング・トポロジー) 32MB 共有 L2 32MB (16MB*) 共有 L2 ・・・ x20 (x12*) z990以降 ブック構造に なった 40MB 共有 L2 ・・・ x8 L1 L1 ・・・ x8 L1 L1 L1 L1 L1 L1 L1 L1: 256K(データ), 256K(命令) L1: 256K(データ), 256K(命令) L1: 256K(データ), 256K(命令) L2: 32MB (16MB*) MCM内の 全チップ&全コアで共有 L2: 32MB MCM内の 全チップ&全コアで共有 L2: 40MB MCM内の 全チップ&全コアで共有 z900 * 12PU MCM モデルの場合 (2064-101~109 および 100) z990 z9 EC は 1 個のプロセッサー・ユニット (PU) チップをあらわす © 2012 IBM Corporation System z プロセッサー - キャッシュ・トポロジー (2) 階層キャッシュの更なる拡張 – 高速化で小さくせざるを得ない L1 キャッシュ (データ用128KB/命令用 64KB) を補うために PU チップ内に大きな L1.5 (z10 EC) や L2/eDRAM L3 (z196) を搭載 – ブック間アクセスはスター・トポロジー (Any-to-Any) 化によりアクセス・タイムを短縮 他のブックのL2 へ eDRAMによる大容量L3/L4で パフォーマンス改善 (スター・トポロジー) スター・トポロジーにより ブック間アクセスを改善 192MB 共有 eDRAM L4 48MB 共有 L2 L1.5 L1.5 L1.5 L1.5 L1 L1 L1 L1 ・・・ x5 24MBチップ チップ内 チップ内 共有 eDRAM L3 24MB チップ内共有 チップ内共有 eDRAM L3 L1.5 L1.5 L1.5 L1.5 L1 L1 L1 L1 L1: 128K(データ), 64K(命令) L1.5: 3MB コア内 L2: 他のブックのL4へ (スター・トポロジー) 4.4GHz動作の 高速プロセッサー採用 48MB MCM内の全チップ&全コアで共有 z10 EC L2 L1 L2 L1 L2 L1 L2 L1 ・・・ x6 L2 L1 L2 L1 L2 L1 L2 L1 L1: 128K(データ), 64K(命令) 5.2GHz動作の 高速プロセッサー採用 L2: 1.5MB コア内 L3: 24MB チップ内の全コアで共有 L4: 192MB MCM内の全チップ&全コアで共有 z196 は 1 個のプロセッサー・ユニット (PU) チップをあらわす © 2012 IBM Corporation 新しいLSPRワークロード © 2012 IBM Corporation LSPRワークロードの新しい指標 Relative Nest Intensity (RNI) 背景:実際の稼働環境に即したワークロード・カテゴリー選択を可能とする 今後の主流となるアプローチ (実績を積みながら、機能改善を図っていく計画) Nest: プロセッサーのストレージ・サブシステムを構成する階層(L1-Cacheからメモリーまで)を示す Intensity: L1-Cache Missした命令・データの取得が、どの階層で満たされたかを示す より深い階層(メモリー・それに近いキャッシュ)へのアクセス頻度が高いほど、RNI値は大きい (High) ワークロード・カテゴリー選択では、L1-Cache Missの割合も考慮される RNI値の一般的な傾向 CPU Intensive Workload ⇒ Low RNI値となる傾向 I/O Intensive Workload ⇒ High RNI値となる傾向 DASD I/O Rateを基にした、ワークロード・カテゴリの簡易評価が可能 zPCR V6では、『DASD I/O Rate per Consumed MSU』< 30 の場合、【LoIO-Mix】の選択を推奨 zPCR V7でも同様な考え方で、その場合は、【Average】の選択を推奨 (ただし、DASD I/O Rate per Consumed MSU < 32 に変更) © 2012 IBM Corporation LSPRワークロードの変更点 (1) 従来 処理形態やソフトウェア特性を考慮した様々なワークロードを利用して、プロセッサー・キャパシティを表現 新しいワークロード 『様々なワークロード環境で、ベンチマークによる実測と分析に基づくデータを提供する』方針は継承 従来のような、「Workload Primitives」や「Workload Mixes」に関する情報は公表せず ハードウェア特性 に基づく「 」が新しく定義 ハードウェア特性(RNI)に 特性 づく「Workload Categories」 しく定義され、それを考慮したプロセッサー・キャパシティを 定義 表現 従来 Workload Primitives z/OS系 •ODE-B (CB-J, CB-S, CB84) •CB-L (CBW2) •WASDB •OLTP-T (IMS) •OLTP-W 新しいワークロード しいワークロード Workload Mixes Workload Categories •LoIO-Mix •Low Relative Nest Intensity (RNI) •CB-Mix •Low-Avg ⇒ zPCRで補完 (50%Low + 50%Avg) •TM-Mix •Average Relative Nest Intensity (RNI) •TD-Mix •Avg-High ⇒ zPCRで補完 (50%Avg + 50%High) •TI-Mix •High Relative Nest Intensity (RNI) •DI-Mix z/VM系 •WASDB/LVm n/a •High/LV ⇒ベースはWASDB/LVm z/Linux系 •WASDB/L n/a •Low/L ⇒ベースはWASDB/L •EAS-AS/L © 2012 IBM Corporation LSPRワークロードの変更点 (2) ワークロードの変換 zPCR V6以前での実行結果をV7.5でロードすると、下表のようなマッピングに従い、自動的にワークロードを変換 その際、自動変換した旨を通知するポップ・アップが表示される zPCR Study – SCP/Workload Conversion 設定済みの 設定済みの Workload Mixes 新しくアサイン しくアサインされる アサインされる Workload Categories LoIO-Mix Average CB-Mix Average TM-Mix Avg-High TD-Mix Avg-High TI-Mix Avg-High DI-Mix High 想定されるワークロード・カテゴリーの分布 Lowカテゴリー ・・・ 5~10%のお客様 Averageカテゴリー ・・・ 80~90%のお客様 ← 省略時解釈 Highカテゴリー ・・・ 5~10%のお客様 © 2012 IBM Corporation 【参考】 新旧ワークロードとRNI値の関係 zPCR V7で で利用する 利用するワークロード するワークロード・ ワークロード・カテゴリー © 2012 IBM Corporation 稼働データによるワークロード・カテゴリの選択 DASD I/O Rateの活用 従来方法:RMFモニターI 『Workload Activity Report』(-DASD I/O- SSCHRT)の値を参照 新機能:SMFタイプ74-1 (Device Activity)レコードをもとに、CP2KEXTRを実行してEDF (Enterprise Data File)を作成し、 PCへダウンロード後、zPCRに取り込むことで、ワークロード ワークロード・ ワークロード・カテゴリーを カテゴリーを自動アサイン 自動アサイン SMFタイプ113レコードの活用 (新機能) 目的:SMFデータ データから 値を把握し、より適切なワークロード・カテゴリーを選択 データから実際 から実際の 実際のRNI値 把握 z10以降のプロセッサーが前提 CPU MF (Measurement Facility)によるカウンター・データを活用 (キャッシュ・メモリー階層の特性把握) SMFタイプ113レコードをもとに、CP3KEXTRを実行してEDF (Enterprise Data File)を作成し、PCへダウンロード後、zPCR に取り込むことで、ワークロード ワークロード・ 選択の ワークロード・カテゴリーを カテゴリーをアドバイス (選択 選択のヒントを ヒントを提供) 提供 © 2012 IBM Corporation CPU Measurement Facility z/OS Hardware Instumentation Services © 2012 IBM Corporation CPUMF, z/OS HIS概要 (1) 新しいハードウェア機構 – CPU Measurement Facility (CPUMF) – z10 EC/BC およびz196, z114で使用可能 – 新しいz/OSコンポーネントである、Hardware Instrumentation Services (HIS)と連携 – CPUMFでは、大きく分けてカウンターデータとサンプリングデーターの2種類のデータを 取得 CPUMFデータ特性と適用範囲 – カウンターデータ (当ガイドの対象範囲) • 長期間でのCPU活動状況に関するデータをカウンターの形式で取得 • 既存のRMF等を補足するパフォーマンス検証データ – CPU置き換えや新機能適用 によるパフォーマンス変動要因の調査 • ワークロード特性調査 – 新しいLSPRワークロード選択基準 • HiperDispatch, CICS Threadsafe, DB2 Large Pageなどの新機能適用によるパ フォーマンス改善効果の補足データとしても活用可能 – サンプリングデータ • 短時間におけるCPU資源の使用状況に関するデータ • アプリケーションやISV製品のパフォーマンスチューニングに向けた基礎データ © 2012 IBM Corporation CPUMF, z/OS HIS概要 (2) CPUMFカウンターデータ – z10以降のプロセッサーにおいて、プロセッサーキャッシュおよびメモリーに関連す る個々の活動状況を示す – データ収集は z/OS HISを通して実施 • LPAR単位でのデータ取得 • SMF Type 113レコードおよび zFS(HFS)ファイルへの書き出し • データ取得に伴うオーバーヘッドは非常に小さい カウンターデータ取得ではCPU使用率はz196にてほぼ0% (RMF Workload Activity Reportにて、APPL%が0.00) – テスト結果より • サンプリングデータ取得の場合、設定に依存するが、1-2%程度となる設定にて データ取得することが推奨 (SAMPFREQ指定) – カウンターデータは以下の5つで構成される • Basic counter set • Problem-state counter set • Group counter set (現時点では未使用) • Crypto-activity counter set • Extended counter set © 2012 IBM Corporation CPUMF, z/OS HIS前提条件 ハードウェア – z10 EC,BC GA2 以降 (Driver 76D, Bundle #20以降) – z196, z114 z/OS – z/OS V1R8以降 – z/VMゲストとして稼動するz/OSは対象外 – 前提APAR • (リリース共通) OA25750, OA25755, OA25773, OA27623 • (V1R8) OA33052 • (V1R9以降) OA30486 – サンプリングデータ取得時の前提APAR • (V1R9以降) OA32113 • (V1R10以降) OA34485 • (V1R11以降) OA30429 • (CICS TS V3R2) PM08568 • (CICS TS V4R1) PM08573 © 2012 IBM Corporation CPUMF, z/OS HIS セットアップ手順 (1) CPUMFデータ取得許可の設定 – HMCより以下の手順で実施 (設定はLPAR単位) 1. 2. 3. 4. CPCイメージアイコンを選択し、Single Object Operationsを実行 Support Elementの画面であることを確認し、CPCイメージを選択 CPC Operational Customizationから、Change LPAR Securityを実行 Change Logical Partition Securityパネルにて、取得対象のデータを選択 (赤枠部分) © 2012 IBM Corporation CPUMF, z/OS HIS セットアップ手順 (2) CPUMFデータ取得許可の設定(続き) 5. 設定が完了したら、”Save and Change”(LPARイメージプロファイルに変更を保存し、動 的に変更を反映) , “Change Runnign System”(LPARイメージプロファイルには変更を保 存せず、動的に変更を反映) , “Save to Profiles” (LPARイメージプロファイルへ変更を保 存だけ行い、動的反映は実施せず)のいずれかをクリック (HMCでの作業は以上で終了) “Save to Profiles”を実行した場合は、変更を反映するためにLPARの再Activateが必要 z/OS HISのセットアップ – HIS Procの作成 (SYS1.IBM.PROCLIBからのコピーでも可) //HIS PROC //HIS EXEC PGM=HISINIT,REGION=0K,TIME=NOLIMIT //SYSPRINT DD SYSOUT=* – – – RACF設定 • HISアドレス空間が使用可能なユーザーID • HISがデータを書き出す UNIXファイルシステムのホームディレクトリー • サンプリングデータを取得する際にはさらにRACF定義追加が必要 SMFデータ取得設定 • SYSにてTYPEに113が含まれている or NOTYPEに113を含んでいないことを確認 セットアップの詳細については Redpaper “Setting Up and Using the IBM System z CPU Measurement Facility with z/OS”を参照ください © 2012 IBM Corporation CPUMF, z/OS HIS セットアップ手順 (3) UNIXファイルシステムセットアップ – HIS専用のzFSを作成することを推奨 • 必要サイズ カウンターデータはデータ取得期間の長さに関係なく、1回のデータ取得で 1PUあたり3KB サンプリングデータは、デフォルトの10分間のデータ取得で約256MB – サンプルJCL (Redpaperより抜粋) © 2012 IBM Corporation データ取得方法 HISアドレス空間起動 – S HIS コマンド実行 • 正しく起動した場合、以下のメッセージが出力 S HIS $HASP100 HIS ON STCINRDR $HASP373 HIS STARTED IEF403I HIS - STARTED - TIME=13.18.50 HIS002I HIS INITIALIZATION COMPLETE – F HIS,BEGIN でデータ取得開始、F HIS,END でデータ取得終了 • コマンドオプションについての詳細は System Commandsマニュアルもしくは Redpaperを参照 • 出力例 (カウンターデータの全種類を取得) F HIS,B,TT=‘TEST',CTRONLY,CTR=ALL,SMFINTVAL=SYNC HIS011I HIS DATA COLLECTION STARTED F HIS,END HIS022I HIS DATA COLLECTION IS ENDING. 943 OUTPUT FILE PREFIX: SYSHIS20120510.132057. <= zFS上のファイル名 TITLE= ‘TEST' © 2012 IBM Corporation 取得データサンプル zFS上に書き出されるデータのサンプル (カウンターデータ – Basic counter set) HIS019I EVENT COUNTERS INFORMATION VERSION 2 FILE NAME: SYSHIS20120419.141511.000.CNT COMMAND: MODIFY HIS,B,TT='TEST',CTRONLY,CTR=ALL STATE CHANGE: NO COUNTER VERSION NUMBER 1: 1 COUNTER VERSION NUMBER 2: 2 COUNTER SET= BASIC COUNTER IDENTIFIERS: 0: CYCLE COUNT 1: INSTRUCTION COUNT 2: L1 I-CACHE DIRECTORY-WRITE COUNT 3: L1 I-CACHE PENALTY CYCLE COUNT 4: L1 D-CACHE DIRECTORY-WRITE COUNT 5: L1 D-CACHE PENALTY CYCLE COUNT START TIME: 2012/04/19 14:15:11 START TOD: C97118A4EDC9AF27 END TIME: 2012/04/19 14:30:25 END TOD: C9711C0D04F036A1 COUNTER VALUES (HEXADECIMAL) FOR CPU 00 (CPU SPEED = 5208 CYCLES/MIC): 0- 3 0000002D44A7B49D 0000000E6FFE31D1 000000006DE16528 0000000AD5631C4A 4- 7 000000002567E6F7 00000007A1E85370 ---------------- ---------------START TIME: 2012/04/19 14:15:11 START TOD: C97118A4EDCAD327 END TIME: 2012/04/19 14:30:25 END TOD: C9711C0D04F0F921 COUNTER VALUES (HEXADECIMAL) FOR CPU 01 (CPU SPEED = 5208 CYCLES/MIC): 0- 3 0000002E860E330F 0000000EDB1DF798 0000000071270CD2 0000000B21B9BB20 4- 7 000000002664FDD0 00000007DDEFE4C3 ---------------- ---------------© 2012 IBM Corporation CPUMF, z/OS HIS取得データの活用方法 © 2012 IBM Corporation CP3KEXTRを用いたSMF Type 113レコードの活用 CP3KEXTR – US ATSが作成・配布しているCapacity Planning Tool “zCP3000”用のInputファイル(EDF ファイル)をSMFデータから加工・生成するツール – http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS4229 より入手可能 – ダウンロードしたzipファイルを解凍して生成される cp3kextr.binファイルをz/OSに転送。TSO TRANSMITコマンドを用いてデータセットへ展開 (具体的な方法は上記サイトに記述あり) – z/OS上で実行するバッチ形式 – SMF Type 23, 70-78, 113レコードが含まれていると、CP3KEXTR実行時のJOBLOGには以 下のようなKey Metricに変換された情報が出力されます(別途EDFファイルも生成されます) CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP3KE113: CP2KE113: VARIABLE AVG MIN MAX STND_DEV COUNT INSTR 306.8 0 613.6 306.8 2 CPI 1.4 0 2.9 1.4 2 PRBS 5.2 0 10.4 5.2 2 L1MP 2.6 0 5.2 2.6 2 MEMP 0.3 0 0.6 0.3 2 RNI 0 0 0.1 0 2 L2P 48.7 0 97.3 48.7 2 L3P 0.9 0 1.8 0.9 2 L4LP 0.2 0 0.3 0.2 2 SMF113_2_CTRVN1=01 CTRVN2=02 – 生成されたEDFファイルはテキストデータとしてPCに転送 © 2012 IBM Corporation zPCRにおけるLSPRワークロード選定 CP3KEXTRにより生成されたEDFファイルを使用したzPCRでの操作方法 – (1)zPCRの Tab-1: Multi-Image Capacity – LPAR Configuration Capacity Planningの “Define LPAR Host, Configure Partitions, Assess Capacity”をクリック © 2012 IBM Corporation zPCRにおけるLSPRワークロード選定 – (2) LPAR Configuration Capacity Planningパネルの“Define LPAR Host Processor” – “Create Host and Partitions From”の “EDF”をクリック © 2012 IBM Corporation zPCRにおけるLSPRワークロード選定 – (3)EDF Intervalsパネルの左下にある”Load EDF”をクリック © 2012 IBM Corporation zPCRにおけるLSPRワークロード選定 – (4) 別ウィンドウでEDFファイルを選択すると以下のパネルが表示される。”Available Data” の “CPU-MF”の箇所にチェックが入っていることを確認し、見積もり対象のIntervalを選択の 上で”Show Partitions”をクリック © 2012 IBM Corporation zPCRにおけるLSPRワークロード選定 – (5)EDF内のSMF Type 113データから、該当LPARのLSPRワークロードは”Low”がアサイン (DASD I/O Rateを基にした場合Averageとなるが、EDFデータからLowが選択) © 2012 IBM Corporation 参考資料 © 2012 IBM Corporation 参考資料 Redpaper “Setting Up and Using the IBM System z CPU Measurement Facility with z/OS” – http://www.redbooks.ibm.com/abstracts/redp4727.html TecDocs Library “CPU MF – 2011 Update and WSC Experiences” – http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/TC000083 TecDocs Library “CPU MF Overview and WSC Experiences” – http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/TC000041 CP3KEXTR – http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS4229 zPCR – http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS1381 © 2012 IBM Corporation