...

CPU Measurement Facility z/OS Hardware Instrumentation

by user

on
Category: Documents
337

views

Report

Comments

Transcript

CPU Measurement Facility z/OS Hardware Instrumentation
CPU Measurement Facility
z/OS Hardware Instrumentation Services
を用いたプロセッサーキャパシティ
いたプロセッサーキャパシティ見積
プロセッサーキャパシティ見積もり
見積もり手法
もり手法
2012年5月18日
System zテクニカル・セールス
© 2012 IBM Corporation
当資料について
当資料は、2012年5月時点で入手可能であった資料や、当方で実際にテストを行った結果などを基にして、
十分な注意を払い作成しておりますが、必ずしも記述内容を保証するものではありません。実際にお客
様環境でご使用になられる場合には、必要に応じて正規のマニュアルによる確認、修正情報の調査、
および事前のテストなどを十分に行なわれるようお願い致します。
トレードマーク
S/390, OS/390, z/OS, zSeries, System z, zEnterprise, z/VM, IBMは
IBM Corporationの商標。その他の会社名、製品名およびサービス名等はそれぞれ各社の商標.
なお、当資料の著作権はIBM Corporationに帰属するものであり、使用または抜粋・転用については、使用
者の責任と良識の範囲内にて行われるべきものです。
© 2012 IBM Corporation
目次
CPUキャッシュデザインの
キャッシュデザインの変遷
LSPRワークロードの
ワークロードの新しい指標
しい指標
CPUMF, z/OS HIS
概要
セットアップ手順
セットアップ手順
データ取得方法
データ取得方法
CPUMF, z/OS HIS取得データ
取得データの
データの活用方法
CP3KEXTRを用いたSMF Type 113レコードの
レコードの加工
zPCRでのLSPRワークロード選択
ワークロード選択
参考資料
© 2012 IBM Corporation
プロセッサーキャッシュトポロジーの変遷
© 2012 IBM Corporation
System z プロセッサー - キャッシュ・トポロジー (1)
階層キャッシュの更なる拡張
– z900 からはデータ用と命令用のキャッシュを 256KB ずつ独立して効率化
– z990 / z9 EC ではブック間の L2 キャッシュ・アクセスのためにデュアル・リング・トポロジーを採用
z900以降 L1 の
命令キャッシュとデー
タ・キャッシュが独立
他のブックのL2へ
(リング・トポロジー)
L1
他のブックのL2へ
(リング・トポロジー)
32MB
共有 L2
32MB (16MB*)
共有 L2
・・・
x20
(x12*)
z990以降
ブック構造に
なった
40MB
共有 L2
・・・
x8
L1
L1
・・・
x8
L1
L1
L1
L1
L1
L1
L1
L1: 256K(データ), 256K(命令)
L1: 256K(データ), 256K(命令)
L1: 256K(データ), 256K(命令)
L2: 32MB (16MB*) MCM内の
全チップ&全コアで共有
L2: 32MB MCM内の
全チップ&全コアで共有
L2: 40MB MCM内の
全チップ&全コアで共有
z900
* 12PU MCM モデルの場合
(2064-101~109 および 100)
z990
z9 EC
は 1 個のプロセッサー・ユニット (PU) チップをあらわす
© 2012 IBM Corporation
System z プロセッサー - キャッシュ・トポロジー (2)
階層キャッシュの更なる拡張
– 高速化で小さくせざるを得ない L1 キャッシュ (データ用128KB/命令用 64KB) を補うために
PU チップ内に大きな L1.5 (z10 EC) や L2/eDRAM L3 (z196) を搭載
– ブック間アクセスはスター・トポロジー (Any-to-Any) 化によりアクセス・タイムを短縮
他のブックのL2 へ eDRAMによる大容量L3/L4で
パフォーマンス改善
(スター・トポロジー)
スター・トポロジーにより
ブック間アクセスを改善
192MB
共有 eDRAM L4
48MB
共有 L2
L1.5 L1.5 L1.5 L1.5
L1 L1
L1
L1
・・・
x5
24MBチップ
チップ内
チップ内 共有
eDRAM L3
24MB チップ内共有
チップ内共有
eDRAM L3
L1.5 L1.5 L1.5 L1.5
L1 L1
L1
L1
L1: 128K(データ), 64K(命令)
L1.5: 3MB コア内
L2:
他のブックのL4へ
(スター・トポロジー)
4.4GHz動作の
高速プロセッサー採用
48MB MCM内の全チップ&全コアで共有
z10 EC
L2
L1
L2
L1
L2
L1
L2
L1
・・・
x6
L2
L1
L2
L1
L2
L1
L2
L1
L1: 128K(データ), 64K(命令)
5.2GHz動作の
高速プロセッサー採用
L2: 1.5MB コア内
L3: 24MB チップ内の全コアで共有
L4: 192MB MCM内の全チップ&全コアで共有
z196
は 1 個のプロセッサー・ユニット (PU) チップをあらわす
© 2012 IBM Corporation
新しいLSPRワークロード
© 2012 IBM Corporation
LSPRワークロードの新しい指標
Relative Nest Intensity (RNI)
背景:実際の稼働環境に即したワークロード・カテゴリー選択を可能とする
今後の主流となるアプローチ (実績を積みながら、機能改善を図っていく計画)
Nest: プロセッサーのストレージ・サブシステムを構成する階層(L1-Cacheからメモリーまで)を示す
Intensity: L1-Cache Missした命令・データの取得が、どの階層で満たされたかを示す
より深い階層(メモリー・それに近いキャッシュ)へのアクセス頻度が高いほど、RNI値は大きい (High)
ワークロード・カテゴリー選択では、L1-Cache Missの割合も考慮される
RNI値の一般的な傾向
CPU Intensive Workload ⇒ Low RNI値となる傾向
I/O Intensive Workload ⇒ High RNI値となる傾向
DASD I/O Rateを基にした、ワークロード・カテゴリの簡易評価が可能
zPCR V6では、『DASD I/O Rate per Consumed MSU』< 30 の場合、【LoIO-Mix】の選択を推奨
zPCR V7でも同様な考え方で、その場合は、【Average】の選択を推奨
(ただし、DASD I/O Rate per Consumed MSU < 32 に変更)
© 2012 IBM Corporation
LSPRワークロードの変更点 (1)
従来
処理形態やソフトウェア特性を考慮した様々なワークロードを利用して、プロセッサー・キャパシティを表現
新しいワークロード
『様々なワークロード環境で、ベンチマークによる実測と分析に基づくデータを提供する』方針は継承
従来のような、「Workload Primitives」や「Workload Mixes」に関する情報は公表せず
ハードウェア特性
に基づく「
」が新しく定義
ハードウェア特性(RNI)に
特性
づく「Workload Categories」
しく定義され、それを考慮したプロセッサー・キャパシティを
定義
表現
従来
Workload Primitives
z/OS系
•ODE-B (CB-J, CB-S,
CB84)
•CB-L (CBW2)
•WASDB
•OLTP-T (IMS)
•OLTP-W
新しいワークロード
しいワークロード
Workload Mixes
Workload Categories
•LoIO-Mix
•Low Relative Nest Intensity (RNI)
•CB-Mix
•Low-Avg ⇒ zPCRで補完 (50%Low + 50%Avg)
•TM-Mix
•Average Relative Nest Intensity (RNI)
•TD-Mix
•Avg-High ⇒ zPCRで補完 (50%Avg + 50%High)
•TI-Mix
•High Relative Nest Intensity (RNI)
•DI-Mix
z/VM系
•WASDB/LVm
n/a
•High/LV ⇒ベースはWASDB/LVm
z/Linux系
•WASDB/L
n/a
•Low/L ⇒ベースはWASDB/L
•EAS-AS/L
© 2012 IBM Corporation
LSPRワークロードの変更点 (2)
ワークロードの変換
zPCR V6以前での実行結果をV7.5でロードすると、下表のようなマッピングに従い、自動的にワークロードを変換
その際、自動変換した旨を通知するポップ・アップが表示される
zPCR Study – SCP/Workload Conversion
設定済みの
設定済みの
Workload Mixes
新しくアサイン
しくアサインされる
アサインされる
Workload Categories
LoIO-Mix
Average
CB-Mix
Average
TM-Mix
Avg-High
TD-Mix
Avg-High
TI-Mix
Avg-High
DI-Mix
High
想定されるワークロード・カテゴリーの分布
Lowカテゴリー ・・・ 5~10%のお客様
Averageカテゴリー ・・・ 80~90%のお客様
← 省略時解釈
Highカテゴリー ・・・ 5~10%のお客様
© 2012 IBM Corporation
【参考】 新旧ワークロードとRNI値の関係
zPCR V7で
で利用する
利用するワークロード
するワークロード・
ワークロード・カテゴリー
© 2012 IBM Corporation
稼働データによるワークロード・カテゴリの選択
DASD I/O Rateの活用
従来方法:RMFモニターI 『Workload Activity Report』(-DASD I/O- SSCHRT)の値を参照
新機能:SMFタイプ74-1 (Device Activity)レコードをもとに、CP2KEXTRを実行してEDF (Enterprise Data File)を作成し、
PCへダウンロード後、zPCRに取り込むことで、ワークロード
ワークロード・
ワークロード・カテゴリーを
カテゴリーを自動アサイン
自動アサイン
SMFタイプ113レコードの活用 (新機能)
目的:SMFデータ
データから
値を把握し、より適切なワークロード・カテゴリーを選択
データから実際
から実際の
実際のRNI値
把握
z10以降のプロセッサーが前提
CPU MF (Measurement Facility)によるカウンター・データを活用 (キャッシュ・メモリー階層の特性把握)
SMFタイプ113レコードをもとに、CP3KEXTRを実行してEDF (Enterprise Data File)を作成し、PCへダウンロード後、zPCR
に取り込むことで、ワークロード
ワークロード・
選択の
ワークロード・カテゴリーを
カテゴリーをアドバイス (選択
選択のヒントを
ヒントを提供)
提供
© 2012 IBM Corporation
CPU Measurement Facility
z/OS Hardware Instumentation Services
© 2012 IBM Corporation
CPUMF, z/OS HIS概要 (1)
新しいハードウェア機構 – CPU Measurement Facility (CPUMF)
– z10 EC/BC およびz196, z114で使用可能
– 新しいz/OSコンポーネントである、Hardware Instrumentation Services (HIS)と連携
– CPUMFでは、大きく分けてカウンターデータとサンプリングデーターの2種類のデータを
取得
CPUMFデータ特性と適用範囲
– カウンターデータ (当ガイドの対象範囲)
• 長期間でのCPU活動状況に関するデータをカウンターの形式で取得
• 既存のRMF等を補足するパフォーマンス検証データ – CPU置き換えや新機能適用
によるパフォーマンス変動要因の調査
• ワークロード特性調査 – 新しいLSPRワークロード選択基準
• HiperDispatch, CICS Threadsafe, DB2 Large Pageなどの新機能適用によるパ
フォーマンス改善効果の補足データとしても活用可能
– サンプリングデータ
• 短時間におけるCPU資源の使用状況に関するデータ
• アプリケーションやISV製品のパフォーマンスチューニングに向けた基礎データ
© 2012 IBM Corporation
CPUMF, z/OS HIS概要 (2)
CPUMFカウンターデータ
– z10以降のプロセッサーにおいて、プロセッサーキャッシュおよびメモリーに関連す
る個々の活動状況を示す
– データ収集は z/OS HISを通して実施
• LPAR単位でのデータ取得
• SMF Type 113レコードおよび zFS(HFS)ファイルへの書き出し
• データ取得に伴うオーバーヘッドは非常に小さい
カウンターデータ取得ではCPU使用率はz196にてほぼ0% (RMF Workload Activity
Reportにて、APPL%が0.00) – テスト結果より
• サンプリングデータ取得の場合、設定に依存するが、1-2%程度となる設定にて
データ取得することが推奨 (SAMPFREQ指定)
– カウンターデータは以下の5つで構成される
• Basic counter set
• Problem-state counter set
• Group counter set (現時点では未使用)
• Crypto-activity counter set
• Extended counter set
© 2012 IBM Corporation
CPUMF, z/OS HIS前提条件
ハードウェア
– z10 EC,BC GA2 以降 (Driver 76D, Bundle #20以降)
– z196, z114
z/OS
– z/OS V1R8以降
– z/VMゲストとして稼動するz/OSは対象外
– 前提APAR
• (リリース共通) OA25750, OA25755, OA25773, OA27623
• (V1R8) OA33052
• (V1R9以降) OA30486
– サンプリングデータ取得時の前提APAR
• (V1R9以降) OA32113
• (V1R10以降) OA34485
• (V1R11以降) OA30429
• (CICS TS V3R2) PM08568
• (CICS TS V4R1) PM08573
© 2012 IBM Corporation
CPUMF, z/OS HIS セットアップ手順 (1)
CPUMFデータ取得許可の設定
– HMCより以下の手順で実施 (設定はLPAR単位)
1.
2.
3.
4.
CPCイメージアイコンを選択し、Single Object Operationsを実行
Support Elementの画面であることを確認し、CPCイメージを選択
CPC Operational Customizationから、Change LPAR Securityを実行
Change Logical Partition Securityパネルにて、取得対象のデータを選択 (赤枠部分)
© 2012 IBM Corporation
CPUMF, z/OS HIS セットアップ手順 (2)
CPUMFデータ取得許可の設定(続き)
5. 設定が完了したら、”Save and Change”(LPARイメージプロファイルに変更を保存し、動
的に変更を反映) , “Change Runnign System”(LPARイメージプロファイルには変更を保
存せず、動的に変更を反映) , “Save to Profiles” (LPARイメージプロファイルへ変更を保
存だけ行い、動的反映は実施せず)のいずれかをクリック (HMCでの作業は以上で終了)
“Save to Profiles”を実行した場合は、変更を反映するためにLPARの再Activateが必要
z/OS HISのセットアップ
– HIS Procの作成 (SYS1.IBM.PROCLIBからのコピーでも可)
//HIS PROC
//HIS EXEC PGM=HISINIT,REGION=0K,TIME=NOLIMIT
//SYSPRINT DD SYSOUT=*
–
–
–
RACF設定
• HISアドレス空間が使用可能なユーザーID
• HISがデータを書き出す UNIXファイルシステムのホームディレクトリー
• サンプリングデータを取得する際にはさらにRACF定義追加が必要
SMFデータ取得設定
• SYSにてTYPEに113が含まれている or NOTYPEに113を含んでいないことを確認
セットアップの詳細については Redpaper “Setting Up and Using the IBM System z
CPU Measurement Facility with z/OS”を参照ください
© 2012 IBM Corporation
CPUMF, z/OS HIS セットアップ手順 (3)
UNIXファイルシステムセットアップ
– HIS専用のzFSを作成することを推奨
• 必要サイズ
カウンターデータはデータ取得期間の長さに関係なく、1回のデータ取得で 1PUあたり3KB
サンプリングデータは、デフォルトの10分間のデータ取得で約256MB
– サンプルJCL (Redpaperより抜粋)
© 2012 IBM Corporation
データ取得方法
HISアドレス空間起動
– S HIS コマンド実行
• 正しく起動した場合、以下のメッセージが出力
S HIS
$HASP100 HIS
ON STCINRDR
$HASP373 HIS
STARTED
IEF403I HIS - STARTED - TIME=13.18.50
HIS002I HIS INITIALIZATION COMPLETE
– F HIS,BEGIN でデータ取得開始、F HIS,END でデータ取得終了
• コマンドオプションについての詳細は System Commandsマニュアルもしくは
Redpaperを参照
• 出力例 (カウンターデータの全種類を取得)
F HIS,B,TT=‘TEST',CTRONLY,CTR=ALL,SMFINTVAL=SYNC
HIS011I HIS DATA COLLECTION STARTED
F HIS,END
HIS022I HIS DATA COLLECTION IS ENDING. 943
OUTPUT FILE PREFIX: SYSHIS20120510.132057. <= zFS上のファイル名
TITLE= ‘TEST'
© 2012 IBM Corporation
取得データサンプル
zFS上に書き出されるデータのサンプル (カウンターデータ – Basic counter set)
HIS019I EVENT COUNTERS INFORMATION VERSION 2
FILE NAME: SYSHIS20120419.141511.000.CNT
COMMAND: MODIFY HIS,B,TT='TEST',CTRONLY,CTR=ALL
STATE CHANGE: NO
COUNTER VERSION NUMBER 1: 1 COUNTER VERSION NUMBER 2: 2
COUNTER SET= BASIC
COUNTER IDENTIFIERS:
0: CYCLE COUNT
1: INSTRUCTION COUNT
2: L1 I-CACHE DIRECTORY-WRITE COUNT
3: L1 I-CACHE PENALTY CYCLE COUNT
4: L1 D-CACHE DIRECTORY-WRITE COUNT
5: L1 D-CACHE PENALTY CYCLE COUNT
START TIME: 2012/04/19 14:15:11 START TOD: C97118A4EDC9AF27
END TIME: 2012/04/19 14:30:25 END TOD: C9711C0D04F036A1
COUNTER VALUES (HEXADECIMAL) FOR CPU 00 (CPU SPEED = 5208 CYCLES/MIC):
0- 3 0000002D44A7B49D 0000000E6FFE31D1 000000006DE16528 0000000AD5631C4A
4- 7 000000002567E6F7 00000007A1E85370 ---------------- ---------------START TIME: 2012/04/19 14:15:11 START TOD: C97118A4EDCAD327
END TIME: 2012/04/19 14:30:25 END TOD: C9711C0D04F0F921
COUNTER VALUES (HEXADECIMAL) FOR CPU 01 (CPU SPEED = 5208 CYCLES/MIC):
0- 3 0000002E860E330F 0000000EDB1DF798 0000000071270CD2 0000000B21B9BB20
4- 7 000000002664FDD0 00000007DDEFE4C3 ---------------- ---------------© 2012 IBM Corporation
CPUMF, z/OS HIS取得データの活用方法
© 2012 IBM Corporation
CP3KEXTRを用いたSMF Type 113レコードの活用
CP3KEXTR
– US ATSが作成・配布しているCapacity Planning Tool “zCP3000”用のInputファイル(EDF
ファイル)をSMFデータから加工・生成するツール
– http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS4229 より入手可能
– ダウンロードしたzipファイルを解凍して生成される cp3kextr.binファイルをz/OSに転送。TSO
TRANSMITコマンドを用いてデータセットへ展開 (具体的な方法は上記サイトに記述あり)
– z/OS上で実行するバッチ形式
– SMF Type 23, 70-78, 113レコードが含まれていると、CP3KEXTR実行時のJOBLOGには以
下のようなKey Metricに変換された情報が出力されます(別途EDFファイルも生成されます)
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP3KE113:
CP2KE113:
VARIABLE AVG MIN MAX STND_DEV COUNT
INSTR 306.8 0 613.6 306.8 2
CPI 1.4 0 2.9 1.4 2
PRBS 5.2 0 10.4 5.2 2
L1MP 2.6 0 5.2 2.6 2
MEMP 0.3 0 0.6 0.3 2
RNI 0 0 0.1 0 2
L2P 48.7 0 97.3 48.7 2
L3P 0.9 0 1.8 0.9 2
L4LP 0.2 0 0.3 0.2 2
SMF113_2_CTRVN1=01 CTRVN2=02
– 生成されたEDFファイルはテキストデータとしてPCに転送
© 2012 IBM Corporation
zPCRにおけるLSPRワークロード選定
CP3KEXTRにより生成されたEDFファイルを使用したzPCRでの操作方法
– (1)zPCRの Tab-1: Multi-Image Capacity – LPAR Configuration Capacity Planningの
“Define LPAR Host, Configure Partitions, Assess Capacity”をクリック
© 2012 IBM Corporation
zPCRにおけるLSPRワークロード選定
– (2) LPAR Configuration Capacity Planningパネルの“Define LPAR Host Processor” –
“Create Host and Partitions From”の “EDF”をクリック
© 2012 IBM Corporation
zPCRにおけるLSPRワークロード選定
– (3)EDF Intervalsパネルの左下にある”Load EDF”をクリック
© 2012 IBM Corporation
zPCRにおけるLSPRワークロード選定
– (4) 別ウィンドウでEDFファイルを選択すると以下のパネルが表示される。”Available Data”
の “CPU-MF”の箇所にチェックが入っていることを確認し、見積もり対象のIntervalを選択の
上で”Show Partitions”をクリック
© 2012 IBM Corporation
zPCRにおけるLSPRワークロード選定
– (5)EDF内のSMF Type 113データから、該当LPARのLSPRワークロードは”Low”がアサイン
(DASD I/O Rateを基にした場合Averageとなるが、EDFデータからLowが選択)
© 2012 IBM Corporation
参考資料
© 2012 IBM Corporation
参考資料
Redpaper “Setting Up and Using the IBM System z CPU Measurement Facility
with z/OS”
– http://www.redbooks.ibm.com/abstracts/redp4727.html
TecDocs Library “CPU MF – 2011 Update and WSC Experiences”
– http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/TC000083
TecDocs Library “CPU MF Overview and WSC Experiences”
– http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/TC000041
CP3KEXTR
– http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS4229
zPCR
– http://www.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/PRS1381
© 2012 IBM Corporation
Fly UP