Comments
Description
Transcript
直伝3:新定番Cortex
第2部 第 ご購入はこちら 内部回路を想像しながら性能を比べてみると とても面白いです 5章 直伝 3:新定番 Cortex-A53 の 実力初体験 石井 康雄 ターゲット・ボード:ラズベリー・パイ2/ラズベリー・パイ3/HiKey LeMaker OSと 実験用プログ ラムを格納 micro SD CPUコア PMU CPUコア PMU CPUコア PMU CPUコア PMU USBハブ/ LAN コント ローラIC USB USB コネクタ ルータ RJ-45 コネクタ RAM HDMI 性能カウンタ・レジスタ 結果を表示 ディスプレイ キーボード LAN インター ネット 実験に使うソフト ウェアを入手 実験1…基本ベンチマーク 実験2…単純なループの分岐予測精度 実験3…変則的な2重ループの分岐予測精度 実験4…関数呼び出しを含めた分岐予測精度 図 1 実験の構成…3 種類のターゲット・ボードを利用して基本性能と分岐予測精度を調べる プロセッサのマイクロアーキテクチャとして説明し た機能が LSI の内部でどのように性能に影響している のか,ということを目視することは困難です.そこで 性能カウンタの値を見ながらマイクロアーキテクチャ が性能にどのように影響しているかを見ていきたいと 思います. 実験すること 本稿執筆時点(2016 年 8 月)では,残念ながら公式 の 64 ビット OS が存在しません.64 ビット動作時の性 能を評価するために Cortex-A53 が搭載された HiKey LeMaker(コラム 1 参照)についても評価します. ● 分岐予測精度 実験 2 〜 4 は,いずれも分岐予測精度の比較です. ここでは,マイクロアーキテクチャの違いに注目する ため,ラズベリー・パイ 2 とラズベリー・パイ 3 のみ ● 基本性能 を評価しています.Cortex-A53 で大幅に増強された 分岐予測リソースが,実際のプログラム実行でどのよ うな影響を与えるかを確認します. 幾つかのループを含むマイクロベンチマークで分岐 予測精度を計測していきます.それぞれのマイクロベ ンチマークは 100 万回ずつ評価され,分岐予測ミス率 と 1 クロック・サイクル当たりの実行命令数(IPC)で 評価しています. 基本ベンチマーク Dhrystone では,3 種類のプラッ トフォームを利用します. ● 実験時の注意…暑くなると性能が下がる ここでは,以下の実験を通じて Cortex-A53 の特徴 を確認していきます(図 1). ・実験 1:基本ベンチマーク Dhrystone ・実験 2:単純なループの分岐予測精度 ・実験 3:変則的な 2 重ループの分岐予測精度 ・実験 4:関数呼び出しを含めた場合の分岐予測精度 ・ ・ラズベリー・パイ 3 ・HiKey LeMaker ラズベリー・パイ 2 2016 年 11 月号 余談ですがラズベリー・パイ3は,オーバヒートを避 けるために,LSIの温度に応じてクロック周波数を下げ る機能があります.負荷がかかるアプリケーションを 63