...

直伝3:新定番Cortex

by user

on
Category: Documents
28

views

Report

Comments

Transcript

直伝3:新定番Cortex
第2部
第
ご購入はこちら
内部回路を想像しながら性能を比べてみると
とても面白いです
5章
直伝 3:新定番 Cortex-A53 の
実力初体験
石井 康雄
ターゲット・ボード:ラズベリー・パイ2/ラズベリー・パイ3/HiKey LeMaker
OSと
実験用プログ
ラムを格納
micro
SD
CPUコア
PMU
CPUコア
PMU
CPUコア
PMU
CPUコア
PMU
USBハブ/
LAN
コント
ローラIC
USB USB
コネクタ
ルータ
RJ-45
コネクタ
RAM
HDMI
性能カウンタ・レジスタ
結果を表示
ディスプレイ
キーボード
LAN
インター
ネット
実験に使うソフト
ウェアを入手
実験1…基本ベンチマーク
実験2…単純なループの分岐予測精度
実験3…変則的な2重ループの分岐予測精度
実験4…関数呼び出しを含めた分岐予測精度
図 1 実験の構成…3 種類のターゲット・ボードを利用して基本性能と分岐予測精度を調べる
プロセッサのマイクロアーキテクチャとして説明し
た機能が LSI の内部でどのように性能に影響している
のか,ということを目視することは困難です.そこで
性能カウンタの値を見ながらマイクロアーキテクチャ
が性能にどのように影響しているかを見ていきたいと
思います.
実験すること
本稿執筆時点(2016 年 8 月)では,残念ながら公式
の 64 ビット OS が存在しません.64 ビット動作時の性
能を評価するために Cortex-A53 が搭載された HiKey
LeMaker(コラム 1 参照)についても評価します.
● 分岐予測精度
実験 2 〜 4 は,いずれも分岐予測精度の比較です.
ここでは,マイクロアーキテクチャの違いに注目する
ため,ラズベリー・パイ 2 とラズベリー・パイ 3 のみ
● 基本性能
を評価しています.Cortex-A53 で大幅に増強された
分岐予測リソースが,実際のプログラム実行でどのよ
うな影響を与えるかを確認します.
幾つかのループを含むマイクロベンチマークで分岐
予測精度を計測していきます.それぞれのマイクロベ
ンチマークは 100 万回ずつ評価され,分岐予測ミス率
と 1 クロック・サイクル当たりの実行命令数(IPC)で
評価しています.
基本ベンチマーク Dhrystone では,3 種類のプラッ
トフォームを利用します.
● 実験時の注意…暑くなると性能が下がる
ここでは,以下の実験を通じて Cortex-A53 の特徴
を確認していきます(図 1).
・実験 1:基本ベンチマーク Dhrystone
・実験 2:単純なループの分岐予測精度
・実験 3:変則的な 2 重ループの分岐予測精度
・実験 4:関数呼び出しを含めた場合の分岐予測精度
・
・ラズベリー・パイ 3
・HiKey LeMaker
ラズベリー・パイ 2
2016 年 11 月号
余談ですがラズベリー・パイ3は,オーバヒートを避
けるために,LSIの温度に応じてクロック周波数を下げ
る機能があります.負荷がかかるアプリケーションを
63
Fly UP