直伝3：新定番Cortex

by user

on 28 марта 2017

Category: Documents

>> Downloads: 4

views

Report

Comments

Description

Download 直伝3：新定番Cortex

Transcript

直伝3：新定番Cortex

第2部
第
ご購入はこちら
内部回路を想像しながら性能を比べてみると
とても面白いです
5章
直伝 3：新定番 Cortex-A53 の
実力初体験
石井康雄
ターゲット・ボード：ラズベリー・パイ2/ラズベリー・パイ3/HiKey LeMaker
OSと
実験用プログ
ラムを格納
micro
SD
CPUコア
PMU
CPUコア
PMU
CPUコア
PMU
CPUコア
PMU
USBハブ/
LAN
コント
ローラIC
USB USB
コネクタ
ルータ
RJ-45
コネクタ
RAM
HDMI
性能カウンタ・レジスタ
結果を表示
ディスプレイ
キーボード
LAN
インター
ネット
実験に使うソフト
ウェアを入手
実験1…基本ベンチマーク
実験2…単純なループの分岐予測精度
実験3…変則的な2重ループの分岐予測精度
実験4…関数呼び出しを含めた分岐予測精度
図 1　実験の構成…3 種類のターゲット・ボードを利用して基本性能と分岐予測精度を調べる
プロセッサのマイクロアーキテクチャとして説明し
た機能が LSI の内部でどのように性能に影響している
のか，ということを目視することは困難です．そこで
性能カウンタの値を見ながらマイクロアーキテクチャ
が性能にどのように影響しているかを見ていきたいと
思います．
実験すること
本稿執筆時点（2016 年 8 月）では，残念ながら公式
の 64 ビット OS が存在しません．64 ビット動作時の性
能を評価するために Cortex-A53 が搭載された HiKey
LeMaker（コラム 1 参照）についても評価します．
● 分岐予測精度
実験 2 〜 4 は，いずれも分岐予測精度の比較です．
ここでは，マイクロアーキテクチャの違いに注目する
ため，ラズベリー・パイ 2 とラズベリー・パイ 3 のみ
● 基本性能
を評価しています．Cortex-A53 で大幅に増強された
分岐予測リソースが，実際のプログラム実行でどのよ
うな影響を与えるかを確認します．
幾つかのループを含むマイクロベンチマークで分岐
予測精度を計測していきます．それぞれのマイクロベ
ンチマークは 100 万回ずつ評価され，分岐予測ミス率
と 1 クロック・サイクル当たりの実行命令数（IPC）で
評価しています．
基本ベンチマーク Dhrystone では，3 種類のプラッ
トフォームを利用します．
● 実験時の注意…暑くなると性能が下がる
ここでは，以下の実験を通じて Cortex-A53 の特徴
を確認していきます（図 1）．
・実験 1：基本ベンチマーク Dhrystone
・実験 2：単純なループの分岐予測精度
・実験 3：変則的な 2 重ループの分岐予測精度
・実験 4：関数呼び出しを含めた場合の分岐予測精度
・
・ラズベリー・パイ 3
・HiKey LeMaker
ラズベリー・パイ 2
2016 年 11 月号
余談ですがラズベリー・パイ3は，オーバヒートを避
けるために，LSIの温度に応じてクロック周波数を下げ
る機能があります．負荷がかかるアプリケーションを
63