セルフタイム回路を用いたスパイク駆動神経回路網エミュレータの構成法

by user

on 28 марта 2017

Category: Documents

>> Downloads: 3

views

Report

Comments

Description

Download セルフタイム回路を用いたスパイク駆動神経回路網エミュレータの構成法

Transcript

セルフタイム回路を用いたスパイク駆動神経回路網エミュレータの構成法

平成 26 年度
学士学位論文
セルフタイム回路を用いたスパイク駆動
神経回路網エミュレータの構成法
A Study on Self-Timed Emulator for
Spiking Neural Network
1150330
塘居治世
指導教員
岩田誠
2015 年 2 月 27 日
高知工科大学情報学群
要旨
セルフタイム回路を用いたスパイク駆動
神経回路網エミュレータの構成法
塘居治世
近年，ディープラーニングをはじめとする汎用人工知能に関する研究が盛んになってお
り，脳内の神経回路網を計算機で模倣して活用しようという多くの試みがなされている．中
でも，スパイク信号を受けた神経細胞の膜電位変化を生物学的知見に忠実にモデル化した，
スパイク駆動神経回路網 SNN(Spiking Neural Network) のシミュレーションが注目されて
いる．しかしながら，これらの神経回路網の模擬には，莫大な演算が必要であり，通常の汎
用的な計算機では，実用的な時間で結果を得る事ができない．そこで，本研究では，比較的
安価に入手可能となりつつある FPGA を活用して， SNN を直接的にエミュレートする方法
を検討した．また，一般的には SNN は非同期に動作するものであり，本研究では，非同期
回路の一種であるセルフタイム回路 STC(Self-Timed Circuit) を活用して SNN の動作を模
擬するエミュレータの構成法を提案した．
提案した SNN エミュレータの構成法に関して， FPGA チップ (Altera 社 Stratix IV) を
対象に論理合成し，回路規模などを求めた．また，動作周波数を 20MHz と仮定して各パラ
メータを変化させながら回路シミュレーションした結果，実時間の 20000 倍の速度でエミュ
レーション可能である事が分かった．この時，エミュレーションの加速変数 a は a = dt × fck
の関係式で与えられ，回路のシミュレーションによって関係式が成り立つ事も確認できた．
キーワード
スパイク駆動神経回路網 (SNN), セルフタイム回路 (STC)
–i–
Abstract
A Study on Self-Timed Emulator for
Spiking Neural Network
Haruyoshi TOMOI
In recent years, novel neural networks such as deep learning are actively investigated and their implementation techniques are also studied. Particularly, spiking neural
network (SNN) is noticed as a biological model to express neuronal membrane potential
due to synaptic spike signals. However, computational complexity required for large
SNN simulation is too enormous to be calculated on commodity computers within practical time. Thus, I examined an SNN emulation method on field programmable gate
array (FPGA) in this study and I designed its FPGA circuit emulating asynchronous
spike propagation in SNN by using the clockless self-timed circuit (STC).
As a result of designing the SNN emulator for FPGA, the emulator has the possibilities that I am quicker in 10,000 times than time on SNN model. Since there is
a tradeoff between its acceleration factor a and emulation time resolution dt, I formulated and identified it as a = dt × fck where fck denotes actual clock frequency of the
synchronous part of the proposed emulator.
key words
Spiking Neural Network(SNN), Self-Timed Circuit(STC)
– ii –
目次
第1章
序論
1
第2章
神経回路網モデル
4
2.1
緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.2
Artificial Neural Network(ANN) . . . . . . . . . . . . . . . . . . . . . .
4
2.3
Spiking Neural Network(SNN) . . . . . . . . . . . . . . . . . . . . . . .
5
IAF ニューロンモデル . . . . . . . . . . . . . . . . . . . . . . . .
6
結言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
セルフタイム回路を用いたハイブリッド型 SNN エミュレータ
9
3.1
緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
3.2
SNN エミュレータの構成方針 . . . . . . . . . . . . . . . . . . . . . . . .
9
3.3
Synapse モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3.3.1
STC(Self-Timed Circuit) とその特徴 . . . . . . . . . . . . . . . .
11
3.3.2
CM 素子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.3.3
CB 素子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.3.4
Asynchronous to Synchronous(AtoS) 回路 . . . . . . . . . . . . .
13
3.3.5
Synchronous to Asynchronous(StoA) 回路 . . . . . . . . . . . . .
14
3.4
Simulator モジュール . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.5
提案エミュレータにおける時間と精度 . . . . . . . . . . . . . . . . . . . .
15
3.6
結言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
FPGA 回路設計と評価
17
4.1
緒言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4.2
FPGA 実装したエミュレータの仕様 (設計・検証手順) . . . . . . . . . .
17
2.3.1
2.4
第3章
第4章
– iii –
目次
4.2.1
Synapse モジュールの設計 . . . . . . . . . . . . . . . . . . . . . .
18
4.2.2
Simulator モジュールの設計 . . . . . . . . . . . . . . . . . . . . .
21
4.2.3
検証手順 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
4.3
設計・検証結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
4.4
結言 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
結論
28
第5章
謝辞
30
参考文献
31
– iv –
図目次
2.1
本研究で対象とする SNN . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
IAF モデルにおける synaptic current . . . . . . . . . . . . . . . . . . . .
7
2.3
連続して到着したスパイク信号による synaptic current の足しあわせ
. . .
8
3.1
SNN エミュレータの構成 . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3.2
Synapse モジュールの構成 . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3.3
STC の概略図 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
4.1
一般的な C 素子の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
–v–
表目次
4.1
論理合成の結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
– vi –
24
第1章
序論
近年，ディープラーニングの登場などにより，ニューラルネットワークに関する研究が再
び盛んになっている．ディープラーニングは，ディープニューラルネットワークを使用し
た機械学習の事で，多層のニューラルネットワークである．従来のパーセプトロン等では，
多層でニューラルネットを構成した際に，期待されるような出力を得る事が難しかったが，
ディープラーニングでは，深い階層を持つ場合でも，勾配が拡散せずに学習する事が可能で
ある．近年の代表的な例として， Google の先行研究では， YouTube の動画からランダム
に取り出した画像 1000 万枚を用いてディープラーニングを行っている．この時使用された
コンピュータは 1000 台 (16000 コア ) で， 3 日間のディープラーニングの結果，このニュー
ラルネットワークは，猫の顔を認識する事が可能になった [1]．この他のニューラルネット
ワークに関する研究として，スパイク駆動神経回路網 SNN(Spiking Neural Network) が注
目されいる． SNN は，従来のニューラルネットワークと比べ，より忠実に脳の動作を模し
たニューラルネットワークであり，スパイク信号による膜電位の時間的な変化までもモデル
として取り入れており，スパイク信号の伝達も非同期に行われるモデルである． SNN に関
する先行研究として IBM では， SNN を実装したニューロモーフィックチップ True North
を 2014 年に開発した． True North は 54 億のトランジスタを搭載したチップであり， 100
万のニューロンと 5600 万のシナプスを実現している．このニューロンの数は，およそ昆虫
の脳に等しい． IBM はこのチップに対してカラー映像 (400 × 240pixel, 30fps) を入力し，
映像内で動く人間をそれぞれリアルタイムに追跡する事を実現した [2]． True North 自体
に学習機能はなく，学習済みのパラメータを与える事で必要な出力を得ている．学習済み
のパラメータの算出には，スーパーコンピュータ Sequoia を用いている． IBM の研究の目
–1–
的は， SNN を活用したフォン・ノイマン型以外の新たなアーキテクチャを開発し，高性能
なコンピュータを開発する事であるが， SNN をより忠実にコンピュータ上に再現する事に
重きを置いた研究も存在する． [3] の先行研究では，スーパーコンピュータ京を用いてソフ
トウェアで SNN を実装し，シミュレーションを行っている．シミュレーションに用いられ
たソフトウェアは NEST[4] であり，並列演算などにも対応した SNN シミュレータである．
これらの先行研究からわかるように，ニューロンのシミュレーションは莫大な演算量を必
要とし，一般的な汎用コンピュータでは，実用的な時間でシミュレーション結果を得る事が
難しい．ディープラーニングに関しては， GPGPU(General-purpose computing on GPU)
等のハードウェア活用によって，演算速度の向上は見込まれるものの，莫大な学習用データ
を必要とするディープラーニングの演算時間は決して短いものではない． SNN においても，
ニューロンの発火タイミングや膜電位の変化を扱う必要があり，汎用的なコンピュータ上で
SNN を実装してシミュレーションを行う事は非常に難しい．
ディープラーニングが多層化によって，より高度な概念の表現を実現している事から，人
間と同規模のニューラルネットワークを構築する事で，人間的な処理を計算機に実装できる
可能性が期待されている．ニューラルネットワークの多層化に伴う演算量の増加によって演
算速度や消費電力の問題が顕著に表れるため，現行のフォン・ノイマン型アーキテクチャ
では，いずれ限界を迎える可能性がある．よって，本研究では，先を見据えたニューラル
ネットワークのモデルとして SNN を対象とした． SNN は，非同期にスパイク信号のやり
取りを行う事から，大規模なネットワークを構築した際にフォン・ノイマン型アーキテク
チャで指摘した処理速度や消費電力の問題の改善が期待できる．また，脳活動を忠実に再
現できる SNN を実際の人間の脳規模で実現した場合，現在主流であるディープラーニング
を超える高性能な AI の誕生が期待されている事も今回 SNN を対象とした大きな理由であ
る．本研究では，計算機上で SNN をシミュレーションするのではなく，比較的安価に手に
入る FPGA チップを活用して SNN を直接的にエミュレートする方法を検討した． FPGA
チップを活用する事で，専用チップの開発コストを抑える事ができる．加えて，ニューロン
モデルやシナプスモデルの拡張を比較的容易に実現できる．また，本研究では，非同期に
–2–
スパイク信号のやり取りを行う SNN を再現するために，先行研究である STC(Self-Timed
Circuit)[?] を活用して非同期にスパイク信号の伝達が可能な同期・非同期ハイブリッド型
SNN エミュレータの検討を行った．
以後，本論文では，第 2 章でニューラルネットワークの研究における SNN の位置づけに
ついて述べ，今回対象とする SNN についての説明を行う．
第 3 章では，ハイブリッド型 SNN エミュレータのアーキテクチャについて説明を行い，
本研究で提案しているエミュレータに用られているモジュールとして， STC を含む Synapse
モジュールと Simulator モジュールの動作について述べる．また，エミュレータに用いるパ
ラメータからエミュレータにおける時間と精度の関係を導く．
第 4 章では，本研究で提案した構成を実際の FPGA チップ (Altera 社 Stratix IV) を対
象に回路設計を行い検証した結果をまとめ， Synapse モジュールの回路シミュレーションに
よって第 3 章で導いた関係式が成立する事を示す．
第 5 章では，本研究で提案した構成をまとめ，提案構成の今後の課題と展望について述
べ，本論文を総括する．
–3–
第2章
神経回路網モデル
2.1
緒言
ニューラルネットワークに関する研究は，古くから行われており，いくつもの手法が提案
されてきたが，従来の ANN(Artificial Neural Network) では，望ましい結果を得る事が難
しかった．しかし，近年のハードウェア技術の進歩などにより DNN(Deep Neural Network)
や SNN(Spiking Neural Network) による研究が現実的になり，ニューラルネットワークが
再び注目されはじめた．本章では， SNN と ANN についての違いについて触れ，本研究で
対象としている SNN についての説明を行う．
2.2
Artificial Neural Network(ANN)
ANN の歴史は古く，代表的なものにはパーセプトロンなどがある．パーセプトロンは，
Frank Rosenblatt が形式ニューロンを参考に開発した ANN[6] であり，視覚と脳をモデル
化している．シンプルなネットワークながら学習能力があり，パターン認識を行う事ができ
る．入力層と出力層の２層のみからなる単純パーセプトロンでは，線形分離不可能な問題を
解けない事が指摘され，多層パーセプトロンへと発展した．多層パーセプトロンでは，バッ
クプロパゲーションを用いて非線形分離な問題に対応している．その後，ニューラルネット
ワークの次元圧縮のためのオートエンコーダなどが提案されディープラーニングの研究が盛
んに行われるきっかけとなった．
–4–
2.3 Spiking Neural Network(SNN)
2.3
Spiking Neural Network(SNN)
ニューラルネットワークの研究には， 2 つの流れがあり，一方は，ディープラーニングに
代表されるような，ニューラルネットワークの活用によって社会的に有意義な技術の開発を
目指す研究であり，もう一方が，動物の脳を忠実にコンピュータ上で再現しようという研究
である．動物の脳機能を忠実に再現するためのニューラルネットワークとして SNN があり，
ニューロン間のスパイク信号の重み以外に，スパイク信号による膜電位の時間的な変化など
もモデルとして取り入れている．図 2.1 に本研究で対象とする SNN を示す．従来の ANN
がフォン・ノイマン型のアーキテクチャに依存しているのに対して， SNN は，同期信号を
必要としない．ニューロンの発火によるスパイク信号は非同期にやり取りされ，その影響が
ニューロンによって演算される． SNN では，スパイク信号による膜電位変化の計算モデル
がいくつか存在するが，本研究では， NEST でベンチマークとしても扱われている最もシン
プルなニューロンモデルの一つである IAF(Integrate and fire) ニューロンモデルを用いて
SNN を構成している．
図 2.1
本研究で対象とする SNN
–5–
2.3 Spiking Neural Network(SNN)
2.3.1
IAF ニューロンモデル
IAF ニューロンモデルは，数あるニューロンモデルの中でも特にシンプルなニューロン
モデルであり，ニューロシミュレーションソフト NEST でもサポートされている [4]． IAF
ニューロンモデルにおける膜電位の計算は，計算式 dV m/dt によって表される． dV m/dt
を以下に記す [7]．
dV m / dt = −(V m − E L) / tau m + I syn(t) /C m + I e / C m
(2.1)
V m は，エミュレーション時間 t − 1 における膜電位を表しており， E L は，安静時膜電
位を表す． tau m は, 膜時定数であり， C m は細胞膜の電気容量， I e は外部からの恒常的
な入力電流である． I syn(t) は外部からのスパイク信号によるシナプス電流を alpha 関数
で求めた後，その電流値の和を求めている． I syn 関数と alpha 関数を以下に示す．
I syn(t) = wij
alpha(t − t j) = e × t / tau s × e
n
X
k=1
(−t / tau s)
alpha(t − t j)
(2.2)
× Heaviside(t)
(2.3)
この式において， e は指数関数を表しており， tau s は alpha 関数による電流値が最大にな
るまでの時間を表し， Heaviside(t) はヘヴィサイドの階段関数を表している． IAF ニュー
ロンモデルにおけるスパイク信号の影響をグラフにしたものを図 2.2 に示す．
時間 t にスパイク信号が到着したとすると，そのスパイク信号は， alpha 関数によって下
のグラフような結果としてニューロン内で演算される事になる．次に，スパイク信号が短い
間隔で連続して到着した場合を考える．
図 2.3 のようにスパイク信号が到着した場合は，連なるスパイク信号の足しあわせによっ
て膜電位が表現される．この時電位が閾値 Vth を超えていた場合には，ニューロンが発火
し，スパイク信号が出力される．
–6–
2.4 結言
図 2.2
2.4
IAF モデルにおける synaptic current
結言
本章では，従来の ANN と SNN の研究目的の違いについて触れ，研究対象として扱う
SNN についての説明を行った．また， SNN のニューロンに用いられている膜電位変化の計
算モデルである IAF ニューロンモデルについて述べた．次章では， IAF ニューロンモデル
と STC(Self-Timed Circuit) を用いた同期・非同期ハイブリッド型 SNN エミュレータの
構成法について述べる．
–7–
2.4 結言
図 2.3
連続して到着したスパイク信号による synaptic current の足しあわせ
–8–
第3章
セルフタイム回路を用いたハイブ
リッド型 SNN エミュレータ
3.1
緒言
本章では，任意のタイミングで入力されるスパイク信号による膜電位変化を演算するた
めの同期・非同期ハイブリッド型 SNN エミュレータを構成する方法について述べる．ハ
イブリッド型 SNN エミュレータは，同期回路として動作する Simulator モジュールと非
同期回路の一種である STC(Self-Timed Circuit) と AtoS 回路・ StoA 回路を組み合わせ
た Synapse モジュールによって構成される．これを 1 つのニューロンと見なし，複数のエ
ミューレータを相互に接続する事で SNN を構築する．
はじめに， SNN エミュレータの構成方針について触れ，次に Synapse モジュールを構成
する各回路の特徴を挙げた後，最後に， Simulator モジュールについての説明を行う．
3.2
SNN エミュレータの構成方針
SNN エミュレータの構成を図 3.1 に示す．
本研究で提案する SNN エミュレータは， Simulator モジュールと Syapse モジュールに
よって構成される． Simulator モジュールは連立微分方程式を差分方程式によって計算する
回路を含み，任意のタイミングで入力されるスパイク信号による膜電位変化の演算を行う．
設定したシミュレーション時間中に発火が起きると， Simulator モジュールからニューロン
–9–
3.3 Synapse モジュール
図 3.1
SNN エミュレータの構成
のスパイク信号が出力されると共に，後続のニューロンへスパイク信号を転送するための転
送要求信号を Synapse モジュールに対して出力する．
Synapse モジュールは， Simulator モジュールに対して他のニューロンからのスパイク信
号の到着を知らせる機能と， Simulator モジュールから出力される転送要求信号を受けて後
続のニューロンとハンドシェイクを行う機能を持つ． Simulator モジュールと Synapse モ
ジュール， 2 つのモジュールを組み合わせる事で SNN エミュレータを構成し， SNN シミュ
レータの拡張性を確保している．
3.3
Synapse モジュール
Synapse モジュールについての説明を行う． Synapse モジュールは， Simulator モジュー
ルから任意のタイミングで送信される転送要求信号を自律的に受信して動作する STC と，
同期回路と STC の信号のタイミング差を吸収する AtoS 回路， StoA 回路によって構成され
– 10 –
3.3 Synapse モジュール
図 3.2
Synapse モジュールの構成
る． Synapse モジュールの構成については図に示す．
3.3.1
STC(Self-Timed Circuit) とその特徴
図 3.3
STC の概略図
– 11 –
3.3 Synapse モジュール
STC は，信号がやってくるタイミングで自律的に動作し，処理を開始する回路である．こ
の特徴を用いる事で，エミュレーション中の任意のタイミングで起こる発火によるスパイク
信号をニューロン間でやり取りする事が可能である． STC は C 素子と呼ばれる，自律駆動
素子 (転送制御回路) から構成され， C 素子の転送要求信号 Send に対して Ack 信号を返す
事でハンドシェイクを行う． STC が自律的に信号を処理可能なのは， C 素子間の相互通信
(ハンドシェイク ) に依るものである．
STC の構成を図 3.3 に示す． STC の構成要素は， DLi (データラッチ ) と C 素子である．
Sendi はデータの転送要求信号， Acki はデータの転送許可信号， CPi は各 C 素子間のハン
ドシェイクが完了した際に，出力される回路制御用の信号である．通常は CPi は DLi に出
力され，入力されるデータをロジックへと開放するために用いられる．ハンドシェイクは以
下のような手順で行われる．
1. データ転送要求信号 Send0 = 1 を C0 に転送する
2. C0 はデータ転送要求信号 Ack0 = 1 を転送し，また， C1 へ Send1 = 1 を転送する
3. Send0 = 1 を C0 へ転送する
4. C0 は Send1 = 1 を C1 へ転送する
5. C1 は Ack1 = 1 を C0 へ転送する
6. C0 は CP 0 = 1 を DL0 へ転送し，データを通過させ， C0 は Send = 1 を C1 へ転
送を行う
7. C1 は Send2 = 1 を C2 へ転送する
8. C2 は Ack2 = 1 を C1 へ転送する
9. C1 は CP 1 = 1 を DL1 へ転送し，データを通過させ， C1 は Send2 = 1 を C2 へ転
送を行う
10. C2 は Send3 = 1 を転送する
11. Ack3 = 1 を C2 へ転送する
12. C2 は CP 2 = 1 を DL2 へ転送し，データを通過させ， C2 は Send3 = 1 を転送する
– 12 –
3.3 Synapse モジュール
以上の手順を繰り返しながら C 素子間でハンドシェイクを繰り返す事で， C 素子は非同期
に信号のやりとり行う．
本研究で提案する SNN エミュレータにおいては，任意のタイミングで出力される転送要
求信号をニューロン間でやりとりするために，より高度な機能が必要となる．本構成を満た
すために機能を付加した C 素子について以下に述べる．
3.3.2
CM 素子
CM 素子は，スパイク信号の伝送遅延が異なる 2 つのニューロンのいずれとハンドシェイ
クを行うか選択する機能を実現する転送制御回路である． CM 素子は， 2 つの C 素子から
Send 信号の入力を受け取り，先に Send 信号を送った C 素子とハンドシェイクを行う．一
方の C 素子とハンドシェイクを行っている間，もう一方の C 素子はハンドシェイクを行わ
ない事で，発火レートの異なる 2 つのニューロンからのスパイク信号をそれぞれ受信する事
を可能にしている．
3.3.3
CB 素子
CB 素子は，発火が起きた際に，後続のニューロン 2 つに対してスパイク信号をそれぞれ
送信するための C 素子である． 1 つ目のニューロンとのハンドシェイクが完了すると，後述
する StoA 回路より branch 信号を受け取り 2 つ目のニューロンへと送信先の切り替えを行
い Send 信号の複数送信を実現している．
3.3.4
Asynchronous to Synchronous(AtoS) 回路
AtoS 回路は，非同期回路と同期回路の信号のタイミング差を吸収するための同期回路で，
接続されている CM 素子からの Send 信号をキャッチすると状態遷移マシンによって一度だ
けハンドシェイクを行い，ハンドシェイクの完了時に Simulator モジュールに対して valid
信号を送信する． valid 信号によって Simulator モジュールはスパイク信号の到着を検知で
– 13 –
3.4 Simulator モジュール
きる． Send 信号の受信から valid 信号を送信するまでを 1 サイクルとして，この動作を繰
り返し，発火によるスパイク信号を後続のニューロンへと送信している．
3.3.5
Synchronous to Asynchronous(StoA) 回路
StoA 回路は，同期回路と非同期回路の信号のタイミング差を吸収する同期回路で，接続
されている Simulator モジュールから発火を知らせる valid 信号を受け取ると，状態遷移マ
シンによって，接続されている CB 素子に対して Send 信号を送りハンドシェイクを開始す
る． CB 素子に接続されている後続のニューロンは 2 つ存在するため， StoA は 2 度ハンド
シェイクを行う必要がある．また， 1 つ目のニューロンとのハンドシェイクが完了したタイ
ミングで， 2 つ目のニューロンへとハンドシェイクを切り替えるための branch 信号を CB
素子に対して送信する事で，後続の 2 つのニューロンとのハンドシェイクを実現している．
3.4
Simulator モジュール
Simulator モジュールは，入力されるスパイク信号が膜電位に与える影響を演算する働き
を持った同期回路である． SNN を構成する上で，最も重要なモジュールであり，モジュール
内部でスパイク信号の到着時刻やスパイク信号の重みを加味して膜電位の変化を演算してい
る． Simulator モジュールの演算の結果，発火が起こると C 素子， AtoS 回路， StoA 回路
から構成される Synapse モジュールに対して転送要求信号である valid 信号が送信される．
Synapse モジュールがこの valid 信号を受け取ると，自身の C 素子と後続の C 素子との間
でハンドシェイクが開始される．ハンドシェイクが完了するとスパイク信号が後続のニュー
ロンへと伝達される．この Simulator モジュールを拡張する事で，膜電位の演算に用いる
ニューロンのモデルを変更する事ができる．膜電位を演算するためのモデルは数多く存在す
るため， Simulator モジュールと Synapse モジュールを個別に構成して拡張性を確保して
いる．
– 14 –
3.5 提案エミュレータにおける時間と精度
3.5
提案エミュレータにおける時間と精度
2 つのニューロン間でのスパイク信号のやり取りを例にエミュレーションの速度・精度の
関係式を求める．まず，モデル上のエミュレーション時間を求めるために，ニューロン A と
ニューロン B の存在を仮定する．ニューロン A からニューロン B へのスパイク信号の伝達
遅延を Dij として，ニューロン B がニューロン A からスパイク信号を受けて発火するまで
の時間を Tｊとおくと，このニューロンのモデルにおけるモデル上のエミュレーション時間
は，
Tj
Dij
とおく事ができる．
次に，実時間でのエミュレーションについて考える． IAF ニューロンモデルの演算による
電位の出力間隔を dt とすると，ニューロン B がスパイク信号を受けてから発火するまでの
モデル上の時間は，
Tj
dt
とおく事ができ，また，電位変化は同期信号の 1 クロック毎に出力
されるため，同期信号の周波数を fck とすると，モデルにおける T j は実時間上で
Tj
dt
×
1
fck
と表す事ができる．モデルにおける伝送遅延 Dij は，エミュレーションを加速させるための
′
a(Accel-factor) に回路上の遅延を含む伝送遅延 Dij
をかけあわせたものと対応させる事が
できる．
以上を式としてまとめると次のようになる．
Tj
≃
Dij
Tj
1
dt × fc k
1
′
a × Dij
(3.1)
′
この式において， Dij
が十分に遅い場合，次のように式を近似する事ができる．
a = dt × fck
(3.2)
求めた式を用いて，回路の速度を導く事ができ，例えば， dt = 1ms，動作周波数 fck =20MHz
における a は 2.0 × 104 となり，実時間の 20000 倍のエミュレーション速度である事を示す．
′
この時，伝送遅延 Dij ， Dij
をスケールする事で，エミュレーションを更に加速させる事
ができる．しかし，伝送遅延をより短く設定する事で，回路上の遅延による値の誤差が，エ
ミュレーションの目的において許容できる場合に限る．
導出した式による，エミュレーション速度と精度の検証は，次章で行う．
– 15 –
3.6 結言
3.6
結言
本章では，セルフタイム回路を用いた SNN エミュレータの構成について述べた．セルフ
タイム回路を用いる事で，スパイク信号の非同期性を実現し，より実際の脳活動に近い条件
でのエミュレートを可能にした．また，膜電位変化の演算を行う Simulator モジュールと転
送要求信号のやり取りを行う Synapse モジュールを個別に構成する事で，他のニューロン
モデルの拡張が容易なように設計を行った．膜電位変化を計算するモデルは数多く存在する
が，ニューロンの膜電位が閾値を超えたら発火するという基本的な動作は同じであるため，
Simulator モジュールの記述を変更する事で，目的に合わせた SNN エミュレータを構成す
る事ができる．
提案した回路構成を実際の FPGA チップに実装するための設計手順と提案回路の検証結
果について次章で述べる．
– 16 –
第4章
FPGA 回路設計と評価
4.1
緒言
本章では，前章で提案した回路構成に関して， FPGA チップ (Altera 社 Stratix V) を対
象とした回路を設計し，回路規模などを評価した．
具体的には， Simulator モジュールに実装するニューロンモデルとして，ソフトウェアシ
ミュレータ NEST でもサポートされている IAF ニューロンを取り上げ， IAF ニューロン４
個の SNN を記述した Matlab コードを， HDL Coder によって Verilog HDL 記述に自動変
換した後， STC とその I/F 回路を追記して， FPGA を対象に論理合成および，配置・配線
を行った．また，設計した Synapse モジュールを用いて前章で示したエミュレータにおける
時間と精度の関係が成り立つ事を検証した．
4.2
FPGA 実装したエミュレータの仕様 (設計・検証手順)
SNN エミュレータは， Simulator モジュールと Synapse モジュールで構成される． Simulator モジュールは，主に Matlab を用いて設計を行い， Synapse モジュールは， Verilog
HDL によって設計している．膜電位変化を演算するための IAF ニューロンモデルは，複雑
な計算式を含んでおり， Verilog HDL を用いて一から構築する事は難しい． Matlab を用い
る事で，より抽象度の高い記述が可能になる事から，本研究では， Simulator モジュールの
設計に Matlab を用い， Matlab のサードパーティ・ソフトである HDL Coder を使用して
Matlab コードを Verilog HDL に自動変換した．そして，自動変換された Verilog コードに
– 17 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
対して Verilog HDL で設計した Synapse モジュールを追記して SNN エミュレータを構築
した．
設計した回路は，実際の FPGA チップを対象に Altera 社の Quartus を用いて論理合成
を行い，回路規模やエミュレーション性能について評価し，また， Synapse モジュールを論
理合成・回路シミュレーションする事で，前章で示した提案エミュレータにおける時間と精
度の関係が成り立つ事を検証した．
4.2.1
Synapse モジュールの設計
Synapse モジュールは， STC と AtoS 回路， StoA 回路で構成され，それぞれ Verilog
HDL コードで設計されている． STC は， 2 入力 2 出力のニューロンを実現するために， CM
素子と CB 素子を用いており，それぞれ NAND ゲートや NOT ゲートによる組み合わせ回
路である． AtoS 回路， StoA 回路は，状態遷移マシンであり，同期信号を受けて動作する順
序回路である．
STC における C 素子の仕様を説明をする． C 素子の構成図を図 4.1 に示す．図に示す通
り， C 素子の内部にはいくつかの遅延素子が組み込まれている．この遅延素子は， C 素子の
動作を保証するために必要なものである． CM 素子， CB 素子にも同じように遅延素子が組
み込まれており，遅延量は遅延 D が 2ns で，それ以外の遅延が 1ns である．一般的な C 素
子に，より高度な機能を付与したものが CM 素子と CB 素子であり，それぞれ機能が異な
る． CM 素子は， 2 つの C 素子からの Send 信号を受け付ける事ができ，先に届いた Send
信号と優先的にハンドシェイクを行う．現状， CM 素子は 2 つの C 素子としかハンドシェイ
クを行う事ができないため，本研究で提案する SNN よりも規模の大きな SNN を構成する
際には， CM 素子の改良が必要となる． CB 素子は， branch 信号によって接続先を切り替
える事ができる C 素子であり， branch 信号の bit 幅を増やす事で必要な数だけ送信先を増
やす事が可能である．しかし，複数の送信先に対して同時にハンドシェイクを行う事はでき
ないため，接続数が増えるほど優先度の低い送信先までの信号の伝達が遅くなってしまう問
題がある．よって，より大規模な SNN を構成する際は， CB 素子の改良が必要である．
– 18 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
C 素子は，隣接する C 素子が連鎖的にハンドシェイクを行う事で信号の伝達を行うため，
今回提案する SNN エミュレータのように，任意のタイミングでハンドシェイクを行わせた
い場合には，期待する動作をしない場合がある．また， C 素子間の信号は非同期に行われて
いるのに対して Simulator モジュールの演算は同期信号と同期して行われており，任意のタ
イミングで送信されるスパイク信号を扱うためには，信号のタイミング差を吸収する AtoS
回路と StoA 回路が必要になる．
図 4.1
一般的な C 素子の構成
AtoS 回路の仕様について説明する． AtoS 回路も StoA 回路も状態遷移マシンで構成され
ている． AtoS 回路は，接続されている CM 素子から送られてくる Send 信号の立ち下がり
を同期信号毎にキャプチャし，立ち下がりを検知すると，状態を遷移して， CM 素子が正常
に動作するような Send 信号， Ack 信号を発生させる．
AtoS 回路には， nw IDLE, nw HOLD, nw ACK の 3 状態が存在し，クロック信号の立
ち上がり毎に， CM 素子からの Send 信号によって状態を遷移させる．また， AtoS 回路に
は，入力信号として， clock 信号， reset 信号， Send 信号があり，出力として， Ack 信号と
valid 信号がある． AtoS 回路の実際の動作を以下に記す．
– 19 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
スパイク信号の到着による Simulator モジュールに対する通知
1. 1 クロック目の立ち下がりで，ネガティブエッジフリップフロップ回路によって Send
信号をキャプチャする．
2. 2 クロック目の立ち上がりで， valid 信号を立ち上げ， 3 クロック目で valid 信号を立ち
下げる．
状態遷移マシンによる CM 素子とのハンドシェイク
1. リセット信号によって出力信号と状態をリセットする．状態は， nw IDLE へと移る．
2. CM 素子からの Send 信号の立ち下がり，すなわち Send = 0 を検知すると， Ack = 0
にして状態を nw HOLD に移す．
3. nw HOLD の状態では， 1 クロックの間， Ack = 0 に固定し続け，状態を nw ACK へ
と移す．
4. nw ACK では，クロックの立ち上がりに合わせて， CM 素子からの Send 信号を監視
しており， CM 素子の Send 信号が Send = 1 となったら， Ack = 1 にして状態を
nw IDLE へと移し動作を終了する．
AtoS 回路は， 1 回のハンドシェイクが完了する度に，スパイク信号の到着を知らせる valid
信号を Simulator モジュールに対して送信する．この時， CM 素子に接続されているデータ
ラッチに対して CM 素子からデータラッチ開放信号である CP 信号が出力されているため，
Simulator モジュールは，届いたスパイク信号の識別子を valid と共に受け取る事ができる．
StoA 回路の仕様について説明する． StoA 回路には， nw IDLE, nw REQ, nw ACK,
nw coDown, nw REQ2, nw ACK2 の 6 状態が存在し，クロックの立ち上がり毎に， CB 素
子に対して信号を送信・受信し，状態を遷移させる．また， StoA 回路の入力には， clock
信号, valid 信号, reset 信号, Ack 信号 (それぞれ 1bit) が存在し，出力には， Send 信号,
enable 信号， branch 信号 (それぞれ 1bit) がある． StoA 回路の動作を以下に記す．
– 20 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
状態遷移マシンによる CB 素子とのハンドシェイク
1. リセット信号によって出力信号と状態をリセットする．状態は， nw IDLE へと移る．
2. Simulator モジュールからの valid 信号の立ち上がり，すなわち valid = 0 を検知する
と， Ack = 0 にして状態を nw REQ に移す．
3. nw REQ の状態では， CB 素子からの Ack 信号を監視しており， Ack = 0 であった場
合は， Send = 0 にして，状態を nw ACK へと移す．
4. nw ACK では， CB 素子からの Ack 信号が Ack = 1 となるまで状態を維持し， Ack = 1
となったら， 2 つ目の送信先と CB 素子がハンドシェイクを行うように branch = 1 に
切り替え，状態を nw coDown へと切り替える．
5. nw coDown では， 2 回目のハンドシェイクを CB 素子と行うために， Send 信号を立
ち下げ，状態を nw REQ2 へと移す．
6. nw REQ2 の状態では， Ack 信号の立ち下がりを監視し， Ack = 0 であれば， Send 信
号を立ち下げ，状態を nw ACK2 へと移す．
7. nw ACK2 では， CB 素子からの Ack 信号が立ち上がるまで状態を維持し， Ack = 1 と
なったら， Send 信号を立ち上げ， branch 信号をリセットし， enable 信号を立ち下げ，
Simulator モジュールに対して， 2 回のハンドシェイクの完了を通知する．通知が完了
したら，状態を nw IDLE に移して動作を終了する．
各ニューロンの CB 素子の Send 信号の先には，同期信号によって動作する遅延回路があ
り，同期信号をカウントして遅延量を調節する事ができる．これによって， SNN における
スパイク信号の伝送遅延を実現している．
4.2.2
Simulator モジュールの設計
Simulator モジュールは， Matlab によって設計されている． Matlab で設計を行う際には，
Verilog HDL で設計を行う際と同じように，回路の動作を記述した Matlab コードとその動
作を検証するためのテストベンチコードが必要になる．提案回路では，多数存在するニュー
– 21 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
ロンモデルのうちソフトウェアシミュレータ NEST[4] でもサポートしている IAF モデルを
Simulator モジュールに実装している． IAF モデルを Matlab コードとして実装するために
は，トップの関数として式 2.1 と，式 2.1 の内部にある I syn 関数， I syn 関数の内部にあ
る alpha 関数が必要になる．どの関数に関しても変化する値はエミュレーション時間 t のみ
である． alpha 関数では， ex という指数関数を用いるが， Verilog HDL で指数関数をエミュ
レーション時間ごとに求める事は，実装上難しいため，あらかじめエミュレーション時間分
の値を配列に格納しておき， alpha 関数が呼び出される度に配列から値を取り出す事で実現
している．この時指数関数に用いる e1 は仮数部 16 桁の数 2.7182818284590455 である．
I syn 関数では，入力されるスパイク信号の影響をすべて足し合わせる必要があり， IAF
モデルに必要な関数とは別に，スパイク信号の入力を検知してスパイク信号の識別子と入力
された時間を格納するための関数が必要になる． Verilog HDL では， 2 次元配列をサポート
してないため，時間と識別子の配列をそれぞれ用意してスパイク信号の値を格納している．
配列のサイズは，ニューロンがスパイク信号を受けてから発火するまでの時間を考え，およ
そ 18 − 20 の間で設計する． Synapse モジュールのハンドシェイクが完了すると， Simulator
モジュールに対して Synapse モジュールより valid 信号が入力される． Simulator モジュー
ルが valid = 1 を検出すると，その時のエミュレーション時間とスパイク信号の識別子を用
意されている配列の先頭から格納していく． I syn はこの配列の値をループ文で先頭から取
り出し，スパイク信号が膜電位に与える影響として用いる．また，この時スパイク信号の識
別子を判定する事で，ニューロン間の重み wij を掛け合わせている．スパイク信号には，そ
れぞれニューロンの識別子が存在し，本研究における提案 SNN おいては，ニューロンの数
は， 4 つであり，識別子のビット幅は 2bit である．
I syn 関数や alpha 関数によって IAF ニューロンモデルは，エミュレーション時間 t 毎
に膜電位 V m を出力する．この時の膜電位の値のビット幅は全体で 25bit であり，整数部
は， 7bit，指数部が 17bit の値である． V m の値が，指定した閾値 Vth を超えたら， IAF
ニューロンは発火してスパイク信号と Synapse モジュールに対する valid 信号を出力する．
Synapse モジュールは，この valid 信号を受け取ると後続のニューロンとハンドシェイクを
– 22 –
4.2 FPGA 実装したエミュレータの仕様 (設計・検証手順)
開始する． IAF ニューロンが発火すると， V m や配列に格納されていたスパイク信号は，不
応期の間リセットされ続ける．発火の際に出力される識別子に関しては， Synapse モジュー
ルからの enable 信号が入力されるまで固定され， enable 信号が入力されるとリセットされ
る．これは，ニューロン間の伝達遅延が大きく，ハンドシェイクが完了するまで識別子を固
定しないと後続のニューロンに対して正しくスパイク信号が伝達されないためである．関数
ファイルの設計に関しては，以上である．次は，テストベンチの設計に関して述べる．
テストベンチには，関数を動かすために必要な入力値を記述する必要がある．今回必要な
入力は，エミュレーション時間 t，スパイク信号の識別子 Identif ier ，スパイク信号検知信
号 valid，これらを引数として関数に渡し，指定したエミュレーション時間まで t をインク
リメントしながらループさせる．
本研究で提案する SNN エミュレータでは， 1 つのニューロンとして書き出した Matlab
コードを相互に接続するのではなく， 1 つの Matlab コード上で 4 つのニューロンを実装し
ている．これは， Matlab HDL Coder で読み込む事ができる関数のファイルが 1 つという
制限からである．よって，テストベンチ側で用意する t や Identif ier ， valid などは，想定
するニューロンの数だけ必要になる．
Matlab 上で動作の確認が完了したら， Matlab HDL Coder を用いて， FPGA チップファ
ミリや，回路実装時のクロック周波数などの各オプションを指定して Verilog HDL として
出力する．
4.2.3
検証手順
本研究では，設計した SNN エミュレータの動作を検証するために，実際の FPGA チップ
を対象に論理合成を行った．対象とする FPGA のチップファミリは， Altera 社の Stratix
IV EP4SE820F43I4 で，論理合成・回路シミュレーションには， Altera 社 Quartus II
ver13.0(Quartus) と Mentor Graphics 社 Questa Advanced Simulator(Questa Sim) を用
いた．論理合成には，主に Quartus を用い，論理シミュレーション・実遅延シミュレーション
には， Questa Sim を用いている． Quartus に同梱されている Mentor Graphics ModelSim
– 23 –
4.3 設計・検証結果
というシミュレータでは，いくつかの機能の制限があり本研究で提案する回路を扱う事がで
きないため，今回は使用していない．
設計の完了した Simulator モジュールと Synapse モジュールの Verilog HDL ファイルを
Quartus に取り込み，論理合成を実行して， Stratix IV EP4SE820F43I4 における設計回
路のスペックを検証した．次に， Synapse モジュールに対して配置配線を行い，配置配線が
完了すると Quartus から呼び出した Questa Sim を用いて論理シミュレーション・実遅延
シミュレーションを行い，エミュレーション性能やエミュレータにおける時間と精度の関係
を検証した．
4.3
設計・検証結果
提案構成を設計し， Quartus を用いて論理合成した結果を以下の表に示す．比較として
表 4.1
論理合成の結果
LE 数
Pin 数
DSP ブロック数
SNN エミュレータ
677,554(105%)
352(31%)
960(100%)
Simulator モジュール
677,521(104%)
316(28%)
960(100%)
36(3%)
0
Synapse モジュール
33(1%)
Simulator モジュールのみの場合， Synapse モジュールのみの場合の結果も表にまとめてい
る．結果を見ると， Simulator モジュールが LE 数， Pin 数のほとんどを占めている事がわ
かる．実際の FPGA(Stratix IV EP4SE820F43I4) を対象に Simulator モジュールの合成
を行った結果， LE(Logic-Element) 数が 677,521 で全体の 104%となり，より大きな FPGA
でなければ， SNN エミュレータの実装が不可能である事が分かった． alpha 関数は，指数
関数の演算を含むが， Verilog HDL では，指数関数をサポートしていないため，予めエミュ
レーション時間の分だけ求めた値を配列に格納して必要な時に呼び出している．膜電位を求
める際には，現在のエミュレーション時間までに到着したスパイク信号の影響をすべて加味
– 24 –
4.3 設計・検証結果
する必要がある．スパイク信号の入力が無い状態では，およそ t = 20 で発火が起きるため，
ニューロンの発火レート等を考え，現在の仕様では外部から入力されるスパイク信号を格納
する配列のサイズは 20 になる．よって， 1 度の膜電位を求めるために， alpha 関数は 20×2
回呼び出される． alpha 関数内の指数関数の値や alpha 関数自体の呼び出し回数の多さが回
路規模の増大に関係していると考えられ，回路規模縮小のためには，演算式の工夫が必須で
ある．
また，本研究で用いている IAF ニューロンモデルでは， 1 つ前の膜電位の値を利用して，
現在の膜電位を求めるが，この再帰的な計算を実現するために， Matlab コード内の永続変
数である persistent を用いている． persistent を用いる事で，テストベンチ側の値の更新
が削減でき， FPGA の pin 数を減らす事が可能である．一方， persistent を用いる事で，
DSP ブロックを多く消費することも検証できており，合成にかかる時間も増大する．
次に，エミュレータの精度と速度の関係について検証を行った．設計した Synapse モ
ジュールを Quartus に取り込み，実遅延シミュレーションによって信号波形を確認し，
ニューロン A が発火して valid 信号とスパイク信号が出力されてから，ハンドシェイクの完
了によってニューロン C の valid 信号が Simulator モジュールに入力されるまでの時間を
確認した．
モデル上の伝送遅延 Dij を 50us と与え，エミュレーション間隔 dt =1ms とし，ニューロ
ン A に対するスパイク信号の入力が無い場合で回路シミュレーションを行った結果，モデル
上で与えていた 50us という伝送遅延は，回路上では， C 素子や AtoS， StoA 回路の遅延な
どによって 50.898us であった． 0.898us が回路の遅延である．
この時，前章で示した関係式を用いて計算を行う．まず， dt =1ms， fck =20MHz とおく
と， a = 2.0 × 104 である．よって，エミュレーションは実時間の 20000 倍で動作している
事がわかる．次に，エミュレーションの精度について求める．スパイク信号の入力が無い
状態におけるニューロンの自然発火までの時間 T j はおよそ 20ms であり，式ｘの左辺が，
20ms
50us ，
右辺が
20ms
1
50us × 20M Hz
1
×50.898us
2.0×104
である．それぞれ求めると左辺 = 400，右辺 = 392.942 と
なり，その精度は 98.235%である．同様に，伝送遅延 Dij 5ms で回路シミュレーションを行
– 25 –
4.4 結言
うと，左辺 = 4，右辺 = 3.999 となり，その精度は 99.982%である．
以上によって dt や Dij の設定次第では， SNN エミュレータが実時間よりも速い速度でエ
ミュレーション可能である事と， SNN エミュレータの高速化による信号精度劣化のトレー
ドオフ関係を検証できた．
4.4
結言
本章では， SNN エミュレータの設計・検証手順について述べた． Matlab を用いる事でよ
り抽象的な記述によって柔軟なニューロンモデルの設計を行う事ができた．しかし， Matlab
コード上でサポートしている記述が Verilog HDL ではサポートしていない場合があるため，
Verilog HDL に変換する際の事も考慮しつつ設計する事が肝要である．また， Verilog のよ
うにハードウェア的な記述を Matlab コードでは実現できないため，自ら設計した回路を自
動生成された Verilog HDL コードに追記する場合も予め Verilog HDL を意識した Matlab
による設計が必要である．
Synapse モジュールに関しては，非同期に動作する C 素子を任意のタイミングでハンド
シェイクさせるために，同期信号で動作する AtoS 回路や StoA の設計を行った．状態遷移
マシンを用いる事で， C 素子の非同期なハンドシェイクを同期回路でも実現し， Simulator
モジュールと Synapse モジュールとの信号のタイミング差をうまく吸収する事が可能に
なった．
SNN エミュレータは，パラメータの設定によって実時間よりも速い速度で，エミュレー
ションを行う事が理論上可能である事が確認できた．しかし，伝送遅延のスケールによって，
回路の遅延の影響が変化するため，速度と精度のトレードオフ関係を考慮して，エミュレー
ションの目的にあったパラメータの設定が重要である．今後は， Simulator モジュールの実
遅延シミュレーションによって SNN エミュレータの最大動作周波数を求め，実際の FPGA
に実装した場合でも正しく SNN が動作する事を検証する必要がある．
次章では，これまでに述べてきた，本研究の構成や設計・検証についてまとめ，今後の課
– 26 –
4.4 結言
題や展望について述べる．
– 27 –
第5章
結論
近年，ディープラーニングの登場等により，ニューラルネットワークに関する研究が再び
盛んになっている．ディープラーニングに登場の大きな要因には，ハードウェア技術の進歩
が挙げられ，莫大な数のニューロンをコンピュータ上で実装して並列演算できるように事な
どがある．ディープラーニングに代表されるような従来の ANN は，簡略化したニューラル
ネットワークを用いる事で，社会的に有意義な技術を開発するといった研究目的であるのに
対して， SNN の研究目的の多くは，動物の神経回路網をより忠実にコンピュータ上で再現
したいという目的のもと行われている研究である． ANN と比べ，複雑な演算を含む SNN
に関しても，ハードウェア技術の進歩によって以前より大規模なネットワークをコンピュー
タ上で実装可能になった．しかし，未だに人間の脳規模のネットワークを構築するまでには
至っておらず， ANN のシミュレーションの敷居の高さが伺える．スーパーコンピュータ等
の高価なハードウェア機器を扱う事ができるのは，一部の大規模な研究機関に限られ，個人
の研究者や小規模な研究機関において，大規模な ANN をシミュレーションする事は，現実
的ではない．そこで，本研究では，比較的安価に入手可能になりつつある FPGA チップを
活用して，高速に動作する SNN エミュレータの構成について検討を行った．
検討の結果，理論上高速に動作するエミュレータを設計する事ができた．また，本研究で
提案した SNN エミュレータは，ニューロン間のスパイク信号のやり取りに， STC を用い
ており， SNN の非同期な信号の通信も再現する事ができた．しかし， Simulator モジュー
ルに関しては，論理シミュレーションまでの検証しか行っていないため，今後は，実遅延シ
ミュレーションによって実際の FPGA にも実装が可能である事を検証する必要がある．ま
た，実遅延シミュレーションによって Simulator モジュールの最大動作周波数を求め，式ｘ
– 28 –
が成り立つ事も検証する必要がある．設計した SNN エミュレータは，エミュレーション時
間の加速のみでなく，ニューロン間の伝送遅延もスケールしてエミュレーションを行う事が
でき，更なる高速化が可能であった．しかし，エミュレーション時間と信号精度はトレード
オフの関係になっており，信号の劣化が許容できる場合において，伝送遅延をスケールして
高速化を行う事ができる．
提案構成を設計・合成した結果から目標としていた回路の動作速度や回路面積を達成す
る事はできなかったが，今回検討した， SNN エミュレータは，最適化を一切行っていない
ため，最適化によって回路規模や最大動作周波数の改善が見込まれる事が分かった．また，
本研究において膜電位の変化を演算するニューロンモデルには， IAF ニューロンモデルを用
いたが，演算の方法が異なる別のニューロンモデルを実装する事で，回路面積の多くを占め
る Simulator モジュールの規模を縮小できる可能性がある．今後は，様々なニューロンモデ
ルを実装し，それぞれ比較する必要がある．
ニューロン間のスパイク信号のやり取りに関して， SNN の非同期性を実現するために，
本研究では，スパイク信号の送信に STC を活用して検討を行ったが， SNN エミュレータに
親和性の高い非同期回路を模索する事で，エミュレーション速度・精度が向上できると考え
る． STC を用いた非同期回路においては，ハンドシェイクが完了していない間の転送要求
信号は全て無視されてしまうため，本研究のように任意のタイミングで転送要求信号が出力
される回路との相性が悪い．伝送遅延をハンドシェイクの時間として定義しているため，ハ
ンドシェイクが完了しない間は，ニューロンが発火してもその信号は全て無視される事にな
る．また，伝送遅延が ms オーダである事に対して，エミュレーションの時間は us オーダで
あるため，伝送遅延が重大なボトルネックとなってしまう事も今回検証できた．よって今後
は， SNN を FPGA で構成する際に最も親和性の高い非同期回路を模索し，実装する事が重
要であると考える．
本研究の課題は多いが，これらを克服できれば， SNN と FPGA の性質を生かした超低消
費電力な高速 SNN エミュレータを構成する事ができると考える．
– 29 –
謝辞
本研究を行うにあたり，日頃より懇切丁寧にご指導，ご鞭撻を賜りました岩田誠教授に
心より深謝申し上げます．
本研究の論文の副査をお引き受け頂きました，中原潔教授，並びに吉田真一准教授に感
謝の意を表します．
研究室の先輩として，日頃から暖かいご支援，ご協力を頂きました，大学院修士課程田
口龍一氏，松田佳介氏，宇野則文氏，岡宗祥平氏に心より感謝いたします．
研究室の同期として，日頃からご支援，ご協力を頂きました，清藤敦氏，馬場滉也氏，
福田昌平氏に心より感謝いたします．
研究室の後輩として，日頃から暖かいご支援，ご協力をいただきました，梅嵜佑樹氏，小
川友暉氏，渋田広樹氏，松本隆太氏に心より感謝いたします．
最後になりましたが，日頃よりご支援頂きました関係者の皆様に，心より感謝申し上げ
ます．
– 30 –
参考文献
[1] Andrew Y.Ng, et al., “Building high-level features using large scale unsupervised
learning,” International Conference on Machine Learning, 2014.
[2] Paul A. Merolla et al., “A million spiking-neuron integrated circuit with a scalable
communication network and interface,” Science 345, 668, 2014.
[3] S. Kunkel, et al., “Spiking network simulation code for petascale computers,” Frontiers in Neuroinformatics, vol. 8, pp.1-23, Oct.2014.
[4] “NEST Initiative,”
http://www.nest-initiative.org/Software:About_NEST,
Feb.2015.
[5] Kazuhiro Komatsu, Shuji Sannnomiya, Makoto Iwata, Hiroaki Terada, Suguru
Kameda, Kazuo Tsubouchi, “Interacting Self-Timed Pipelines and Elementary Coupling Control Modules,” IEICE TRANSACTIONS on Fundamentals, Vol.E92-A,
No.7, pp.1642-1651, July 2009．
[6] Rosenblatt Frank., “The Perceptron: A Probabilistic Model for Information Storage
and Organization in the Brain,” Psychological Review 65 (6): pp.386408, 1958.
[7] A. Morrison, et al., “Exact subthreshold integration with continuous spike times in
discrete time neural network simulations,” Neural Computation, vol. 19, pp.47-79,
2007.
– 31 –

セルフタイム回路を用いたスパイク駆動 神経回路網エミュレータの構成法

Comments

Description

Transcript

セルフタイム回路を用いたスパイク駆動神経回路網エミュレータの構成法