Comments
Description
Transcript
発表資料 - PC Cluster Consortium
物性物理におけるモンテカルロ法とその大規模化 藤堂眞治 東京大学物性研究所 計算物質科学研究センター [email protected] powered by ALPS http://alps.comp-phys.org/ 1 Acknowledgment • 松尾春彦 (現 RIST), 設楽秀之 (富士通) • 諏訪秀麿 (現 Boston University), 本山裕一, 安田真也 (東大院工) • 川島直輝, 富田祐介, 渡辺宙志, Jie Lou (現 復旦大学), 正木晶子 (東大物性研), 鈴木隆史 (兵庫県立大), 原田健自 (京大), 坂倉耕太 (NEC) • Matthias Troyer (ETH), 五十嵐亮 (物性研), 他 (ALPS Collaboration) • 次世代ナノ統合シミュレーションソフトウェアの研究開発 • HPCI戦略プログラム(SPIRE) 分野2 <新物質・エネルギー創成> (CMSI) • 理研計算科学研究機構(AICS) 「京」試験利用 2 CMSIは3つのコミュニティーの融合組織 分野2「新物質・エネルギー創成」 計算物質科学イニシアティブ Computational Material Science Initiative (CMSI) 戦略機関 (代表 物性研) 分子科学研究所 物性研究所 金属材料研究所 協力機関(11機関) 産官学連携(2機関) 産 物 総 材 研 機 構 分子科学 教育(9機関) 豊 総 名 神 京 橋 研 古 戸 都 技 大 屋 大 大 科 大 学 学 大 学 物性科学 金 沢 大 学 大 阪 大 学 東 京 大 学 東 北 大 学 材料科学 7 3 4 応用 (奔流) デバイス エネルギー変換 分子機能 重点;ナノ構造電子機能予測 重点;燃料電池物質 重点;全原子Simによる ウイルス分子科学 高性能リチウムイオン電池 電子的~機械的性質の マルチ・シミュレーション スピントロニクス、 マルチフェロイックス材料 重点;水素・メタンハイドレート 生成、安定 ナノ・生体系反応制御・ 化学反応ダイナミクス 太陽電池高効率長寿命化 生体分子高次構造と機能 バイオマス酸素反応解析 光機能分子と非線形外場応答 分子の光物性 光誘起電子ダイナミクスと 光・電子機能量子デバイス 新材料探索 高効率エネルギー 変換構造用材料 ナノ構造体材料の高効率非平 衡エネルギー変換 重点;相関の強い量子系新量子相探求とダイナミックス 電子相間の強い物質 の新機構解明 強相関電子系の 励起ダイナミックス 新しい量子相・量子臨界現象 基礎 12 (源流) ポリモルフ生起分子集団機能 重点;電子状態・動力学・熱揺らぎ融和と物質理論新 凝縮分子科学系揺らぎとダイナミックス 分子における電子の動的 過程と多体量子動力学 分子の微細量子 構造予測 新量子相・新物質 5 Why quantum lattice models? • • • • QLM: quantum spin models, bosonic Hubbard models, etc Effects of strong correlations in multi-degree-of-freedom systems • various types of long-range order ! J xy ! + − − + z H= (Si Sj + Si Sj ) + J Siz Sjz • quantum disordered phase 2 !i,j" !i,j" (quantum liquids, spin gap phases) • phase transitions and critical phenomena • 1st order transitions, continuous phase transitions, quantum critical point Universality • depends on few parameters: dimensionality, symmetry of order parameter, etc Powerful unbiased simulation algorithms • quantum Monte Carlo methods • exact diagonalization, DMRG, etc 6 Deconfined critical phenomena • Possibility of continuous phase transition between two symmetry broken phases Novel critical phenomena due to quantum interference Neel$state$ VBS$state$ Emergence of U(1) symmetry Senthil, et al (2004) broken& not&broken& SU(2)&rota+onal& &&&&&symmetry& la2ce&rota+onal& &&&&symmetry& not&broken& broken& • SU(2) symmetric NCCP1 model (Kukulov et al 2008) weak 1st order? • SU(N) J-Q model (Lou et al 2009) consistent with DCP scenario 7 Spin ladder material Na2Fe2(C2O4)3(H2O)2 J. Phys. Soc. Jpn., Vol. 78, No. 12 (b) (a) • • Fe2+ ions in octahedral crystal field effective S=1 spins at low T O b C Fitting experimental data by QMC results for several theoretical models (ladders, dimers, etc) J. Phys. Soc. Jpn., Vol. 78, No. 12 a a c b H. YAMAGUCHI et al. c /ion) B/ion) Susceptibility (emu/mol) QMC and the DMRG methods, respectively. For Fig. 1. (Color online) (a) Crystal structure of Na2 Fe2 (C2 O4 )3 (H2 O)2 . Fig. 2. (a) z (a) H = 100 Oe 2þ these calculations, we use the following parameter values, ions are Hydrogen and sodium atoms are omitted for clarity. Fe 0.20 (C2 O 1288.1 GHz connected by oxalate molecules and form two-leg ladders along the gz ¼ 4:7, gx ¼ 2:0, gy ¼ 2:5, !a ¼ 0:30, and R ¼ 0:1{ 0:5 for 0.20 H//a FeO6 octahedra a-axis, as shown by red broken lines. (b) Distorted " 977.2 GHzH k a (" ¼ 24" , ’ ¼ 90" ) and H ? a (" ¼ 102" , ’ ¼ H// 45 ). a y bridged by oxalate ion. (c) Arrangement of the ladders in the bc-plane, 0.15 847.0 GHzThe principal axis directions and their g-values are deterand red broken lines corresponding to rungs of the ladders. 0.15 x mined from the saturation magnetizations and the slopes of 730.5 GHzthe ESR resonance 0.10 modes in the following isolated dimer 2.2 Experimental methods model analysis. In these field directions, the two sites of the 0.10 H⊥ a The magnetic susceptibilities of a single crystal of SIO H//a ladder are magnetically equivalent. In the calculation, we 0.05 were measured at 100 Oe with a superconducting quantum H⊥a add the temperature-independent Van Vleck paramagnetism T=1.3 K experimentmagnetometer (Quantum interference device (SQUID) 0.05 H = 100 results Oe do notexperiment reproduce to both #k and #? . The calculated calculation magnetizations in pulsed Design MPMS-XL7). High-field the experimental ones well, especially the upturn of # k 0 50 0.00 magnetic fields up to about 53 T were measured utilizing a 15 Van 20 Vleck 25 para30 at approximately 5 K. In5 Fig. 10 6(b), the 5 10 15 20 the 25 30 non-destructive pulse magnet, and magnetizations were Temperature (K) manetic contributions are subtracted from both Mk and M? . Temperature (K) using a standard pick-up detected by an induction method )3 (H2 O)2 at 1.3 K for (b) Wesignals, find a small anomaly at half of the saturation magnetng and weak coil system. z H// a Yamaguchi, Kimura, Honda, Okunishi , Todo, Kindo, Hagiwara (2009) (b) ization of R ¼ 0:14 calculated for H k a, which can be ESR measurements on a single crystalH//a of SIO in pulsed 4 considered to originate from y a 1/2 magnetization plateau. magnetic fields up to about 53 T were carried out using our Fig. 3. 24° and The calculated results also poorly explain the experimental 8 H pulse field ESR apparatus equipped with a non-destructive 3 Susceptibility (emu/mol) the 1623.6 GHz (c) Fe b H. YAMAGUCHI et al. c YAMAMOTO, ated by SSE. System sizes are from LTODO, = 8 to AND L = 16.MIYASHITA denote linear extrapolations of data points. 0.3 1.4 PHYS B.1.2 Mean-fi MOTO, TODO, AND MIYASHITA PHYSICAL REVIEW B 79, 094503 $ 1 We also analyze the Therefore we confirm the the su- Bose-Hubbard Hamiltonian We existence analyze theofextended on a 0.2 SUCCESSIVE PHASE TRANSITIONS AT FINITE… 22 In order approximation. ! " 1 / 2. se in the region of cubic lattice II. MODEL B. Mean-field approximation 0.8 sublattice structure which 0.15 0.25 Sπ(L=12) by the SSE We nalso theNLordering processes derTTSof density.0.6by Herethe w a j +a aia†j % + V = − t $a†i on analyze the extended Bose-Hubbard H Hamiltonian π in j analyze by SSE ρ • Interacting s TRANSITIONS AT FINITE TEMPERATURES soft-core bosons "ij# π(L=10) "ij# 0.1 220.2SIn order to order study the superfluid solid state,order we approximation. and attice 0.4 ρs(L=12) sublattice structure which is characterized a staggere tonian for thisbyMF is given ρ (L=10) 0.15 1 study the ordered† states †at finite temperatures. s SF − !of the n0.05 $1%NSwe adopt mean fields0.2 for the H = − t $ai a j + aia j % + V nin j + U ni$ni − 1%der i , density. Here II. MODEL 0.25 Sπ ! ρs Supersolid in extended Bose-Hubbard model ! ρs Sπ T/U !ithe !i ! ! ansition between the normal liquid phase and 2 = H 0.1 MF H "ij# "ij# order and superfluid order at sublattices A and B. The 0 0 SS s expected to belong to the universality class of † tonian for thisoperators MF is0.1 given by 0.05 0 0.2 0.3 0.4 1 where a and a are the creation and annihilation of i i odel•because the phase transition occurs in the † + U ! ni$n −boson 1% − !$&a nai†,' = "of% and n$1% Supersolid =ai co-existence ! † (b) , = a T/U+ HA + i j ij with i = − zt$a i ai. The parameter t 0denotes 2 i of the orderi parameter symmetry breaking = H C, H A + a A% & B + 0.04 MF 0.045 A 0.05 B 0.055 0.06 the hopping matrix element, Uand and V are the on-site and long-range order (=solid) On the other hand, the phase transition y† of Z2. diagonal t/U ! is the nearest-neighbor repulsions, respectively, and 0.3 1.4 aioff-diagonal are thetocreation and annihilation operators of long-range order (=superfluid) dai isand expected belong to the XY universality † FIG. 6.sum The t-T phase diagram for V / UU = 1 / z and ! / U = 0.7 † over chemical potential. The notation "ij# means the the a†j ' = "parameter % and n = a a . The parameter t denotes ne the $&ai ,order ij i has i = − zt$a + a % & + zVn m + 1% T−S !n H i the S (L=12) A 0.25 B A$n A −state 1.2 symmetryoptical of U!1". lattice A TheAtransition π A B obtained by temperatures of n the solid 3 SSE. • Experimental realization: " 2 , where L is Theand system size are is N = L pping matrix element, nearest-neighbor U and V are thepairs. on-site S (L=10) plotted by solid circles and those T#s are π of the superfluid state n, we study the temperature dependence of theseThe order parameter † ρ (L=12) 1 the length of the system. of the solid = −data zt$a &A + HB the -neighbor repulsions, respectively, and ! is the plotted by open circles. The liness connect points for B%the B+a 0.2 eters. ρs(L=10) guide to the eyes. state al potential. The notation "ij#ismeans the sum over the 0.8 3 -neighbor pairs. The system size is N = L , where L is 0.15 U solid for0.6!t / U 1 successive transitions of superfluid and † iQ·$r −r % j k gth A. of Stochastic the system. The expansion order parameterS#of= the2 ! solid series + aBAs %& zVnBinmthe − !n e "nH #,= − zt$a $2% A + seen A +SSE n B$nB − 1%here jn=kB0.045, !/UB = 0.7". was simulation, 2 N jk 0.1 C =su2zt& we find again the suppression of the solid order by 0.4 the show the results obtained by SSE. The simulaperfluid fraction. Namely, S" has a cusp at the superfluid 0.05 # , # , # % is the wave vector that represents thedepictwhere where Q = $ z$=6% is and the numbe erformed in the1grandiQ·$r canonical ensemble using 0.2comtransition point. We also the phase diagram −r % j k "n n #, e3.staggered $2% parameter As for the order superfluid ! # = N2= j order. k pare of thatthe to that of SSE !Fig. 8". a qualitatively mAThey andshow mB are the mean fi 12 es N = 103Sand N jk 0 0!tc ,numbe &Ais&tation zVm Ce.g., = 2zt T c" good fraction agreement, there the we adopt Bose-Einstein B − tetracritical AmB ,point values of the that of condensation the order parameters state, of solid, S#, and 0 temperatures 0.1 0.2 0.4 and the critical TS" and T0.3 #s are suppressed by spectively, , # , #% is of thetemperature wave vector represents = $# , as a function forthat various values z$=6% isof the number of nearest-neighbor sites. sQ appearance the other order as before. (c) 1 the † where T/Umentioned † http://www.uibk.ac.at/th-physik/qo $k=0superfluid = 2 ! "a j akm+Aakand a j#Let $3% fields ed order. forthe the transition order parameter of the 5!a", we As show from normal liquid studythe the mean competition between the solid and to supermBus are corresponding the e = "n # m N A A ordersofbythe analyzing the Ginzburg Landau Yamamoto, Todo, Miyashita (2009) we condensation fraction con- jk tation number operators for A !GL" and free B site lidadopt for t /Bose-Einstein U = 0.02 in which only S# appears FIG. fluid 5.values Temperature dependence of order parameters obt energy. Since the order parameters m and $ take small value Similarly, &normal A and & B corre the same way, the transition from normal liquid whilebyinspectively, SSE !V = Uvicinity /simulation z". !a"of !tthe/ Utetracritical = 0.02, $ / U = 0.7": liquid-no in the mean-field analysis, the SSE we in the point, the GL free energy is 9 1 多体量子系のためのアルゴリズム • 最近20年の進展 • 厳密対角化、Lanczos法 • 補助場量子モンテカルロ法 Scalapino, Hirsh, Sorella, Imada • 密度行列繰り込み群法 White • 動的平均場近似とその拡張 Kuramoto, Metzner, Vollhardt, Kotliar • 変分モンテカルロ法 Gros, Yokoyama, Shiba, Sorella, Ogata • 経路積分繰り込み群法 Kashima, Imada • ガウス基底モンテカルロ法 Gorney, Drummond, Assaad, Troyer, Imada • 第一原理計算との融合 Kotliar, Georges, Aryasetiawan, ... • クラスターアルゴリズム量子モンテカルロ法 Evertz, Kawashima, Todo, ... 10 World-line QMC for lattice models • Progress since 1990s • Direct simulation in imaginary time continuum • Alternative representation based on high-temperature expansion (SSE) • Simulation in grand-canonical ensemble • Solving critical slowing down by cluster updates (loop algorithm, etc) • Worm (directed-loop) updates for systems with less symmetries • Large spin size S ≥ 1, bosons • Off-diagonal correlation functions • Solving negative sign problem (only for very special models) • Extended ensemble Monte Carlo method (quantum Wang-Landau) • Order-N method for long-range interaction • Non-trivial parallelization of loops using MPI and OpenMp • Using balance-condition instead of DBC 11 「量子モンテカルロ」とは何か? • tr[A exp( H)] A = tr[exp( H)] 次の式を評価したい • ただし、H も A も超巨大な行列 (次元 ∼ 10 • テイラー展開の第 n 次の項を考える tr H = n i1 i2 ··· in 106 ) Hi1 ,i2 Hi2 ,i3 · · · Hin ,i1 106 n • この中に現われる (10 • それぞれの項は、ある種の「経路」(path)を表す 5 4 ) 個の項を確率的にサンプリング 3 6 1 1 4 3 5 6 12 連続虚時間ループアルゴリズム量子モンテカルロ法 (Continuous imaginary-time loop algorithm quantum Monte Carlo method) • 虚時間経路積分により d+1 次元古典系に焼き直す (世界線表示) • クラスター(ループ)アルゴリズムによる非局所更新 - 緩和は非常に速い = =0 • 実際にプログラムの内部で行っていること • 指数分布に従って、一定密度で「横木」を生成 • Union-Find アルゴリズムを使って、全てのクラスター(ループ)を認識 13 One Monte Carlo step in loop algorithm cluster identification labeling world-line configuration graph loop flip loops next configuration parallelization of loop algorithm is nontrivial! • insertion of operators/cuts with constant density Poisson process • cluster identification • cf) conventional local flip is easy to parallelize, but is suffered from critical slowing down ~(system size)2 non-local operations on trees/lists 14 Parallelization of loop algorithm • distributing world-line configuration to several processors • (d+1)-dimensional lattice is split into Np slices with equal imaginary time thickness • labeling process can be performed independently on each process 15 Parallelization of loop algorithm • • binary-tree algorithm for cluster identification N ⇥ = Np log Np / overhead of parallelization is (N log Np )/ Np (negligible at very low temperatures) 16 Further Optimization (a) • node 7 slave node 6 master node 7 slave slave node 4 master node 3 slave node 2 master node 1 slave node 0 master master slave master update unify stage 1 • node 5 node 4 node 3 slave unify • node 6 Introduction of butterfly-type communication • eliminates overhead in distribute process • majority vote trick to determine loop directions with minimum communication • efficient for high-dimensional torus Reduction of number of stages • ‘bucket brigade’ adjacent communication • effective for low-dimensional torus Hybrid parallelization with MPI and OpenMP • multi-thread parallelization with Open MP • inter-node parallelization with MPI • reduces memory and communication overhead in each node • fine-grained parallelization of cluster identification by introducing asynchronous wait-free union-find algorithm node 5 node 2 node 1 master broadcast update unify stage 2 node 0 broadcast rank 7 rank 6 rank 6 rank 5 rank 5 rank 4 rank 4 rank 3 rank 3 rank 2 rank 2 rank 1 rank 1 rank 0 rank 0 update stage 0 unify update stage 1 unify update stage 3 rank 7 unify (b) update stage 2 17 Asynchronous wait-free union-find algorithm 1.find root of each cluster/tree 2.unify two clusters 3.compress path to the new root • locking whole clusters (e.g. by using “omp critical”) is too expensive • finding root and path compression are “thread-safe” • wait-free unification by using CAS (compare-and-swap) atomic operation 8 7 speed up 6 5 4 3 2 1 1 2 3 4 5 6 7 8 number of threads 18 並列化チューニング状況 • 京におけるチューニング状況 京フルシステムでの並列性能推定 ノード数 24576 通信時間 13.7% 並列化オーバーヘッド 54.4% 100000 10000 9 1000 speed up 82944 15% 58% 8 wall time [sec/MCS] 7 100 10 6 5 4 3 2 1 1 1 10 100 1000 10000 100000 number of nodes 0 1 10 100 1000 10000 100000 number of nodes • ウィークスケーリング:24576ノード:12288ノード = 98.66% • MIPS値:0.164 PIPS (理論ピーク性能の10.4%) • FLOPS値:7.63 TFLOPS (理論ピーク性能の 0.243%) 19 ALPS/looper による「京」全系計算 • マイルストーン:S=5 反強磁性ハイゼンベルグ鎖の量子モンテカルロ計算 → 相関長 ∼ 2×105、エネルギーギャップ ∼ 5 × 10-5 → 膨大な数の頂点からなるランダムグラフ中の全ての連結成分の識別問題 • 頂点・辺の数 ∼ 1013、クラスター数 ∼ 1012 • 線形演算ではなく、並列グラフ処理により量子統計物理の重要問題を解く • Graph500 の “Large” ∼ “Huge” 問題サイズ(メモリ 0.14∼1.1PB)に匹敵 • • 2011/11の Graph500 では最大でも“Medium” サイズ(メモリ 17TB) TOP500の一位の「京」フルノードでしかできない非自明並列化 • 単なるベンチマークだけでなく、フルノードを使ったプロダクション ラン(平衡状態のシミュレーション) • ハイブリッド並列化による高速化 ∼ 105 • ループアルゴリズムによる高速化 ∼L2∼ 1014 実質的には 1019 の高速化 20 The ALPS project ALPS = Algorithms and Libraries for Physics Simulations • International collaboration for developing open-source softwares for simulation of quantum lattice models, such as quantum spin systems, electron systems, etc • ALPS Libraries = collection of generic Parameter XML Files Lattice XML File Model XML File C++ libraries • ALPS Applications = collection of Quantum Lattice Model application packages using modern algorithms such as QMC, DMRG, ED, etc • Quantum Monte Carlo Exact Diagonalization DMRG ALPS Framework = environment for executing large-scale parallel simulations including XML schemas, tools, scheduler, etc Outputs in XML Format http://alps.comp-phys.org/ 21 ALPSプロジェクトの目標 • • 計算物性物理の現状 • 研究グループ毎にそれぞれ異ったコード • シミュレーションを行なう模型毎に異ったコード • アルゴリズムはますます複雑に • 互換性のない入出力形式 ALPSプロジェクトの目標 • 最新のアルゴリズムを用いた ”community code” の開発 • 大規模並列計算などのためのC++ライブラリ・フレームワーク開発 • 統一入出力形式の提案とそれにもとづくデータ解析ツールの作成 • 計算物理の専門家だけでなく、理論家・実験家にも使えるシミュレー ションソフトウェア 22 A Simulation using ALPS Lattice XML File square lattice Model XML File H = J < i,j > Parameter File LATTICE = "square lattice" MODEL = "spin" L = 16 Jxy = 1 Jz = 2 SWEEPS = 10000 THERMALIZATION = 1000 { { { { T T T T = = = = 0.1 0.2 0.5 1.0 } } } } parameter2xml tool <LATTICES> <LATTICE name="square lattice" dimension="2"> <PARAMETER name="a" default="1"/> <BASIS><VECTOR>a 0</VECTOR><VECTOR>0 a</VECTOR></BASIS> </LATTICE> <UNITCELL name="simple2d" dimension="2"> <VERTEX/> <EDGE> <SOURCE vertex="1" offset="0 0"/> <TARGET vertex="1" offset="0 1"/> </EDGE> <EDGE> <SOURCE vertex="1" offset="0 0"/> <TARGET vertex="1" offset="1 0"/> </EDGE> </UNITCELL> <LATTICEGRAPH name="square lattice"> <FINITELATTICE> <LATTICE ref="square lattice"/> (0,1) <EXTENT dimension="1" size="L"/> <EXTENT dimension="2" size="L"/> <BOUNDARY type="periodic"/> </FINITELATTICE> <UNITCELL ref="simple2d"/> (0,0) (1,0) </LATTICEGRAPH> </LATTICES> Parameter XML File application programs [ S iz S jz + ( S i+ S j- + S i- S j+ )/ 2 ] - h i S iz <MODELS> <BASIS name="spin"> <SITEBASIS name="spin"> <PARAMETER name="local_S" default="1/2"/> <QUANTUMNUMBER name="S" min="local_S" max="local_S"/> <QUANTUMNUMBER name="Sz" min="-S" max="S"/> <OPERATOR name="Sz" matrixelement="Sz"/> <OPERATOR name="Splus" matrixelement="sqrt(S*(S+1)-Sz*(Sz+1))"> <CHANGE quantumnumber="Sz" change="1"/> </OPERATOR> <OPERATOR name="Sminus" matrixelement="sqrt(S*(S+1)-Sz*(Sz-1))"> <CHANGE quantumnumber="Sz" change="-1"/> </OPERATOR> </SITEBASIS> </BASIS> <HAMILTONIAN name="spin"> <PARAMETER name="J" default="1"/> <PARAMETER name="h" default="0"/> <BASIS ref="spin"/> <SITETERM> -h * Sz(i) </SITETERM> <BONDTERM source="i" target="j"> J * (Sz(i)*Sz(j) + (Splus(i)*Sminus(j)+Sminus(i)*Splus(j)))/2 </BONDTERM> </HAMILTONIAN> </MODELS> Quantum Lattice Model Quantum Monte Carlo Exact Diagonalization DMRG DMFT Python based evaluation tools Plots Outputs in HDF5 & XML 23 ALPS Lattice XML periodic chain with length L <LATTICE name="chain lattice" dimension="1"> <BASIS><VECTOR> 1 </VECTOR></BASIS> </LATTICE> <UNITCELL name="simple1d" dimension="1" vertices=”1”> <EDGE> <SOURCE vertex="1" offset="0"/><TARGET vertex="1" offset="1"/> </EDGE> </UNITCELL> <LATTICEGRAPH name = "chain lattice"> <FINITELATTICE> <LATTICE ref="chain lattice"/> <PARAMETER name=”L”/> <EXTENT size ="L"/> <BOUNDARY type="periodic"/> </FINITELATTICE> <UNITCELL ref="simple1d"/> </LATTICEGRAPH> 24 Model XML for describing Hamiltonian XXZ spin model with two types of bonds (e.g. nearest and next nearest neighbor interactions) <HAMILTONIAN name=”spin”> <PARAMETER name=”Jz” default=”J”/> <PARAMETER name=”Jxy” default=”J”/> <PARAMETER name=”J” default=”1”/> <PARAMETER name=”Jz'” default=”J'”/> <PARAMETER name=”Jxy'” default=”J'”/> <PARAMETER name=”J'” default=”0”/> <PARAMETER name=”h” default=”0”/> <BASIS ref=”spin”/> <SITETERM site=”i”> -h * Sz(i) </SITETERM> <BONDTERM type=”0” source=”i” target=”j”> Jz * Sz(i) * Sz(j) + Jxy * (Splus(x)*Sminus(y)+Sminus(x)*Splus(y)) / 2 </BONDTERM> <BONDTERM type=”1” source=”i” target=”j”> Jz' * Sz(i) * Sz(j) + Jxy' * (Splus(x)*Sminus(y)+Sminus(x)*Splus(y)) / 2 </BONDTERM> </HAMILTONIAN> H= ! !i,j" ! J xy (Si+ Sj− + Si− Sj+ )] − [Jz Siz Sjz + hSiz 2 i 25 ALPS framework and “K Computer” ALPS/looper library tools applications domain-specific libraries numerics • parallelization within MCS XML manipulation GUI database MC QMC ED DMRG lattice model observables scheduler random ublas iterative eigenvalue solver Boost library generic C++ C / Fortran graph ALPS/parapack library • • multiple-level parallelization adaptors for extended ensembles serialization XML/XSLT BLAS LAPACK MPI 26 ALPSの展開 • 上方展開 (大規模化・高性能化・並列化) • 中核アプリ「大規模並列量子モンテカルロ法」(ALPS/looper) の高度化 • 高並列スケジューラ(ALPS/parapack)のハイブリッド多重並列化 • • Fortran, C プログラムのための API 作成 下方展開 • 実験家・理論家による幅広い利用を視野に • Windows/Macintosh 用バイナリインストーラの開発 • ワークフロー・履歴管理システムとの統合 • GUI (グラフィカルユーザインターフェース)の開発 • マニュアル・チュートリアルの日本語化 27 Windows, Mac OS X 用バイナリインストーラ for Mac OS X for Windows 28 ワークフロー・履歴管理システムとの統合 http://www.vistrails.org/ 29 ALPS version 2.1 & ALPS/looper version 4.0 • JSTAT, P05001 (2011) The ALPS project release 2.0: open source software for strongly correlated systems B. Bauer1 L. D. Carr2 H.G. Evertz3 A. Feiguin4 J. Freire5 S. Fuchs6 L. Gamper1 J. Gukelberger1 E. Gull7 S. Guertler8 A. Hehn1 R. Igarashi9,10 S. Isakov1 D. Koop5 P.N. Ma1 P. Mates1,5 H. Matsuo17 O. Parcollet12 G. Pawlowski13 J.D. Picon14 L. Pollet11,1 T. Pruschke6 E. Santos5 V.W. Scarola15 U. Schollwöck16 C. Silva5 B. Surer1 S. Todo17,10 S. Trebst18 M. Troyer1 ‡ M. L. Wall2 P. Werner1 S. Wessel19,20 Theoretische Physik, ETH Zurich, 8093 Zurich, Switzerland Department of Physics, Colorado School of Mines, Golden, CO 80401, USA 3 Institut für Theoretische Physik, Technische Universität Graz, A-8010 Graz, Austria 4 Department of Physics and Astronomy, University of Wyoming, Laramie, Wyoming 82071, USA 5 Scientific Computing and Imaging Institute, University of Utah, Salt Lake City, Utah 84112, USA 6 Institut für Theoretische Physik, Georg-August-Universität Göttingen, Göttingen, Germany 7 Columbia University, New York, NY 10027, USA 8 Bethe Center for Theoretical Phyics, Universität Bonn, Bonn, Germany 9 Center for Computational Science & e-Systems, Japan Atomic Energy Agency, 110-0015 Tokyo, Japan 10 Core Research for Evolutional Science and Technology, Japan Science and Technology Agency, 332-0012 Kawaguchi, Japan 11 Physics Department, Harvard University, Cambridge 02138, Massachusetts, USA 12 Institut de Physique Theorique, CEA/DSM/IPhT-CNRS/URA 2306, CEA-Saclay, F-91191 Gif-sur-Yvette, France 13 Faculty of Physics, A. Mickiewicz University, ul. Umultowska 85, 61-614 Poznan, Poland 14 Institute of Theoretical Physics, EPF Lausanne, CH-1015 Lausanne, Switzerland 15 Department of Physics, Virginia Tech, Blacksburg, Virginia 24061, USA 16 Arnold Sommerfeld Center for Theoretical Physics and Center for NanoScience, University of Munich, Theresienstrasse 37, 80333 Munich, Germany 17 Department of Applied Physics, University of Tokyo, 113-8656 Tokyo, Japan 18 Microsoft Research, Station Q, University of California, Santa Barbara, CA 93106, USA 19 Institute for Solid State Theory, RWTH Aachen University, 52056 Aachen, Germany 20 Institut für Theoretische Physik III, Universität Stuttgart, Pfaffenwaldring 57, 70550 Stuttgart, Germany 1 2 • • http://alps.comp-phys.org/ http://wistaria.comp-phys.org/alps-looper/ ‡ Corresponding author 30 応用 (奔流) デバイス エネルギー変換 分子機能 重点;ナノ構造電子機能予測 重点;燃料電池物質 重点;全原子Simによる ウイルス分子科学 高性能リチウムイオン電池 電子的~機械的性質の マルチ・シミュレーション スピントロニクス、 マルチフェロイックス材料 重点;水素・メタンハイドレート 生成、安定 ナノ・生体系反応制御・ 化学反応ダイナミクス 太陽電池高効率長寿命化 生体分子高次構造と機能 バイオマス酸素反応解析 光機能分子と非線形外場応答 分子の光物性 光誘起電子ダイナミクスと 光・電子機能量子デバイス 新材料探索 高効率エネルギー 変換構造用材料 ナノ構造体材料の高効率非平 衡エネルギー変換 重点;相関の強い量子系新量子相探求とダイナミックス 電子相間の強い物質 の新機構解明 強相関電子系の 励起ダイナミックス 新しい量子相・量子臨界現象 基礎 12 (源流) ポリモルフ生起分子集団機能 重点;電子状態・動力学・熱揺らぎ融和と物質理論新 凝縮分子科学系揺らぎとダイナミックス 分子における電子の動的 過程と多体量子動力学 分子の微細量子 構造予測 新量子相・新物質 31 CMSIで開発中のアプリケーション (41本) • 第1部会 • • 第2部会 • • modylas, GAMESS-FMO, REM, PIMD, ermod, DC, Direct SAC-CI 第4部会 • • RSDFT, CONQUEST, RS-CPMD, RSPACE, Multi-probe electron transport simulator, hybridQMCL, PIQUANDY, CPVO, HiLAPW, OpenMX, TC++, CASINO, QMAS, xTAPP, FEMTECK 第3部会 • • MACE, DDMRG, 2D-Extended-DMRG, ALPS/looper, GELLAN, MCMOZ, GAMESS拡張 STATE, TOMBO, feram, CP2K, MoIDS, CPMD, BigDFT, 3D-RISM, Amber9拡張, Machikaneyama2002, HiRUNE 他 • hnpack, NANIWA 赤: ナノGC中核アプリ(6), 太字: 京で試験利用中(29) 32 物質科学分野の代表的なアルゴリズム • 密度汎関数法 (平面波基底、実空間基底)、第一原理分子動力学法、時間依存密 度汎関数法、 実空間・実時間電子電磁場ダイナミクス法、分子動力学 (短距離 相互作用、長距離相互作用)、モンテカルロ法 (古典、量子)、量子化学計算、厳 密対角化 • 物質科学のアプリケーションの特徴 • 相関の強い系の平衡状態・定常状態・アンサンブルに興味がある (1トラジェ クトリの計算だけではだめ) • シミュレーションする系の次元は3次元に限らない。量子的な相関など、空 間的に局所的であるとも限らない • 遠くの相関を取り込む/平衡状態にたどりつくための工夫として、非局所的な操 作/演算が多くの場合必要 • メモリバンド幅を要求するアプリケーションが多い • 大域通信・バタフライ型通信など高次元のネットワークを要求するものも多い 33 「サイエンス・モデル」と開発環境 • 計算物質科学では、少数のコミュニティーコードではなく、むしろ研究グ ループ毎に多数のコードが存在 → 新しい手法・アルゴリズムがどんどん試 されている • 「スモールサイエンス」的な要素も強い • 現象から「有効模型」の抽出 ∼ 様々なアイデアにもとづいたアルゴリ ズムの開発 ∼ プログラミング ∼ シミュレーションの実行 ∼ 結果の解 析∼「有効模型」へのフィードバックをごく少人数で • 「ギリギリのチューニングをしてxx%」ではなく「3ヶ月でyy%の実効効 率」が出せるような開発環境が重要 • • PC ∼ クラスタ ∼ スパコン ∼ 京 ∼ 次世代へのシームレスな環境が必要 「京」のような大規模なスパコンを使いこなすためには、ソフトウェア開発 においても個人を越えて組織的に進めることが今後不可欠に 34 Summary & Outlook • HPCI戦略プログラム分野2 <新物質・エネルギー創成> CMSI • 強相関量子多体系研究のフロンティア • • • 新量子相と量子臨界相の探求・解明 量子モンテカルロの概要・並列化・大規模化 • 整数演算・グラフアルゴリズムの重要性 • 計算機の性能向上 + アルゴリズムのブレークスルーによる相乗効果 • ALPSプロジェクト 物質科学分野のアプリケーション 35