PUBLICATIONS

研究成果

学術論文下線付きは本研究チームメンバーを示す.

  • Susumu Yamada, Toshiyuki Imamura, Takuya Ina, Narimasa Sasa, Yasuhiro Idomura, and Masahiko Machida,

    Quadruple-Precision BLAS Using Bailey’s Arithmetic with FMA Instruction: Its Performance and Applications,

    Proc. iWAPT: 12th International Workshop on Automatic Performance Tuning, IEEE IPDPS2017, pp. 1342-1349, Orlando, FL, USA, 2017

国際会議発表下線付きは本研究チームメンバー,太字は口頭発表登壇者を示す.

  • D. Mukunoki and T. Imamura, Implementation and Performance Analysis of 2.5D-PDGEMM on the K Computer, PPAM2017, September 2017.

  • S. Yamada, T. Imamura, M. Machida, Communication avoiding Neumann expansion preconditioner for LOBPCG, ParCO2017, September 2017.

  • T. Imamura, etc, Towards Modern High Performance LA Library Enabling Heterogeneity and Flexible Data Formats, ParCO2017, September 2017.

  • Y. Hirota and T. Imamura, Parallel Divide-and-Conquer Algorithm for Solving Tridiagonal Eigenvalue Problems on Manycore Systems, PPAM2017, September 11, 2017.

  • D. Mukunoki, T. Imamura: Implementation and Evaluation of 2.5D Matrix Multiplication on K Computer, ISC High Performance (ISC 2017), research poster session, Jun. 2017. [PRACE poster Award]

  • S. Yamada, T. Imamura, T. Ina, N. Sasa, Quadruple-precision BLAS using Bailey’s arithmetic with FMA instruction: Its performance and applications, iWAPT2017, IPDPS2017, June 2.

  • Yusuke Hirota, Susumu Yamada, Toshiyuki Imamura, Narimasa Sasa, Yasuhiro Idomura, Takuya Ina and Masahiko Machida,
    Performance of the Quadruple Precision Eigensolver Library QPEigenK on Supercomputer Systems,
    SIAM Conference on Computational Science and Engineering 2017 (SIAM CSE17), Hilton Atlanta, Atlanta, USA, February 27–March 3, 2017.

  • Toshiyuki Imamura,

    Acceleration of the EigenG solver on a consumer-ranged GPU,

    2017 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing, Taipei, Taiwan, March 2017

  • Yusuke Hirota and Toshiyuki Imamura,
    Development of Banded Eigenvalue Solvers for Shared Memory Parallel Computers,
    The 7th AICS International Symposium, RIKEN AICS, Kobe, Japan, February 23–24, 2017 (poster).

  • Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi: Implementation Techniques for High Performance BLAS Kernels on Modern GPUs, SIAM Conference on Computational Science and Engineering (CSE17), Feb. 28, 2017.

  • Toshiyuki Imamura, Yusuke Hirota, Susumu Yamada and Masahiko Machida,

    Communication Avoiding and Synchronous Reducing Techniques for Dense Parallel Eigenvalue Solver,

    SIAM CSE17, Atlanta, USA, Feb.2017.

国内学会発表下線付きは本研究チームメンバーを示す.

  • 青木聖陽廣田悠輔今村俊幸,横川三津夫: FFTカーネルを用いたKNLでのスケーラビリティに関する調査,情報処理学会研究報, Vol. 2017-HPC-161, No. 16, pp. 1-7, 2017年9月20日

  • 真弓明恵, 井戸村泰宏,伊奈拓哉,山田進,今村俊幸: 多相流体コードJUPITER における前処理付きChebyshev 基底CG 法ソルバの収束特性評価, 日本原子力学会2017年春の年会 計算科学技術 一般セッション, 2017年9月

  • 大井祥栄, Parareal手法を用いた時間並列計算の性能評価, 第46回数値解析シンポジウム (NAS2017)

  • 椋木大地今村俊幸: 京コンピュータにおける2.5次元アルゴリズムを用いた分散並列行列積の実装と評価, 情報処理学会研究報, Vol. 2017-HPC-159, No. 1, pp. 1-6, 2017年4月.

  • 椋木大地, 今村俊幸: 京コンピュータにおける2.5次元アルゴリズムを用いた分散並列行列積の実装と評価, 情報処理学会研究報, Vol. 2017-HPC-159, No. 1, 2017年4月.

  • 真弓 明恵,井戸村 泰宏,伊奈 拓哉,山田 進,今村 俊幸,

    多相流体コードJUPITERにおける前処理付き省通信CG法ソルバの開発,

    日本原子力学会2017年春の年会, 東海大湘南キャンパス, 2017.3.27-29.

  • 廣田悠輔, 今村俊幸: 四倍精度固有値ソルバの性能分析およびポストムーア時代の倍精度固有値ソルバの性能予測, 第5回大規模並列数値計算技術に関する研究集会, 2017年3月27日.

  • 椋木大地, 今村俊幸: Reduced-/Extended-precision BLASの実装方法の検討, 第5回大規模並列数値計算技術に関する研究集会, 2017年3月27日.

  • 廣田悠輔今村俊幸
    メニーコアプロセッサ向け分割統治法の実装技術,
    第158回ハイパフォーマンスコンピューティング研究発表会, 大月ホテル和風館,熱海市,2017年3月8–10日.

  • 廣田悠輔
    帯行列固有値問題に対する高性能分割統治法アルゴリズム,
    ワークショップ「行列計算のための数値計算法」, 名古屋大学工学部3号館,名古屋市,2017年1月19–20日.