震度6強の地震から一週間

どうも~日本に来てもう5年目になっているけど震度5以上の地震は初めて経験してわりと怖かった留学生のざおです。
13日夜11時頃に震度6強の地震が発生しましたね。仙台市では震度5強と5弱が観測されたようです。
翌日の朝、滝沢先生からslackに送られてきた研究室の被害状況の写真がこちらです。

(上の三つの写真)学生部屋は本棚にある本が落ちたり、デスクにあるモニターが倒れたり、引き出しが出てきたりしただけで大きな損害はありませんでした。
(下の三つの写真)実験室の方がカオスでしたね。棚に収納したキーボードが落ちてバラバラになったり、サーバーのラックがずれたりしていました。
卒業の季節で、特に卒論修論の〆切が近い時にこのような大きな地震が来るのは本当に大変なことです。
幸いなことに、研究室の全てのサーバーは昔からバッチリ地震対策しているおかげで、今回の地震で研究データへの被害は全くありませんでした。
せっかくなので、うちの研究室のメインの地震対策を紹介しようと思います。

(上の三つの写真)まずは学生部屋ですが、
・本棚の一番上の二つの段は転落防止柵が設置されていて、おかげさまで本は学生席にぶっ飛んで来ませんでした。
・今回の地震が土曜日の夜で、当時、研究室は誰もいませんでした。もしその場にいても、ヘルメットは各自の学生席付近に掛けており、すぐかぶって逃げることができます。
・発火防止のため、コンセントもきちんと整理されています。
(下の三つの写真)次は実験室ですね。
・収納用の棚は全部壁に固定されているため、倒れることはありませんでした。
・大量のサーバーがある実験室も、発火しないようにコンセントは番号で、それぞれの電流上限をきちんと管理しています。
・ケーブルなどの備品を収納する棚も、一番上の段に転落防止用の青いベルトが設置されています。
あと、写真にはありませんが、研究データはクラウドと研究室にあるNASの両方で管理されています。
研究室NASには冗長性があり、HDDの一つや二つが壊れてもちゃんとデータが復旧できるようになっています。
今回の地震で特に被害が多かったモニターが倒れることについては、今後、耐震マット・耐震ジェルのようなものを購入し、各自の机に設置する予定です。
なにはともあれ、うちの研究室において、今回の地震は人への被害がないのは一番幸いなことです。
地震から一週間が経った今、たまに余震が来るけど、みんなはもう元の通りに元気で大学生活を送っています。

Khronos Groupに参加しました

Khronos GroupはOpenGL、OpenCL、SYCLといったソフトウェア開発環境の標準規格を管理している非営利団体です。
当研究室が主導して、東北大学がKhronos Groupに学術メンバーとして参加しました。
将来のスパコンのための標準プログラミングモデルに関して、当研究室は積極的に議論に参加していきます。
当研究室で開発しているSYCL実装であるneoSYCLがKhronosのページで紹介されています。
また、HPCwireの記事でも言及されました。
 
 

A100を導入しました

どうも~A100を購入すると聞いた時の驚きが未だに消えないM1のミンルです~
とうとう、うちの研究室もA100 GPUを導入しました(。・ω・ノノ゙パチパチ 見た目からのこの輝き本当に凄いですね。
せっかくなので、既存のRTX 2080Tiを搭載したサーバーにA100を追加してみました。

 
さてさて、A100と言ったらやはりその性能が気になりますね!早速、CIFAR-100とCNNで走ってみました~
モデルの学習時間(20エポックと100エポック)は左側の図の通りです。やはりCPUより圧倒的に速いですね。
ただ、20エポックの時2080Tiより速いのは予想通りですけど、100エポックの時は逆に遅くなってきましたね。
その理由を調べるため、各ステップごとの実行時間を調べてみました。結果は右側の図の通りです。最初の数十エポックはA100の方が速くて、後ろになるとどんどん遅くなってきましたね。
その理由はですね、なんと!排熱が追いついてないんです。(悲しみ)
RTX2080Tiの方はずっと26度から40度あたりに対して、A100は34度からほんの一瞬で80度突破ですよ。(えぐい)

今回の結論としては:
A100の性能は本当に優秀だけど、良い排熱環境がないとその性能を引き出せませんでした。(涙)

HPC Asia’21において柯さんが発表

こんにちは。滝沢研M2の柯です。
1月20日から22日にかけて2021 International Conference on High Performance Computing in Asia-Pacific Regionが開催されました。
COVID-19の影響で、HPC Asia 2021はオンライン開催の形式になりました。
Session 2で発表を行いました。詳細は以下の通りです。

  • Ke, Yinan, Mulya Agung, and Hiroyuki Takizawa. “neoSYCL: a SYCL implementation for SX-Aurora TSUBASA.” The International Conference on High Performance Computing in Asia-Pacific Region. 2021. [Program]

 

集合写真を撮影しました(2020)

2020年の終わりにオンライン忘年会が開催されました.
2020年は大変な年でしたが,私たちはなんとか研究活動を続けてくることができました.
来年も頑張っていきましょう!!
今回の忘年会ではリモートで新しい集合写真も撮りました!

 

PCCC20において滝沢先生が講演を行いました

12月15日、滝沢先生がPCCC20にて講演を行いました。
PCCC20「HPCシステム最前線」シンポジウムの詳細はこちらにご参照ください。
発表内容は以下の通りです。

IEEE BigData’20において趙さんが発表

こんばんは、発表が終わった勢いで早速記事を書いてるM1の趙(Zhao)です。
12/10-12/13にかけて、2020 IEEE International Conference on Big Data (IEEE BigData 2020)が開催されました。
コロナの影響でアメリカに行けないのは非常に残念でしたが、こたつで国際学会に参加できるという非常に珍しい経験をすることができました(笑)。
IEEE BigDataのワークショップ、Third International Workshop of Internet of Things Data Analytics (IoTDA)にて発表を行いました。

  • Failure Prediction in Datacenters Using Unsupervised Multimodal Anomaly Detection
    Minglu Zhao*, Reo Furuhata*, Mulya Agung†, Hiroyuki Takizawa†, and Tomoya Soma‡
    *Graduate School of Information Science, Tohoku University
    †Cyberscience Center, Tohoku University
    ‡Corporate Business Development Division, NEC Corporation

Pre-recorded動画とリアルタイムのQ&Aセッションの様子は以下の通りでした。

電子版日本経済新聞において,滝沢教授,江川客員教授が取材されました

電子版日本経済新聞において,スパコンの熱中症リスク予測サービスにおける利用について,滝沢教授と江川客員教授が取材を受けました.
本文は以下より閲覧できます.
異なる分野のプロとスパコンで社会実装を果たしたパーソナライズドサービスとは? ~熱中症リスク予測への挑戦~ | 日本経済新聞 電子版特集
 

CANDAR’20で古畑君,劉君,江端君が発表

こんにちは.M2の江端です.
11/24~11/27にかけて,The Eighth International Symposium on Computing and Networking (CANDAR’20) が開催されました.
当初は沖縄での開催予定でしたが,COVID-19の影響によりオンライン開催となりました.仕方のないことですが,沖縄,行きたかったですね.
さて,当研究室からは,M1の古畑玲生君,M2の劉佳恒君,江端直樹君の3名が発表を行いました.

  • Reo Furuhata, Minglu Zhao, Mulya Agung, Ryusuke Egawa, and Hiroyuki Takizawa, “Improving the accuracy in SpMV implementation selection with machine learning,” The Eighth International Conference on Computing and Networking Workshops (CANDARW), 2020. [youtube]

 

  • Jiaheng Liu, Ryusuke Egawa, Mulya Agung, and Hiroyuki Takizawa, “A Conflict-Aware Capacity Control Mechanism for Last-Level Cache,” The Eighth International Conference on Computing and Networking Workshops (CANDARW), 2020. [youtube]

 

  • Naoki Ebata, Yoko Isobe, Ryusuke Egawa, and Hiroyuki Takizawa, “Polymorphic Data Layout for SX-Aurora TSUBASA Vector Engines,” The Eighth International Conference on Computing and Networking (CANDAR), 2020. [youtube]

 
古畑君の発表はWorkshop Best Paper of LHAMを受賞しました!おめでとうございます!受賞記事はこちら
また,今回の発表でいただいたコメントや質問をもとに,より研究を発展させていきたいですね.
 

CANDARW’20において古畑らがWorkshop Best Paper of LHAMを受賞

こんばんは,M1の古畑です.
2020年11月25日(JST)から2020年11月27日(JST)にかけて開催されたCANDARW’20 (The Eighth International Conference on Computing and Networking Workshops)にてオンラインで発表を行い, Workshop Best Paper of LHAM: International Workshop on Large-scale HPC Application Modernization を受賞しました.
COVID-19の影響によりオンライン開催となり,開催予定地であった沖縄での発表はできませんでしたが,大変有意義な経験になりました.
学会で発表することができたことも,賞を頂くことができたことも,共著者の方々と研究室の皆さんの協力があったからこそ成し遂げられたものでした.
日頃から研究活動を支えてくださっている研究室の皆さんへ改めて感謝を申し上げます.

Improving the Accuracy in SpMV Implementation Selection with Machine Learning
Reo Furuhata*, Minglu Zhao*, Mulya Agung†, Ryusuke Egawa‡, and Hiroyuki Takizawa†
*Graduate School of Information Science, Tohoku University
†Cyberscience Center, Tohoku University
‡Department of Information and Communication Engineering, Tokyo Denki University