震度6強の地震から一週間

どうも~日本に来てもう5年目になっているけど震度5以上の地震は初めて経験してわりと怖かった留学生のざおです。
13日夜11時頃に震度6強の地震が発生しましたね。仙台市では震度5強と5弱が観測されたようです。
翌日の朝、滝沢先生からslackに送られてきた研究室の被害状況の写真がこちらです。

(上の三つの写真)学生部屋は本棚にある本が落ちたり、デスクにあるモニターが倒れたり、引き出しが出てきたりしただけで大きな損害はありませんでした。
(下の三つの写真)実験室の方がカオスでしたね。棚に収納したキーボードが落ちてバラバラになったり、サーバーのラックがずれたりしていました。
卒業の季節で、特に卒論修論の〆切が近い時にこのような大きな地震が来るのは本当に大変なことです。
幸いなことに、研究室の全てのサーバーは昔からバッチリ地震対策しているおかげで、今回の地震で研究データへの被害は全くありませんでした。
せっかくなので、うちの研究室のメインの地震対策を紹介しようと思います。

(上の三つの写真)まずは学生部屋ですが、
・本棚の一番上の二つの段は転落防止柵が設置されていて、おかげさまで本は学生席にぶっ飛んで来ませんでした。
・今回の地震が土曜日の夜で、当時、研究室は誰もいませんでした。もしその場にいても、ヘルメットは各自の学生席付近に掛けており、すぐかぶって逃げることができます。
・発火防止のため、コンセントもきちんと整理されています。
(下の三つの写真)次は実験室ですね。
・収納用の棚は全部壁に固定されているため、倒れることはありませんでした。
・大量のサーバーがある実験室も、発火しないようにコンセントは番号で、それぞれの電流上限をきちんと管理しています。
・ケーブルなどの備品を収納する棚も、一番上の段に転落防止用の青いベルトが設置されています。
あと、写真にはありませんが、研究データはクラウドと研究室にあるNASの両方で管理されています。
研究室NASには冗長性があり、HDDの一つや二つが壊れてもちゃんとデータが復旧できるようになっています。
今回の地震で特に被害が多かったモニターが倒れることについては、今後、耐震マット・耐震ジェルのようなものを購入し、各自の机に設置する予定です。
なにはともあれ、うちの研究室において、今回の地震は人への被害がないのは一番幸いなことです。
地震から一週間が経った今、たまに余震が来るけど、みんなはもう元の通りに元気で大学生活を送っています。

We joined Khronos Group

Khronos Group is a non-commercial organization to manage open standards for software development such as OpenGL, OpenCL and SYCL.
Led by our lab, Tohoku University has joined Khronos Group as an academic member.
Our lab will aggressively join the discussions on standard programming models for future HPC systems.
A SYCL implementation we are developing, named neoSYCL, is introduced at Khnoros’s website.
It is also mentioned in an article at HPCwire.

Khronos Groupに参加しました

Khronos GroupはOpenGL、OpenCL、SYCLといったソフトウェア開発環境の標準規格を管理している非営利団体です。
当研究室が主導して、東北大学がKhronos Groupに学術メンバーとして参加しました。
将来のスパコンのための標準プログラミングモデルに関して、当研究室は積極的に議論に参加していきます。
当研究室で開発しているSYCL実装であるneoSYCLがKhronosのページで紹介されています。
また、HPCwireの記事でも言及されました。
 
 

Welcome A100

Hello there~ This is Minglu, a 1st-year master-degree student who still could not forget the impact when we heard our prof was planning to buy an A100 GPU!
Finally, welcome to A100! It was very shining when we were taking it out from the box.
We installed A100 into a server used for RTX 2080Ti temporarily.

 
Okay, there, I believe you must also be interested in its performance! Let’s figure it out using CIFAR-100 and CNN.
The training time for 20 and 100 epochs are showing in the left figure. Obviously, it is definitely faster than the CPU.
Though it is the same as what I expected that A100 is faster than 2080Ti for 20 epochs, when it comes to 100 epochs, A100 becomes slower instead.
To investigate the reason, we checked the execution time of each step. The results are showing in the right figure. At first few tens of epochs, A100 is fast. But it gets slowing down later.
To our surprise, the reason is because of the temperature 🙁
RTX2080Ti’s temperature was kept around 26 to 40 degrees, while A100’s temperature exceeded 80 degrees in a moment from 34 degrees. (AMAZING!!😨)

In conclusion:
Though A100’s performance is very excellent, we could not fully use it without a good cooling environment. 🙁

A100を導入しました

どうも~A100を購入すると聞いた時の驚きが未だに消えないM1のミンルです~
とうとう、うちの研究室もA100 GPUを導入しました(。・ω・ノノ゙パチパチ 見た目からのこの輝き本当に凄いですね。
せっかくなので、既存のRTX 2080Tiを搭載したサーバーにA100を追加してみました。

 
さてさて、A100と言ったらやはりその性能が気になりますね!早速、CIFAR-100とCNNで走ってみました~
モデルの学習時間(20エポックと100エポック)は左側の図の通りです。やはりCPUより圧倒的に速いですね。
ただ、20エポックの時2080Tiより速いのは予想通りですけど、100エポックの時は逆に遅くなってきましたね。
その理由を調べるため、各ステップごとの実行時間を調べてみました。結果は右側の図の通りです。最初の数十エポックはA100の方が速くて、後ろになるとどんどん遅くなってきましたね。
その理由はですね、なんと!排熱が追いついてないんです。(悲しみ)
RTX2080Tiの方はずっと26度から40度あたりに対して、A100は34度からほんの一瞬で80度突破ですよ。(えぐい)

今回の結論としては:
A100の性能は本当に優秀だけど、良い排熱環境がないとその性能を引き出せませんでした。(涙)

HPC Asia’21において柯さんが発表

こんにちは。滝沢研M2の柯です。
1月20日から22日にかけて2021 International Conference on High Performance Computing in Asia-Pacific Regionが開催されました。
COVID-19の影響で、HPC Asia 2021はオンライン開催の形式になりました。
Session 2で発表を行いました。詳細は以下の通りです。

  • Ke, Yinan, Mulya Agung, and Hiroyuki Takizawa. “neoSYCL: a SYCL implementation for SX-Aurora TSUBASA.” The International Conference on High Performance Computing in Asia-Pacific Region. 2021. [Program]

 

Ke made a presentation at HPC Asia 2021

Hello, this is Ke from Takizawa Lab.
2021 International Conference on High Performance Computing in Asia-Pacific Region was held from 20 to 22 Jan.
Due to the COVID-19, the HPC Asia 2021 was held as a virtual event.
I made a presentation in Session 2. The details of the presentation are shown as follows.

  • Ke, Yinan, Mulya Agung, and Hiroyuki Takizawa. “neoSYCL: a SYCL implementation for SX-Aurora TSUBASA.” The International Conference on High Performance Computing in Asia-Pacific Region. 2021. [Program]

 

集合写真を撮影しました(2020)

2020年の終わりにオンライン忘年会が開催されました.
2020年は大変な年でしたが,私たちはなんとか研究活動を続けてくることができました.
来年も頑張っていきましょう!!
今回の忘年会ではリモートで新しい集合写真も撮りました!

 

New group photo uploaded (2020)

Due to the Covid-19, an online party was held at the end of this year.
We took a screenshot as the new group photo.
Let’s enjoy our life in this lab and research together!

Prof. Takizawa gave a talk at PCCC20

Prof. Takizawa gave a talk at PCCC20 on 15th Dec.
The details of the PCCC20 “The Forefront of Advanced HPC system” symposium are here.
Here are the details of this talk.