ケルヒャーが家族入り

こんにちは.M2 のしも (古畑) です。とうとう当研究室にも例の黄色い高水圧洗浄機がやってきました。早速、組み立てて使ってみました。なんということでしょう!床を覆っていた埃がなくなって、きれいな床が見えますよ!ピカピカです!これからの掃除がお手軽になりそうですね。今後の活躍にも注目です!

滝沢先生 (共著) が執筆した本が発売されました!

滝沢寛之 (共著) 先生が執筆した本 「ソフトウェア自動チューニング 科学技術計算のためのコード最適化技術」が9月18日に発売されました!ソフトウェア自動チューニングの各ツールの原理や使い方を紹介しています。研究や講義のお供に一冊いかがでしょうか?
https://www.morikita.co.jp/index.php/books/mid/087221

院試終わりました!!

8月末に大学院入試が終わりました。
B4の皆さんお疲れ様でした。
当研究室では、院試勉強期間が3ヶ月も与えられ、先輩達の過去問解答例が充実しております。
B4はこれから卒業研究にむけて頑張ります!!

B4院試お疲れ様会

こんにちは、B4の石井です。

現在、滝沢研究室に所属している学部4年生3名の院試合格が決まりました!
そこで院試お疲れ様会として打ち上げを開いていただきました。
緊急事態宣言中ということでオンライン上ではありましたが、とても盛り上がりました!

大学院に進学してからも頑張っていきたいと思います!

HOT CHIPS 33に参加しました。

滝沢研博士1年のLiuです。HOT CHIPS 33に参加しました。

HOT CHIPSは、高性能マイクロプロセッサと集積回路に関する半導体業界の主要な国際学会の一つです。今年は、有名企業や国立研究所の技術者やチップ設計者が最新の技術や製品を紹介・発表しました。今回の学会は、8月22日から24日までの3日間、オンラインで開催されました。

CPU、データプロセッサ、機械学習プラットフォームなどのセッションがあり、質の高いプレゼンテーションが数多くあり、多くのイノベーションや新技術が紹介されていました。

今年は、トップレベルの企業が新しいCPUを発表しました。この場をかりて、興味を持ったいくつかのトピックスとその感想を紹介します。

1. Intel Alder Lake

Alder Lakeは、Intel Coreプロセッサの最新世代です。コアの設計がこれまでとは全く異なります。PコアとEコアというアーキテクチャの異なる2つのコアを使い、ハイブリッドな性能を実現しています。

図1 PコアとEコア (出所: Intel)

Pコアはシングルおよび軽量スレッドのスケーラブルなアプリケーションで高い性能を発揮し、Eコアはマルチスレッドのアプリケーションで優れたスループットを発揮します。スケジューリングについては、IntelはThread Directorを使用して、適切なワークロードを適切なタイミングで適切なコアに配置します。PコアとEコアのサイクルあたりの命令実行数 (IPC) の違いに基づいて、アプリケーションは4つのクラスに分類されます。エネルギー効率や性能に関する情報は、定期的にEHFIテーブルに書き込まれ、OSのスケジューラが最適なコアの割り当てを選択します。Thread Directのアーキテクチャを以下に示します。

図2 Thread Director (出所: Intel)

2. AMD Zen3

Zen2と比較して、新世代は19%のIPC向上を達成しています。非常に大きい技術進歩です。図は、Zen3の主な変更点を示しています。

図3 Zen3コアとZen2コアを比較 (出所: AMD)

私にとって最も興味深いのは、Zen3のキャッシュ階層です。L3の総サイズは変わりませんが、コアごとの直接アクセスが2倍になり、実効メモリのレイテンシが減少しています。また、L2とL3のミスの少なさにも驚かされます。 また、3D V-cache技術により、L3は192MBと驚異的な容量となっています。

図4 Zen3のキャッシュ階層と3D V-cache技術 (出所: AMD)

3. IBM Telum

新しいIBM Zシステムは、Z15とはかなり異なっており、特にキャッシュ階層が異なっています。各コアには32MBのプライベートL2キャッシュがあり、これはZ15のL2キャッシュの8倍にあたります。しかしTelumでは、物理的なL3およびL4キャッシュは存在せず、IBMはL2を使用して仮想的なL3およびL4キャッシュを生成します。これにより、L3とL4の機能はそのままに、チップ面積とレイテンシーを大幅に削減し、コアあたりのキャッシュサイズをさらに向上させています。このような実装により、1ソケットあたり40%以上の性能向上を実現しています。

図5 IBM Telumのキャッシュ階層 (出所: IBM)

4. Intel Xeon Sapphire Rapids

近年、プロセッサーの設計では、モジュラー・アーキテクチャーが普及しています。これは、ダイサイズが小さければ小さいほど、チップ製造における歩留まりが良くなるためです。Sapphire Rapidsでは、EMIB技術を用いてマルチタイルデザインを実現しています。各タイルに搭載されているアクセラレーション・エンジンは重要な部品のひとつです。データストリーミング、クイックアシスト技術、ダイナミックロードバランサーなどを搭載し、コモンモードタスクのオフロードをサポートしています。

図6 Sapphire Rapids (出所: Intel)

また、今回は共有LLCも増え、2つのモード (フラット、キャッシング) を持つHBMについても言及されています。

まだまだ、全てを紹介しきれないほどの素晴らしい発表がありました。例えば、SamsungのHBM2-PIM、チップレットと3Dパッケージング、などなどですね。今回の学会では、多くの刺激的なアイデアや技術を学ぶことができました。私は、創造性と改善を達成するための努力に感銘を受けました。これらの新しいアーキテクチャやアイデアは、チップ設計分野における人気のあるトレンドを示しており、私自身の研究にも大いに役立つと思います。

今年度のB3講習会が終了しました!

皆さん久しぶりです~ M2のめろちゃんです~
この記事を書いている1時間くらい前に、今年度のB3講習会の最終回が無事に終わりました(パチパチ)

B3講習会とは

配属を希望するみなさんへのページにも説明がありますが、滝沢研ではB3やM1の新しく研究室に配属された、いわゆる研究室新入生のための充実した教育プログラムが用意されています。
今年度はB3の学生3名とM1の学生が1名が滝沢研に配属されました(パチパチ)。合計4名の研究室新入生に講習会・勉強会を行いました。

今年度の講習会

今年度は、合計8回の講習会がありました。

日付 講師 内容
17th June 金子 環境構築
24th June 金子 Git & GitHub
1st July 松瀬 LaTeX
8th July 菅原 C
9th July 佐々木 並列
15th July 古畑 Singularity
29th July 佐竹 Python
5th Aug Minglu 機械学習

それぞれの講習会はこんな感じでした。

講習会で勉強した内容が本番の研究をするときにちゃんと役に立ってくれれば嬉しいですね。
それでは、良い夏休みを~

B3歓迎オンラインパーティー

6月末にB3学生の配属を祝う歓迎会が開催されました。
対面で歓迎することは叶いませんでしたが、面白そうなWebサービス上で開催したこともあり盛り上がりました!

B3学生の皆さんが今後この研究室で活躍する姿を楽しみにしています!

B4卒業写真撮影

卒業アルバム用に、B4メンバー+先生方で集合写真を撮影しました!
梅雨前ギリギリで天気も晴れ、いい写真が撮れましたね!よかったです!

RECONF 6月研究会において金子が発表

こんにちは、M1の金子です。

6月8日から9日にかけてRECONF 6月研究会がありました。
RECONFは主にFPGAなどのリコンフィギュラブルデバイスやシステムに関する研究について、定期的に研究会を開催しています。

詳細は以下をご覧ください。
2021-06-09 16:10 FPGAクラスタのためのSYCLインターフェースの開発とCPU-FPGA連携の評価 [プログラム]

オンライン発表とはいえ、はじめての対外発表で緊張しました。もっと発表経験を積んでいきたいですね。

iWAPT2021において佐々木さんが発表

こんにちは,M2の佐々木です.

5月17日から21日にかけてIPDPS2021(35th IEEE International Parallel &Distributed Processing Symposium)が開催されました.

名称的には「並列分散処理学会」ですが,アーキテクチャからクラウド,ニューラルネットワークまでと対象範囲は広く,「ミニSC」的な学会です.

アメリカ ポートランドにて開催予定でしたが,昨年に引き続き,時節柄オンライン開催となりました…

また,併設のワークショップiWAPT2021(The 16th International Workshop on Automatic Performance Tuning)では,ヘテロジニアスなHPCシステムのファイルI/O特性と自動チューニングの必要性について発表を行いました.

詳細は以下をご覧ください.

  • Yuta Sasaki, Ayumu Ishizuka, Mulya Agung and Hiroyuki Takizawa. “Evaluating I/O Acceleration Mechanisms of SX-Aurora TSUBASA.” 2021 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW). [プログラム]


IPDPS2022は,(実地開催なら)フランス リヨンで開催予定です.

来年の今頃には,気軽に渡航できるようになっていると良いですね!