09/05/2019 0 Comments AI, 深層学習

プロジェクト用のディープラーニングマシンの中身を一挙大公開!


皆さん!初めまして!

株式会社虹賢舎の川島です!

今、https://www.axisjp.co.jp/さんの機械学習プロジェクトに参加させていただいております。

そのプロジェクト関連の内容もこのサイトから、ドンドン紹介していきたいと思います!

機械学習と言っても、とても広い概念を持つ言葉ですが、今回のプロジェクトも機械学習の威力を存分に発揮する、人間のポーズ検出関連のアプリケーションを開発しているま最中です!

にも関わらず早くも、お客さんから、相談と問い合わせが来ている状況です!

割と欲張りなプロジェクトで、内容が盛りたくさんです!

これから、そのプロジェクト内容も別のエントリで数回に分けて紹介していきたいと思います。

機械学習などと言ったら、エンジニアにとっては、とてつもない、計算をするイメージがお持ちでしょう。

それもその通りで、機械学習では、より精度の良いモデルを学習させるためには大量なデータを学習させる必要がありますので、演算の量が急激に増加します。

そこで、登場するのはGPUです。

機械学習専用マシン

いうまでもなく実際に機械学習のアルゴリズムを実行するには、GPUだけではなく、一つ完全なシステムが必要です。

一つのラボのような環境を構築するためには予算も確保しなければいけないですが、今回はとても恵まれている状況で、なんと、このプロジェクトの専用のパワフルな機械学習マシンまで用意されています!

なんという贅沢な幸せな事でしょう!(エンジニアにとってはこういうことが大事ですね!)

今回は、特別にすでにセットアップしたものをバラして中身を見せてもらいました!

Axis社の社長に自ら分解していただきました!なんという名誉なことでしょう!もうすでに贅沢です!笑

一回電源を消して、ケーブルなども抜きます。

裏側は、こんな感じです。LANの口が二つがありますね。これも何気に嬉しいポイントですね。

後ろの蓋を開けます!

この段階ですでに、ワクワクが止まりません!何か格好いいのが見えますね!

GPU

そうなんです!まず目に入るのはやはり主役のGPUです!

MSI GEFORCEの文字が見えますね!これは後ほど、もう少し紹介します!

私も初めて知りましたが、これ、稼働するときに、光るんですね!

なんという幻想的な!笑。GPUがディープラーニングにも適しているということが分かる前は、GPUといえば、3DゲームやE-Sports用のイメージが強いですね。

それの名残なのか、LEDの装飾がとても格好良くてたまらないですね。しかし蓋を閉めると見えないという課題があります!笑

MSI(https://jp.msi.com/)のGeForce RTX 2080 Ti

今一枚で約15万円もするのですね!二枚ですと、30万円!これまだGPUだけですよ!

マザーボードに装着してしまいましたので、正面の写真はこの商品ボックスをご参照ください!笑

点灯するLEDが少し暗い環境でビジュアルな効果が抜群です。

ついつい、何枚も写真を撮ってしまいました!笑

しばらく、msiのGeForce RTX 2080 Ti写真をご覧ください!

だって、格好良いじゃないですか?

もちろん、格好良いだけではなく、このGPUはとてもパワフルな処理能力と特徴的なVlinkのところも要注目ですね!

AIの学習処理やのAIをフル活用するようなアプリケーションでは、開発者は並行処理により大きく依存することになります。

そこで、マルチ(複数の)GPU やマルチCPUを搭載したシステムが業界では常に常識になっております。

その中には、大規模で複雑な計算処理をこなすためには、PCIeなどのシステム相互接続を使用した4GPU や8GPUのシステム構成もあります。

ところが、マルチGPUシステムレベルではPCIeの帯域幅がボトルネックになっていて、さらに高速なマルチプロセッサの相互接続が必要になってきます。それを解決するのがnVidiaのVLink技術です。今のGPUはVlink Bridgeが未装着ですが、必要な時、すぐアップグレードできますね。

TemnsorFlow などのフレームワークを利用して、マルチ(複数の)GPU、仮想的に、一つのGPUとして、プログラミングできます、これはプログラマーにとっては、嬉しいことですね。

右側に接続しているのは、GPUに電力を供給する電源ケーブルです。

精密機械の電源は命です。

「良質」な電源の供給がとても大事です。

電源のケーブルが、電源ユニットからGPUにつながっていることも確認できます。

 

電源

GPUもさることながら、マシン全体、安定的な運用は、良質な電源が必要です。それを担保してくれるのは、こちらのCorsair AX1600i電源です。

深層学習の用途で、安定して学習させる時の電源の安定もとても重要です。強力のGPUを積んでいるとは言え、複雑な課題をチャレンジするときは、やはり膨大な計算量になり、場合によっては十数時間、数日かかることもあるでしょう。

その中、不安定な電源は大きな打撃になる恐れがあります。数日の計算を電源の不安定で途中でリセットされるのが嫌でしょう。

メーカーのサイトによりますと

Corsair AX1600i は、最先端の GaN トランジスタと最高の部品だけを用いて作られた究極のデジタル ATX 電源であり、94% 以上の変換効率を実現します。

だそうです。そのGaNトランジスタのこともとても気になりますね!

スイッチング電源の回路で、スイッチング回路の質は電源に大きいな影響を持ちますね、その部分を担当しているトランジスタがもちろん優れている性能が求められますね。

電源ケーブルはすべて取り外しが可能なフルモジュラー方式になっています。

昔自作した人が覚えているかもしれませんが、その時代は、電源ケーブル外せないのが主流だった記憶があります。稀にケーブルの長さが足りなく、届かないなんてことも稀にありました!笑

たくさんのケーブルが用意されて、マザーボードから、GPUまで、マシン内の全ての部品に良質な電力を供給できます。

実は今このぐらい余っています。笑

ハードディスクや他のコンポーネントを拡張する際には、すぐ繋げられます!

 

メモリ

深層学習のマシンでは、もはや、GPUにほとんどの仕事を任せますので、OSを運行させるためのスペックは普通並でもいいかもしれません。

それでも、このマザーボードでは、MAXで64GBまでメモリの増設ができます。パワーと拡張性が兼備しているマザーボードですね、しばらく淘汰されることなく、そのまま運用できそうですね。

マザーボード

マザーボードがAUSUからのWS Z390 PROです。

このマザーボードの一番特筆すべき特徴は、(一部下記のリンクから引用:https://www.asus.com/jp/Motherboards/WS-Z390-PRO/

  • クアッドGPUサポート: デュアルスロットグラフィックスカードを4枚まで搭載可能です。今回のマシンは二枚搭載していますね。
  • AI Overclocking: CPUとクーラーに基づいてCPUパフォーマンスを即座に最適化し、エキスパートによるチューニングと同等の効率を実現
  • 電力ソリューションの改良: プレミアムコンポーネントの採用で優れた電力効率を実現
  • 業界最先端の冷却オプション: Fan Xpert 4または高評価のUEFIを介してファンとウォーターポンプを包括的に制御
  • デュアルM.2ヒートシンク: 超効率的なヒートシンクがM.2 SSDの温度を下げて抑制されない転送速度と信頼性の向上を実現
  • 超高速ストレージ: デュアルM.2およびU.2に加えて、USB 3.1 Gen 2 Type-AおよびType-Cポート搭載、フロントパネルコネクター

今回もGPUと選別とマザーボードの選別はセットで行いました。

マザーボードを購入して、大きいGPUをさせないという失敗例もあったようで、みなさんも気をつけてください。

 

CPU

CPUはもうi9一択でしょう!笑

これは今、デスクトップ用の最速のCPUと言えるでしょう。

CPUをずっと注目している方は、おそらくどこかでこのパッケージを見たことがあるでしょう。なかなか特徴的で、ダイヤモンドの形にしていますね。今はこのプロジェクトに参加しているエンジニアのデスクトップに飾っています。笑

ハードディスク

最後、はーでディスクを見てみましょう!

この「いよいよ対面する感」がいいですね!

背面の蓋を開けると、すぐハードディスクにアクセスできる設計になっています。

ハードディスクの交換作業を実施するときは、便利ですね。

ご覧の通り。すでに、四枚のハードディスクが装着されておりまして、その上SSDも一枚利用している構成です!なんという贅沢な記憶装置!

プロジェクトの進行状況によって、いつでも拡張できるスペースも確保しています!

機械学習の大量の学習用データや、出力のデータの格納も心配なさそうですね。

今はRaid -10で組んでいいます(冗長性を実現するため)、これはとても贅沢な組み方で、容量は1/2になります。でもデータのロスがあんまり心配しなくていいです。

上の写真に見える小さい方のハードディスクですが、みなさんが推測している通り、SSDになります。データIOが早いので、マシンのOSを格納しています。Boot用です。

あと三つのスロットがありますね、Maxで3TBまで拡張できます。

これはもう一つ小さいデータセンターですね。笑

まとめ

いかがでしょうか、とにかく贅を尽くしたなかなかのモンスターマシンですね。

実は、このケースを探すのも一苦労しました。

GPUが二枚ざしのケースは実は、なかなか数が少なくて、大きいGPUが入れるのはあんまりないですね。これから深層学習が普及することによって、こういうケースも一般的になるのかな。

また、このケースの構造上、騒音がほぼないように設計されています。

大きいなファンがプリインストールされています。大量の計算処理すると、熱も出ますので、熱対策がとても重要です。みなさんもケースを選別するときは、熱対策をしっかり講じるものをお選びください。

ここまで一通り、このプロジェクトのパワフルな深層学習のマシンを見ました!

とても勉強の多い体験でした!株式会社アクシスの社長様、ありがとうございました!

次回は、このマシンを実際に回して、どのぐらいの性能(ベンチマーク)があるかを見ていきたいと思います!

楽しみにしていてください!

では、次の記事で会いましょう!

株式会社 川島賢

著書:今すぐ試したい! 機械学習・深層学習(ディープラーニング) 画像認識プログラミングレシピ

ABOUT US