Feko は、複雑で電気的に大規模な問題を効率的に分析するための業界をリードするソルバーと高性能コンピューティング (HPC) テクノロジを提供します。並列スケーリングの効率は、エンジニアがこのような課題を効率的に解決できるようにするための重要な指標です。
並列スケーリングの効率とは何ですか?
「並列スケーリング効率」は、コンピューティング クラスターで問題を解決するときに頻繁に発生する概念です。大規模なサーバーやクラスター コンピューティング システムを使用すると、「コアの数はいくつあれば十分か」というよくある質問が出てきます。この概念を理解し、コンピューティング クラスターでの一般的なソルバーのパフォーマンスを知ることで、この質問に対処するのに役立ちます。
「並列スケーリング効率」という用語は、パフォーマンス基準に対して測定された、既存の計算リソースに計算リソースをどれだけ効率的に追加できるかとして定義できます。簡単に言えば、ユーザーの観点からは、コア数 (または並列プロセス数) が 2 倍になると、ソリューション時間が半分になると期待されます。さらに、メモリ消費量に関しては、メモリ消費量の増加は最小限になると期待されます。理想的なシナリオでは、並列プロセス数が増加してもメモリ消費量は一定のままです。この記事では、Feko が優れた並列スケーリング機能を備えており、メモリ節約アルゴリズムによってスケーリング パフォーマンスをほぼ理想に近づけることができることがわかります。
並列スケーリングのパフォーマンスは、次の 2 つの要素に大きく依存します。
- 選択されたソルバー
- モデルの電気的なサイズ
モデルを大規模と定義することは、必ずしもその物理的なサイズに依存するわけではありません。たとえば、船舶は物理的に大きな問題であると考えられますが、関心のある周波数がわずか数 MHz であれば、これは実際には電磁気学の観点からは電気的に「小さな」問題です。問題がどの程度大規模であるかは、主にその電気的サイズ (波長) に依存します。さらに考慮すべき事項として、RCS に対するレドームの熱変形の影響など、マルチフィジックス解析があります。
Feko は、アンテナ配置や RCS における大規模な問題を解決するのに適しています。さらに、Feko は大規模なクラスターに導入でき、利用可能なコンピューティング リソースを効率的に活用できます。
アンテナ問題の並列スケーリング
モーメント法(MoM)ソルバー
MoM は、主にモデルの表面メッシュ表現で動作する、周波数領域におけるマクスウェル積分方程式のフルウェーブ解法です。
ケース1 - 小規模モデルMoM
まず、現代のラップトップ コンピューターで解けるほど小さいモデルを考えてみましょう。これは、有限の基板上の直列給電パッチ アレイです。最長の寸法は自由空間波長の約 10 倍で、モデルは 18,000 個の未知数で構成されます。
このモデルには、7 GB 強のメモリが必要です。このモデルは、2 から 16 まで 2 ずつ増加するさまざまな数の並列プロセスで計算されます。下のグラフには、2 つの重要なメトリックが表示されています。
まず、合計ウォールタイムは、Feko ソルバーを起動してから終了するまでの経過時間 (物理時計で表示) です。
次に、合計メモリです。これは、ソリューションの実行中に Feko が消費するピークの合計メモリです。実行時間とメモリは、並列効率 (青)、および実際の時間とメモリ使用量 (赤) の観点から表示されます。グラフの参照は、使用される並列プロセスの最小数であり、この場合は 2 つのプロセスです。したがって、2 つのプロセスの場合、効率は 100% として表示されます。
グラフは、並列プロセスを追加すると実行時間が短縮されることを示しています。ただし、実際の値の傾きが小さくなり、効率のパーセンテージも低いことから、このモデルでは 8 ~ 10 プロセス程度が適切な数であることがわかります (効率は約 60%)。マシンにアイドル プロセスが残っている場合は、別のモデルを解くために使用できる可能性があります。メモリは、並列プロセスの増加とともにわずかに増加します。したがって、メモリに関する並列スケーリング効率はほぼ 100% です。
異なる解析モデルの計算を実行できるようにするには、最適化検索の観点から、並列プロセスの数を 4 に設定し、4 つの異なる解析モデルを実行すると、1 つの解析モデルに 16 プロセスすべてを使用するよりも速く解決できます。
ケース2 - MoMを使用した大規模モデル
次に、2.6 GHz のルーフトップ アンテナ システムを備えた自動車という、はるかに大きなモデルについて考えてみましょう。最長の次元はおよそ 36 自由空間波長で、モデルは 246,000 個の未知数で構成されており、約 450 GByte のメモリが必要です。
並列プロセスの数が増えると、合計ウォールタイムも大幅にスケールします。このモデルは、コンピューティング クラスターで解くのに適しています。
比較
ケース 1 とケース 2 を比較し、スケーリング効率が 60% と非常に優れていることを考慮すると、パッチ アレイモデルは約 14 の並列プロセスでこのしきい値に達しますが、自動車モデルでは 64 から 128 のプロセスで同じしきい値に達します。
マルチレベル高速多重極法(MLFMM)ソルバー
MLFMM は、電気的に大規模な問題に適用可能な MoM の加速技術です。