ケース5 - MoMを使用した中規模から大規模のモデル
F5 航空機のモデルを考えてみましょう。その長さは 14 メートル (または自由空間波長の 47 倍) です。航空機は、MoM ソルバーを使用して 1 GHz で解析されます。これは 245,000 個の未知数で構成され、500 GByte 弱のメモリを必要とします。合計 361 個の入射角が解析されます。


実行時間の効率は、64 プロセスから 128 プロセスに移行するときに興味深い変曲点を示しています。ノードあたり 64 コアの場合、コンピューティング クラスター内のノード数は 1 から 2 に増加し、128 プロセスで実行できるようになりました。分散マトリックス ソリューション アルゴリズムは、2 つのコンピューティング ノードを使用する場合に効率が向上するように自動的に調整されます。この調整の影響は、解決するモデルの特性によって異なる場合があることに注意してください。
ケース6 - MLFMM(およびSPAI前処理)を使用した大規模モデル
次に、層状誘電体でモデル化された窓を備えた大型の自動車モデルを考えてみましょう。自動車は、MLFMM を使用してモノスタティック RCS に対して 14 GHz で解析されます。

車のサイズはわずか数メートルですが、未知数の数が 2,300 万、最長の寸法が約 200 波長であるため、このモデルも大規模であると考えられます。メモリ要件は約 260 GByte です。

MLFMM ソルバーは、前の入射角の解を現在の角度の解の初期推定として使用します。上のグラフの時間は、単一の入射角を解く場合の代表値です。MLFMM ソルバーで CFIE 2を使用すると、反復解の速度が大幅に向上しますが、モデルが閉じた PEC オブジェクトである必要があります。車の構造と窓に隙間があるため、この例では CFIE を使用できませんでした。
この場合、 SPAI 3プリコンディショナーが採用されているため、メモリのスケーリングは優れています。
ウォールタイムのスケーリング効率は低いように見えますが、RCS の場合、後続の入射角に対して反復ソリューション段階のみが繰り返されることを覚えておく必要があります。また、初期推定値の使用を考慮し、反復ソリューション段階のみを考慮すると、MLFMM を使用したモノスタティック RCS に期待できる並列スケーリングをよりよく表すものになります。
MLFMM ソルバーの RCS とは異なり、MoM マトリックスが解決されると、各入射角が非常に速く解決されます。多くの入射角では、マトリックス計算と LU 分解段階を考慮するよりも、MoM ソルバーのソリューションのこの部分に重点を置く方が賢明です。
比較
ケース 5 とケース 6 を比較すると、実行時間とメモリの両方の点で、MoM の方が MLFMM よりもスケーラビリティに優れていることがわかります。
ワークロード管理
散乱および RCS の問題には、多数の独立したソリューションが必要です。単一のソリューション (たとえば、単一の入射角) に利用可能なすべてのリソースを使用する代わりに、利用可能なコンピューティング リソースの一部を使用して、入射角の合計数のサブセットを同時に解決する方がはるかに効率的なソリューションです。この目的のために、モデルを入射角の合計数のサブセットに分割し、Altair PBS Professional によって管理されるコンピューティング クラスターにジョブをアップロードする機能を備えたファーミング スクリプトをダウンロードできます。その後、PBS は、ファーミング スクリプトによって同時に送信されるすべての同時ジョブを管理します。
結論
MoM は MLFMM よりもスケールが優れていることが多いですが、MoM の欠点は、モデル サイズが大きくなるにつれてメモリ消費が増加することです。メモリは、未知数 (通常はメッシュ化された三角形の数) の 2 乗に比例します。ただし、フル ウェーブ ソルバーであるため、MLFMM などの反復ソルバーで時々発生する潜在的な収束の問題はありません。Feko の既定のソルバーは MoM であり、常に適切な開始点となります。
どちらのソルバーを使用するかは、モデルの MoM を適用したものと、MLFMM を適用したものとを一定時間実行し、ソルバーの進行状況を観察することで判断できます。また、メモリ不足のために MoM ソルバーがハード ドライブの領域を使用する場合 (この点については通知されます)、MLFMM に切り替えることをお勧めします。
最近のコンピューティング リソースの急増により、これらのソルバーで巨大な問題を解決できるようになりました。当然、この記事の大型旅客機のような大規模な問題の場合は、大規模なサーバーまたはクラスターで解決することになります。2 つや 4 つといった少数のプロセスを使用するのは無意味です。ただし、並列スケーリングの効率を計算する目的では、これらのメトリックを含めることは有用です。
電気的に巨大な問題 (たとえば、MLFMM の未知数が 1 億~ 2 億を超える問題) の場合、より合理的なスケーリング テストは、コンピューティング クラスター上の 1 つのコンピューティング ノード (たとえば、32 コアまたは 64 コア) から開始し、それを並列スケーリングの参照として使用し、次にコンピューティング ノードの数を 2 倍にして並列スケーリングの効率を把握することです。
複数のソリューションや同じモデルのバリエーションを必要とするプロジェクトに着手する前に、この記事でアンテナ配置と RCS の例とともに説明した MoM および MLFMM ソルバーなどの並列スケーリング テストを実行することは、利用可能な特定のハードウェア上で適切な数の並列プロセスを選択するための情報を得るための良い方法です。
1 MoM行列への後方代入
2 複合場積分方程式 (CFIE) は、基底関数の設定で電場積分方程式 (EFIE) と
磁場積分方程式 (MFIE) の両方を使用します。これにより、条件の整った行列が生成され、収束が向上し
、解決時間が短縮されます。
3スパース近似逆行列前処理 (SPAI) はメモリ効率の高い前処理ですが、場合によっては
収束が悪くなる可能性があります。収束には前処理が必要であり、適切なデフォルト設定が自動的に適用されます。