目を欺くもの – 第 1 部(Michael Kowal)

    本ページは英語ドキュメントを翻訳したものです。

     


     

    目を欺くもの(Michael Kowal) – 第 1 部

    …煙を取り払う

     

    シニア ネットワーク設計エンジニアのあなたは、在宅勤務することがあまりにも多く、人付き合いを忘れた世捨て人のような生活を送っています。長い時間を室内にこもってプロジェクトにかかりきりだったので、少し息苦しさを感じてきました。そこで環境を変えてみることにしました。気分転換にホーム オフィスから出て、会社のローカル オフィスの 1 つで仕事をすることにしました。ラップトップを取り出してオフィスに落ち着いて 5 分もしないうちに、ジュニア エンジニア(いつもまごついているように見えるので、親しみをこめて「後輩君」と呼ばれている)がやってきて、助けを求めてきました。どうやら、在宅勤務を切り上げるにはタイミングが悪かったようです。

     

    後輩君は、シニア設計エンジニア(あなたの同僚)の下について、ACME Corporation の 2 つの新しいデータセンターの設計に携わっていました。今日 ACME Corp. の CTO に設計をプレゼンテーションする予定なのですが、大きな問題が 1 つあります。理由はわかりませんが、リーダーであるシニア設計エンジニアが姿を消してしまったのです。後輩君は、2 つの設計案を前にとまどっています。CTO の要求で、顧客にプレゼンする案を 1 つ選ばなければなりません。そこで後輩君は、CTO に提案する設計を決めるため、2 つの設計の違いがよくわかるように助けてほしいと頼みにきたのです。

     

    次の 2 つの設計と、設計メモを見せてくれました。

     

    設計 #1:

    Blog27-design1.png

     

    設計 #2:

    Blog27-design2.png

     

    設計メモ:

    • 設計 #1 では、各リーフ ノードとすべてのスパイン ノード間をフル メッシュ接続する。
    • 設計 #2 は中継ノードを導入して、データセンターの East-West トラフィック フローを相互接続するためだけに使用する。
    • 両方のリーフ/スパイン設計に、リーフ ノードを 20 GE(10 GE EtherChannel)で接続するサーバがある。リーフとスパイン ノード間のリンクは 100 GE。
    • BGP はルーティングに使用される。eBGP がリーフとスパイン ノード間で使用される。各データセンター サイトでは、リーフ層は固有の BGP ASN を使用し、スパインは単一の共通 ASN を使用する。リーフ ノードの VLAN は BGP に再分配される。設計 #2 では、中継ノードは独自の BGP ASN に配置される。

     

    両方の設計をざっと見た感じでは、どちらも気に入らないというのが本心です。そのうえ、苛立たしいことに、後輩君は要件を説明することなく、どの設計オプションが良いかを聞いてきます。これまでにも、経験の浅いエンジニアが「パブロフの犬」さながらに振る舞うのを幾度となく目にしています。つまり、顧客からキーワードをいくつか聞き出しただけで、要件をまだ完全に理解していないのに製品の選定に取り掛かってしまうのです。こうした事態にはうんざりです。そこで後輩君に、要件をもう一度確認してもらえないだろうかと頼みます。

     

    後輩君は、次の要件があると説明します。

    • 現在、ACME のアプリケーションは、専用データセンター インフラストラクチャではなく、ACME のコア ネットワーク デバイスに直接接続している。この設計は、設備への物理アクセスを監査できるようビジネス アプリケーションは専用環境に配置するという、ACME の新しいセキュリティ ポリシーに違反している。
    • ACME Corporation は、2 つの冗長データセンターを新たに建設し、多階層型アプリケーションの高可用性を実現しようとしている。アプリケーション層は、ライン オブ サイトを直接確認できる数マイル離れた 2 つの新しいデータセンターに分散される。
    • アプリケーション層間には、非常に多量の同期トラフィックが発生する。同期トラフィックに何らかの信頼性に欠ける配信(遅延、ジッターなど)が発生した場合、アプリケーションはユーザ エクスペリエンスに悪影響を及ぼす同期プロセスをリセットできる。
    • コストはきわめて重要な要素で、特に OpEx コストを管理する必要がある。運用の複雑さを最小限に抑える必要がある。ACME は OpEx を削減するためなら CapEx が増加してもよいと考えている。
    • 将来、アプリケーションの増加に従って、1 つ以上のデータセンター サイトを追加する可能性がある。運用の複雑性に大きな影響を与えることなく、拡張できる設計にする必要がある。

     

    後輩君に手を貸した方が早く一人きりになれるのではないかと思い、いくつかの違いを簡単に分析してみせます。具体的には、次のようにコメントしました。

    • 設計 #1 には高レベルの冗長性が備わっている。リンクやノードに障害が発生しても、設計 #2 ほど大きな影響は生じない。設計 #2 で両方の中継ノードに障害が発生すると、すべての East-West トラフィックが失敗する。
    • 設計 #1 には 2 倍の数の 100GbE トランシーバが必要だが、そのコストが設計 #2 で追加される中継ノードのコストを上回るかどうかはわからない。顧客が追加リーフ ノードを増設するつもりなら、設計 #2 の場合は設計 #1 とは逆にトランシーバのコストが低下すると指摘すること。
    • 設計 #2 にある主な欠点の 1 つは、データセンター間の East-West トラフィックがまず中継ノードを通過しなければならないことである。
    • 今後より多くのデータセンターが追加されると仮定すると、設計 #1 では、リーフ ノードが追加されるとポイントツーポイント リンクが急激に増加するという、最悪の結果になる。
    • 設計 #1 では、今後より多くのデータセンターが追加されると、管理対象の自律システムの数が減るので、East-West トラフィック フローのトラブルシューティングが簡素化されるとアピールできる。

     

    このアドバイスを受けて、後輩君は 2 つの設計案の大まかな分析をホワイトボードにまとめることができました。

    設計 #1設計 #2
    最大の冗長性X
    最小の CapExX
    最小の OpExX
    最適なトラフィック フローX

    セキュリティ

    XX
    最大の拡張性X

     

    後輩君は、両方の設計に長所と短所があることを理解し、ACME Corp. に両案を提案することにしました。ACME 本社での会議に同行して設計の提案を手伝ってほしいと頼まれますが、現在抱えている仕事が山ほどあるからと、丁寧にお断りすることにします。結局、電話会議で参加することで落ち着きます。これなら、全神経を集中させなくてもすみます。

     

    電話会議の後は、後輩君がすべて把握したようなので、解放されて仕事に戻れました。しかしそれは後輩君が質問してくるまでのことでした。その質問は当初耳にしていなかったことで、後輩君にもう一度聞き返しました。後輩君の説明では、設計 #2 が提案する中継ノードの使用方法では、データセンター間の接続性にリスクが多すぎるのではないかと CTO は思っているようです。設計 #1 は CTO のほとんどの要件を満たしますが、データセンター間で必要となる大量の接続は例外です。 さらに、必要な光学機器の追加は問題ではありませんが、ファイバの追加リース コストは許容範囲を超え、設計の拡張性が低下します。ACME の CTO は、専門家であるあなたのアドバイスに判断を委ねようとしています。

     

    どちらのソリューションを提案すべきでしょうか。

    a) 設計 #2 を修正し、中継ノードとスパイン ノードとの間の 100 GE インターフェイスを 400 GE インターフェイスにアップグレードして、データセンター間のスループット ボトルネックのリスクを低減する。

    b) 現在の 2 層設計ではなく、3 段階の Clos ファブリックを提案して、拡張性を強化し、複雑性を低減し、可用性を向上させる。

    Blog27-Clos Fabric.png

    c) 設計 #1 を修正して、データセンター間に DWDM を使用してスケーラブルな方法でコストを削減する。

    d) 設計 #2 を修正して、純粋な eBGP 設計から MP-BGP EVPN コントロール プレーンを使用する VxLAN ベースのオーバーレイに変更して、複数のデータセンターに拡張する際の複雑性を軽減する。

    e) 設計 #1 を修正して、免許を受けた周波数帯を使用するマルチギガビット ワイヤレス バックホールを使用して、光ファイバの制約を強化し、コストを削減して可用性を向上させる。

    f) ローカル データセンターを廃止して、アプリケーションを 2 つのクラウド プロバイダーに分割し、コストと複雑性を低減し、同時に高可用性とスケーラビリティをクラウド プロバイダーにオフロードすることを提案する。

     

    どれかを選んで、その妥当性を説明してみてください。第 2 部では、私が選んだソリューションと、その理由を説明します。

     

    著者について

    pic Michael Kowal.jpg

     

    過去 12 ヵ月間、Michael Kowal はシスコにおいて、キャリア ルーティングおよび最適な設計とアーキテクチャに取り組んできました。現在は、国立研究機関、地域のサービス プロバイダー、大規模な政府および高等教育機関の顧客と協力しながら、Evolved Programmable Network の教育、設計、構築を支援しています。公共セクターにおける Michael の研究対象は、BGP、LISP、セグメント ルーティング、IPv6、および DWDM などのテクノロジーです。

    Michael は現在、Routing & Switching、Service Provider、Voice トラックの CCDE と CCIE を取得しています。また、Stevens Institute of Technology で電気工学の修士号を取得しています。

     

    次の方法で、このテーマについてさらに学んだり情報を交換したりすることができます。

    CLNBanner