100G SR4はMPOコネクターのマルチモードファイバーを用意する必要があるし、コスト的にもケーブル一体型のAOCはSR4のトランシーバー二個よりも安いでAOCをお勧めする事が多いのですが、AOCの欠点としてパッチパネルを経由する配線ができないことと、故障時にトランシーバー部だけの交換が出来ないことがあります。
MPOコネクター部の障害要素が無い事もAOCの利点です。
もうすこし、現場での運用手順の違いを細かく見て行きましょう。
1)故障検知
本来は故障個所の特定作業も単純ではありませんが、この項では本筋ではありませんでのトランシーバーの故障であることが速やかに特定できた前提で話を進めます。
2)迂回路確認
故障個所を迂回する処理が機能しているのか。直すよりも先にサービスに与えている影響を調べます。
3)迂回路設定
次に、回復時のサービスの変動を最小化するにはどの単位で機能復帰させるのが適切かを考え。その対象範囲の迂回路設定します。
4)作業ユニット分離
迂回路の確認が終了したら、作業に必要な単位をサービスから切り離し機能停止します。
5)故障個所修復作業
今回のケースでは100G SR4であればコネクターを抜いて、トランシーバーを抜いて、新しいトランシーバーを刺して、コネクターを刺す。
AOCであれば、両端のトランシーバーを抜いて配線を回収し、新しい配線を通し、再びトランシーバーを刺す。
問題は両端のトランシーバーに触る事よりも配線を通す作業に大きな工数の差が発生すると思われます。
6)障害解消確認
7)作業ユニット復帰
8)迂回設定解除
9)システム動作確認
ケーブルの損傷の場合
ケーブルの損傷の場合、SR4でかつ予備の配線がある場合はその区間変更のパッチ操作を行います。
AOCの場合は、トランシーバー障害と同じ操作を行います。
SR4でかつ予備の配線が無い場合には、基本的にはAOCの場合と作業手順が同じです。
SR4
トランシーバー障害
|
SR4ケーブル障害 | AOC障害 | |
---|---|---|---|
トランシーバー抜入 | △(片側) | × | 〇 |
配線引き直し | × |
〇
(予備配線が無い場合)
|
〇 |
迂回路操作 | 〇 | 〇 | 〇 |
工数 | 小 | 大 | 大 |
結局のところパッチパネルを要するような距離の配線にはAOCは向かないと言う事です。パッチパネルを経由する事は多くの場合予備の配線があることを示します。
配線経路のスペースが狭い場合、トランシーバー部を付いたままのAOCは作業に制約があります。
大事なのは復帰手順
百歩譲って故障発生時のサービスの揺らぎは許容しても、復帰時の揺らぎは許されません。復帰手順はとても大事で難しい。
故障状態が解消されたことの確認をどうするか。
トランシーバーの故障でリンクダウンした場合、単純にトランシーバーの交換作業を行うとリンクが勝手に上がり経路の再計算が行われ、その上位のサービスにも構成変更の情報が伝わります。ただ、原因が他にあり直ぐに再びリンクダウンを起こる事もあります。
このように、状態がフラップする事は絶対に避けなければいけません。
復帰時にサービスが不安定になる要素をいかに排除できるか。
ロードバランサーなどを利用している場合は、新規のサービスリクエストから受け付けるテーブルに追加する。
もしくは、次のメンテナンスウィンドウまで復帰を保留する。