例えば回線使用率が30%と表示されている時の回線のイメージは、幅のある通路の30%の幅が埋まっているものでしょう。

JPIXで公開されているトラフィックグラフも同様なイメージです。

しかし、実際の回線はパケットが流れている時は100%の幅を占有しており、パケットが無い時はゼロの二つの状態を繰り返しているので。回線容量に対して何パーセントの使用率と言うのはある時間あたりに流れたパケットの総数をカウントして時間で割った平均値でしかありません。

パケットとパケットの間隔が縮まり、ゼロの時間が減ると回線使用率は上がっていきます。通信技術者としてはこの違いを忘れてはいけません。

特にトラフィックの合流や回線帯域が変化する時に発生する問題を推察するには、使用率ではなくパケットの間隔で考えないといけないからです。例えば10Gのバックボーンから1Gの支線にデータが流れ込むことを考えましょう。当然時間当たりの容量が減るのでその間パケットはキューに待たされることになります。バックボーンから流れてくるパケット間隔が均等に空いていれば何も問題がないのですが、それは保証されていませんので極めて短い間隔で10個くらいながれてきてその後しばらく間隔があいているケースもありえます。

間隔があいている時間帯も含めて平均値を計算すると1Gを大きく下回る数値になるでしょう。しかし、機器のバッファーが例えば5つしかパケットを保持できなかった場合3,4個のパケットが廃棄されるのは仕様からくる当然の結果です。このような障害を避けるために回線容量が変化する時にはキューの仕様を注意深く確認する必要があります。

同じ回線帯域でもパケット間隔が変化したことによる障害もあります。PCとPCを直接10Gで接続すると正常に動作するのにスイッチを経由するとPCではパケットロスを訴えてくる事があります。この時にスイッチのインターフェースカウンターをみても廃棄はゼロです。実はパケットはちゃんとPCまで届いているのですが、間隔が詰まってしまったために受け取れなくなってしまったのです。スイッチのジッター(Jitter)特性の問題なのですがこれは中々仕様として明確に記載されておらず、かつこの障害は原因追及が困難です。

次は、複数の回線が合流する時を考えてみましょう。今まで述べてきたように様々なカウンターの表示では低い回線使用率であったも実際の処理の時はパケットの間隔が狭まりバッファーによる待ちの処理が必要になります。十分な容量のバッファーを備えていればパケットの廃棄は起きませんが通過時間にばらつきが生じますのでパケット間隔が一定にならないジッター特性が悪くなります。そして、端末の処理によってはパケット間隔が大きく伸びると途中の回線でパケットが廃棄されたと判断し、ドロップのカウンターアップをします。この場合も中継機器で見る限りはパケットの廃棄はゼロですので障害の調査は混迷することになります。

パケット通信の回線は満杯と空の繰り返しであることをお忘れなきよう。


コメント欄を読み込み中