IPC glitchに関連して、全てのFEのNIC設定を変更しました。 経緯 過去のDGSの試験でFrontEnd側のNIC設定(ITR:InterruptThrottleRate)によってパフォーマンスが改善している結果があった。 現状、その辺の設定は行われていない。 今回ITRを変更することでIPC glitchの改善に繋がるか確認する。 手順 1.FEにログインする 2.sudo ethtool -C eth1 rx-usecs 0 現状分かること 数日IPC Glitchの発生状況を確認する予定です。 vmstatで確認する限り異常な負荷はなさそうです。 inやcsの値が増減していますが、変化は許容範囲(データ取得する度に変化する) (テストでk1px1とk1test0は事前に8月10日に変更していた。k1ioo0はデータ取り忘れた) before after - in cs us sy id wa in cs us sy id wa k1lsc0 20 52 26 2 71 0 46 33 26 2 71 0 k1asc0 3 31 29 2 69 0 7 30 29 2 69 0 k1als0 11 5 1 0 99 0 0 12 1 0 99 0 k1ioo0 - 59 14 13 1 86 0 k1ioo1 16 0 6 1 94 0 31 21 6 1 94 0 k1imc0 7 6 16 2 82 0 31 60 16 2 82 0 k1pr2 11 4 2 0 97 0 21 14 2 0 97 0 k1pr0 20 16 2 0 97 0 5 2 2 0 97 0 k1prm0 19 12 2 0 97 0 4 22 2 0 97 0 k1mcf0 0 0 0 0 100 0 0 0 0 0 100 0 k1bs 6 4 4 0 96 0 16 15 4 0 96 0 k1sr2 4 4 4 0 96 0 13 15 4 0 96 0 k1sr3 18 29 7 1 93 0 33 11 7 1 93 0 k1srm 16 15 5 0 95 0 2 2 5 0 95 0 k1omc0 60 7 18 2 80 0 10 53 18 2 80 0 k1omc1 1 1 0 0 99 0 0 0 0 0 99 0 k1ix1 1 0 6 0 94 0 0 0 6 0 94 0 k1iy1 0 2 7 1 92 0 3 1 7 1 92 0 k1ex1 0 1 9 1 91 0 0 1 4 1 95 0 k1ey1 1 0 6 0 94 0 0 1 6 0 94 0 k1ex0 1 0 4 1 95 0 0 1 4 1 95 0 k1ey0 33 25 5 1 94 0 1 0 5 1 94 0 *k1px1 1 0 0 0 100 0 *k1test0 0 1 16 2 82 0 k1iy0 0 0 1 0 99 0 0 0 1 0 99 0 in クロック割り込みも含む、1秒あたりの割り込み回数 cs 1秒あたりのコンテキストスイッチの回数 us カーネルコード以外の実行に使用した時間(ユーザー時間、nice 時間を含む)(%) sy カーネルコードの実行に使用した時間(システム時間)(%) id アイドル時間(%) wa IO 待ち時間(%) k1boot: /diskless/root/etc/rc.Local 前/usr/sbin/ethtool -C eth1 rx-usecs 1 後/usr/sbin/ethtool -C eth1 rx-usecs 0 --- All FE NIC settings were changed in relation to IPC glitch. Background In past DGS tests, the NIC setting (ITR: InterruptThrottleRate) on the FrontEnd side improved performance. Currently, such settings have not been made. We will check if changing ITR this time leads to improvement of IPC glitch. Procedure 1. Log in to the FE. 2.sudo ethtool -C eth1 rx-usecs 0 What we know now We plan to check the occurrence of IPC Glitch for a few days. There seems to be no abnormal load as far as I can see with vmstat. The values of in and cs are increasing and decreasing, but the changes are acceptable (they change every time data is acquired). (k1px1 and k1test0 were changed to August 10 in advance for testing. k1ioo0 forgot to take the data.) before after - in cs us sy id wa in cs us sy id wa k1lsc0 20 52 26 2 71 0 46 33 26 2 71 0 k1asc0 3 31 29 2 69 0 7 30 29 2 69 0 k1als0 11 5 1 0 99 0 0 12 1 0 99 0 k1ioo0 - 59 14 13 1 86 0 k1ioo1 16 0 6 1 94 0 31 21 6 1 94 0 k1imc0 7 6 16 2 82 0 31 60 16 2 82 0 k1pr2 11 4 2 0 97 0 21 14 2 0 97 0 k1pr0 20 16 2 0 97 0 5 2 2 0 97 0 k1prm0 19 12 2 0 97 0 4 22 2 0 97 0 k1mcf0 0 0 0 0 100 0 0 0 0 0 100 0 k1bs 6 4 4 0 96 0 16 15 4 0 96 0 k1sr2 4 4 4 0 96 0 13 15 4 0 96 0 k1sr3 18 29 7 1 93 0 33 11 7 1 93 0 k1srm 16 15 5 0 95 0 2 2 5 0 95 0 k1omc0 60 7 18 2 80 0 10 53 18 2 80 0 k1omc1 1 1 0 0 99 0 0 0 0 0 99 0 k1ix1 1 0 6 0 94 0 0 0 6 0 94 0 k1iy1 0 2 7 1 92 0 3 1 7 1 92 0 k1ex1 0 1 9 1 91 0 0 1 4 1 95 0 k1ey1 1 0 6 0 94 0 0 1 6 0 94 0 k1ex0 1 0 4 1 95 0 0 1 4 1 95 0 k1ey0 33 25 5 1 94 0 1 0 5 1 94 0 *k1px1 1 0 0 0 100 0 *k1test0 0 1 16 2 82 0 k1iy0 0 0 1 0 99 0 0 0 1 0 99 0 in Number of interrupts per second, including clock interrupts cs Number of context switches per second us Time used to execute non-kernel code (including user time and nice time) (%) sy Time used to execute kernel code (system time) (%) id Idle time (%) wa IO wait time (%) k1boot /diskless/root/etc/rc.Local Before /usr/sbin/ethtool -C eth1 rx-usecs 1 After /usr/sbin/ethtool -C eth1 rx-usecs 0