
Ubuntu日本語フォーラム

ログインしていません。
こんにちは、bekkou68 と言います。
現象として、ある日を境に、Munin のグラフが更新されなくなりました。
「/var/log/munin/munin-update.log」を見てみると、
2010/07/27 13:40:12 [INFO]: Munin-update finished (10.06 sec)
2010/07/27 13:45:01 Opened log file
2010/07/27 13:45:01 [INFO]: Starting munin-update
2010/07/27 13:45:01 [INFO] Process 31154 is dead, stealing lock, removing file
2010/07/27 13:45:01 /usr/share/perl5/Munin/Master/UpdateWorker.pm line 139
2010/07/27 13:45:01 [ERROR] Munin::Master::UpdateWorker<localdomain;localhost.localdomain> died with '[FATAL] Socket read from localhost.localdomain failed. Terminating process. at /usr/share/perl5/Munin/Master/UpdateWorker.pm line 139
...propagated at /usr/share/perl5/Munin/Common/Timeout.pm line 66.
'
2010/07/27 13:45:11 [WARNING] Call to accept timed out. Remaining workers: localdomain;localhost.localdomain
2010/07/27 13:45:11 [INFO] Reaping Munin::Master::UpdateWorker<localdomain;localhost.localdomain>. Exit value/signal: 18/0
2010/07/27 13:45:11 [INFO]: Munin-update finished (10.07 sec)
2010/07/27 13:50:01 Opened log file
となっています。
その他のログではエラーは起きていないようでした。
また、HTML(/var/cache/munin/www/)の「localdomain/localhost.localdomain」配下の png は、
グラフ描画はされていませんが更新日時は変わっています。
今まで行ったアプローチとしては、
HTML のオーナーを munin であることを確認したり、HTML を消して作り直したり、
各設定ファイルを確認したり、munin munin-node をインストールし直したりしました。
が、解決できません。
アドバイスいただけると嬉しいです。
どうぞよろしくお願いします。
オフライン
munin-node が読めないと言っている気がするので telnet で 接続できるか試してみましょう
$ telnet 127.0.0.1 4949 Trying 127.0.0.1... Connected to 127.0.0.1. Escape character is '^]'. # munin node at host.domain list cpu df hddtemp_smartctl load memory munin_stats sensors_temp quit
通常ならこのようになります
オフライン
chinajunk さん、お返事ありがとうございます。
$ telnet 127.0.0.1 4949 Trying 127.0.0.1... Connected to 127.0.0.1. Escape character is '^]'. # munin node at xxx list acpi cpu cpuspeed df df_inode entropy forks fw_packets http_loadtime if_err_eth0 if_eth0 interrupts iostat iostat_ios irqstats load lpstat memory open_files open_inodes proc_pri processes swap threads uptime users vmstat quit Connection closed by foreign host.
のようになりました。いかがでしょうか?
オフライン
list で表示されたプラグインを一つずつ試してみましょうか
結果が表示されずにタイムアウトするプラグインがあるかもしれません
fetch cpu user.value 1478283 nice.value 195119 system.value 357240 idle.value 21115206 iowait.value 211296 irq.value 4109 softirq.value 90186 steal.value 0 .
もし全部うまくいった場合はごめんなさい、ちょっとわからないです
オフライン
chinajunk さん、ご返事ありがとうございます。遅くなってすみません。
全てに対して fetch してみましたが、全てタイムアウトしませんでした。
もう少し自分で調べてみます。ご対応ありがとうございました!
オフライン