
Ubuntu日本語フォーラム

ログインしていません。
症状に気付いたのはWindows 7 pro/64bitにて常駐して監視・運用にあたっている
「TWSNMPマネージャ Ver.4」にて
「2012/2/6 1:53:00_IPレベル動作監視=重度障害」と緊急アラートが発動。
複数のファイルサーバ(TeraStation TX)とラックマウントサーバで運用中の
ProxyにDNSとSFTPサーバ3台が常時稼働中です。
その為にはレガシーサーバとして稼動しているWindows XP SP3 proの
「コマンド・プロンプト」で「browstat status」と入力して、
間違いなくマスターブラウザとして
Ubuntu10.04 LTSが登録されている「確認」をする必要性があります。
何故ならば、Ubuntu10.04 LTSがダウンして、
上記のTeraStation TXの稼働時間がUbuntuを上回ると、
必ず(100%の確率で)TeraStation TXがマスターブラウザとして登録されてしまう
「怪現象」が起きてしまうからです。
それを回避する為に最初に書いた「TWSNMPマネージャ Ver.4」ですが、
ソコに記載してあった「2012/2/6 1:53:00_IPレベル動作監視=重度障害」と
同じエラーログを
Ubuntu10.04 LTSの「システム」から「システム管理」から「ログビューア」
を上手に活用できればシステムの全部のログを閲覧できるそうですが・・・。
ログビューアに蓄積された膨大なデータから
今回の私のようなエラーを探し出すには
どの様な検索や「絞込みの言葉」が必要なのか是非教えて下さい。
最後になりましたが、Ubuntu10.04 LTSのログビューアを
もっと判りやすく視覚的にハッキリするソフトウェアの様なモノは、
「Ubuntu ソフトウェア センター」からはダウンロード出来ませんか?
何とか判りやすく日本語でUbuntuのログのデータを活用したいので
宜しくアドバイスと具体的な方策をお願いします。
オフライン
どなたかUbuntuに精通なされている方の
アドバイスを
至急お願い致します!
オフライン
環境、
問題としている現象、
どのような情報を求めているのか、
などよく読み取れませんでした。
使用機器、役割、OSなどの詳細情報や、
起きた現象、問題としている現象、
など整理して投稿していただいた方がコメントが付きやすくなるかと思います。
なお、日本語でログを出力させたいというような記述もありましたが、ログを読む人の恐らくほとんどは英語で表示して欲しい(日本語で表示して欲しくない)という人達だと思いますので、日本語対応しているのかどうかは判りませんが、たとえ対応していたとしても、翻訳が無いような気がします。
オフライン
>>どのような情報を求めているのか、などよく読み取れませんでした。
>>使用機器、役割、OSなどの詳細情報や、起きた現象、問題としている現象
自分では、最初の記事に「Windows 7」とか「TeraStation TX」と明記したのですが?
解かりにくい文章で申し訳ありません。
当方としても充分に解かる範囲の使用機器や・役割などは
>>複数のファイルサーバ(TeraStation TX)と
>>ラックマウントサーバで運用中のProxyにDNSとSFTPサーバ3台が常時稼働中です。
>>その為にはレガシーサーバとして稼動しているWindows XP SP3 pro
この様に記載してあったのですが、
どうやらウマく伝わらなかった様でした。
>なお、日本語でログを出力させたいというような記述もありましたが、
>ログを読む人の恐らくほとんどは英語で表示して欲しい
(中略)
>日本語対応しているのかどうかは判りません
なるほど、Ubuntu10.04 LTSのログビューアに関しては、
Windows XPやWindows 7の様に日本語の環境下では「全滅」の様ですね?
そうとなると、この度の案件は諦めて、
Ubuntu10.04 LTSでエラーが起きたりフリーズして強制停止になった場合は、
別の解決策を見つけるしか手段が無さそうです・・・。
オフライン
話題の中心が、「TWSNMPマネージャ Ver.4」というソフトであるなら、ちょっと自分にアドバイスできそうなことはなさそうですが、問題としている現象がUbuntuに関連することであれば、何か分かることがあるかも知れません。
機器として言及されているものには、
1. TeraStation(複数台)
2. ラックマウントサーバ
3. レガシーサーバ(?)
というものがあるようですね。
TeraStationは型式はさておき、通常のNASだと思われますが、これはデフォルトで稼働させているものでしょうか。
ラックマウントサーバで、OSとしては何が動作しているのでしょうか。これの上でUbuntu 10.04が動作しているのでしょうか。
また、Proxy, DSN, SFTPサーバが動作しているとのことですが、それぞれのサーバソフトは何が動作していますでしょうか。
レガシーサーバ(Windows XP)と呼んでいるものは具体的にはどのような役割を担っているサーバなのでしょうか。
上記1-3以外にクライアントマシンもいるようですね。
Windows7がクライアントマシンでしょうか。
Windows7上のTWSNMPマネージャが何かをモニタしていて異常を検出するとアラートを発出するようですが、これは何をモニタしていて、どのような状態になればアラートを出すのかは把握されていますでしょうか。
問題としているのは、TWSNMPマネージャ検出した異常状態が発生したことでしょうか。
この異常状態が、「Ubuntu10.04 LTSがフリーズした」ということでしょうか。
その場合、何をもって「Ubuntu10.04 LTSがフリーズした」と判断されていますでしょうか。
もし本当にUbuntuがフリーズしてしまっていたとすると、ログが正常に出力されているかどうかも怪しいですし、フリーズしてしまったのであれば再起動するより手は無いような気もします。
一方、サーバソフトが無応答になったとかであれば、異常を検出してサーバソフトを再起動するような処理をcronで回したり、ということはできるかも知れません。
オフライン
>>問題としている現象がUbuntuに関連することであれば、
>>何か分かることがあるかも知れません。
そうです、Ubuntu 10.04 LTSでのフリーズに対する問題が
本命です。語弊ある書き方で申し訳ありませんでした。
TeraStation TXの型式は
TS-X2.0TL/R5が1台と、TS-X4.0TL/R5が1台です。
>>さておき、通常のNASだと思われますが、
>>これはデフォルトで稼働させているものでしょうか。
そうです、24時間・365日フル稼働です。
下手に電源のON&OFFは寿命を縮めるだけと、メーカーサイドも明言してますので。
メンテ・ファームウェアのUPデートなどでは停止する事もありますが。
そして肝心のUbuntu10.04 LTSで動かしているマシンで、
IBM社製のThinkCentre M52 9210-D7Jという機種になります。
元々はWindows XP Pro SP3が入っていましたが、
現在はUbuntu10.04 LTS を動かしてます。
Proxyとして「Squid 2.7」が動いており、
Squidのログを出力・統計を取るためにSquid Report Generatorこと、
「Sarg 2.2.5」を導入済みです。
Squid.confの設定画面にて「俺がマスターブラウザになる!」と
宣言させるような書式を書いて、それで運用しています。
>>ラックマウントサーバで、OSとしては何が動作しているのでしょうか。
>>これの上でUbuntu 10.04が動作しているのでしょうか。
そうです。
ハードウェア構成は、
Appro Server 1224Xi
Dual インテルXeonプロセッサ(512K L2Cache)
Ubuntu上では4つと認識されてます。HTなので・・・。
チップセット:インテルE7501チップセット
メモリ6×ECC Registered PC2100 DDR-DIMM、
最大で12GBまで対応(2枚1組で使用)
512MB / 1GB / 2GB ECC Registered DIMMに対応
現在はECC対応のPC-2100の1GBを6枚使用してます。
拡張スロット:フルレングスPCI-X/PCI(64-bit/133MHz)×1スロット
グラフィックス:オンボードATI RAGE-XL PCI-based VGA controller 4MB
1280×1024 16万色表示可能
↑
さすがにコレではチープなので、
社外のGeForce FX-5200 128MB仕様のPCIボードを取り付けており、
LCDなどに問題は見られません。
入出力1×シリアルポート、1×PS / 2互換キーボード、
1×PS / 2互換マウス、2×USB
今ではUbuntu 10.04が動作しているのですが、
当時はリソース9.10 (karmic)からのアップデートしたタイプになります。
>>また、Proxy, DSN, SFTPサーバが動作しているとのことですが、
>>それぞれのサーバソフトは何が動作していますでしょうか。
上記のAppro Server 1224Xiは
IBM社製のThinkCentre M52 9210-D7Jという機種が
異常を起こした時に立ち上げる「Disaster-Recovery」としての毛色が強い用途です。
同じようにProxyとして「Squid 2.7」が動いており、
Squidのログを出力・統計を取るためにSquid Report Generatorこと、
「Sarg 2.2.5」を導入済みです。
あと、DNSとSFTPサーバ関係は、
NEC Express5800_SG300cというラックマウント型サーバで
試験段階の導入・検証なので、まだ展開するソフトやパッケージ名も
決まっておりません。なので、これは無視で大丈夫かと思います。
>>レガシーサーバ(Windows XP)と呼んでいるものは
>>具体的にはどのような役割を担っているサーバなのでしょうか。
一つはWindows XP Pro SP3の環境下でしか正常動作しないソフトを
動かすため。
二つ目はcmd=コマンド・プロンプト画面にて「browstat status」と入力して、
何処のマシンがマスターブラウザとして認知されているか?
を、知るためには「Windows XPのディスクから追加インストールを行う必要性」が有り、
現行のWindows 7Pro 64bitでは「不可能な為」です。
上記のWindows XP Pro SP3のレガシークライアントは、
HP社製のHP Compaq dc7900 MTで、
Dual インテルCore2 Duoプロセッサ(2.66GHz)
Windows XP上では2つと認識されてます。
チップセット:Intel Q45/Q43 Hewlet-Packard 3032hチップセット
メモリPC2-6400 DDR2-DIMM、現在は1GBを4枚使用してます。
グラフィックス:オンボードATI Radeon HD 3650
>>上記1-3以外にクライアントマシンもいるようですね。
>>Windows7がクライアントマシンでしょうか。
はい、そうです。Windows7がクライアントマシンです。
モデル名Prime A Thunderstorm GX Windows 7 インストールモデル
OS:Windows7 Professional 64bit
CPU:AMD PhenomⅡ X6 1090T
(6コア/定格3.20GHz/ターボコア動作時最大3.60GHz/9MB トータルキャッシュ/125W)
CPUファンノーマルCPUファン
メモリ:
16GB DDR3 SDRAM(PC3-10600/4GBx4/デュアルチャネル)
グラフィック機能NVIDIA GeForce GTX550 Ti 1GB
SSD:トランスセンド TS64GB
ハードディスク:HITACHI 1TB (HDS721010CLA332/ 7200rpm/512byteセクター)
このHDDが合計4つです。
マザーボードAMD 990FX チップセット搭載 ATX マザーボード
光学ドライブDVDスーパーマルチドライブ
光学ドライブ(追加) 追加光学ドライブ無し
サウンドマザーボード 標準 オンボードHDサウンド
ブロードバンドポート(LAN) ギガビットLANポート x1 (マザーボードオンボード)
IEEE1394 IEEE1394搭載(マザーボードオンボード)
ケース:Primeオリジナル S-350 ブラック(ATX)
リアケースファン背面ケースFAN (12cm 静音FAN)
電源:750W 静音電源 (DELTA ELECTRONICS 製 /80PLUS)
I/Oポート前面:USB2.0 x2 背面:USB2.0 x6 USB3.0 x2 eSATA x1 PS/2 x1
長くなりましたが、こんな所です。
>>Windows7上のTWSNMPマネージャが何かをモニタしていて異常を検出すると
>>アラートを発出するようですが、
>>これは何をモニタしていて、
>>どのような状態になればアラートを出すのかは把握されていますでしょうか。
それは「IPレベル動作確認=監視レベル=HIGH」に設定しており、
指定したPCのIPアドレスからの応答が無くなると
Windows 7上のTWSNMPマネージャがスピーカーから「サイレン音」を
発するためです。
>>この異常状態が、「Ubuntu10.04 LTSがフリーズした」ということでしょうか。
>>その場合、何をもって「Ubuntu10.04 LTSがフリーズした」と
>>判断されていますでしょうか。
手動でWindows XP Pro SP3又はWindows 7からREAL-VNCを使用して遠隔操作を
試みるか,
cmd=コマンド・プロンプト画面にて[ping]コマンドで確認。
応答が無いのでモニターを接続してみると、
デスクトップ画面でマウスカーソルは動かず、キーボードの「Num Lock」や「Caps Lock」
などが点滅状態に・・・。
オフライン
Squid.confの設定画面にて「俺がマスターブラウザになる!」と
宣言させるような書式を書いて、それで運用しています。
[訂正]
正しくはSamba Shareマネージャに於ける
Edit Config Optionから、
設定画面にて「俺がマスターブラウザになる!」と
宣言させるような書式を書いて、それで運用しています。
でした。
オフライン
coconuts による投稿:
>>さておき、通常のNASだと思われますが、
>>これはデフォルトで稼働させているものでしょうか。
そうです、24時間・365日フル稼働です。
下手に電源のON&OFFは寿命を縮めるだけと、メーカーサイドも明言してますので。
メンテ・ファームウェアのUPデートなどでは停止する事もありますが。
不明瞭な書き方ですみませんでした。
FTPサーバ機能などが使える機種もあったため、お聞きしたかったのは、アクセス方法として、デフォルトのsambaでアクセスしているのか、それ以外の方法でアクセスしているのかという点です。
ただ、結局のところ本題とは関係なかったようなので、こちらは忘れていただいて結構かと思います。
coconuts による投稿:
そして肝心のUbuntu10.04 LTSで動かしているマシンで、
IBM社製のThinkCentre M52 9210-D7Jという機種になります。
元々はWindows XP Pro SP3が入っていましたが、
現在はUbuntu10.04 LTS を動かしてます。
Proxyとして「Squid 2.7」が動いており、
Squidのログを出力・統計を取るためにSquid Report Generatorこと、
「Sarg 2.2.5」を導入済みです。
coconuts による投稿:
>>ラックマウントサーバで、OSとしては何が動作しているのでしょうか。
>>これの上でUbuntu 10.04が動作しているのでしょうか。
そうです。
ハードウェア構成は、
Appro Server 1224Xi
Dual インテルXeonプロセッサ(512K L2Cache)
Ubuntu上では4つと認識されてます。HTなので・・・。
Ubuntuがインストールされているサーバが2台あると理解しましたが、その認識でよろしいでしょうか。
coconuts による投稿:
>>Windows7上のTWSNMPマネージャが何かをモニタしていて異常を検出すると
>>アラートを発出するようですが、
>>これは何をモニタしていて、
>>どのような状態になればアラートを出すのかは把握されていますでしょうか。
それは「IPレベル動作確認=監視レベル=HIGH」に設定しており、
指定したPCのIPアドレスからの応答が無くなると
Windows 7上のTWSNMPマネージャがスピーカーから「サイレン音」を
発するためです。
これはpingで応答を確認しているようなイメージでよろしいでしょうか。
coconuts による投稿:
>>この異常状態が、「Ubuntu10.04 LTSがフリーズした」ということでしょうか。
>>その場合、何をもって「Ubuntu10.04 LTSがフリーズした」と
>>判断されていますでしょうか。
手動でWindows XP Pro SP3又はWindows 7からREAL-VNCを使用して遠隔操作を
試みるか,
cmd=コマンド・プロンプト画面にて[ping]コマンドで確認。
応答が無いのでモニターを接続してみると、
デスクトップ画面でマウスカーソルは動かず、キーボードの「Num Lock」や「Caps Lock」
などが点滅状態に・・・。
このあたりの症状を聞くと、Ubuntu機がフリーズしているというご理解で正しいように思えます。
Ubuntu機が2台あると理解していますが、どちらか一台での現象でしょうか。
あるいは、2台ともで起きている現象でしょうか。
もし、まだフリーズしたままである場合は、電源遮断、再起動するより他になさそうです。
再起動後に、ログを見て何が起きたのかを調べ、再発防止が可能かを考えることになりそうです。
中で何が起きたのかが現段階では不明なので、これといったキーワードが思い付きません。
しかし、幸いにも異常検出時刻が判っているので、その前後、特に直前に何かそれらしい記録が残っていないか、/var/log/syslogや、/var/log/syslog.[数字]などのファイルを確認してみて下さい。
異常を示すメッセージが確認できればそのメッセージからさらに辿るべきファイルやキーワードを考えてみましょう。
オフライン
>>Ubuntuがインストールされているサーバが2台あると理解しましたが、
>>その認識でよろしいでしょうか。
[中略]
>>Ubuntu機が2台あると理解していますが、どちらか一台での現象でしょうか。
>>あるいは、2台ともで起きている現象でしょうか。
そうです、今のところは2台です。
IBM社製のThinkCentre M52 9210-D7Jという機種が「メイン」で、
トラブルを起こし、フリーズしたのも同じマシンです。
もう1つの方(Appro Server 1224Xi)は大丈夫です。
>>これはpingで応答を確認しているようなイメージでよろしいでしょうか。
はい、その通りです。
>>中で何が起きたのかが現段階では不明なので、
>>これといったキーワードが思い付きません。
そうですか、残念です・・・。
>>特に直前に何かそれらしい記録が残っていないか、
>>/var/log/syslogや、/var/log/syslog.[数字]などのファイルを確認してみて下さい。
/var/log/のフォルダには、
確かにsyslogというファイル1つと、
Syslog.1からsyslog.7gzという圧縮ファイルまで存在しましたが、
該当すると思われる「異常を検知した日時」には辿り着けませんでした。
「2012/2/6 1:53:00_IPレベル動作監視=重度障害」だけはハッキリしてるのですが。
自分の様な素人管理人には、
ここまでが調べる限界の様です・・・。
オフライン
端末で、
egrep 'Feb\s*6\s*[12]:[0345]' /var/log/syslog*
とかするとなにか引っかからないでしょうか。
上記コマンドで正規表現で日時を絞り込んでsyslog*からログをフィルタすることができます。
正規表現の部分は2/6の1:30から2:09ぐらいまでのログを引っかけることを意図しています。
# 2:30から2:59とか、1:00から1:09まで引っかかりますがあまり多くはログはでていないだろうと。。
ある程度怪しそうなメッセージが絞り込めれば、次はそのメッセージに関連するログを引っかけると少しは状況が見えてくるかも。
オフライン
>>上記コマンドで正規表現で日時を絞り込んで
>>syslog*からログをフィルタすることができます。
昨夜、何度となく「絞り込み検索」を行いましたが、
結果は変わらずでした。
Syslog.1からsyslog.7gzという圧縮ファイルを
Geditで開いて中身のログを確認するも、
「異常を検知した日時」には辿り着けませんでした。
オフライン
ログに参考になるようなメッセージがでていないとなると、ちょっと調査は難しいですね。。
ソフトウェア的な原因としてはドライバ(カーネルモジュール)のバグなどが考えられますが、
ハードウェア情報の詳細をlshwで出力して、公知のドライバのバグ情報(およびその回避方法)を探すといったような、根気の要る作業となります。
あとはハードウェア自体の故障も疑ってみた方がよいかも知れません。
例えばですが、
排熱に問題(ファンの故障、排気口の詰まりなどを目視で確認)が無いか、
メモリに異常がないか(memtest86などで確認可能です)、
電源系に異常(電源電圧の揺れなど。オシロが無いと調べられませんが。。)が無いか、
などなど。
オフライン
>>ログに参考になるようなメッセージがでていないとなると、
>>ちょっと調査は難しいですね。
[中略]
>>根気の要る作業となります。
そうですか・・・
どちらにせよ原因究明が一筋縄でいかないという事だけは解かりました。
>>あとはハードウェア自体の故障も疑ってみた方がよいかも知れません。
サーバをメンテナンスで停止させる時には、
機器内部にエアブローで埃を飛ばしたり、
コンセントの「トラッキング火災」の抑止効果の一つとして、
掃除機なども掛けているのですが・・・。
いずれにしても、
これ以上の「ログ検索」は意味が無さそうなので、
同じ症状が続かないように注意深く様子を見ていきます。
皆様方にはお世話を掛けましたが、
これで「解決済み」にしたいと思います。
オフライン