PC-UNIXの最近のブログ記事

先日PSODになったESXiサーバはその後再発はせず現在元気に動いております。
やはり熱暴走ですかね。


ほこりで吸気口がつまるのを防ぐべく新しい場所を選定中ですが、どうもいい場所が決まらなくて。
ベストな場所は既にファイルサーバが占拠中。
このベストな場所は環境がいいので他にもネットワーク機器やサーバ類がいくつかあり、場所の確保が難しい。
置けるは置けるけど、ESXiサーバも含め吸気口・排気口塞ぐ可能性があるもんで。
整理すれば設置出来る・・・・かな?



で、今後のことも考えてESXiサーバを新調することも検討しときます。
マザーボードはH67チップセットで動く模様。
これにできるだけ低発熱のCPUを乗せる。


ケースはキューブ型をやめてミニタワーぐらいで。
キューブ型でも運用に支障がないのは分かっていますが、汎用性・パーツの流用性を考えるとミニタワーがいいのかな、と。


熱もこもりづらくなるでしょうし、NICを2枚さしても大丈夫かな?
ゲストOSごとに使うNICを変えるとかやってみたい、と。



ま、今の環境でむちゃくちゃ困っているわけでないのでしばらくは今のキューブPCのままですね。
とりあえず置き場所チェンジを早くしよう。




ファイルサーバはずっと利用していたSS21Tとおさらばしたいが、来年かな?
BTXマザーってことをのぞけばいいヤツなんですが。

 

昨日自宅サーバにつながらなくなったのでESXiの画面つけてみたら案の定PSOD(Purple Screen of Death)。


キューブ筐体(SG31G2)が全体的に熱持っていたので熱暴走したっぽい、と思うが前回HDDのエラーだったので一応HDDもチェックする。
とりあえず電源切って筐体掃除。


うーむ、このShuttleのキューブ筐体は側面下段から吸気して、背面の8cmファンで排気するようになってますが、側面下段の吸気口である穴がほこりで埋まってる模様。


穴が埋まって吸気の効率落ちたんでしょうね。
背面も側面ほどではないもののほこりがつまってる。



とりあえずほこりを全部落とす。徹底的に。
その後HDDを別筐体にさしてSmartの状態をチェック。
ヤバいエラーは無い模様だ。


ESXi再稼働させ、ゲストOSも動かす。
ディスクI/O関連のエラーが出てないかチェック。
・・・・・とりあえずないみたい。今のところは。



ただ前回はバックアップを取ろうとゲストOSのコピーをしてた時にエラーでたのでまだ何とも言えず。

熱は稼動後1時間ぐらい経った時点で筐体を触ったが明らかにPSODだったときと温度が違う。



ESXiをキューブ型PCで使ってる上に静音化して熱持ちやすいのに、床に近い割とほこりを吸い込みやすい場所に設置しているのがそもそも問題なのかも。

 

置き場所の変更も考えるかな~。
・・・単なる熱暴走、ってことで片付けたい。とりあえず様子見。

Windows上で簡単にFTPサーバやSyslogサーバ、TFTPサーバ/クライアントを用意できるソフトウェアとして3Cdaemonという超便利ツールがあります。

3Com社製のユーティリティであまり細かい設定をせずに即上記のサーバを用意できるようになってます。
ひとまとめになっているのでお手軽にテストをしたいとき何かは非常に便利なツール。



・・・・でした。



久しぶりにダウンロードしようとしたら3Comが昨年HPに買収されたので、ダウンロード先の3com.comにアクセスしようとするとHPのサイトに飛ばされる模様。

飛ばされた先のHPのサポートサイトを探してみましたが、見つかりそうにありません。
3cdaemonとかファイル名である3cdv2r10.zipで検索しても出てこなかったので・・・
残念。


ちなみにそのファイル名の3cdv2r10.zipで検索すればダウンロードミラー先?はいくつか見つかるようです。
ただ安全なファイルかどうかはもちろんなんともいえないですね。
安心した状態で入手するのはなかなか難しそう。
ミラーサーバ上のファイルでも問題ないとは思いますが、ね・・・・・・


まぁ、Windows上で動作するFTPサーバはたくさんあるし、SyslogサーバもTFTPサーバもフリーでいくつか存在するようです。
ググればいろいろ出てきます。
代替手段はある。ひとまとめに出来ないだけで。

昨年ESXiの調子が悪くなってあーだこーだいじった末にHDDが原因、ということでHDDを交換しました。
その後約1ヶ月順調に稼働しているので満足していたわけですが、ふとこの問題のHDDをRMA(交換)しようと思いメーカー交換に出したんですよ。

WesternDigitalのHDDですがRMA手続きのやり方はGoogleで調べ、申請して交換の了承が降りるもちゃんと交換されるんだろうか・・・・・?と半信半疑ながらも送付。


それが約2週間前。




で無事代替品が戻ってきた。
ちなみにブツはWD10EADS。いわゆるCaviar Greenの1TBモデル。
もちろんAFTじゃないです。AFTじゃなければ今のところ使い勝手がいいので・・・・

戻ってきたHDD

なお、かかった費用は送料だけ。2000円ぐらい。

万が一に備えてESXiのゲストOSのバックアップを取っていたらI/O error発生しコピー失敗。
再現性もあり。
また、ESXiのにmessagesにもI/O errorの出力あり。


Dec 22 23:42:34 vmkernel: 2:13:03:19.327 cpu0:1542)LinBlock: 1926: I/O error, dev 16:00 (hdc), sector 1235802807

ハードの可能性じゃないの~?と思っていた矢先に一気にその可能性が高まってしまった・・・・・
ハードの交換はめんどくさい・・・

 

が、そうも言ってられないのでHDDの交換作業開始。
コピーに問題のあったゲストOSは捨ててもいいゲストOSなのでそれが唯一の救い。
メールが全部溜め込んであって一番重要なメールサーバが無事コピー出来たので山は越えた。


ちなみにHDDじゃなくてマザーボードやケーブルに問題が、って可能性もあるんだよね・・・・
HDD交換後もエラー出ていないか監視しないと。
監視はとりあえず人力・・・・

ESXiのPSOD続き

| コメント(0) | トラックバック(0)

昨日のESXi3.5でPSODが発生する件ですが、予定通りsfcbdを停止させました。
これでしばらく様子見。
これまでの傾向から何か対処しても1ヶ月持たなかったので1ヶ月以上PSODでなければ効果があったと判断できそう。


止め方に関してはHP technical supportのPSOD Due to Memory Leak in sfcbdを参考にした。
※リンク出来なかったので見たいかたはググってください


ただ、もういい加減4.1にしようよ、という気になったので計画立てて4.1に移行したい。
仮想OS上のドライバとか変わっちゃう可能性あるから調べないといけないし、USBメモリ起動もやめたいなぁ。


年明けたら。

週末は自宅サーバで二つほど問題が発生して対応してました。


一つは先日PSODが頻発したESXi 3.5が再びPSOD。
もう一つはSambaとWindows 7 間でのコピーがおかしい。



前者はもうちょい調査が必要。あたりをつけつつはある。
PSODを引き起こすプロセスはsfcbdで、googleなどで検索すると各所で問題になってる模様。
sfcbdって何者?と調べてみるとSmall Footprint CIM Brokerとあり、(最後のdはdaemonと思われ)ゲストOSのヘルスチェック・ステータス取得用?と思われる。よく分からん。
とりあえずこのsfcbdを止めることにしてみる。止めればsfcbdが原因となるPSODは発生しない。


しかしそもそもなんで急にsfcbdがおかしくなったの?という話もあり、ハードに問題が発生しているのかもしれない。
なんだろう・・・・USBメモリは変えたしなぁ~。
あるいは3.5から4.0にVerUPするか。
やはりきちんと認定通ってる機器じゃなきゃダメかな(今はShuttleのキューブPC)。




で、後者のコピーの問題は多分直った。Samba側で使っていたNIC(VIA)のドライバに問題があった模様。IntelのNICがやはりドライバの問題でNGなので余ってたRealtekを投入。
復旧。
Intelがダメで蟹(Realtek)がOKとは・・・・


XP<->Win7間でネットワークを介したコピーに問題があることはよくあるらしい。
その場合、セキュリティソフトが悪さしていることもしばしばあるらしい。
今回いろいろ試して結果としてはWindows7側ではなく、Samba(FreeBSD8.0)のNICが原因でしたが、どうもWindows7のネットワークを介したコピーはいろいろ問題ありそうだ。
SMB2.0になったことも関係しているのかしら。




しかしこれでほぼ2日間潰した。ちくしょうめ。

先週仮想サーバのESXiの調子が非常によくありませんでした。
具体的にはよく落ちる。
ゲストOSの反応が無くなり、ESXiそのものも反応無くなるので直接コンソールのぞくとPurple Screen of Death(PSOD)状態。


初めて見たときはなんだこの変な色は!と思いましたよ。
↓こんな感じなんですが。

PSOD


これが2、3日に一回、だんだん頻度が上がって最終的に毎日になりました。


予想した原因は以下の2つ。

  • ESXiをインストールしたUSBメモリが限界に来た
  • 使ってるVersion(3.5.1 Update2)が持ってるバグ


両方とも考えられるので使ってないUSBメモリにチェンジしてVersionUP。
ESXi4.0/4.1にしたときの環境変化に対応している暇がないのでとりあえず3.5.1の最終版。そうでなくてもゲーム用PCの環境移行終わってないのに。
いつかは4.0/4.1にしたいんですけどね。



で、無事安定動作するようになりました。
ちなみにESXi導入したのが去年の今頃なので、USBメモリが問題なら1年後また発生する可能性がある。
で、あればそれまでに4.0/4.1にアップグレードしたいなぁ。

AFTフォーマットのWD20EARSにFreeBSDをインストールし、ファイルサーバとして使用を始めてから2週間ほど経過しました

まだおそるおそる使っているものの、動作は安定しています。
加えて、明らかに改善した点がありました。ファイル読み書きのスループットがあがっています。
感覚的には1.5倍。


以前使っていたWD10EADSは1TB出たてに購入した250GBプラッタの16MBキャッシュのものなので、それが500GBプラッタの64MBキャッシュに変わったわけで速くなって当たり前か。


あとはOSのメジャーバージョンあげたことも関係しているのかも。



そんな感じでそろそろおそるおそるではなく、フツーに利用したいかと。
ちょうどここ1年ダウンロード販売で購入した音源が溜まっているのでまずはそれを新ファイルサーバに・・・・
あとCubaseのプロジェクトファイルのバックアップも止まっていたのでそれもごっそり移動。

WD20EARSのAFTですが前回の調査の結果、ランダムライトが顕著に遅くなることが分かりました。


さて、FreeBSDで使う場合はどうすればいいんでしょうか。


結論としては多分正常に動いた。少なくとも何もしないときとは大きな差が。
でもこれでOKかどうかはもうちょっといじらないと分からない。

ネタ元:セキュリティホール memo


大元の記事曰く、

この間は繰り返し影響範囲の広いコミットが実施されるため,終了のアナウンスが流れるまではPorts Collectionのアップデートとアップグレードは控えていた方がいいといえます。また,影響範囲が多岐に渡るため,2010年4月の半ばあたりを目処に,すべて削除して再インストールした方がいいかもしれません。



な、なんだってー!! ΩΩ Ω



すべて削除して再インストールした方がいい・・・・・
すべて削除して再インストールした方がいい・・・・・
すべて削除して再インストールした方がいい・・・・・


スーパーめんどくさいです・・・・仮想化システム利用で箱の用意は簡単でも中身の用意は簡単にいかないでしょうね。

2年前に構築したファイルサーバの容量の限界が見えてきました。


そろそろ見直しの時期のようです。
そもそもsambaがいまだに2.xなのを3に変えたい。


Western Digtalの2TBが15000円以下まで下がったのでそろそろ買い時でしょう。


そういや2年前に1TB買った時は2万円切った買ったとかそんな感じだったはず。


箱は変えず、SS21Tのままでいきたいと思います。HDDだけチェンジ。OSも入れなおし。
FreeBSD8.0にしたいがこの前VMwareでテストしたときにちょっと上手くインストールできなかったので7.2で。


時間かかりそうなので限界が近いとはいえ余裕を見つけてやりたいですね。
まだHDDの値段下がるかもしれないし。

Updateすることにした。
詳細はこの辺[マイコミジャーナル]からどうぞ。
ローカルユーザが権限昇格してしまうタイプの脆弱性ですね。ゼロデイ攻撃(実証コード)が出てた模様。

ついでだ、ということでFreeBSDそのものを7.1から7.2にアップグレードかけた。
freebsd-updateで一発。楽チン。
ていうかまだ7.1だったのかよ言われました。すいませんサボってました。

もうmake worldとかする機会は少なくなるのかな。
以前1日かけてNetBSDのメジャーアップデートをしたのが懐かしい。

月曜日にMacmini(24時間稼動)に接続されている外付けHDD、「冷やし系検温番」が見えなくなりました。WesternDigitalの1TBが入ってます。

最初は認識してましたが、アクセス開始したらHDDをOS側でロスト。
いや、前にもこういうことはあったんですよ。んでスリープ機能オフにしてたりしたんですが。

結論を言ってしまうと24時間稼動のMacminiに外付けHDDつけるのやめた。

うちのESXiで使用しているHDDがSeagateのビンゴモデル(ST3500320AS)でビンゴファームウェア(SD15)だったのでWesternDigitalの1TBを買ってきて入れ替えました。

仮想OSだとゲストOSとホストOSのメンテ完全に切り離せるのがメリットですね。
今回もゲストOS全部止めてSeagateからWesternDigitalにまるごとコピーして終わり・・・・・のはずだったんですが、以下の問題が出ました。


  • コピーが・・・・遅い
Strage作成後、ESXiにsshでログインしてcpでコピーしたのですが20GB程度に30分ほどかかってしまいました。ローカルコピーなのに・・・・・

ちなみにまったく別のシステムのVIC上でコピーしても遅かったので、そういうもんなんでしょうかね?


  • MACアドレスが変わってた
コピーしたあとDatastoreをブラウズし、vmxファイルを右クリックしてInventry追加。 初回起動にUUID(固有ID)変えるかといったので変えた。 たぶんこれが原因でゲストOSのMACアドレス代わりました。 その結果、通信が恐ろしく不安定に。

機器の故障でH/W交換した後に他の機器が古いMACアドレス覚えていて通信できなくなるのはよくあることです。
その場合新しいMACを再学習させてやります。

ただ、今回はうちのブロードバンドルータがうまく学習できなかったらしく、通信自体は成立するのにブツブツ切れます。TCPの再送起きまくり。
ブロードバンドルータ再起動してARPクリアしたら解消したので、ブロードバンドルータのARP学習に問題があったと思うのですが、それでなぜTCPの再送が起きまくってたのかは不明です。

ゲストOSのMACアドレスは手入力も出来るので、前のMACアドレスと同じものにしておく、ってのが解決策なのかもしれない。


ということで移行作業は無事完了。
いろいろと苦労しましたが、やってみないとわからないしね~。
SeagateのHDDはちゃんとした対応策が出るまで寝かせることにします。
ちなみに動いてました。認識しないなどの問題は出ていません。

カレンダー

<   2011年9月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  
contents by leSYN情報発信所EXTRA こちらでレトロゲームのアレンジとかやってます。

2008年以前の内容

アーカイブ