障害メンテナンス情報
「熨斗と水引」は一個人が趣味で運営しているサイトです。
サーバ機について、ご興味のある方は
「熨斗と水引」のサーバ機について をご覧下さい。
●サーバの障害・設定情報
サーバのこれまでのトラブルとその対処方法を出来る限り列挙しています。
【2024年4月30日】
先日ユーザーの方からPDFデータが「安全にダウンロードできません」というエラーが表示されるとメールをいただきました。これはブラウザのセキュリティー設定の警告メッセージで、当サイトがSSLに対応していないことが原因です。これまでも様々な問題に対処してきましたが、ディストリビューションも構築パッケージもCMSも(ついでに管理人も)古い老サーバ(老管理人)のため、リスクのあるサーバの更新はせず、このまま余生を過ごさせようと思っています。
※対処方法:ブラウザ設定により警告メッセージの非表示やPDFダウンロードが可能。(警告メッセージをコピペして検索し対処)
【2023年7月28日10:00~11:30】
またもやアクセス集中で、表示速度が低下する時間帯がありました。
※対処方法:MonitでWebサーバーを死活監視し異常発生時に自動再起動するよう設定。どうかうまくいきますように・・・(-人-)
【2023年7月14日11:00~14:00】
お盆と年末恒例のアクセス集中で、サイトへのアクセスができない時間帯がありました。
※対処方法:VPSのコンパネより強制再起動。スケールアップでも解決しないことが判明!どうしたらいいのぉぉ
【2022年12月9日10:30前後】
またもやアクセス集中のため、サイトへのアクセスができない時間帯がありました。
※対処方法:VPSのコンパネより強制再起動。そろそろスケールアップか、それともCDNか、実に悩ましい・・・
【2022年12月5日10:00~11:30】
アクセス集中のため、サイトへのアクセスができない状態や大変時間がかかる状態がありました。
※対処方法:VPSのコンパネより強制再起動。なんだかんだ毎年12月恒例だな。(´・ω・`)
【2021年12月15日】
またもやImageMagickのconvertコマンドでエラー。原因はこれまたサーバの容量不足と判明、肥大化したログファイルを削除する。
※なんとディスク容量の80%がログでした。教訓「ログはこまめに削除しましょう。」
【2021年9月10日】
本日ImageMagickのconvertコマンドでエラーが頻出しているのを確認。原因はサーバの容量不足と判明。2回目のスケールアップとなる。
※もしかして、8月の障害も容量不足が原因なのか、それにしても懐が痛む・・・orz
【2021年8月18日~2021年8月24日】
これまでで最大の障害が発生!バックアップ用サーバも同時に吹っ飛んだので半ば諦めかけていたところ、実験用サーバに2年半前のバックアップを発見!どうにかこうにか復旧にこぎつけました。
※もう死にそう・・・orz
【2020年2月28日~2020年3月28日】
スケールアップのおかげでサーバは安定したものの、最近ピーク時でもないのに速度低下がみられるようになった。これも新型コロナウイルスによる回線混雑の影響か。
※どうか早くコロナが収まってくれますように・・・(-人-)
【2018年9月28日~2018年9月30日】
サイトに接続できない状況が頻発。httpdのメモリリークの疑いが濃厚のため、いつものようにチューンナップを試みるも解決せず、やむなくスケールアップを行うに至る。
※VPSのコントロールパネルよりスケールアップ。毎月の出費増が痛い・・・orz
【2017年5月19日2:00~9:00】
2時頃からサーバが不安定になり、5時から9時まで約4時間ほど完全に停止状態になっていた模様。原因は現在調査中。
※VPSのコントロールパネルより強制再起動。
【2016年9月11日11:00~13:00】
DoS/DDoS攻撃???突然CPU負荷が跳ね上がったため、2時間ほどサーバが停止状態になっていました。
※対処方法:念のためアタック対策として fail2ban を導入。
【2016年8月29日17:00~】
本日、レンタルしている「さくらインターネット」のサーバー障害でサイトが一時閲覧不能になっていたようです。m( _ _ )m
※対処方法:1時間程度で復旧した模様。
【2016年6月21日】
Windows10の環境下で、のし紙のPDF作成時に文字化けを起こすとの報告があり、調査したところ、不具合が見つかりましたので修正をいたしました。
※対処方法:フォームデータ送信の際に明示的に文字コードを指定。ご報告いただきましたユーザー様に感謝いたします。
【2016年2月12日】
OpenMP対応のImageMagickがconvert処理で異常な高負荷になるバグがあり、突然高負荷状態が起きるようです。その都度リブートして対応してますが、とりあえずはバグフィックス待ちです。
【2015年12月25日】
このところのアクセス集中時にサーバがフリーズする原因をログからほぼ特定。
※対処方法:特定したPHPスクリプトから原因部分を切り離した後、CPU使用率の持続的低下を確認。
【2015年12月23日】
19:52~20:36迄フリーズ状態。
※対処方法:VPSのコントロールパネルより強制再起動。
【2015年9月21日】
16:00頃サーバーのフリーズを発見!1時間程度固まっていたようです。例によって原因不明・・・orz
※対処方法:VPSのコントロールパネルより強制再起動。
【2015年8月19日】
ここ数日サーバーがやたらと重いのでtopで確認したところ、CPU使用率が99%って・・・ありえな~い!!
※対処方法:rebootして事なきを得ました。しっかしこの世界まだまだわからんことが多すぎる。(´・ω・`)
【2015年7月17日】
さすがにもう大きなトラブルはないだろうと高を括っていたら、本日いきなり「サーバが見つかりません」と見たくないアラートが・・・即ムームードメインにチャットでライブヘルプ。「
【重要】[お名前.com] ドメイン 情報認証のお願い」のメールを無視していたことによる利用制限が原因でした。orz
※対処方法:利用制限解除で復旧。皆さん、メールのタイトルに「重要」の文字があったら、とりあえず目を通しましょう。
当たり前か( _ _ )..........o
【2015年6月4日】
さくらのVPSに切り替えてやっと安定してきたと思ったら、久しぶりにMyDNSのネームサーバがダウン。12:40から2時間ほどサイトが見つからない状況になっていました。
待てよ・・・もう自鯖じゃないんだから、さくらのネームサーバ使えばいいだけじゃん!
※対処方法:MyDNSからさくらインターネットのネームサーバに切り替えました。(4ヶ月も気付かないなんて・・・とほほ。)
【2015年2月4日】
玄箱HG/自宅サーバから、さくらインターネット/VPSに切り替えました。
※玄箱はバックアップ用として余生を過ごさせる事にしました。玄箱よ、ありがとう!そしてお疲れ様。
【2015年1月5日】
昨年の暮れあたりからPHPスクリプトを置いているサーバが503エラーを頻繁に出すようになり、今日もいくつかのPDF自動生成サービスが停止していました。
※そろそろ自鯖からVPSに切り替える時期なのかも・・・でも、もう少しがんばりたい。
【2014年12月26日】
本日、PHPスクリプトを置いているサーバ(ロリポップ)が半日以上停止していることが判明しました(汗)
※対処方法:ロリポップに問い合わせ、午後3時過ぎに何とか復旧。いろいろと想定外のハプニングが続くなぁ~
【2014年11月12日】
やっと自宅サーバが安定してきたと思ったら今度はネームサーバの不調?今月に入ってから毎日のように数分から最大で1時間程度、サイトが見つからない状態が起きています。当サーバはMyDNSのネームサーバを利用してドメイン名とIPアドレスとの解決を行っているのでMyDNS.JPのサーバがダウンしていると、「サーバが見つかりません。」と出てしまいます。
※対処方法:どこかに安定したフリーのネームサーバないかな…
【2014年5月28日】
AM2:10から数十分の間、ISPの不定期な夜間のIPアドレス変更による影響のため、サイトに接続できない状態にあったと思われます。
※対処方法:DNSサーバーへのIP自動更新を30分にしているため30分以内に自動更新された模様。
【2014年3月30日】
無線ルータのブリッジ接続で痛恨の設定ミス、PM0:30からPM3:30まで繋がりにくくなっていました。
トホホ・・・
【2014年2月24日】
PC追加に伴うLAN環境見直しのため、PM8:45~PM11:15までの約2時間半、アクセスできない状況が続いていました。
【2014年1月28日】
新しく設置したコンテンツのPDF生成に関わる処理を、うっかり体力の無い玄箱にやらせてしまっていたため、この数日間混雑時にサーバがもっさりとしていました。
※対処方法:重たい処理を外部PHPサーバに移す。
【2013年12月25日】
サーバのパフォーマンス向上のため、20まで下げていたMaxClientsの設定値を、もとのデフォルト値(150)に戻したことが功を奏したようでサーバが安定してきました。
もう少し頑張ってみるか・・・
【2013年12月】
12月に入ってアクセスが集中する時間帯にサーバがダウンするトラブルが頻発するようになったので、とりあえずMaxClientsを20から150に設定しました。そろそろ限界かな・・・
※対処方法:今のところ監視を強化し、停止していたら再起動するという対処療法で様子見
【2013年4月10日水曜日】
AM10:00~AM10:30までの約30分間、電気工事に伴う停電のため、サイトに接続できない状態にありました。
※対処方法:停電復帰後、DNSサーバ更新により正常復帰
【2013年2月15日金曜日】
PM0:45~PM1:15までの約30分間、DIAGランプ4回点滅状態(ファンの異常)でサーバが停止していました。
※対処方法:昨日ファンの掃除をした際、ファンの向きが逆だったことが判明、正常な向きに付け直して復帰(orz…)
【2013年2月14日金曜日】
PM3:00~PM3:15までの約15分間、うっかりHubの電源を切ってしまったためネットワークが切断していました。
※対処方法:Hubの電源を入れなおし、正常復帰。(掃除中のうっかりミス。これだから自宅サーバは怖い・・・)
【2012年11月10日土曜日】
PM2:30~PM6:30までの約4時間、停電(瞬断)によると思われる不具合のためサーバの電源が落ちていました。
※対処方法:電源スイッチを入れ、正常復帰。(度重なるようなら瞬断対策としてUPSの検討が必要かも)
【2012年10月6日土曜日】
http://nihon.mydns.jp(DDNS)を、NAMEベースのバーチャルホストに設定しました。
※http://nihon.mydns.jp 「日本史ゴロ合わせ年表」 を公開。
【2012年9月20日木曜日】
「教えて!リカちゃん」からの報告により、数日前から一部の展開図がダウンロードできない状態になっていたことが判明。
※PHPスクリプトを設置していた外部サーバのダウンが原因だとわかり、別サーバにスクリプトを移して対応。
【2012年9月19日水曜日】
PM3:30~PM4:00までの約30分間、ネットワーク再構築作業のため、サーバーを一時停止しました。
※対処方法:作業終了後、正常復帰。
【2012年9月8日土曜日】
AM2:30~AM3:00までの約30分間、定期バックアップのためサーバーを一時停止しました。
※対処方法:バックアップ後、正常復帰。
【2012年8月9日木曜日】
最速キャッシュハック(Fastest Cache Hack)の導入により、XOOPSのセッション数を計測するタイプのアクセス解析モジュール(LogCounterX)が機能しなくなりました。
※メンテナンス内容:Apacheログを直接解析するタイプのアクセス解析プログラム(WebDruid)に切り替えました。
【2012年5月27日木曜日】
AM5:15~AM6:00までの45分間半、緊急メンテナンスのため、サイトに接続できない状態にありました。
※メンテナンス内容:玄箱の静音対策
玄箱の主な音の発生源はHDDとファンの2箇所、ファンの音はKURE 5-56をファンの軸に差したことで一応解決。一方のHDD回転音の方はハードディスクを静音化対策が施されたものにするしかないようなのでとりあえず保留。
【2012年5月17日木曜日】
AM2:37~AM6:02までの約3時間半、ISPの不定期な夜間のIPアドレス変更による影響のため、サイトに接続できない状態にありました。
※対処方法:DNSサーバーのIP更新方法を不安定なddclientから、wgetでBasic認証ページにcronで定期的にアクセスする方法に変更
【2012年5月15日火曜日】
PM4:12~PM4:26までの約14分間、DNSサーバのシステムアップデートによる再起動作業のため、サイトに接続できない状態にありました。
※対処方法:DNSサーバ再起動後、再開
【2012年2月23日木曜日】
AM2:42~AM8:30までの約6時間、ISPの不定期な夜間のIPアドレス変更による影響のため、サイトに接続できない状態にありました。
※対処方法:DNSサーバ更新により正常復帰
【2011年12月23日金曜日】
PM2:00~PM5:00までの3時間、停電によるサーバ障害のため、サイトに接続できない状態にありました。
※対処方法:DNSサーバ更新により正常復帰
無料で使えるアクセスログ解析ツールとAPI
重い玄箱サーバのレスポンスを改善する目的で導入した Fastest Cache Hack (最速キャッシュハック) の影響で、アクセス解析モジュール LogCounterX が使えなくなってしまったことから、以前から気になっていたアクセスログ解析ツールを試してみました。
レンタルサーバーや自宅サーバなどで一般的に使用されているApacheのログを管理・解析するためのツールと、Googleが提供している無料のアクセス解析ツール Analytics のAPIを利用したWebサービスの3種類です。
●Apacheのログ解析ソフト(WebDruid)
Webdruid はApacheログの解析結果を統計処理してグラフィカルに図示してくれる解析ソフトです。
「graphviz」を合わせてインストールすると遷移図も作成してくれます。
ローテートの間隔は1日1回午前3:00に行うように設定しています。
★「WebDruid」でログ解析を見る
●超高速なApacheのログ解析ソフト「Visitors」
「WebDruid」は比較的表示が速い解析ツールですが、「Visitors」は更にそれを上回る軽快なログ解析ツールです。 ウェブサーバログファイルを入力すると、統計をいろいろな形のレポートとして出力します。
その設計方針は同じタイプの他の解析ツールと比較すると少し異なって見えるかもしれません。
ローテートの間隔は1日1回午前4:00に行うように設定しています。
★「Visitors」の解析サンプルを見る
●Google Analytics APIを利用したWebサービス「SeeTheStats」
SeeTheStats は、Google Analytics のAPIを利用して、Analyticsの解析結果を外部に公開できるサービスです。
Analyticsはページにトラッキングコードを埋め込むタイプのアクセス解析サービスのため、サーバ側にキャッシュされたページのアクセスもカウントしてくれます。
ただ、上の2つの解析ツールと比べると表示が重いのが難点です。
賢い管理者の賢いアクセスログ解析法とは
アクセスログをきちんと読んで、アクセスアップやサイト改良に使えてますか?
高価なソフトを入れたけど、数字をなんとなく眺めるだけになってませんか?
サーバー管理に偏りがちの間違ったアクセスログ解析を見直しましょう。
間違った知識にもとづくアクセスログ解析では、Webサイトを使った正しいマーケティングができません。儲かるWebサイトを作るための正しいアクセスログ解析の方法をじっくり基礎から解説!
★アクセスログ解析の教科書