SaaSサービスの障害について
弊社がご提供させていただいております、SaaSサービス(ap01)におきまして、
サービスが利用できない状況となっておりました。
対象のお客様におかれましては、サービスのご利用に支障が出ておりますことを深くお詫び申し上げます。
7月9日 7:12 本障害は復旧しました。
なお、本障害におけるお客様データの破損、欠損はございません。
原因ならびに経過について、以下にご報告させていただきます。
SaaSサービスの品質向上のため、障害を未然に防ぐ努力をして参ります。
障害について
- 対象サイト
- SaaSサーバ機(URLがhttps://ap01.nisaas.jp/より始まるサイト)
- 内容
- サイトに接続すると、下記のエラーが表示されます。
接続エラー
データベースへの接続ができません。
システム管理者まで問い合わせをお願いします。
エラー内容(2)
pg_connect() [function.pg-connect]: Unable to connect to PostgreSQL server:
could not connect to server: No such file or directory Is the server running
locally and accepting connections on Unix domain socket "/tmp/.s.PGSQL.5432"?
- 発生状況
-
- 2時 05分
- データベースを2重化しているソフトウェア(pg_pool)の再起動に失敗し停止
これによりSaaSサービスでは、データベース接続エラーとなりサービス利用不能
監視システムから停止したソフトウェア(pg_pool)に対して自動起動を
計10回行いましたが起動に失敗 - 6時 30分
- 保守要員により、手動にてSaaSサービスのデータベース接続先を
サイトごとにプライマリーデータベースに変更 - 7時 12分
- すべてのサイトの手動変更が完了してSaaSサービスが復旧
- 原因
- ソフトウェア(pg_pool)の起動に失敗した原因は、サーバでプロセスを制御するセマフォが
枯渇していたため起動するソフトウェア(pg_pool)にセマフォの割り当てができなかったため。 - 今後の対策
- サーバの再起動(セマフォ解放のため)の実施を行います。
また、データベースの2重化をしているソフトウェア(pg_pool)の復旧の対処を行います。
こちらは緊急メンテナンスとして2012年7月11日(水) 午前1:00~5:00で作業を実施します。
⇒ [ SaaSサービス メンテナンス作業に伴う夜間サービス停止のお知らせ]
また、再発防止策として今後はセマフォの使用状況を監視対象として運用監視を行います。
お問い合わせ先
その他障害や不審な動作等ございましたら、
下記「お問い合わせ先」までご連絡いただきますようお願い申し上げます。