II-7-10. ありがちなトラブルとその対策

Linuxサーバの運用を行う際に、サーバ自体の運用管理およびネットワークの設定や環境設定に関して、ありがちなトラブル事例を紹介し、その対策について解説する。

【学習の要点】

* 発生するトラブルはパスワード忘れなど運用のミスに起因するもの、ハードウェア障害などサーバ自体に起因するもの、ネットワークの遮断など外部要因に起因するものなどがある。

* 日常運用でよく発生するトラブルの把握とその対応方法を理解する。

図II-7-10. ありがちなトラブルの例

【解説】

Linuxサーバ運用中に発生するトラブルについて、その対応方法を確認する。特にネットワーク障害などは様々な要因により発生するため、いくつかのコマンドを組み合わせて原因の追究を行い、的確な対応を行う必要がある。

1) 運用上のミスによるトラブルの例

* rootのパスワードを忘れた

rootのパスワードを忘れてしまった場合、以下の手順でパスワードの再設定を行う。

i) システムをシングルユーザモードで起動する。

boot: Linux 1

ii) プロンプトが表示されたらpasswdコマンドでrootのパスワードを設定する。

# passwd root

* 誤ってファイルを削除した

Linuxではrmコマンドでファイルを削除した場合、標準のコマンドで復活することが困難である。

ファイルのバックアップを定期的に行っている場合、バックアップファイルから該当するファイルをリストアすることにより、ファイルの復旧を行うことができる。

2) ネットワーク障害によるトラブルの例

* ネットワークサービスが利用できなくなった

ネットワークサービスが利用できなくなった、様々な原因が考えられる。代表的な原因の確認手順は以下の通り。

i) ifconfigコマンドでネットワークインタフェースの確認

コンピュータに接続されているネットワークインタフェースが正常に動作し、ネットワークの設定が正しく行われているか確認を行う。

ネットワークが正しく設定されていない場合、ネットワークインタフェースが動作していないか、DHCPサーバからネットワーク情報が取得できなかったなどの原因が考えられる。

ii) pingコマンドで接続の確認

宛先となるサーバがネットワークに接続されている状態か確認を行う。

サーバからの応答がなかった場合、サーバがネットワークに接続されていない、サーバが起動されていない、もしくはサーバまでの経路で障害が発生しているなどの原因が考えられる。

iii) tracerouteで経路情報の確認

宛先となるサーバまでの経路情報が正しく設定されているか確認を行う。途中で経路が途絶えてしまう場合、途絶えたところでネットワークの障害が発生している可能性がある。

この場合、途絶えた機器に対してpingコマンドを実行し、機器がネットワークに接続されている状態か確認を行う。

iv) telnetでサービスの起動確認

利用するサービスがサーバにて起動されているか確認を行う。telnetでサーバへ接続する際に、オプションとしてサービスのポート番号を指定することにより、サービスが起動されていることが確認できる。

OSS Course Naviのコンテンツは IPA OSS モデルカリキュラムを基としています。