질문&답변
클라우드/리눅스에 관한 질문과 답변을 주고 받는 곳입니다.
리눅스 분류

아.. 제가 질문하려던 것은...

작성자 정보

  • 홍보성 작성
  • 작성일

컨텐츠 정보

본문

당연 I/O 에러가 dmesg나 message 로그에 나옵니다.
문제는 해당 에러가 발생할려면 disk access가 발생해야 미리 알 수 있을 것이고.
그래서 보통 badblock check를 하는 거죠.
미디어 상태, disk 작동 상태등을 알아 낼 수 있다는 거죠.

매일 이런 로그를 메일로 받는 다던가 해서 규칙적으로 확인합니다. 일반적으로 어느날 아무 경고없이 콱 죽어버리는 경우는 별로 없죠. 몇일 또는 몇시간 정도 시스템 에러 로그가 발생합니다. 디스크는 엑세스 해야 확인할 수 있으니 badblock check등을 통해 전체 디스크 엑세스를 발생 시켜 에러유무를 확인하는 거죠.

질문의 요점이 하드디스크로 맞춰져 있어 해당 내용으로 시작해서 이런 답변이 된거 같은데. 장애에 대한 모니터링을 하시고 싶으신 건가보네요.

mrtg나 스크립트 등을 이용해 하드웨어 및 네트워크등을 모니터링 할 수 있도록 SMS 구축 할 수 있습니다.
일부 레이드카드등은 snmp를 지원하여 디스크 상태를 알려주는 기능도 있네요.
이밖에 시스템 온도, 팬속도 등도 snmp를 통해 지원하는 것도 가능한걸로 알고 있습니다. 물론 서버급 시스템에 드라이버를 제공하는 경우에 한하여 그렇죠.

일반적으로 snmp와 일부 스크립트를 이용하거나 전문 시스템 모니터링 프로그램을 사용하여 이메일, 소리, 팝업창 으로 경고를 하도록 구성합니다.

김재성 님의 글



답변 감사드립니다.

하지만 제가 질문하고자 한 것은 badblock을 check하는 것이 아닙니다.

일반 동작 상태에서 특정 문제가 발생하여 그 결과로 감지되는 장애를 말하는 것 입니다.

즉, badblock에 어떤 쓰기를 한다던가 하면 그로 인해 문제가 발생할 것 입니다.

물론 그냥 system이 뻑~ 갈수도 있지만, 그렇지 않고 단지 장애에 대한 event만 발생시키고 해당 operation이 실패될 수도 있겠지요.

이런 경우 해당 장애를 어떻게 알아낼 수 있는가 입니다.

좀 어려운가요? ^^

암튼 내가 지금 하드디스크의 장애 유무를 check 하겠다가 목적이 아니고 그냥 운용중에 문제가 발생한 것을 어떻게 감지해 낼 수 있는가 입니다.

그럼 고수님들의 조언 부탁드리겠습니다.

 




 

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,037 명
  • 현재 강좌수 :  35,807 개
  • 현재 접속자 :  100 명