질문&답변
클라우드/리눅스에 관한 질문과 답변을 주고 받는 곳입니다.
리눅스 분류

서버가 자꾸 다운이 되어 message 로그를 통한 고수님들의 도움을 구합니다.

작성자 정보

  • 거부기 작성
  • 작성일

컨텐츠 정보

본문

서버가 자꾸 다운이 되어 message 로그를 보니
다운될 당시(다운된 시간)에 message 로그에 아래와 같이 기록된 내용(3번의 로그)들이 있습니다.
원인이 다양한 것 같기는 한데 리눅스에 워낙 초보다 보니 의미를 모르겠습니다.
(저희는 사회복지단체라 서버관리자가 따로 없는 관계로...ㅡㅡ)


Jul 12 16:41:55 serv kernel:  =======================
Jul 12 16:42:05 serv kernel: BUG: soft lockup - CPU#5 stuck for 10s! [httpd:19190]
Jul 12 16:42:05 serv kernel:
Jul 12 16:42:05 serv kernel: Pid: 19190, comm:                httpd
Jul 12 16:42:05 serv kernel: EIP: 0060:[<c0463e61>] CPU: 5
Jul 12 16:42:05 serv kernel: EIP is at find_vma+0x3e/0x53
Jul 12 16:42:05 serv kernel:  EFLAGS: 00000287    Not tainted  (2.6.18-128.el5 #1)
Jul 12 16:42:05 serv kernel: EAX: d1ee97dc EBX: 00393934 ECX: d1ee97c4 EDX: ebc31cfc
Jul 12 16:42:05 serv kernel: ESI: f4ff1200 EDI: f7d27000 EBP: 00000004 DS: 007b ES: 007b
Jul 12 16:42:05 serv kernel: CR0: 8005003b CR2: 00393934 CR3: 0ee11000 CR4: 000006d0
Jul 12 16:42:05 serv kernel:  [<c0610f24>] do_page_fault+0x1a3/0x4d9
Jul 12 16:42:05 serv kernel:  [<c0610d81>] do_page_fault+0x0/0x4d9
Jul 12 16:42:05 serv kernel:  [<c0405a89>] error_code+0x39/0x40
Jul 12 16:42:05 serv kernel:  =======================
Jul 12 16:42:15 serv kernel: BUG: soft lockup - CPU#5 stuck for 10s! [httpd:19190]
Jul 12 16:42:15 serv kernel:
Jul 12 16:42:15 serv kernel: Pid: 19190, comm:                httpd
Jul 12 16:42:15 serv kernel: EIP: 0060:[<c0463e61>] CPU: 5
Jul 12 16:42:15 serv kernel: EIP is at find_vma+0x3e/0x53
Jul 12 16:42:15 serv kernel:  EFLAGS: 00000287    Not tainted  (2.6.18-128.el5 #1)
Jul 12 16:42:15 serv kernel: EAX: d1ee97dc EBX: 00393934 ECX: d1ee97c4 EDX: ebc31cfc
Jul 12 16:42:15 serv kernel: ESI: f4ff1200 EDI: f7d27000 EBP: 00000004 DS: 007b ES: 007b
Jul 12 16:42:15 serv kernel: CR0: 8005003b CR2: 00393934 CR3: 0ee11000 CR4: 000006d0
Jul 12 16:42:15 serv kernel:  [<c0610f24>] do_page_fault+0x1a3/0x4d9
Jul 12 16:42:15 serv kernel:  [<c0610d81>] do_page_fault+0x0/0x4d9
Jul 12 16:42:15 serv kernel:  [<c0405a89>] error_code+0x39/0x40
Jul 12 16:42:15 serv kernel:  =======================

Jul 14 01:12:02 serv kernel: list_del corruption. next->prev should be e6c309e4, but was e6c309e0
Jul 14 01:12:02 serv kernel: ------------[ cut here ]------------

Jul 14 11:32:01 serv kernel: BUG: unable to handle kernel NULL pointer dereference at virtual address 00000083
Jul 14 11:32:01 serv kernel:  printing eip:
Jul 14 11:32:01 serv kernel: c0610eb


고수님들의 도움을 간절히 구합니다.

관련자료

댓글 1

마성민님의 댓글

  • 마성민
  • 작성일
아마도 가상화서버(Xen, KVM, VMWare 등)를 사용하시는 것으로 보이는데, 해외에서도 유사한 버그로 인해 문제를 겪고 있는 분들이 꽤 계시는듯 합니다.

정확한 원인에 대해서는 알기 어렵지만, 아마도 가상화된 하드웨어에 대하여 O/S가 100% 서포팅을 하지 못하기 때문 일 수도 있을 것 같습니다.

동일한 문제를 겪었던 다른 해외 사용자의 경우 하드웨어를 변경 하여 테스트 하였을때는 아무런 문제가 없다는 것으로 보아, 아마도 가상화된 하드웨어 또는 물리적 하드웨어를 변경하면 무언가 해결 방안이 나오지 않을까 싶네요.

많은 도움이 되지 못해 죄송합니다. ^^;;;;

공지사항


뉴스광장


  • 현재 회원수 :  60,045 명
  • 현재 강좌수 :  35,861 개
  • 현재 접속자 :  73 명