5대중 2대의 서버에 문제가 생겨서 문의드립니다.
다섯 대 모두 하드웨어는 동일구성이고, CentOS 5.10_X64 설치되어있습니다.
문제의 서버 두대는 fdisk-l 에서 디스크 정보가 인식이 안되고,
Nov 4 04:02:29 localhost init: Trying to re-exec init
Nov 5 18:57:28 localhost kernel: acs_ame acs_ame_abort: Waitting 1 times
Nov 5 18:57:28 localhost kernel: acs_ame acs_ame_abort: Waitting 2 times
Nov 5 18:57:28 localhost kernel: acs_ame acs_ame_abort: Waitting 3 times
Nov 5 18:57:28 localhost kernel: acs_ame acs_ame_abort: Waitting 4 times
Nov 5 18:57:32 localhost kernel: acs_ame acs_ame_abort: Raid abort Fail.
Nov 5 18:57:32 localhost kernel: acs_ame ACS driver Abort task ID = 141 cmd=[8a], success!
로그에 위와 같은 메세지가 찍히고 있습니다.
raid 디스크가 오프라인 상태로 변동되서 그런것 같은데, 무슨 문제인지 알수가 없어서
문의드립니다.
서버 재부팅 후에는 또 정상적으로 구성되고 디스크 인식도 잘 되고 있습니다.
레이드 컨트롤러 문제라면, 다른 제품으로 변경해서 재구성해야될텐데, 나머지 3대는
이상 증상이 없어서 고민중입니다.
무슨 문제인지 아시는 분 있으시면 답변 좀 꼭 부탁드립니다.
저 제품의 지원은 중단되어서 모라 말하기 힘든데 로그 분석이 가능한지 물어나 봐야겠네요.
드라이버가 재대로 안올라오는거 같아 보입니다.
근데 불안불안하네요... 중요한 데이터 먼저 백업받아두시는걸 추천드립니다.
아직 써비스 오픈 전이라 데이터들은 많이 쌓여있지는 않아요.
하지만 써비스 오픈 후 같은 증상이 반복될까봐 불안해서요.
윈도우용 펌웨어는 찾아보니 몇 개 있는것 같은데, 리눅스 관련
펌웨어는 찾지 못하고 리눅스 드라이버만 찾아서 모듈에 적재한
상태입니다.
지원이 중단된 상태라서, accusys쪽에 문의해도 뚜렷한 해결책을
받지못해서 이래저래 고민되는 상황입니다.
5대 전부 같은문제면 컨트롤러 교체를 하겠지만, 3대는 정상적으로
작동해서... 고민되네요...