X11Dai-N 보드에 8280L * 2, 256G
Adaptec RAID 71605 Sun OEM HGST 4T SAS 12ea RAID 5를 쓰고 있습니다.
Windows Server 2019를 OS로 사용하며 Hyper-V 테스트 VM 40개쯤 돌리고 있습니다.
일전에 올라온 등록된 Hard Disk Sentinel 5.5를 설치해서 사용중이었습니다.
몇일전 Case를 교체하면서 시스템을 재부팅했는데 일정 시간이 지나고 나서
RAID 5 볼륨이 사라지는 현상이 나타납니다.
내부 장착된 Adaptec RAID 카드에는 붉은색 led가 계속 점등됩니다.
Hard Disk Sentinel 5.5 설치후에 하드디스크별 모니터링 아이콘에 다음과 같이 수행된 것을 확인하고는
필요치 않아서 종료하며 사용했었습니다.
퇴근시에도 전원을 안끄고 다녀서 몰랐는데 최근 케이스 교체로 Hard Disk Sentinel이 계속 수행되니까
일정 시간이 지나면 볼륨 자체가 사라지고 카드에는 붉은 led만 점등되는 현상이 나타납니다.
Hard Disk Sentinel을 종료하면 문제가 없습니다.
Events에는 다음과 같은 오류가 보입니다.
Faulting application name: cimserver.exe, version: 2.13.0.0, time stamp: 0x55547775
Faulting module name: pegindicationservice.dll, version: 2.13.0.0, time stamp: 0x55547693
Exception code: 0xc0000005
Fault offset: 0x0000000000003c26
Faulting process id: 0x1f64
Faulting application start time: 0x01d627f0e0a3366f
Faulting application path: C:\Program Files\Adaptec\maxView Storage Manager\pegasus\bin\cimserver.exe
Faulting module path: C:\Program Files\Adaptec\maxView Storage Manager\pegasus\bin\pegindicationservice.dll
Report Id: 41a7fe47-7cbd-434b-84a2-a742243cefab
Faulting package full name:
Faulting package-relative application ID:
Adaptec 71605 카드 바이오스와 드라이버는 최신 버전입니다.
혹시 이런 경험을 해보신분의 조언 부탁드립니다.
아니면 Hard Disk Sentinel은 필요시만 쓰고 종료시키며 써여 할까요?
maxView STORAGE MANAGER 상의 이벤트에는 아무런 기록이 없습니다.
아마도 뭔가 기록되기 전에 먹통이 되는 것이 아닌가 싶습니다.
서버 앞에 선풍기 돌려보세요..
아마도 Hard Disk Sentinel 하드 디스크 모니터링에 대한 부분과 충돌이 아닌가 의심됩니다.
별도로 외부 DAS나 FC HBA 및 10G스토리지연결로 저장장치를 구성하여 사용합니다.
내부 부하가 발생하는데 디스크IO가 없는데도 영향을 받게되는 경우가 많아서 서버따로 스토리지 역할 따로 배치시킵니다.
CPU 메모리 부하 커지면 파워사용율도 엄청 큽니다. 디스크 떨어지는건 시간문제...
Oracle RAC 구성을 위해 내부적으로 Hyper-V에 Xpenology VM 구성하고 해당 VM의 스토리지는 Fusion IoDrive DUO 2.4T를
사용합니다.
NFS로 RAC를 구성했습니다.
Adaptec RAID 5로 구성된 볼륨은 설치용 ISO 파일과 백업용입니다.
주기적으로 백업이기 때문에 그때만 주로 사용합니다.
Hard Disk Sentinel만 종료하면 아무런 문제가 없어서 Adaptec 카드와 문제가 있는지 경험하신 분의 의견을 듣고자 했습니다.
실 운용환경이 아니기 때문에 별도의 스토리지는 구성하지 않았습니다.
이 환경에서 테스트한 걸 사이트에 적용합니다.
실제 운영 사이트는 DB는 IBM S824 * 2, WAS는 IBM S822 * 2, Storage는 EMC로 구성됩니다.
일부는 DB/WAS IBM S822 * 2, Storage는 EMC입니다.
기능과 구성, 자동 설치 스크립트 개발, 모니터링 개발 등을 위해 Hyper-V에 Oracle & RedHat Linux로 구성해서
테스트합니다.
그래서 빠른 개발과 테스트를 위한 환경이 제 PC입니다.
저런 문제가 있으면 사용하지 않는게 나아 보입니다..
레이드 볼륨까지 파헤쳐서 낱낱의 하드의 상태를 보는 것은 좋으나 몬가 안 맞는 듯합니다..
언제 사라지는지 모르게 먹통이 됩니다.
RAID 볼륨의 개별 하드 디스크 온도에 스마트정보까지 다 확인할 수 있어 좋긴한데
문제를 야기합니다.
필요할때만 잠깐씩 실행하고 꺼두고 있습니다.