RAID 카드 오류 질문

   조회 1397   추천 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 

이곳 장터에서 RAID 카드를 구입했습니다.

ServeRAID M5210을 구입했는데요..
(혹시 몰라, 자세한 스펙 등은 다음 링크 참고해 주십시오: https://lenovopress.lenovo.com/tips1069-serveraid-m5210-sas-sata-controller)


잘 동작합니다.
그런데 데이터를 복사해 보니, 다음과 같은 오류 메시지가 표시됩니다.
--------------------------
Controller ID:  0   Single-bit ECC error; critical threshold
    exceeded:   ECAR  
    =   860116160  , ELOG   =   1056768      , ( Src: Data Bits lane bitmap=0010, bank bitmap=00, elog 102000).
---------------------------------

장착한지 얼마 안 되었는데.. 5~10분 간격으로 메시지가 표시됩니다.



첫 번째는 '경고'로 표시되었고, 메시지는 다음과 같습니다.
Controller ID: 0 Single-bit ECC error; warning threshold exceeded: ECAR =  8.60116e+008 ELOG =  1.05677e+006 (  Src: Data Bits lane bitmap=0010, bank bitmap=00, elog 102000 ) .

두 번째는 '오류'로 표시되었고, 메시지는 다음과 같습니다.
Controller ID: 0 Single-bit ECC error; critical threshold exceeded: ECAR =  8.60116e+008 ELOG =  1.05677e+006 (  Src: Data Bits lane bitmap=0010, bank bitmap=00, elog 102000 ) .
(warning에서 critical로 변경되었네요.)

세 번째도 '오류'로 표시되었고, 메시지는 다음과 같습니다.
 Controller ID: 0 Single-bit ECC error; further reporting disabled: ECAR =  8.60116e+008 ELOG =  1.05677e+006 (  Src: Data Bits lane bitmap=0010, bank bitmap=00, elog 102000 ) .
('further reporting disabled' 라는 메시지는 더 이상 이 문제를 보고하지 않는다는 말인가요?)


질문은..
1. 메모리 모듈을 교체해야 할까요?
(이 카드의 메모리 모듈은 탈착식이긴 합니다.)
(ChatGPT에게 물어봤더니, 메모리 오류이고 교체하는 것을 권장하네요.)

2. 메모리 모듈을 교체해야 한다면, 이런 이유로 판매자께 연락드려서 교환이나 환불 요청해도 괜찮겠습니까?

3. 무시하고 계속 써도 될까요? (아마 안 되겠죠?)


이상입니다.
고맙습니다~


짧은글 일수록 신중하게.
박문형 2024-09
캐쉬메모리 달린 레이드 카드에서 캐쉬메모리가 문제 라면 어찌보면 제일 큰 문제입니다..
구매하신지 얼마나 되는지는 모르지만 판매자에게 이야기하고 조치를 받는 것이 맞다고 생각합니다..
술이 2024-09
펌웨어 버젼은요?

아벰 레이드카드 펌웨어 구형은 배터리 오류니 메모리 오류니 뿌려데는 버그 있습니다.그거 모르고 배터리 캐쉬 여러번 바꾼적도 많아요.
     
아마데우쓰 2024-09
그런 문제도 있었습니까?
답변 고맙습니다.

다음과 같이 나오네요.
Firmware Package Version: 24.21.0-0112
BIOS Version: 6.36.00.3_4.19.08.00_0x06180203

그런데 이게 최신인지는 좀 찾아봐야 알 것 같아요..
          
술이 2024-09
https://download.lenovo.com/servers/mig/2021/04/21/43719/lnvgy_fw_raid_mr3.0.5200-24.21.0-0151-2_windows_x86-64.chg

일단 업데이트부터 빨리는 하는게 좋을거 같습니다. 이슈 히스토리 보면 심각한 내용들이 많네요. 위에 펌웨어는 캐쉬데이터도 손실되는 이력을 갖고 있습니다. ECC 관련 비슷한 이력도 있는거 보니 업데이트 하면 해결될 기미도 보입니다.
               
아마데우쓰 2024-09
세상에..
얘네 네이밍이 황당하네요.
24.21은 계속 같고.. 그 뒤의 빌드넘버가 의미가 이렇게 클 줄이야.

정말 고맙습니다.

24.21.0-0151-2 버전을 설치하니까, 현재는 잠잠합니다.
(아직 시간이 얼마 안 되었지만요.)

0112와 0151이 이렇게 차이가 클 줄이야..
     
아마데우쓰 2024-09
24.21.0-0151-2 버전을 찾았습니다.
숫자 변화가 크지 않은 것으로 보아, 좋은 결과가 있을 것 같지는 않습니다만..
일단 적용해 보고 상황을 좀 보겠습니다.

다시 한 번 답변 감사드립니다~
epowergate 2024-09
저도 장터에서 ServeRAID M5210 몇 개 구매했는데 대부분 유사한 문제가 있었습니다. 
저는 다 버렸습니다.
구매한지 1주일 넘었으면 그냥 버리시는게 정신 건강에 좋습니다.
     
아마데우쓰 2024-09
24.21.0-0151-2 버전으로 펌웨어 업그레이드를 하니.. 감쪽같이 해당 문제가 사라졌습니다.
아주 잘 동작하고 있습니다.

며칠 더 지켜봐야겠습니다.
술이 2024-09
저런 이슈는 델도 비슷하게 있습니다. 같은 유전자 LSI 콘트롤러들은 뭐 간혹 생기긴 합니다. 한참지난 모델들은 이미 펌웨어 이슈들이 다 해결된 마지막 펌웨어여서 크게 이슈가 없는데 바로 나온지 얼마안된 레이드들은 1-2년 지나면 리부팅 없이 쓰면 꼭 문제를 일으켰습니다. 그리고 레이드콘트롤러들이 펌웨어 제대로 된거 걸리면 볼륨이 깔금하게 초기화 되버리는 경우도 있어서 펌웨어 나왔다 싶으면 바로 올려야 됩니다.


QnA
제목Page 3617/5721
2014-05   5223288   정은준1
2015-12   1751263   백메가
2017-08   3289   사랑별이
2012-01   6421   미수맨
2012-02   5800   윤치열
2015-07   5166   IT란
2015-07   3989   포포봄
2017-08   3247   뮤노
2022-12   2802   LevinF
2012-02   7320   설영수
2016-08   6184   geniefix
2017-08   6601   무아
2022-12   3347   osthek83
2014-03   4742   유호준
2015-07   4734   자연인
2022-12   1732   콘스탄틴
2016-08   7327   미수맨
2014-04   4857   Nikon
2020-01   4344   2573레토나
2023-01   1832   행복하세
2014-04   3682   Sunrise
2016-08   4378   철이님