에뮬렉스 OCE11102 카드장착시 IRQL_NOT_LESS_OR_EQUAL BSOD가 발생합니다.

NaN   
   조회 3805   추천 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 


DELL 7920 Tower 2cpu모델을 사용중입니다.

10Gbps 랜카드로 에뮬렉스 OCE11102 IBM OEM모델(49Y795X)를 사용중입니다.

일전부터 하드를 6개를 초과해서 사용하면 시스템이 불안정해지는(프리징, 블루스크린등) 이슈가 있어서 6개로 어찌저찌사용중

최근에 하드디스크를 좀 교체하고나서부터 계속 부팅후 로그인화면에서 첨부한 사진과 같은 문제가 발생하고있습니다.


제가 해본것들은 다음과 같습니다.

- 하드의 베이 위치(핫스왑)를 바꾸거나 수량을 추가하거나 줄이고 

- 펌웨어와 드라이버를 한번 최신버전으로 올리었고 

- 하드디스크, 메모리는 이상없음을 확인했습니다. 

정말 어쩌다가 한번씩 안뜨는경우가 있긴한데 10번중9번은 에러가 뜨더군요. 

카드이상이 있나 싶어서 여분의 동일한 카드가 있어서 변경해보았으나 동일한문제가 발생하였고 PCIE슬롯을 CPU2번으로 바꿔보기도하고 다른위치의 슬롯에 장착해보기도 하였으나 문제가 여전히 동일합니다.


이 과정에서 비실비실한 하드가 하나 있었는지 하도 강제종료를 해서 그런가 하드하나가 운명까지 하는 슬픔을 겪게 되었습니다.

다른 제가 해볼만한 조치가 있을지 고견구해봅니다..

별도로 다른브랜드의 다른 카드를 구해볼려고하는데 유의하거나 우려되시는점이 있다면 그것도 알려주시면 도움이 될것 같습니다.

항상감사합니다.

짧은글 일수록 신중하게.
VSPress 2023-04
제가 7820을 사용하는데, 기존에 잘 사용하던 에뮬렉스 10GbE 랜카드를 끼우면 작동이 엄청나게 불안정해져서 사용을 포기했었습니다.
될때도 있었으나 대부분 잘 안되었습니다.

델 7820/7920 워크스테이션에서 에뮬렉스 10기가 랜 카드에는 호환성 문제가 있는 것이 분명합니다.
     
NaN 2023-04
언급해주신것과 거진 동일하다고 느껴지는 이슈를 겪고 계시네요 저도 그냥 빠르게 포기하는것이 맞다는생각이 들기도 하네요.
CM10 2023-04
저도 얼마전에 이랬는데 요즘은 또 괜찮네요..
아마 윈도우 업데이트하고 그런거같습니다
술이 2023-04
혹시 10102 모델 아닌가요? 11102 모델은 딱히 별 이슈없이 잘 붙는데...
     
NaN 2023-04
판매하신분이 저희회원이신점도 그렇고 카드와 펌웨어또한 11102 로 표시되어있습니다.
지금 문제 있는 시스템에도 잘되다가 발생한것이라 특정한 조건의 경우에 발생하는것으로 추정하고있긴합니다.
박문형 2023-04
혹시 다른 10G 카드를 구하신다면 멜라녹스 제품을 권해 드려 봅니다..

카드들이 광모듈 제품밖에 없고 보통 해외에서만 보이는 카드이지만 호환성 문제가 아마 재일 적을 듯합니다..

칩셋으로 볼때 ConnectX-3 이상의 칩셋이면 윈도우즈 10이 지원 됩니다.. (드라이버 지원 문제는 모델 정하신 다음 구입 전에 꼼곰히 챙겨야 합니다..)

모델은 각 칩셋 버젼과 속도별로 상당히 여러가지가 있습니다..

Mellanox MCX311A-XCAT 같은 경우 1포트이지만 카드 크기가 작고 열도 적게 나며 가격이 괜찮은 편입니다..
제온프로 2023-04
IRQ 충돌입니다.
카드 위치를 다른 슬롯으로 이동해보고.
바이오스 초기화 해 보시고.
바이오스에서 쓰지 않는 장치 disable 해 보세요.

예를들어 OCE11102가  IRQ 11번을 사용하고 있다면..
IRQ 5번이나 7번 10번으로 한번씩 이동 해 보세요.
같은 번호에 다른 장치가 많이 않들어가도록 위치 해 보세요..

PNP 지원으로 자동으로 IRQ 자원을 자동으로 해 주기로 했지만.
메인보드 바이오스와 카드 펌웨어가 서로 잘 낫다고 합으로 못봅니다.

않쓰는 장치들은 Disable 하시고.. IRQ 정리를 해 보세요.
     
NaN 2023-04
저도 또한 IRQ 를 의심하고 있으나 본문에 기술한것과 같이 슬롯을 변경하는 것도 시도를 해보았으나 이따끔 해결되지만 여전히 문제가 존재하였고
이야기해주신것처럼 시리얼포트 온보드랜등 최대한 끌수 있는것들은 꺼보았으나 문제가 동일합니다.
옅게 알고 있는 지식으로는 모던컴퓨팅에서는 IRQ를 ACPI로 공유해서 사용하는지라 여러기기를 사용할수있는것으로 알고 있고 심지어 음수로도 할당되는것으로도 알고 있습니다. 또한 문제가있다면 블루스크린대신 장치관리자에 경고표시만되는걸로 알고 있구요.
일단 BIOS는 사용하지 않고 있고 UEFI를 사용하고 있는 환경이고 말해주신것처럼 수동으로 선택해서 확인해보고 싶지만 제가 찾지를 못하는것인지 아무리 찾아보아도 관련설정메뉴가 보이지는 않습니다. 혹시 T7920에서 IRQ를 수동으로 설정하는 방법을 알고계시다면 알려주시면 감사하겠습니다.
술이 2023-04
보통 요즘보드는 IRQ 이슈 거이 없습니다. 특히 저 서버나 웍스보드는 롬부족 현상도 없는 모델일건데...
그래서 하드를 추가한후 이리 되었다?라고 하면 이건 커널쪽 이슈로 봐야 할거 같은데 의심가는거 두가지를 보고 있습니다.
가상메모리 페이징파일 설정이 모든 드라이브 기본값을로 되어 있을건데 이거 무조건 C드라이 운영체제 깔린 드라이브만 설정하게 해야됩니다. 페이징파일에 커널영역도 드라이브에 들어가는데 이게 디스크 액세스타임 좀 늦는다면 페이징폴트로 블루스크린 발생할수 있습니다.
둘째는 백신입니다. 윈도우라면 다른 백신 다 삭제하기 바랍니다. 기본 디펜더로 써보고 블루스크린 유무를 파악해보세요.
     
NaN 2023-04
백신의 경우 디펜더만 사용하고 있고 다른백신은 없는상태입니다
가상메모리 다 끄고 SSD만 사용하게 설정해놓았을터인데 한번 체크해보겠습니다 이야기해주신것처럼 잘되다가 안되는경험을 겪게될때가 파티션이 추가되는등의 과정들이 있어서 이야기해주신부분에 약간의 추정이 되는기분이 듭니다.
spndisk 2023-04
전혀 상관 없을 수도 있지만 저는 랜카드는 아니고 특정 레이드 카드 사용 시(저의 경우 lsi 9270-8i)에 윈도우 버전 2004 이상 사용 시에 동일한 블루스크린이 떴었습니다. 예상하건대 2004 이상의 윈도우에 자체 포함된 드라이버가 문제가 있지 않을까 생각합니다. 그래서 아예 따로 구한 드라이버가 포함된 윈도우 설치 파일로 윈도우를 깔아 사용 중입니다. 참고만 해 주세요.^^
박문형 2023-04
디스크 6개는 어떤 상태로 셋팅이 되어 있나요??

모두 온보드인지?? 레이드 카드 같은 것 사용했는지??

MiniTool Partition Wizard 같은 프로그램으로 디스크들을 보면 윈도우즈에서 보이는 파티션 말고 숨어 있는 파티션들이 나옵니다..

데이터 망실하지 않게 주의하면서 필요 없는 파티션과 데이터들은 정리해주는 것이 좋습니다..

디스크 6개 달고 시스템 불안이라고 말씀하셔서 파워쪽 문제 있는 것 아닌가 라는 생각을 하고 있었습니다..

물론 GPU를 여러개 달거나 전기를 무지 먹는 GPU를 사용하면 디스크를 여러개 설치하는데 문제가 있을 수도 있지만 델 워크스테이션이면

여러가지 상황에 대비하여 테스트 및 검증을 했을 것이라고 생각하기에 어딘가 불량 아닌가 라는 생각도 해봅니다..
     
NaN 2023-04
온보드를 사용중이며 RAID모드로 VROC로 사용중입니다.
스톡이아닌 3080을 사용중이며 파티션쪽은 정리할수가 없는 상황입니다. (데이터가 많이필요해서요..)
일전에 디스크6개+에뮬렉스카드+3080으로 무거운게임을 주마다 몇시간씩 돌린상황이라서 이야기주신 파워문제는 일단 배제하고 있습니다.
별개로 이야기주신것처럼 윈도우에서는 인식되지 않는 ext4 파티션이 몇개있습니다 (리눅스도 개발환경에있어서)
나우마크 2023-04
간단하게 ,
다른 회사 제품으로 테스트 해 보고 문제 있는 지
확인이 가장 좋을 것 같습니다.
송주환 2023-04
ocnd65.sys는 Emulex NDIS 드라이버입니다.
해당 오류 메시지는 드라이버의 IRQL이 Dispatch Level 이상일 때 해당 드라이버의 커널 메모리 영역에서 Pageable 또는 Invalid memory address에 접근하려 했다는 것을 의미합니다. 커널 모드 영역에서의 잘못된 메모리 참조는 즉시 시스템을 크래시 시키며, 제대로 된 원인 확인을 위해서는 메모리를 덤프한 뒤 windbg로 분석을 해 봐야 합니다.

대부분의 경우 원인은 드라이버 버그이나, 다른 커널 모드 드라이버와의 충돌로 인해 동일한 문제가 발생할 수 있습니다.
일례로, 테크넷에 올라온 한 사례의 경우 ocnd65.sys가 EMC 응용 프로그램 설치 후 재부팅을 하지 않았다는 이유로 크래시 되는 것을 확인할 수 있습니다. 이건 타사 드라이버와의 충돌 케이스입니다.
https://social.technet.microsoft.com/Forums/en-US/a90a983d-eaa5-4bb7-90b4-e486945f4a91/server-2016-blue-screen?forum=winservergen

trace 없이 이 문제를 디버깅 하려면, 먼저 안전모드로 부팅 후 해당 문제가 재현되지 않는 것을 확인하고, emlex 드라이버와 상호작용 할 가능성이 있는 타사 드라이버를 하나씩 비활성화 해가며 문제가 사라지는 케이스를 찾는 것이 최선입니다.

+ Emulex 11002는 공식적으로 Windows Server 2012 까지 지원됩니다.
dateno1 2023-04
드라이버부터 바꾸어보세요

최신이라고 생각하신게 최신이 아닐 수 도 있고, 반드시 최신이 가장 잘 작동하란 보장 없습니다
NaN 2023-04
금일 Emulex를 대체할 Solarflare S7120 카드를 구하여 장착하였고 2시간가량 사용중인데 문제가 해결된것 같습니다.
주환님의 답변대로 드라이버버그내지 하드웨어 조합이 그냥 잘 안맞는듯 싶습니다.
답변주신분들 감사합니다.


QnA
제목Page 1353/5704
2015-12   1656842   백메가
2014-05   5121507   정은준1
2017-07   3653   laputa
2016-03   3653   무아
2018-07   3653   Olorin
2014-03   3653   이해찬
2017-04   3653   무아
2017-07   3653   이윤주
2014-03   3653   병맛폰
2015-02   3653   김건우
2017-05   3654   랑구스
2020-05   3654   정은준1
2019-04   3654   낭만케이
2021-01   3654   라천민
2020-04   3654   comduck
2017-08   3654   자연인
2015-03   3654   멋쟁이
2017-12   3654   회로쟁이
2017-05   3654   수필처럼
2014-03   3654   미담
2014-01   3654   황진우
2015-06   3654   쌍cpu