Hyper-V 클러스터 구성 관련 질문 드립니다.

술이   
   조회 2208   추천 1    

임계치 올려주세요 여러번 페일오버 테스트 하면 핑퐁 안치고 그냥 오프라인 시켜버립니다.

기본값은 1인데 6시간동안 6이나 10정도로 해주면 될거 같습니다.

너무 높으면 진짜 둘다 장애 발생시 서로 핑퐁 치다가 더큰 장애가 날수 있어서 그때는 오프라인으로 되는게 문제를 막을수 있습니다.


짧은글 일수록 신중하게.
구십평 2022-02
답변 감사합니다. 말씀해주신대로 클러스터 속성에서 클러스터 코어 리소스 그룹 들어가보니 각 Hyper-V 노드들이 체크박스에 체크가 되어있지 않더라구요. 원래 따로 설정해줘야 하나보네요. 체크 한 상태로 다시 테스트 해보겠습니다. 혹시 지금 답변주신 값이나 내용처럼 필수로 체크해볼만한 옵션 있을까요?
구십평 2022-02
현재 말씀해주신 메뉴에서 체크박스에 Hyper-V 노드 2대 체크 후 테스트하니, 기존 1번에 클러스터 공유볼륨 , 쿼럼 디스크가 있는 상태로 FC 케이블을 절체하니 2번 노드로 공유볼륨 , 쿼럼디스크 잘 넘어갔습니다.
그러나 2번 노드에 몰려있을때 다시 한번 FC 케이블을 절체하니 (1번 노드 FC케이블은 원복한 뒤 일정 시간 지나고 테스트) 쿼럼 디스크만 다시 1번 노드로 넘어가고 클러스터 공유볼륨은 오프라인으로 빠져버리네요. 공유볼륨을 여러개 추가해서 해봐도 쿼럼 디스크만 문제없이 옮겨다니고 클러스터 공유볼륨은 최초 1회만 넘어가고 2회부터 오프라인으로 빠져버립니다. 또 다른 설정값을 찾아보는데.. 어렵네요 ㅜㅜ
술이 2022-02
뭔가 물리적인 설정이 잘못된거 같습니다.
     
구십평 2022-02
원래 초기 구성에서 추가로 더 건드릴 옵션이 있다거나 그런건 없나요?
그리고 FC 케이블 절체 시 원래 볼륨 및 VM들이 모두 Failover 되어야 정상인게 맞나요?
말씀해주신 체크박스에 노드들 체크한것도 어느순간 한쪽은 풀려있고, FC 케이블 절체해도 첫회에는 잘 넘어가고 그 이후부터 안넘어가는거 보면 분명 무슨 설정값에 문제가 있는 듯 한데..
스토리지와 서버 연결 등 물리적인 설정은 기존에 운영하던 서버가 있어서 그대로 구성해서 물리적인 문제는 아닌걸로 판단이 됩니다 ㅜㅜ
          
술이 2022-02
FC 끊고나서 다시 붙이면 자동으로 붙지 않습니다. iscsi 는 TCP 방식이라 어느 시간동안은 재시도롤 하는데 FC는 그런게 없어요 만약 다시 스토리지나 FC 재연결 되었으면 디스크 관리에 디스크 다시 검사를 해줘야 합니다. 그러고 나서 다른노드를 끊어야 되요.
FC 방식은 스토리지가 끊어졌거나 다운되서 다시 올라오면 자동으로 붙여주지 않는데서 나오는 문제입니다. 보통 스토리지 뻗으면 서버를 리부팅 해주거나 리부팅 못하는 상황이면 디스크 다시검사로 블럭세션이 다시 활성화 되게끔 해줘야 하는데 그런거를 간과한거 같습니다.
예전에 ZFS 블럭스토리지 FC로 붙일때 리부팅이나 디스크 다시검색을 해주기까지 항상 오프라인 상태였었습니다. 만약 끊어진 시간이 얼마 되지 않으면 다시 붙기는 하지만 그것도 상황마다 다릅니다.
               
구십평 2022-02
아, 그래서 부팅 또는 클러스터 재기동 후 첫 시도때는 잘 넘어가고 그 다음부터 안넘어간걸까요? FC케이블을 원복해도 말씀해주신것처럼 자동으로 붙지 않으니, 다시 되돌아가지 못했나보네요!
혹시 그럼 이와 같은 테스트를 할 때, FC케이블 원복 후 FC케이블 절체됐던 서버를 재부팅 하면 되는건가요? 말씀해주신 디스크 다시 검사는 혹시 어떻게 하는지 알 수 있을까요?! 일단 FC 원복하면 공유볼륨은 디스크 관리자에서 추가 조치 하지 않아도 육안으로 보이긴 하던데, 여기서 디스크 다시 검사를 추가로 해줘야한다는 말씀이시죠?!  FC 케이블 원복 후 복원 방안들이 위 2개 말고도 더 있다면 알려주시면 정말 감사하겠습니다!
     
구십평 2022-02
전체적인 테스트 종합 결과로는..
재부팅 또는 디스크 다시 검사 작업을 하지 않아도
FC케이블 원복 후 10분이 지난 뒤에 다시 반대편 FC케이블을 절체하면 정상적으로 원복이 되네요. (failover)
시간을 재보면서 했는데 원복 후 5분 , 6 분 은 오류가 났고 10분이 지나야만 정상적으로 다시 failover 됐습니다.
10분이라는 시간이 고정된거보면 혹시 Failover 시간 관련하여 정책이나 설정값 아시는게 있으실까요?!
구십평 2022-02
결국 저희 테스트 환경과 실제 장비 둘 다 절체한 FC케이블 원복 후 10분이 지난 뒤 다른 서버 FC케이블을 절체해야 정상적으로 잘 넘어가서, 정합성을 맞추기 위해 10분이라는 시간이 필요한 것으로 마무리 되었습니다. 10분이라는 시간이 어디에서 필요한건지는 더 알아봐야할 것 같지만, 도움주신 덕에 잘 마무리 되었습니다. 감사합니다.


QnA
제목Page 614/5730
2014-05   5265390   정은준1
2015-12   1790374   백메가
2024-06   1870   애월남
2018-10   5952   crogym
2024-06   1550   은빛차차
2011-11   5755   방o효o문
2015-06   5282   겨울나무
2014-02   3725   chis
2018-10   6202   sbg2005
2015-06   5024   가빠로구나
2021-03   4357   닷쿤
2018-10   3538   푸하히
2024-07   2332   술이
2019-12   3293   나로와
2021-03   4413   뉴자
2015-07   4899   일론머스크
2012-01   6909   EYESSHOT
2014-03   5444   조지연
2020-01   4873   디셈버
2024-07   1798   핸즈
2012-01   7268   허대웅
2022-12   2031   꺄울