음...
자게에 글을 쓰며 자괴감은 들지만.. 일단 오늘의 상황을 써보고 자문을 구해보고자 합니다..
오늘의 작업은 네트워크 이중화 입니다..
블레이드 샤시에는 SW가 2개가 박혀있습니다.
Cisco Catalyst Switch Module 3012 for IBM BladeCenter 이놈입니다..
이래 생긴 놈인데.. 이게 외부로 보이는 External port들입니다.. 저기 16번 17번을 트렁크로 묶어서 서버팜으로 보냅니다..
저게 2개니깐 각각 2개씩 트렁크로 묶어서 업링크 포트가 각각 서버팜1,2로 가는거지요...
아무 문제 없이 통신이 됩니다...내부 VLAN설정은 문제가 없습니다... 속도도 잘 나옵니다...
문제는 SW1의 업링크 라인을 뽑았을때.... Failover가 안됩니다.... 물론 SW2f를 바라보고 있는 애들은 살아있죠...
반대로 SW1의 포트를 연결하고 SW2를 뽑으면... 상기와 반대로 됩니다...
내부 논리 링크가 죽지 않으니... 예들은 링크가 살아있다고 생각하고 넘어가질 않습니다...
티밍 설정은 제대로 되어 있습니다... 스위치가 죽으면 자동으로 잘 넘어갑니다만...
이 경우는 업링크만 해제된 상태이고.. 내부 스위치링크는 살아있으니.. 이게 죽었다고 인식을 안하고...
계속 액티브가 되어 있는겁니다... 결국 상단의 헬스체크를 안한다는 얘기가 되는거죠..
AIX도...VM도...HP도 동일 구성에서 잘 넘어갑니다...
HP엔지니어 왈... 업링크가 죽으면 다운링크도 죽이는 옵션이 있을거라고 합니다.. 지네들 구형 장비에도 그 정도는 있다고...
네... 저도 시스코 스위치에 그런게 없을거라 생각치 않습니다 ㅎ.. 멍텅구리 더미도 아닌데...
일단 GUI옵션에는 없습니다... 블레이드 매니지먼트에도 없고... 스위치 GUI에도 없습니다..
-_-;;
망할...
스위치 콘솔에 붙여서.. CLI로 봐도.... 스위치 컨피그를 뽑아봐도 해당 설정 항목이 안보입니다..
분명 커맨드가 존재하거나.. 또는 다른 방법이 있을거 같은데... -_-;;
어떠한 조언이라도 좋으니... 많은 지도 편달 부탁드려봅니다..
(__ )미리 감사 인사 부터 드려놓겠습니다..ㅎ
글이 중구난방이라 이해가 가지 않는 부분이 있다면 댓글에 달아주세요.. 다시 더 상세히 풀어서 쓰겠습니다..
최신 펌웨어가 SE8인데.. 박혀있는 애들은 한놈은 SE이고 하나는 SE4입니다..SE4인 놈은 장애로.. 교체한 이력이 있네요...
네트워크 구조를 같이 그려서 생각해 보셔야 할것 같습니다. ( ex> 물리적으로 구성, 네트워크설정값 LACP, HSRP)
물리적 구조위에 설정파일 비교를 하면서 찾아봐야 할것 같습니다.
혹시나 해서..ㅎㅎ 입니다..
보시는게 좋을것 같습니다.
안되면 2방안으로 ipsla+ eem 으로
ping으로 link를 감시하고 ping fail시포트를 shutdown
할수도 있을것 같습니다.
아니면 중간에 있는 장비에서 LLCF가 되면
자동으로 상단이 죽으면 하단도 끊어줍니다.
hsrp 나 vrrp를 돌리신다면, track을 써서
priority를 낮추는 방법도 있습니다.
정말 용어를 모르니.. 깜깜하네요 -_-;;;
------------------------------------
자료 찾아보니 EIGRP가 BFD를 지원합니다.. 해당 스위치가 EIGRP프로토콜은 지원을 합니다... 그러면... 말씀하신대로 가능한거겠죠??
A서버- ibm스위치 모듈(시스코)15,16- 서버팜 스위치1
A서버- ibm스위치 모듈(시스코)17,18- 서버팜 스위치2
이런 구성이라고 예상해 봤을때
A서버 와 서버팜 스위치 1 간에 BFD 를
그리고 A서버와 서버팜 스위치2간에 BFD를 연동합니다.
즉 A서버도 BFD를 그리고 서버팜 sw1.2도 BFD가 지원 되어야 합니다.
중요한것은 시스코스위치 모듈 과 서버팜 sw의 trunk link가 끊겼을때 ibm내부 링크도 함께 끊어주는 기능 CCLF
를 찾아보시는게 빠른 방법일것 같습니다.
그래서 둘중에 스위치 하나가 죽으면 다른 스위치로 넘어가게 구성이 되어 있습니다.. 이름은 스위치지만 샤시에 포함된 I/O모듈입니다..
블레이드 서버들은.. 각각 SW1과 SW2에 물려있고...
각각 SW는 16,17번 에 트렁크 되어 업링크 전송되고 SW1은 서버팜SW 1로 SW2는 서버팜SW2로 갑니다.
블레이드 서버 내부에는 SW1과 SW2를 바라보는 가상NIC이 티밍이 되어 있어서..어쨋거나 스위치가 죽거나 NIC이 죽으면 잘 넘어갑니다..
근데 현재 상태에서는 내부적으로는 모두 살아있는 상태이다 보니..(NIC도 살아있고... 스위치 링크도 살아있으니..) 윗단이 죽건 말건 안넘어갑니다...
말씀하신데로 BFD도 찾아보고 있고.. 아래 김진규님이 말씀하신 LLCF도 찾아보고 있습니다.
스윗치 모듈만의 문제는 아닌거 같은데..
블레이드 내부에서 체크는 문제가 없습니다.. 아주 정직하게 내부에서 링크가 끊어지면 failover잘 됩니다...
물리적으로 스위치를 내려도 잘 넘어갑니다... 다만 스위치에서 업링크를 제거 했을때... 안넘어가는... -_-...
다른 엔지니어들 왈.... 자동으로 스위치에서 신호를 죽여줘야 하는데.. 왜 안되는지 모르겠다고 ㅎㅎ...
단순 L2면 티밍으로 될꺼 같은데 안되는거보니
다른 방법으로 우회해야 할것 같습니다