안녕하세요 선배님들 네린이 질문 드립니다!
제목과 같이 해당 장비를 셋팅 할 기회가 생겨서 이번에 시행착오를 겪으며
열심히 구성을 해보는 중인데, 너무 두서없이 진행을 하여 뭐가 어떻게 해서
통신이 가능하게 되었는지에 대해 이해가 너무 떨어집니다ㅠ
왜 리눅스 서버에서 어떠한 설정을 하고, 인피니밴드에 어떠한 설정을 해서 통신이 되는지에 대해 아직도 헷갈리네요...
그리고 QM8700의 데이터시트 상에는 QSFP56 40포트라고 되어있고 QSFP+에 대한 내용은 없는데,
QSFP+ 는 지원하지 않는지도 궁금합니다!
많은 선배님들의 조언 및 질타 부탁드립니다! 감사합니다!
장비 : Mellanox QM8700, Dell R760 서버 *2(Rocky Linux 8.6)
설정 사항 :
(1) QM 8700 : ib 0(192.168.0.1/24), web user interface O
(2) R760 (1) : ib 0(192.168.0.44/24), opensm 구동 중(QM8700 웹UI 상에서 Subnet Manager is running remotely 라고 관찰 됨)
(3) R760 (2) : 미설정
½ºÀ§Ä¡¿Í ¼¹ö»çÀÌ¿¡ IPoIB·Î ¿¬°áµÇ¾î¼ ¼·Î Åë½ÅÇÏ°í ÀÖ½À´Ï´Ù ( QM8700´Â ÀÎÇǴϹêµå ½ºÀ§Ä¡³×¿ä.)
¸®´ª½º ¼¹ö¿¡ ¼³Ä¡µÈ (¸á¶ó³ì½º)¾îµªÅÍ°¡ IB ¸ðµå·Î µ¿ÀÛÇÏ°í
Dell S4128T-ON <-> QM8700 <-> R760 (1), (2) ¿¬°áÀ» Çغ¸¾Ò½À´Ï´Ù¤Ð
Subnet Manager is running remotely
QM8700ÀÇ ³×Æ®¿öÅ© SpecÀ» È®ÀÎ ÇÏ¿©¾ß ÇÕ´Ï´Ù. ÇÁ·ÎÅäÄÝÀÌ Áö¿ø µÉ ¼öµµ ÀÖ°í. ¾Æ´Ò ¼öµµ ÀÖ°í Çؼ..
[root@localhost ~]# ibping 192.168.40.44
ibwarn: [153453] _do_madrpc: recv failed: Connection timed out
ibwarn: [153453] mad_rpc_rmpp: _do_madrpc failed; dport (Lid 192)
ibwarn: [153453] _do_madrpc: recv failed: Connection timed out
ibwarn: [153453] mad_rpc_rmpp: _do_madrpc failed; dport (Lid 192)
--- (Lid 192) ibping statistics ---
3 packets transmitted, 0 received, 66% packet loss, time 4922 ms
rtt min/avg/max = 0.000/0.000/0.000 ms
±×·¸±â ¶§¹®¿¡ Dell S4128T-ON°ú´Â ¿¬°áÀÌ ºÒ°¡´É ÇÕ´Ï´Ù
QM8700Àº Ethernet Switch ¾Æ´Ï°í..
ÀÎÇǴϺ¥µå´Â IP ÁÖ¼Ò¸¦ ¾²Áö ¾Ê°í.. Mac Address ÁÖ¼Ò¸¦ »ç¿ëÇÕ´Ï´Ù.
À§Ã³·³
IP ÁÖ¼Ò¸¦ ´õ ÇØ Áֽ÷Á¸é..
IP over iB ¸¦ ¼³Á¤ÇÏ°í..
°¢ È£½ºÆ®º° IP ÁÖ¼Ò¸¦ ÁöÁ¤ÇÑ ÈÄ¿¡ »ç¿ë °¡´ÉÇØ Áý´Ï´Ù.
QM8700 Subnet¸¦ °¡Áö°í Àֱ⠶§¹®¿¡ Node µéÀº OpenSM¸¦ ½ÇÇàÇÒ ÇÊ¿ä ¾ø½À´Ï´Ù.. È¥¼±¸¸.,..