|
[필독] 처음 오시는 분을 위한 안내 (736) |
정은준1 |
2014-05 |
5212401 |
0 |
2014-05
5212401
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1743750 |
25 |
2015-12
1743750
1 백메가
|
7516 |
SRTP 지원하는 NVR (1) |
한효석 |
2023-04 |
2028 |
0 |
2023-04
2028
1 한효석
|
7515 |
Raid 카드에 연결 가능한 하드디스크 용량 제한이 있을까요? (8) |
긴머리루이스 |
2023-01 |
2028 |
0 |
2023-01
2028
1 긴머리루이스
|
7514 |
허브가 7번만 불이 들어와 있습니다.. (8) |
김준유 |
2022-05 |
2028 |
0 |
2022-05
2028
1 김준유
|
7513 |
태블릿 액정 이상 문의드립니다. (1) |
명랑 |
2021-08 |
2028 |
0 |
2021-08
2028
1 명랑
|
7512 |
아아... 끊어저버린 몰렉스 커넥터를 수리할만한 곳이 있을까요? (6) |
정무현 |
2023-07 |
2028 |
0 |
2023-07
2028
1 정무현
|
7511 |
Redhat 10G NIC Autonego 안됨 (5) |
새내기 |
2022-05 |
2028 |
0 |
2022-05
2028
1 새내기
|
7510 |
LG에어컨 필터에 사용되는 벌집구조 플라스틱(?) 이름이 뭘까요? (1) |
라혼 |
2023-10 |
2028 |
0 |
2023-10
2028
1 라혼
|
7509 |
어떤 선택이 더 좋을까요? (9) |
박종대 |
2022-03 |
2028 |
0 |
2022-03
2028
1 박종대
|
7508 |
스마트스위치용 게이트웨이가 불이 났습니다.. 수리 가능할까요..? (7) |
문상진 |
2023-04 |
2028 |
0 |
2023-04
2028
1 문상진
|
7507 |
국내 공유기에서 말하는 Twin IP나 SuperDMZ의 정식 기술 명칭이 있을까요? (17) |
민호양 |
2024-08 |
2027 |
0 |
2024-08
2027
1 민호양
|
7506 |
dell md1200 베이에 있는 정보는 가지고 올 수 없나요? (2) |
웍브로스 |
2021-05 |
2027 |
0 |
2021-05
2027
1 웍브로스
|
7505 |
시놀로지 스토리지풀 (4) |
사누스 |
2021-12 |
2027 |
0 |
2021-12
2027
1 사누스
|
7504 |
op룸 정리는 어떻게 하시나요? (2) |
강민준1 |
2023-04 |
2027 |
0 |
2023-04
2027
1 강민준1
|
7503 |
S-ATA HDD 파워케이블 관련해 질문합니다. (4) |
신우섭 |
2023-09 |
2027 |
0 |
2023-09
2027
1 신우섭
|
7502 |
USB메모리의 특정 폴더에 암호걸 방법 없을까요? (4) |
영산회상 |
2022-07 |
2027 |
0 |
2022-07
2027
1 영산회상
|
7501 |
DELL HARDWARE DIAGNOSTICS 빠른 실행 방법 문의 (1) |
풀로드시스템 |
2024-07 |
2027 |
0 |
2024-07
2027
1 풀로드시스템
|
7500 |
satadom 전원공급을 sata 단자에서 해결 가능한가요? (3) |
겨울나무 |
2021-08 |
2027 |
0 |
2021-08
2027
1 겨울나무
|
7499 |
서버 열쇠를 잃어버렸을 경우 열려면.. (4) |
2CPU최주희 |
2023-04 |
2027 |
0 |
2023-04
2027
1 2CPU최주희
|
7498 |
인문계에서 정보처리기사 응시가능? (12) |
뚜뚜김대원 |
2024-06 |
2027 |
0 |
2024-06
2027
1 뚜뚜김대원
|
7497 |
안드로이드에서 베터리 5% 미만일때 어둡게 안하는 방법 있을까요? (4) |
병맛폰 |
2022-02 |
2027 |
0 |
2022-02
2027
1 병맛폰
|
클러스터는 여러대를 한대 처럼 사용하는 목적이고..
네트워크와 데이터 이동 대역폭 문제에 시달립니다.
그래서 Ethernet 이 느려서 인피니벤드를 사용합니다.
(Infiniband 40G/100G/200Gbps)
1번 컴퓨터가 2번 컴퓨터의 메모리를 접근하는데..
2번 OS의 간섭을 받습니다. 그러면 느려져요..
그래서 RDMA를 사용합니다. 서로 OS 간섭없이 다른 컴퓨터의 메모리와 NVMe, GPU를
마치 나의 Local Device 를 사용하는 것 처럼 제한 없이 빠르게 쓸 수 있어야 합니다.
PC나 서버와는 또 다른 개념입니다... 슈퍼컴퓨터 인 것이죠..
일반적은 HPC에서 말하는 클러스터에 대한 견해입니다.
SLURM에 대한 견해는 아닙니다.
IB와 RDMA의 개념은 대략 알고 있었지만 비용문제 때문에 제외했습니다.
우선 MPI 와 OPENMP를 실습하는데 초점을 두고 있습니다.
몇가지 추가적으로 여쭤봐도 될까요?
Q1. infiniband 없이 실습하는건 반쪽짜리 학습이 될까요?
mellanox connect x3 40g nic 가 생각보다는 저렴한것 같아 ib 스위치와 함께 구축할 생각도 해봤습니다.
Q2. 여기서 언급하신 NVME는 캐싱용인가요?
Q3. 실제 HPC에서는 각 노드에 독립적으로 OS를 설치하나요?
Q4. HPC 활용에 초점을 둔다면 어디서부터 공부하는게 좋을까요?
제가 컴퓨터 전공이 아니라 학교에서 배우기는 어려울것 같습니다.
이렇게 도움 주셔서 정말 감사합니다!!
openMP는 하나의 컴퓨터 내에서 multi core를 사용하도록 작업을 쉽게 분배하는 것이고, 컴파일러 확장으로 손쉽게 for문을 등을 나눠주도록 하는 녀석입니다.
openMPI는 네트워크를 통해 다른 컴퓨터에서 연산을 하도록 해주는 기능입니다.
slurm은 워크로드 관리자로, 클러스터 환경에서 N개의 PC에 걸쳐 mpi로 구현된 프로그램을 여러 사용자가 일감을 예약하여 클러스터 전체의 사용량을 최대한 끌어내기 위한 관리자 입니다.
일단 현재 공부하시려는게 클러스터 쪽이라면
차라리 슈퍼컴퓨팅 센터의 운영 메뉴얼과 프로그래밍 메뉴얼을 보시면 간접적으로
클러스터가 어떻게 돌아가는지 빠르게 아실수 있을 것이고
그 이후에는 slurm 이나 openhpc, pbs 등으로 클러스터에 그런 시스템을 구축하는 쪽으로 방향을 잡으시면 어떨까 합니다.
다만, 이런식의 연산 클러스터 구축은 HPC/슈퍼컴퓨터 쪽에 주로 적용되지
클라우드 쪽에서는 hpc로 구현되진 않습니다.
그냥 생각대로 하는 거죠.
인피니밴드일 필요는 없어요.
메인보드에 BMC가 꼭 있어야 하는 건 아니예요.
온보드 랜으로 돼요.
고장난 노드는 계산할 때 빼버리는 거죠.
다른 노드에 영향을 주진 않아요.
가상이라면 BMC 없어도 그닥 문제 없습니다
메인스트림도 램 256기가까지 되다보니 실습용으로 구축하는데 아무 지장 없습니다