|
[필독] 처음 오시는 분을 위한 안내 (735) |
정은준1 |
2014-05 |
5139141 |
0 |
2014-05
5139141
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1673629 |
25 |
2015-12
1673629
1 백메가
|
79281 |
OpenLDAP ACL 설정관련 질문입니다. (3) |
dragoune |
2014-04 |
4082 |
0 |
2014-04
4082
1 dragoune
|
79280 |
레이드 윈도우즈 설치 문제 (8) |
티키 |
2014-03 |
4082 |
0 |
2014-03
4082
1 티키
|
79279 |
시놀로지 금지어 해제된건가요? (4) |
퍼싱글 |
2016-04 |
4082 |
0 |
2016-04
4082
1 퍼싱글
|
79278 |
헤놀로지 DTS 문의 드립니다. (3) |
김유중 |
2016-10 |
4082 |
0 |
2016-10
4082
1 김유중
|
79277 |
HP z420 쿨러 관련 문의 (6) |
백룡 |
2019-04 |
4082 |
0 |
2019-04
4082
1 백룡
|
79276 |
혹시 요렇게 생긴 케이블(4pin female to female) 구할수있는데가 있을까요??? (6) |
r이승원r |
2016-11 |
4082 |
0 |
2016-11
4082
1 r이승원r
|
79275 |
USB 네트워크어뎁터 하나 추천해주세요 (6) |
방o효o문 |
2015-07 |
4082 |
0 |
2015-07
4082
1 방o효o문
|
79274 |
3.5 오디오 케이블 추천 부탁드립니다... (4) |
호박고구마 |
2017-10 |
4082 |
0 |
2017-10
4082
1 호박고구마
|
79273 |
[자체완료?]슈마 PWS-865-PQ 는 호환이 가능한가요? (6) |
DoubleSH |
2018-04 |
4082 |
0 |
2018-04
4082
1 DoubleSH
|
79272 |
HDMI 모니터가 벽돌모드로 되어 버렸어요 (4) |
샤릉합니다 |
2019-01 |
4082 |
0 |
2019-01
4082
1 샤릉합니다
|
79271 |
독일어 해석도 가능하시겠지요? (6) |
아름다운노을 |
2014-03 |
4082 |
0 |
2014-03
4082
1 아름다운노을
|
79270 |
IDE (암) to SATA (수) 전원케이블을 구하고 싶습니다. (9) |
김훈1 |
2018-03 |
4082 |
0 |
2018-03
4082
1 김훈1
|
79269 |
고견 부탁 드립니다. (6) |
PCMaster |
2018-02 |
4082 |
0 |
2018-02
4082
1 PCMaster
|
79268 |
2CPU 회원님 / GPS 연장케이블 좀 찾아주세요.. (6) |
sungsung |
2019-07 |
4082 |
0 |
2019-07
4082
1 sungsung
|
79267 |
이 삼성 외장하드를 as 교환 받을 수 있을까요? (5) |
luciddream |
2018-05 |
4082 |
0 |
2018-05
4082
1 luciddream
|
79266 |
HDD불량으로 메인보드에서 소리가 날수도 있나요? (4) |
예관신규식 |
2018-01 |
4082 |
0 |
2018-01
4082
1 예관신규식
|
79265 |
워크스테이션 그래픽 카드는 어디서 구매하죠? (6) |
기림 |
2015-05 |
4082 |
0 |
2015-05
4082
1 기림
|
79264 |
랜카드 문의 드립니다... (5) |
lovemiai |
2016-02 |
4082 |
0 |
2016-02
4082
1 lovemiai
|
79263 |
유전원 USB 허브 추천해 주세요~ (6) |
앤드유저 |
2017-03 |
4083 |
0 |
2017-03
4083
1 앤드유저
|
79262 |
dell 워크스테이션 sas 기능과 sata연관성은 어떻게 될까요? (5) |
waney |
2016-08 |
4083 |
0 |
2016-08
4083
1 waney
|
어느 회사 레이드 카드인가요??
델이나 소프트웨어 레이드 제조사에서는 이 문제에 대하여 모라고 이야가 하나요??
그리고 저렇게 많이 하드를 달게 되면 하드 1개 고장나서 교체를 해도 리빌딩 시간이 2주일 이상 걸릴듯합니다.. (해봐야 알겠지만)
가장 최신의 가장 빠른 캐쉬 달린 하드웨어 레이드 카드를 박아도 만족할만큼 성능 개선이 될지는 누구도 모르며 실제 작업해봐야 압니다..
저는 리눅스 잘 모르지만 mdadm은 부팅하드 미러링 하는 정도에서 사용 되는 것으로 알고 있습니다..
그렇게 간단한 질문이 아니라는 것은 몇 달 고생해가면서 배우긴 했지만 질문을 하려니 이렇게 단순해져버리네요^^;; 웃고 있어도 웃는게 아니라는게 참 안타깝습니다.
그 외 시스템이 DELL 이니까
DELL의 기술지원쪽에 문의하여 12G에 가장 최신 가장 캐쉬 메모리가 큰 레이드 카드와 HDD를 BMT용으로 대여 받아
현재 외장으로 된 스토리지를 빼고 BMT 해본다...
DELL은 가격은 비싸지만 성능이 어느 정도 개런티된 EMC 나 EqualLogic 의 중대형 RAID 장비가 있습니다..
이것을 대여 해서 BMT 해보고 맞는 장비를 찾아야 할 듯합니다..
100G 인피니벤드를 다 받아줄 장비는 흔치 않을 듯합니다..
100G 정도를 받쳐 주는 스토리지는 NVME를 여러개 묶은 것이나 가능한 듯한데 대용량 구현이 힘듭니다..
mem total: 257G memused: 7.1G free 817M, buff/cache 243G, available 은 238G 입니다.
파일서버, 계산노드의 sar나 iostat의 iowait 로 판단해야 한다면 어느 정도로 올라가야 사용자의 작업을 제한 해야 할까요?
io모니터링 (그리고 일반적인 모니터링) 툴이 있다면 추천해주시면 잘 찾아보겠습니다.
-------------
우선 데이터 백업 정도
그 외 시스템이 DELL 이니까
DELL의 기술지원쪽에 문의하여 12G에 가장 최신 가장 캐쉬 메모리가 큰 레이드 카드와 HDD를 BMT용으로 대여 받아
현재 외장으로 된 스토리지를 빼고 BMT 해본다...
--------------------
네 델쪽에 문의해보겠습니다. 가장 캐쉬 메모리가 큰 레이드 카드 문의해보겠습니다. 답변 너무너무 감사드립니다.
링크에 HBA라고 나옵니다..
재일 나은 방법입니다..
우선 백업부터 철저히 하세요..
작업하다가 실수로 다 날려먹는 경우도 있을수 있으니까요..
독립적인 3차 백업까지 하면 데이터 망실 위험이 많이 줄어든다고 합니다..
그러나 큰 데이터를 가지신 분들은 현실이 그렇지 못하죠..
https://www.dell.com/learn/us/en/04/campaigns/dell-raid-controllers
그 솔류션을 개발 판매 하시는 분이 이 사이트에 계십니다..
http://www.2cpu.co.kr/freeboard_2011/1055569?&sfl=wr_name%2C1&stx=epowergate&sop=and
DELL로도 정 답이 없으면 방법이 없는지 문의라도 해봐야죠..
리눅스는 그것을 당장 놓을데가 없어서 메모리에 적체중이고
하드는 느리기에 그냥 꾸역꾸역 일만 하는 중입니다..
중간에 인피니 벤드 끊어도 메모리에 있는 데이터가 하드로 가야 하기에 하드는
어느 정도 계속 억세스 할 겁니다..
사고 안 난 것이 희안합니다..
mem used: 6.1G
free 668M
shared 8.3M
buff/cache 244G
available 은 239G입니다.
Swap 은 used free 다 합쳐서 4기가가 안되구요.
뭘해도 안될겁니다.
그냥 h840으로 바꾸시고 hdd 15개 단위로 raid6로 묶어서 사용하세요.
괜한 cache 같은거 사용하지 마시고요
Gluster, ceph, lustre 등 잘못사용하시면 졸업 재때 못할수도 있습니다.
BBU라 불리는데 충전지 타입과 컨덴서 타입이 있을 겁니다..
잘 해결되기를 기원합니다..
데이터가 많이 쌓이면 쌓일수록 극악의 쓰기속도를 보여주는게 ZFS입니다. 그리고 ZFS는 자주 호출하는 데이터일경우 효과가 좋지 랜덤형으로 읽고 쓰고 지워지고 하는건 오히려 역효과를 불러옵니다.
ZFS에서 윈도우 스토리지로 바꾸게 된 이유도 다 여기에 있었습니다.
소프트레이드 쓸려면 SSD나 NVME랑 퓨전해야딥니다. 어설프게 했다간 아우 속도 지랄맞아요.
그리고 파일서버는 메모리 거이 안씁니다. ZFS 같은 메모리 읽기캐쉬형이나 사용하지 보통은 안써요.
처음부터 설계 미쓰인거 뜯어고치는것도 쉽지 않을듯 싶네요. 왜 저렇게 구성했는지도 이해가 안가고 NFS를 꼭 써야 하는지도 의문이 가네요.
캐시 있는 hba를 붙이는 것 외에 할 수 있는 일은 뭐가 있을까요?
2. 파일시스템은 모르는거 사용하는거 아닙니다.
3. 확신이 없거나 모르시면 파일시스템은 OS가 Default로 사용하는거 사용하셔야 합니다. 저는 EXT4 추천. XFS는 아직도 모르겠음
4. NFSoverRDMA는 좋아보이지만 확신 없으시면 사용하지 않는거 추천합니다. 어느시점부터 stale 에러 발생하기 시작하면 모든 client 리부팅 해야합니다. 거의 매일..
5. 그 정도 규모면 자잘한 기술로 해결못합니다. 절대못합니다. SSD Cache, cache 많은 raid controller, 메모리 cache, ... 모두 사용하시면 않됩니다.
그나마 추천드리는 방법은
1. SSD (SAS 타입)로 journal device 사용. 가능하면 lun당 1개씩. jouirnal device도 mirror 구성. 필수!!!
2. raid controller의 메모리는 장애발생시 recovery용이다라고 생각. Raid LUN 설정시 No Cache, DirectIO 모드로 설정
3. Linux Kernel에 dirty_ratio=20, dirty_background_ratio=20, swapness=0 로 설정
4. Disk Scheduler는 noop
입니다. 이렇게 하면 성능때문에 교수가 뭐라고 하던 데이터 날아가서 졸업못하는 일은 없을겁니다.
백업은 알아서
구글에서 뭐라고 하던 책임지지 못할 사람들이 하는말 듣지 마시고 가장 안정적인 방법으로 하세요.
scheduler 그리고 parameter는 바꿔놔야겠네요. Dell h840사서 RAID 세팅도 그렇게 해야겠습니다.
시스템에 전송속도가 느린 것이 아니라..
Hang 이 걸린다를 보고 해석해 봅니다..
시스템이 느린 것하고는 차원이 다릅니다..
1. 서로 동작하고자 하는 firmware 의 부조화...
2. 과열로 인한 Malfunction.
이렇게 제시해 보고 싶네요...
그리고 이런 문제는 정식 기술지원 받으셔야 할 것 같습니다...
System Health Check Analyzing Report 작업 후 조치 까지 전문가의 손길이 필요해 보입니다.
HANG이 발생을 할 수 있는데 이게 시스템에서 말하는 HANG인지 아니면 그냥 느낌상 HANG인지를 구분하는게 쉽지 않습니다.
보통 IO 때문에 HANG이 걸리면 KERNEL 메시지 발생합니다. 120초 동안 응답이 없다 뭐 이런종류의 메시지 입니다.
IO HANG을 해결하는 쉬운 방법은 drop_cache 3 하시면 100% 풀립니다. 물론 1시간 이내에 다시 발생합니다. drop_cache하면 또 풀립니다.
저희 고객중에 drop_cache를 10분마다 cron에 넣고 하시는분 계십니다.
이 방법은 중독성 없는 진통재 맞는 처방이라 할 수 있을것 같습니다만 원인을 제거하지는 못합니다.
몇가지 팁은 RAID Controller에 BBU 있다면 barrier off 하셔도 무방합니다. 이렇게 하시면 IO HANG 발생할 가능성 현저히 낮아집니다.
dirty_ratio=5, dirty_background_ratio 2로 하셔도 IO HANG 발생 가능성 낮아집니다.
더 확실한 방법은 MEMORY를 4G 또는 8G로 낮추세요. IO HANG 거의 발생하지 않습니다.
그리고 FILE 서버에서는 절대로 SWAP 사용하시면 않됩니다. file corruption 발생할 수 있습니다.
어려운건 (아니면 더 쉬운건) IO HANG이 아니라 FILE Service (NFS 서버)가 HANG이 걸리는 겁니다.
진짜 HANG이 걸린다면
1. top등을 보면 nfsd의 cpu 사용율이 높을것이고 (iowait은 낮고)
2. client에서 stale에러가 발생
할겁니다.
대부분 원인은 file system에 무리하게 tuning을 하려고 들었을때 발생합니다.
아니면 client에서 사용하는 프로그램이 그지같이 만들어져도 발생합니다.
서버에 memory error 발생하면 100% 발생 합니다
가장 중요한건 nfs 서버에서 성능을 위해서 async, no_subtree_check, wdelay 넣는경우가 많습니다.
무슨 배짱인지 모르겠습니다.
위 3개 옵션중에 1개라도 사용하면서
1) HANG이 걸린다
2) 리부팅후 파일이 망가졌다
3) CLIENT 여러대가 동시에 IO를 할때 파일의 정합성이 깨진다
등의 불평을 하면 않됩니다.
그냥 당연한 겁니다.