|
[필독] 처음 오시는 분을 위한 안내 (737) |
정은준1 |
2014-05 |
5267122 |
0 |
2014-05
5267122
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1792038 |
25 |
2015-12
1792038
1 백메가
|
84097 |
VPS 리눅스 sysbench 메모리 read/write 속도가 안나오네요.. |
김컴맹 |
2018-10 |
3941 |
0 |
2018-10
3941
1 김컴맹
|
84096 |
vpn 서버 스팩문의? (7) |
사랑하라 |
2018-10 |
3811 |
0 |
2018-10
3811
1 사랑하라
|
84095 |
Lenovo TS140 기본 power 팬 유무 (2) |
아스란 |
2018-10 |
3771 |
0 |
2018-10
3771
1 아스란
|
84094 |
요즘 퍼핀브라우져 플래시되나요? (2) |
김건우 |
2018-10 |
4535 |
0 |
2018-10
4535
1 김건우
|
84093 |
방으로 랜선이 하나 들어오는데 커플러쓰면 2라인 가능한가요? (16) |
호호 |
2018-10 |
6854 |
0 |
2018-10
6854
1 호호
|
84092 |
T7910 vs R7910 (10) |
통신보안 |
2018-10 |
4436 |
0 |
2018-10
4436
1 통신보안
|
84091 |
중국산 v2 보드 신제품 소식 (9) |
이라달 |
2018-10 |
5806 |
0 |
2018-10
5806
1 이라달
|
84090 |
레이드카드 최대하드용량....스펙대로 써야하나요? (8) |
김건우 |
2018-10 |
4997 |
0 |
2018-10
4997
1 김건우
|
84089 |
Visual studio에서 run할 시 산출된 변수 값 확인 방법 질문 (3) |
python |
2018-10 |
3228 |
0 |
2018-10
3228
1 python
|
84088 |
해킨 사양추천 (6) |
DDDIE |
2018-10 |
4751 |
0 |
2018-10
4751
1 DDDIE
|
84087 |
통계용 워크스테이션- 잘 돌아가려면... (5) |
김훈1 |
2018-10 |
4905 |
0 |
2018-10
4905
1 김훈1
|
84086 |
인텔 CPU RMA 부가세 관련 문의 (9) |
호호 |
2018-10 |
4446 |
0 |
2018-10
4446
1 호호
|
84085 |
X8dai 보드 램 인식 문제 (8) |
부산초보 |
2018-10 |
3516 |
0 |
2018-10
3516
1 부산초보
|
84084 |
DX79SI 메인보드가 ECC/REG메모리 지원되나요 (6) |
앙끄 |
2018-10 |
5475 |
0 |
2018-10
5475
1 앙끄
|
84083 |
c# 에서 excel 파일 만들 때 컬럼명으로 쓸 수 없는 문제 (4) |
무아 |
2018-10 |
3526 |
0 |
2018-10
3526
1 무아
|
84082 |
Dell 서버 컴퓨터... 거하게 하나 장만했습니다... (6) |
깐남 |
2018-10 |
4639 |
0 |
2018-10
4639
1 깐남
|
84081 |
ADAPTEC ASR-71605와 LSI 9265-8I중 어떤 것이 좋을까요? (5) |
online9 |
2018-10 |
3861 |
0 |
2018-10
3861
1 online9
|
84080 |
신용카드 ICTU Security Check Fail 오류 메세지 (1) |
삐돌이슬픔이 |
2018-10 |
4519 |
0 |
2018-10
4519
1 삐돌이슬픔이
|
84079 |
Xpenology + PLEX 설정 질문드립니다. |
임시현 |
2018-10 |
3343 |
0 |
2018-10
3343
1 임시현
|
84078 |
메인보드 핀펴는법 질문드립니다 (5) |
나나나나나 |
2018-10 |
3304 |
0 |
2018-10
3304
1 나나나나나
|
재전송이 아닌, 원래 패킷이 5초 지연되어 들어가나요?
일단 패킷 캡쳐상에서 seq가 연속되고 있기도 하고요
혹시 더미허브(논메니지먼트 허브)급인가요??
재대로 확인할려면 포트 모니터링 장비 붙여서 패킷로스 확인해보는 편이 좋아 보입니다..
그 외 조심할 것은 케이블의 품질입니다..
전임자에게 물어보니 초기비용 몇만원 아끼려고 24포트가 아니라 8포트 붙였다는데
인터넷은 전용선을 깔아놨고요...
경영진도 그렇고 제정신이 아니었던 것 같습니다.
100 mbps 스위치가 아닌지 체크
일단 링크는 기가빗으로 나오네요
월요일에 업체 영업 담당에게 문의넣었는데
문의 폼으로 연락하라더니 아직까지 연락이 없네요.
그런데, 5ms도 아니고 5sec는 스위치문제로 생긴 지연이라고 보기에는 너무 과도합니다.
지금 캡쳐를 서버에서 하셨으니 보내고 받은 시점 역시 서버의 시간이고, 그렇다면 저 지연은 스위치가 아니라 서버에서 발생한거라고 보는게 타당한 것으로 사료됩니다.
서버 message log나 어플리케이션(asterisk)등 에서는 해당 시간대에 특별히 에러나 워닝 같은게 안보여서 원인을 찾는데 시간이 걸리고 있습니다.
따로 원인을 확인할 방법이 있을런지요?
(하드 배드 등으로 데이터가 재대로 못날라가고 지연되는 경우)
어느 서버에서 데이터 오류나 지연이 생기는지부터 확인하세요.. (여러 서버인지 그 서버 하나인지)
하위서버는 pbx입니다만 하위서버에 udp로 보내는 저래서 하위서버와는 무관하게 발생하는게 아닐까 생각하고 있습니다.
HDD 오류라면 뭘로 검사하는게 좋을지요?
부끄럽게도 아직도 리눅스(centos6 입니다)를 잘 모릅니다.
fsck를 쓰게되면 데이터가 다 날아간다고 절대 쓰지말라고 전임자에게 배웠는데 제 자신이 무지해서 무섭네요...
처음 리눅스 배울 때 꽤나 소리를 들어서요... ㅎ
(채크하다 서비스 끊어지면 골치)
하드에서 S.M.A.R.T 채크라는 것이 있는데 리눅스 명령어 중에 이것을 채크할 수 있다면 이 내용으로 하드의 건강상태를 짐작할 수 있습니다..
저도 리눅스는 거의 모르기에....
찾아보겠습니다 ㅎㅎ
fsck는 보통 논리적인 오류(파일시스템이나 볼륨의 메타데이터 정보 불일치 등)을 검사할 때 씁니다.
SMART 검사는 smartctl -t long /dev/sdX 같은 형태로 검사하시면 되고요,
이건 하드디스크 펌웨어에서 검사를 하는 것이기 때문에, 시스템이 크게 느려지거나 하는 문제는 없습니다.
그리고 정말 디스크 자체의 문제를 파악할 수 있습니다.
badblocks 는 OS 위에서 디스크를 읽으면서 테스트하는 것이기 때문에 다른 프로세스의 IO에 영향이 있을 수 있습니다.
디스크는 문제가 없지만, 케이블이 문제가 있다거나, SATA컨트롤러가 문제가 있다거나 하는 경우에는
SMART오류는 없는데, 실제 읽기 테스트를 할 때 문제를 발견하게 됩니다.
그리고 데이터를 읽을 때 오류가 발생해야만 문제라고 보는 것이 아니고,
오류가 없다고 하더라도 전송속도가 너무 느리거나, io wait가 높게 나오는 것도 문제가 있다고 봐야합니다.
그리고 fsck로 검사를 하다가 데이터를 날린다는 이야기는,
검사를 하는 것 자체는 문제가 없지만, fsck가 오류를 발견했을 때 수정을 시도하면서 문제가 발생하는 경우가 있습니다.
그게 OS 파티션이고, 마운트되어서 현재 사용중인 파티션이면 오류를 수정하면서 운나쁘게도 시스템이 다운될수도 있는 것이지요.
그리고 제 생각에도 윗분들 말씀처럼 스위치보다는 서버 문제일 가능성을 고려해보시는 것이 좋겠네요.
IO wait가 심하게 높은 경우에는 OS 커널 쪽에서 제때제때 IO 명령을 못 받아줄 수가 있는데요,
사용중인 디스크에 문제가 있거나 컨트롤러에 문제가 발생하면 그런 경우가 있을 수 있습니다.
일시적으로 시스템이 행이 걸렸다가 풀렸다가 하는거죠.
서버에서 SSD를 사용하는데 용량을 거의 풀로 사용하면서 프리징이 걸렸다 풀렸다 하면서 네트웍도 끊어졌다 붙었다 하는 그런 경우도 있었구요.
그리고 모든 경로를 다 확인해보셨는지요?
올려주신 그림에 reverse 방향의 delta는 올려주지 않아서요.
- 상위서버 -> 운영서버: 상위서버와 운영서버 양쪽에서 패킷 캡쳐해서 비교. 보통은 불가능해서 운영서버에서만 확인하죠.
- 상위서버 <- 운영서버: 상동
- 운영서버 -> 하위서버: 운영서버와 하위서버 양쪽에서 패킷 캡쳐해서 비교. (올리신게 하위서버에서 확인한 패킷을 올리신 것 같은데 맞나요?)
- 운영서버 <- 하위서버: 상동
제가 겪은 경우인데요, 고객사에서 제공한 IDC상면에 서버를 넣었는데 네트웍 대역폭이 부족해서 비슷한 상황이 발생한 적이 있습니다.
IDC의 서버들이 shared 네트웍을 사용하는데 장애발생 당시 고객사에서 배치로 파일전송을 하면서 (그것도 한낮에!!!) 대역폭을 몽땅 사용하고 있어서......
그냥 하루만 그랬으면 넘어갔을텐데 그분들이 뭘 잘못 만들었는지 일주일정도 계속 낮에 배치를 수동으로 돌리는 바람에 ㅋㅋㅋ
IDC랑 우리랑 계약한것도 아니니 대역폭 꽉 차서 장애나는건 우리는 모르고 고객사 담당자가 바뀌었는데 연락처 갱신을 안해서 고객사에서도 모르고 있었고...
고객사 사람이랑 같이 IDC들어가서 확인해보고 알았죠.