기본적인 시스템 모니터링 툴로 서버 점검하기 (Ubuntu 20.04)

쓰기

기본적인 시스템 모니터링 툴로 서버 점검하기 (Ubuntu 20.04)

딥러닝서버

2023-11

2023-11-30 11:27:09

안녕하세요, 오늘은 Ubuntu OS 상에서 각종 기본적인 시스템 모니터링 툴을 설치하고

문제가 발생 시 기본적인 사항들을 점검하는 방법들을 다뤄보도록 하겠습니다.

이러한 툴들은 Ubuntu 뿐만 아니라 Linux 계열은 대부분 사용가능하므로, 설치 방법만 조금씩 다를 뿐 사용방법은 동일합니다.

서버가 느리거나 제대로 작동하지않는 것 같다고 생각될 때 여러분들은

무엇부터 하시나요?

증상마다 다르지만 저는 하드웨어 결함 유무부터 확인해봅니다.

쿨러가 제대로 장착되어있지 않거나 서멀구리스가 말라붙어

냉각이 제대로 되지 않을 때 cpu 온도는 올라갑니다.

때문에, 저는 서버가 느리다고 생각될 때 제일 먼저 cpu 온도 측정을 합니다.

1.Cpu 온도 확인 툴 설치(lm-sensors)

sudo apt-get install lm-sensors

sudo sensors-detect --auto

sudo service module-init-tools restart

명령어 : watch sensors

watch sensors 명령어를 입력하면

아래와 같이 부품들의 센서에서 측정된 온도 값들이 나옵니다.

Cpu 기본 온도가 높고 돌아가는 프로세스가 많을 때 과부하가 걸려서

온도가 과하게 높아지면 서버는 자체적으로 온도를 낮추기위해 성능을 저하시킵니다. 때문에 적절한 온도 관리는 서버 관리의 핵심 요소라고 할 수 있죠.

그렇다면 어떤 프로세스가 자원을 많이 잡아먹고 있는지는 어떻게 확인할까요?

2.자원 사용량 모니터링 ( cpu / ram )

sudo apt-get install htop

명령어 : htop

사용자 친화적으로 모니터링을 할 수 있게 해주는 툴이라 많이 애용하는 편입니다.

이 정보를 토대로 어떤 프로세스가 자원을 많이 잡아먹고 있는지 확인이 가능하겠죠, 그리고 그 프로세스가 비정상적으로 자원을 잡아먹고 있다면, 그로 인해 서버가 느려지는 것이라는 걸 알 수 있게 됩니다.

이렇게 서버 내부에서 돌아가는 프로세스와 하드웨어 온도를 체크하셨음에도 문제가 없다면, 다음 단계로 넘어갑니다.

3.디스크 모니터링 (iotop)

sudo apt-get install iotop

명령어 : iotop

제 서버의 디스크 사용량입니다.

아무런 작업을 안하고있어서 DISK READ 와 DISK WRITE 부분이 변동이 없죠,

간단하게 apt update와 apt upgrade로 디스크가 작업을 할 수 있게 해보겠습니다.

위와 같이 디스크 쓰기 부분이 활성화되는 것을 알 수 있죠.

이것들을 모두 체크한다음

이번엔 네트워크 쪽을 살펴봐야합니다.

4.프로세스 트래픽 모니터링 (nethogs)

sudo apt-get install nethogs

명령어: nethogs (명령 인자를 추가하지 않으면 첫 번째 인터페이스를 모니터링합니다.)

(예: sudo nethogs eth0 / sudo nethogs 인터페이스이름)

이렇게 어떤 사용자의 PID 가 트래픽을 유발하고있는지 확인이 가능합니다.
(트래픽 측정을 위해 apt update와 upgrade를 사용 후 캡처한 사진입니다.)

그럼 만약 트래픽이 과도하게 발생되고있다면, 이것을 추적하는 방법을 찾아야겠죠?

5.네트워크 트래픽 모니터링(iftop)

sudo apt-get install iftop

명령어: iftop

(IP나 도메인 주소 같은 민감정보는 가렸습니다.)

보시면 어디에서 트래픽이 출발해서 어디에서 트래픽이 들어오는지

추적이 가능합니다.

위 정보들을 토대로 근본적인 원인을 찾고 해당 서비스의 로그분석등을 통해 원인을 찾아나갈 수 있게 됩니다.

감사합니다.

https://www.aiocp.co.kr/ ( 딥러닝,머신러닝 서버 판매 ,컨설팅) https://bigbangcloud.co.kr/ ( GPU 클라우드 서비스) ::: AI 서버의 모든것 ::: 인공지능의 시작~ (주)이호스트ICT

로그인 하시면 댓글을 남길 수 있습니다

쓰기

강좌게시판

쓰기

2/28

번호	제목Page 2/28	글쓴이	날짜	조회	추천
532	[CMM] 사진/동영상 자동 정리 프로그램 01 - 프로그램 소개 (4)	캔위드	2016-03	20965	2
[CMM] 사진/동영상 자동 정리 프로그램 01… (4) 2016-03 20965 1 캔위드
531	머신러닝(Tensorflow) 사용기 5 ( Deep MNIST for Experts) (14)	백만스물하나	2016-08	24002	6
머신러닝(Tensorflow) 사용기 5 ( Deep MN… (14) 2016-08 24002 1 백만스물하나
530	쉽고 심플한 NAS 운영체제, OpenMediaVault(OMV) 설치/세팅 가이드(1) - 설치편 (15)	김준연	2023-03	36407	13
쉽고 심플한 NAS 운영체제, OpenMediaVaul… (15) 2023-03 36407 1 김준연
529	DSM 업데이트 (DSM 5.0 -4493 Update 3) (4)	주영진영아빠	2014-07	23536	5
DSM 업데이트 (DSM 5.0 -4493 Update 3) (4) 2014-07 23536 1 주영진영아빠
528	[CMM] 사진/동영상 자동 정리 프로그램 02 - 프로그램 설치	캔위드	2016-03	11053	1
[CMM] 사진/동영상 자동 정리 프로그램 02… 2016-03 11053 1 캔위드
527	시놀로지 VMM에 안드로이드 7.1 설치하기 (6)	화정큐삼	2020-11	13614	1
시놀로지 VMM에 안드로이드 7.1 설치하기 (6) 2020-11 13614 1 화정큐삼
526	감사합니다!	oht993	2023-03	26282	0
감사합니다! 2023-03 26282 1 oht993
525	[CMM] 사진/동영상 자동 정리 프로그램 03 - 간단 사용법 (21)	캔위드	2016-03	12292	2
[CMM] 사진/동영상 자동 정리 프로그램 03… (21) 2016-03 12292 1 캔위드
524	CentOS 8에서 Alma Linux 마이그레이션	딥러닝서버	2022-04	9899	0
CentOS 8에서 Alma Linux 마이그레이션 2022-04 9899 1 딥러닝서버
523	파일질라 설정방법 (1)	turtl	2017-05	20661	4
파일질라 설정방법 (1) 2017-05 20661 1 turtl
522	HP Prodesk 400 G1 Mini CPU 제한 언락 강좌 (18)	스캔l민현기	2022-04	10785	6
HP Prodesk 400 G1 Mini CPU 제한 언락 강좌 (18) 2022-04 10785 1 스캔l민현기
521	[물개손에 축복을]콘덴셔 등 메인보드 수리시에..... 납제거 하기 힘드시죠? (20)	안형곤	2011-01	22705	2
[물개손에 축복을]콘덴셔 등 메인보드 수… (20) 2011-01 22705 1 안형곤
520	다양한 기능을 가진 Java 기반 FTP 서버 CrushFTP 소개.. (6)	turtl	2017-05	24190	5
다양한 기능을 가진 Java 기반 FTP 서버 C… (6) 2017-05 24190 1 turtl
519	Fusion-IO 벤더 OEM 제품의 타사 펌웨어 씌우기 (3)	RuBisCO	2019-05	13814	0
Fusion-IO 벤더 OEM 제품의 타사 펌웨어 … (3) 2019-05 13814 1 RuBisCO
518	Lenovo ThinkCentre M72e Tiny용 해킨토시 설치가이드 (23)	화정큐삼	2021-12	9770	6
Lenovo ThinkCentre M72e Tiny용 해킨토시… (23) 2021-12 9770 1 화정큐삼
517	여성학개론(1)... 여친만들기. (12)	황진우	2013-12	40776	6
여성학개론(1)... 여친만들기. (12) 2013-12 40776 1 황진우
516	유니비스트로 제작된 클로버 부트로더를 통한 해킨토시 카탈리나 간편설치 가이드 (17)	화정큐삼	2020-11	20308	12
유니비스트로 제작된 클로버 부트로더를 … (17) 2020-11 20308 1 화정큐삼
515	프로그램 개발강좌-3 (7)	황진우	2015-02	37908	9
프로그램 개발강좌-3 (7) 2015-02 37908 1 황진우
514	[필독] 최근 ffmpeg 다운받으신 분들 있다면 2월 13일 이전 버전으로 다시 받으셔야 … (2)	캔위드	2016-03	13188	6
[필독] 최근 ffmpeg 다운받으신 분들 있다… (2) 2016-03 13188 1 캔위드
513	[참고자료] How many cores does 3ds Max support? (1)	QS왕통키손…	2016-08	15681	2
[참고자료] How many cores does 3ds Max … (1) 2016-08 15681 1 QS왕통키손…