안녕하세요. 회사 내부에서 서버 및 어플리케이션 모니터링 솔루션이 필요해서 확인을 하고 있는데, 혹시 제품 선정에 도움을 받고 싶어서 게시판에 문의 드립니다.
** 하려고 하는 것.
- 회사에 VMware HA 구성이 되어 있고, 가상화 물리서버 2대 호스트 및 스토리지로 구성되어 있음.
- VMware HA는 호스트1이 장애시 호스트2에서 VM을 기동하는 Fail Over 기능을 제공
- 다만, VM 자체의 어플리케이션 장애는 감지할 수 없어서, VM OS 재기동을 불가능 함.
* 어플리케이션 장애 종류 :
** 웹서비스 프로세스가 다운되어, 서비스가 불가능 한 상태
** 웹서비스 프로세스는 살아 있는데, Hang 이 걸려서 웹서비스를 못하는 상태
- 이런 서비스 장애를 감지하고, 서비스 재기동, 또는 OS 재부팅이 가능한 솔루션이 필요함.
** 필요한 기능
- 중요 서비스 프로세스 실행중, 다운 감지. 다운 감지시 서비스 Restart 기능 필요
- 서비스 프로세스 실행중이나, HANG (서비스를 할수 없는 좀비 상황) 감지를 할수 있게
스크립트를 넣을수 있는 기능 필요(MSSQL로 쿼리 & 결과값을 리턴 받는 등)
- DB 전용(MSSQL, 오라클, MySQL 등의 서비스 감시가 별도로 있는 제품
(없다면, 위의 스크립트로 상황 체크가 가능한 제품)
- 3분 이상 서비스 프로세스에 응답이 없거나 HANG 상태가 유지되면, 서버 OS 리부팅
- 외부 인터넷이 안되는 상황에서 감시가 되도록, 온프레미스 구축형 제품이어야 함.
- Windows 및 Linux 가 지원되는 제품
- 되도록이면 저렴하거나 라이센스에 문제없는 오픈소스 제품
관련된 솔루션 정보를 주시거나, 해당 솔루션 파트너사를 소개를 부탁드리겠습니다.
다만 Windows & Linux 지원은 비용과 직접적인 관련이 있습니다.
좋은 상용솔루션들 많이 있지만 예산을 모르면 함부로 추천 못하는 분야 입니다
그나마 쓰기 편한게 장미HA일겁니다. Application Server process 감지후 사후처리하는 기능은 있을겁니다.
물른 상용 솔루션 수준의 무언가를 보장하진 않지만 비용이 들지 않고, 커스터마이징은 가능합니다
리눅스 오픈소스 모니터링 솔루션도 있긴 한데 안써봐서 모르겠지만 써본사람 말로는 괜찮다고는 하네요.
참고하겠습니다.