클라우드 환경에서의 데이터 분석 관련 문의

쓰기

클라우드 환경에서의 데이터 분석 관련 문의

2021-11

2021-11-18 09:44:29

조회 1590 추천 0

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다.

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다.

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다.

혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요

짧은글 일수록 신중하게.



술이 2021-11 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다. 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다.



제온프로 2021-11 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠.. 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠..

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

619/5693

번호	제목Page 619/5693	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (228)	백메가	2015-12	1556441	25
(광고) 단통법 시대의 인터넷가입 가이드(… (228) 2015-12 1556441 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (729)	정은준1	2014-05	5021102	0
[필독] 처음 오시는 분을 위한 안내 (729) 2014-05 5021102 1 정은준1
101494	미크로틱 rb750gr3 다운로드한계값이 50MByte 정도나오는게 맞나요? (8)	블랙펄	2018-06	4001	0
미크로틱 rb750gr3 다운로드한계값이 50MB… (8) 2018-06 4001 1 블랙펄
101493	WebDAV(IIS) 환경에서 office 파일을 열 경우 로그인창이 뜹니다. (3)	dragoune	2015-02	4575	0
WebDAV(IIS) 환경에서 office 파일을 열 … (3) 2015-02 4575 1 dragoune
101492	HP DL380e gen8 뒷면 2.5" 에서 부팅하는 방법은? (3)	MikroTik이진	2018-06	4867	0
HP DL380e gen8 뒷면 2.5" 에서 부… (3) 2018-06 4867 1 MikroTik이진
101491	보통 마더보드 팬 헤더는 개별적으로 몇 암페어까지 출력이 가능한가요? (10)	아름드리소…	2018-06	4830	0
보통 마더보드 팬 헤더는 개별적으로 몇 … (10) 2018-06 4830 1 아름드리소…
101490	사운드 설정에 대하여 잘 아시는분.... 5.1채널 설정 (5)	Sikieiki	2020-11	4433	0
사운드 설정에 대하여 잘 아시는분.... 5.… (5) 2020-11 4433 1 Sikieiki
101489	Hyper-V Server에서 Samba 권한 위임 어떻게 하나요? (2)	PiPPuuP	2015-02	4471	0
Hyper-V Server에서 Samba 권한 위임 어떻… (2) 2015-02 4471 1 PiPPuuP
101488	17인치 lcd 모니터의 사진과 같은 증상이 ad보드 때문일까요? (3)	스카이	2011-02	8428	0
17인치 lcd 모니터의 사진과 같은 증상이… (3) 2011-02 8428 1 스카이
101487	레노보 웍스 멜로디 에러 문의	가온누리I강…	2018-06	3468	0
레노보 웍스 멜로디 에러 문의 2018-06 3468 1 가온누리I강…
101486	2cpu 사이트가 이상하게 느려요. (4)	천외천oo노…	2016-04	4305	0
2cpu 사이트가 이상하게 느려요. (4) 2016-04 4305 1 천외천oo노…
101485	[ 32bit OS ] OS가 4GB의 물리적 메모리만 인식하는지요 ? (12)	전설속의미…	2017-04	7550	0
[ 32bit OS ] OS가 4GB의 물리적 메모리만… (12) 2017-04 7550 1 전설속의미…
101484	dell t7910 사이드 패널 부품번호 알려주세요 (5)	어랏	2018-07	3265	0
dell t7910 사이드 패널 부품번호 알려주… (5) 2018-07 3265 1 어랏
101483	dropbox처럼, 실시간으로 작동하는 동기화? 미러링 프로그램이 있을까요? (2)	고상현	2011-03	10374	0
dropbox처럼, 실시간으로 작동하는 동기… (2) 2011-03 10374 1 고상현
101482	납땜 해주실수 있는분 계시나요? (14)	일론머스크	2018-07	4963	0
납땜 해주실수 있는분 계시나요? (14) 2018-07 4963 1 일론머스크
101481	IP할당 질문있습니다 (14)	나는관제	2019-08	4982	0
IP할당 질문있습니다 (14) 2019-08 4982 1 나는관제
101480	첸브로 케이스 나사 질문 (16)	조병철	2015-02	6146	0
첸브로 케이스 나사 질문 (16) 2015-02 6146 1 조병철
101479	안녕하세요! 2670 듀얼 구성 찾아보다가 처음 질문 드립니다! (12)	비와서코털…	2016-04	5083	0
안녕하세요! 2670 듀얼 구성 찾아보다가 … (12) 2016-04 5083 1 비와서코털…
101478	조우연님 보시면 답변좀 부탁드립니다. (2)	방o효o문	2011-03	6348	0
조우연님 보시면 답변좀 부탁드립니다. (2) 2011-03 6348 1 방o효o문
101477	파워 문의 (10)	헌터D	01-29	1136	0
파워 문의 (10) 01-29 1136 1 헌터D
101476	Thinkstation D30의 그래픽카드 호환성 (2)	레종9	2016-05	3615	0
Thinkstation D30의 그래픽카드 호환성 (2) 2016-05 3615 1 레종9
101475	구글 크롬 사용법 (Ctrl + F 찾기) 질문입니다. (3)	CPU4	2022-06	3246	0
구글 크롬 사용법 (Ctrl + F 찾기) 질문입… (3) 2022-06 3246 1 CPU4