클라우드 환경에서의 데이터 분석 관련 문의

쓰기

클라우드 환경에서의 데이터 분석 관련 문의

2021-11

2021-11-18 09:44:29

조회 1527 추천 0

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다.

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다.

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다.

혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요

짧은글 일수록 신중하게.



술이 2021-11 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다. 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다.



제온프로 2021-11 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠.. 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠..

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

250/5688

번호	제목Page 250/5688	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (228)	백메가	2015-12	1535289	25
(광고) 단통법 시대의 인터넷가입 가이드(… (228) 2015-12 1535289 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (728)	정은준1	2014-05	4999472	0
[필독] 처음 오시는 분을 위한 안내 (728) 2014-05 4999472 1 정은준1
108761	후지쯔 RX100 S8 iRMC 로그인 오류 관련 질문드립니다 (3)	alphq6489	2023-11	1529	0
후지쯔 RX100 S8 iRMC 로그인 오류 관련 … (3) 2023-11 1529 1 alphq6489
108760	z9pe-d16 nvme부팅성공했어요~~ (3)	듀얼CPU초보	2022-07	1529	0
z9pe-d16 nvme부팅성공했어요~~ (3) 2022-07 1529 1 듀얼CPU초보
108759	노트북 메인보드가 또 나간것 같습니다. 어느부분이 문제일까요? (5)	화정큐삼	2022-10	1529	0
노트북 메인보드가 또 나간것 같습니다. … (5) 2022-10 1529 1 화정큐삼
108758	홈페이지 자동이동 막을 수 있나요 ? (6)	COER	2023-09	1529	0
홈페이지 자동이동 막을 수 있나요 ? (6) 2023-09 1529 1 COER
108757	4tb 4개 레이드 5 리빌드 시간 얼마나 걸리나요? (11)	청춘	2023-04	1529	0
4tb 4개 레이드 5 리빌드 시간 얼마나 걸… (11) 2023-04 1529 1 청춘
108756	"두낫콜"이 뭔가요 (3)	하셀호프	06-07	1529	0
"두낫콜"이 뭔가요 (3) 06-07 1529 1 하셀호프
108755	갑자기 윈도우 10이 버벅버벅하네요 (3)	정진환	2022-03	1530	0
갑자기 윈도우 10이 버벅버벅하네요 (3) 2022-03 1530 1 정진환
108754	리눅스에서 12세대 데스크탑 e코어랑 노트북CPU e코어랑 다른가여? (5)	비빔밥빔비	2023-06	1530	0
리눅스에서 12세대 데스크탑 e코어랑 노트… (5) 2023-06 1530 1 비빔밥빔비
108753	전자기기의 ac전원을 자체를 제어해도 괜찮은가요? (8)	spndisk	2023-02	1530	0
전자기기의 ac전원을 자체를 제어해도 괜… (8) 2023-02 1530 1 spndisk
108752	인텔 듀얼 랜카드 PRO/1000PT 문의 (MAC address) (4)	블루2014	2022-12	1530	0
인텔 듀얼 랜카드 PRO/1000PT 문의 (MAC a… (4) 2022-12 1530 1 블루2014
108751	PCIe 1x 슬롯 3개짜리 확장해서 메인보드옆에 나란히 설치할수있는 보드가 있을가요? (12)	로벨리아	2023-12	1530	0
PCIe 1x 슬롯 3개짜리 확장해서 메인보드… (12) 2023-12 1530 1 로벨리아
108750	30x30 프로파일 벽 거치부속물 적당한게 있을까요? (6)	강한구	2023-02	1530	0
30x30 프로파일 벽 거치부속물 적당한게 … (6) 2023-02 1530 1 강한구
108749	바이오스 고수님들 도와주세요! (4)	삼성컴유저	03-10	1530	0
바이오스 고수님들 도와주세요! (4) 03-10 1530 1 삼성컴유저
108748	멀티 채널 구성문의 (6)	청춘	2022-11	1530	0
멀티 채널 구성문의 (6) 2022-11 1530 1 청춘
108747	바이오스 업데이트하다가 갑자기 전원이 꺼져서 먹통됬는� (10)	나나나나나	02-20	1530	0
바이오스 업데이트하다가 갑자기 전원이 … (10) 02-20 1530 1 나나나나나
108746	공유기 flash memory에 대해서 궁금합니다. (3)	쌉맨트	2022-09	1530	0
공유기 flash memory에 대해서 궁금합니다. (3) 2022-09 1530 1 쌉맨트
108745	저 사양 컴퓨터에서 윈도우 10 사용시 속도 올리는 팁 아시는분 (9)	씨엔	2022-08	1530	0
저 사양 컴퓨터에서 윈도우 10 사용시 속… (9) 2022-08 1530 1 씨엔
108744	파이썬 왜 오류가 나는 걸까요? (13)	Sakura24	05-26	1530	0
파이썬 왜 오류가 나는 걸까요? (13) 05-26 1530 1 Sakura24
108743	ddr5-5600 삼성메모리 문의 (5)	헌터D	2023-12	1531	0
ddr5-5600 삼성메모리 문의 (5) 2023-12 1531 1 헌터D
108742	심심해서 멜라녹스 가입했더니 NAVERCORP라고 표시되고 장비리스트가 보입니다 (1)	현정사랑	2022-03	1531	0
심심해서 멜라녹스 가입했더니 NAVERCORP… (1) 2022-03 1531 1 현정사랑