클라우드 환경에서의 데이터 분석 관련 문의

쓰기

클라우드 환경에서의 데이터 분석 관련 문의

2021-11

2021-11-18 09:44:29

조회 1916 추천 0

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다.

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다.

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다.

혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요

짧은글 일수록 신중하게.



술이 2021-11 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다. 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다.



제온프로 2021-11 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠.. 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠..

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

661/5729

번호	제목Page 661/5729	글쓴이	날짜	조회	추천
	[필독] 처음 오시는 분을 위한 안내 (737)	정은준1	2014-05	5258327	0
[필독] 처음 오시는 분을 위한 안내 (737) 2014-05 5258327 1 정은준1
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1783161	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1783161 1 백메가
101362	[ 파이썬 - 추천 문의 ] 네트워크 장비 설정 자동화 및 소켓 프로그래밍 (3)	전설속의미…	2021-09	2786	0
[ 파이썬 - 추천 문의 ] 네트워크 장비 설… (3) 2021-09 2786 1 전설속의미…
101361	용산에 밥사먹을곳좀 있으면 추천좀.... (4)	FreeBSD	2019-12	2786	0
용산에 밥사먹을곳좀 있으면 추천좀.... (4) 2019-12 2786 1 FreeBSD
101360	pm9a1 을 구매후.. 펌웨어를 업뎃하려고 했는데요 ㅠㅠ... (7)	천번둥개	2023-03	2786	0
pm9a1 을 구매후.. 펌웨어를 업뎃하려고 … (7) 2023-03 2786 1 천번둥개
101359	델 M6600에서 혹시 3800시리즈 CPU가 호환이 될까요? (6)	신은왜	2019-05	2786	0
델 M6600에서 혹시 3800시리즈 CPU가 호환… (6) 2019-05 2786 1 신은왜
101358	이 제품 쓸만한 할까요? (5)	늘파란	2020-02	2786	0
이 제품 쓸만한 할까요? (5) 2020-02 2786 1 늘파란
101357	FTP 파일질라 서버 접속 윈도우는 되고 리눅스는 안되는 경우 (5)	검은구룡	2020-07	2786	0
FTP 파일질라 서버 접속 윈도우는 되고 리… (5) 2020-07 2786 1 검은구룡
101356	rp5800 펌업후 부팅불가 (2)	파리대왕	2020-01	2786	0
rp5800 펌업후 부팅불가 (2) 2020-01 2786 1 파리대왕
101355	DELL T30 ram호환 문의 드립니다. (1)	우유먹는사습	2019-06	2786	0
DELL T30 ram호환 문의 드립니다. (1) 2019-06 2786 1 우유먹는사습
101354	시피유 질문드려봅니다. (5)	쌉맨트	2023-11	2787	0
시피유 질문드려봅니다. (5) 2023-11 2787 1 쌉맨트
101353	2cpu 사이트 레이아웃 (6)	heck	2020-03	2787	0
2cpu 사이트 레이아웃 (6) 2020-03 2787 1 heck
101352	이메일 서버 관련 DNS MX 설정 문의 드립니다. (5)	kcy72o8R	2019-03	2787	0
이메일 서버 관련 DNS MX 설정 문의 드립… (5) 2019-03 2787 1 kcy72o8R
101351	Loudness Equalization 이 뭔가요? (8)	LevinF	2022-12	2787	0
Loudness Equalization 이 뭔가요? (8) 2022-12 2787 1 LevinF
101350	윈도우 2008 R2 USB 제작 방법 (12)	일국	2023-02	2787	0
윈도우 2008 R2 USB 제작 방법 (12) 2023-02 2787 1 일국
101349	Dell R640 메모리 생산 연도에 따른 호환성? 문제 (7)	DLis	2023-04	2787	0
Dell R640 메모리 생산 연도에 따른 호환… (7) 2023-04 2787 1 DLis
101348	[해결] rclone 1.62.x 문제로 fuse3 설치가 필요합니다. (4)	azchoi	2023-03	2787	0
[해결] rclone 1.62.x 문제로 fuse3 설치… (4) 2023-03 2787 1 azchoi
101347	eurodk에서 공유기를 구매하면 비용이 얼마쯤 나올까요? (3)	ommn	2018-12	2787	0
eurodk에서 공유기를 구매하면 비용이 얼… (3) 2018-12 2787 1 ommn
101346	CineBench 이용시 CPU 사용량 77% 만 나와요	문영식	2021-10	2788	0
CineBench 이용시 CPU 사용량 77% 만 나와요 2021-10 2788 1 문영식
101345	요녀석을 뭐라부르나요? (3)	캡틴아메리카노	2020-03	2788	0
요녀석을 뭐라부르나요? (3) 2020-03 2788 1 캡틴아메리카노
101344	2.5Gbps 유선랜 호환성 문제. (8)	엠브리오	2024-05	2788	0
2.5Gbps 유선랜 호환성 문제. (8) 2024-05 2788 1 엠브리오
101343	시놀로지 스냅샷 질문 드립니다 (1)	전진	2020-11	2789	0
시놀로지 스냅샷 질문 드립니다 (1) 2020-11 2789 1 전진