클라우드 환경에서의 데이터 분석 관련 문의

쓰기

클라우드 환경에서의 데이터 분석 관련 문의

2021-11

2021-11-18 09:44:29

조회 1601 추천 0

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다.

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다.

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다.

혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요

짧은글 일수록 신중하게.



술이 2021-11 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다. 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다.



제온프로 2021-11 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠.. 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠..

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

253/5696

번호	제목Page 253/5696	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (230)	백메가	2015-12	1565001	25
(광고) 단통법 시대의 인터넷가입 가이드(… (230) 2015-12 1565001 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (730)	정은준1	2014-05	5028410	0
[필독] 처음 오시는 분을 위한 안내 (730) 2014-05 5028410 1 정은준1
108862	영어회화 공부 인강(교과서+온라인학습)과 학원 둘중 선택고민중입니다. (32)	로벨리아	2023-11	1590	0
영어회화 공부 인강(교과서+온라인학습)과… (32) 2023-11 1590 1 로벨리아
108861	3.5mm-5.5mm 변환젠더 오프라인 매장 구매 (2)	piedPiper	02-06	1590	0
3.5mm-5.5mm 변환젠더 오프라인 매장 구매 (2) 02-06 1590 1 piedPiper
108860	e5-2690에서 최고사양으로 교체를 한다면 뭐까지 가능할까요? (6)	사식이	05-01	1590	0
e5-2690에서 최고사양으로 교체를 한다면 … (6) 05-01 1590 1 사식이
108859	"두낫콜"이 뭔가요 (3)	하셀호프	06-07	1590	0
"두낫콜"이 뭔가요 (3) 06-07 1590 1 하셀호프
108858	하드브라킷 어디 판매 할까요? (2)	행복하세	2022-06	1590	0
하드브라킷 어디 판매 할까요? (2) 2022-06 1590 1 행복하세
108857	PC 분배기 / 공유기 같은게 있을까요? (11)	다잡아	04-16	1590	0
PC 분배기 / 공유기 같은게 있을까요? (11) 04-16 1590 1 다잡아
108856	10G 연결 시, 파일 안 보이는 현상과 사파리에서의 속도 문제 질문입니다 (10)	회원	2023-02	1590	0
10G 연결 시, 파일 안 보이는 현상과 사파… (10) 2023-02 1590 1 회원
108855	스마트폰으로 하루종일 녹음하는 앱있나요 (5)	블루모션	05-20	1591	0
스마트폰으로 하루종일 녹음하는 앱있나요 (5) 05-20 1591 1 블루모션
108854	팩스를 상대방에 보내는데 폰으로받는앱 (13)	yummy	2023-05	1591	0
팩스를 상대방에 보내는데 폰으로받는앱 (13) 2023-05 1591 1 yummy
108853	우회로 유투브 프리미엄 쓰시는분들 중단되신적 있으신가요? (5)	osthek83	2023-02	1591	1
우회로 유투브 프리미엄 쓰시는분들 중단… (5) 2023-02 1591 1 osthek83
108852	주피터 설치는 일반 GPU 쓰는 것처럼, 앤비디아 젯슨 나노도 똑같나요? (2)	GPGPU	2021-11	1591	0
주피터 설치는 일반 GPU 쓰는 것처럼, 앤… (2) 2021-11 1591 1 GPGPU
108851	안녕하세요 혹시 win2003 server std 설치파일 구할수 있을까요? (3)	song05	2022-04	1591	0
안녕하세요 혹시 win2003 server std 설치… (3) 2022-04 1591 1 song05
108850	그래픽카드의 깡성능만 가장 잘 확인할 수 있는 벤치마크는 무엇일까요? (7)	drama	2022-09	1591	0
그래픽카드의 깡성능만 가장 잘 확인할 수… (7) 2022-09 1591 1 drama
108849	윈도우 10 작업표시줄 검색상자 먹통 (2)	꿩꿩꿩	05-23	1591	0
윈도우 10 작업표시줄 검색상자 먹통 (2) 05-23 1591 1 꿩꿩꿩
108848	해머기능만 고장난드릴 사용처가 있을까요 (9)	나나나나나	05-28	1591	0
해머기능만 고장난드릴 사용처가 있을까요 (9) 05-28 1591 1 나나나나나
108847	LED 전등용 SMD 모듈. (4)	엠브리오	2022-01	1591	0
LED 전등용 SMD 모듈. (4) 2022-01 1591 1 엠브리오
108846	슈마 SC745 신품 가격? (4)	atozztoa	2023-10	1591	0
슈마 SC745 신품 가격? (4) 2023-10 1591 1 atozztoa
108845	쿼드로 K5200으로 디아블로2 레저렉션이 될가요? (10)	짱님	2022-05	1591	0
쿼드로 K5200으로 디아블로2 레저렉션이 … (10) 2022-05 1591 1 짱님
108844	SMB 멀티채널에 대한 질문입니다. (10)	최창현	2023-11	1591	0
SMB 멀티채널에 대한 질문입니다. (10) 2023-11 1591 1 최창현
108843	usb로 전력분배 가능할까요?? (4)	컴박	2022-03	1591	0
usb로 전력분배 가능할까요?? (4) 2022-03 1591 1 컴박