클라우드 환경에서의 데이터 분석 관련 문의

쓰기

클라우드 환경에서의 데이터 분석 관련 문의

2021-11

2021-11-18 09:44:29

조회 1623 추천 0

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다.

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다.

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다.

혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요

짧은글 일수록 신중하게.



술이 2021-11 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다. 분석업무 MySQL을 쓰는데 있을지 모르겠지만 아예 없을겁니다. 분석 프로세스를 수행하는 DB서버들은 엄청 IO가 심합니다. 여기 대기업도 오라클과 티베로쪽만 봤습니다. 뭐 알겠지만 위 상황에서 트러블 해결할려면 아무리 MySQL이라고 할지라도 인건비만 억이상 들걸로 보입니다.



제온프로 2021-11 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠.. 작은 규모가 아니니 이제 부터는 제대로 해야죠.. 부분적으로 필요한 부분은 Oracle로 땡겨가서 작업해야죠.. -DATABASE 분리 쪼갬 -DATABASE 이전 -DB분석서버 확충(Local) -Local 이전 계획 수립 너무 비대해질때까지 AWS에 있었던 것은 아닌지.. 더 늦기 전에 빨리 해야죠..

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

258/5700

번호	제목Page 258/5700	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (230)	백메가	2015-12	1586455	25
(광고) 단통법 시대의 인터넷가입 가이드(… (230) 2015-12 1586455 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (732)	정은준1	2014-05	5050151	0
[필독] 처음 오시는 분을 위한 안내 (732) 2014-05 5050151 1 정은준1
108855	지식산업센터 서로 다른 호실간 네트워크 연결 문의 (13)	권태영	2022-03	1623	0
지식산업센터 서로 다른 호실간 네트워크 … (13) 2022-03 1623 1 권태영
108854	애플 스토어 포인트 관련	달광이	2023-07	1623	0
애플 스토어 포인트 관련 2023-07 1623 1 달광이
108853	ESXI 오류 관련해서 질문드려요.. (1)	컴맹주니	2023-05	1623	0
ESXI 오류 관련해서 질문드려요.. (1) 2023-05 1623 1 컴맹주니
108852	Crystal Diskinfo에선 "좋음"인데 노트북에서 테스트 시 에러 발생 (11)	펠릭	2024-03	1623	0
Crystal Diskinfo에선 "좋음"인… (11) 2024-03 1623 1 펠릭
108851	그래픽 카드 쿨링팬 문의 (3)	바다늑대	2021-11	1623	0
그래픽 카드 쿨링팬 문의 (3) 2021-11 1623 1 바다늑대
108850	라즈베리파이에 OMV를 설치했는데 왜 이렇게 나오는 건가죠? (4)	이매망량2	2024-05	1623	0
라즈베리파이에 OMV를 설치했는데 왜 이렇… (4) 2024-05 1623 1 이매망량2
108849	쿼드로 K5200으로 디아블로2 레저렉션이 될가요? (10)	짱님	2022-05	1623	0
쿼드로 K5200으로 디아블로2 레저렉션이 … (10) 2022-05 1623 1 짱님
108848	씽크패드 (중고노트북 냄새 없에는 방법을 알고 계시나요?) (3)	블루윙	2023-01	1623	0
씽크패드 (중고노트북 냄새 없에는 방법을… (3) 2023-01 1623 1 블루윙
108847	불안한 중국산 하드를 조금이나마 안전하게 만들려면 어떤 방법이 있을까요?? (28)	어훕	2023-11	1624	0
불안한 중국산 하드를 조금이나마 안전하… (28) 2023-11 1624 1 어훕
108846	클라우드 환경에서의 데이터 분석 관련 문의 (2)	Risingdream	2021-11	1624	0
클라우드 환경에서의 데이터 분석 관련 문의 (2) 2021-11 1624 1 Risingdream
108845	윈도우 10 업데이트를 완료할수 없습니다. 변경사항 취소중... 해결착 있을까요. (12)	pilsuni	2024-07	1624	0
윈도우 10 업데이트를 완료할수 없습니다… (12) 2024-07 1624 1 pilsuni
108844	고정된 3.5 hdd 자리에 ssd 설치 어떻게 하세요? (4)	씨퓨지퓨	2023-06	1624	0
고정된 3.5 hdd 자리에 ssd 설치 어떻게 … (4) 2023-06 1624 1 씨퓨지퓨
108843	알리발 Wifi 드라이버 다운로드 (8)	무법자	2023-01	1624	0
알리발 Wifi 드라이버 다운로드 (8) 2023-01 1624 1 무법자
108842	NVME pcie adaptor 추천	나우마크	2023-03	1624	0
NVME pcie adaptor 추천 2023-03 1624 1 나우마크
108841	9260-8i 레이드 HDD 교체 (8)	무법자	2023-02	1624	0
9260-8i 레이드 HDD 교체 (8) 2023-02 1624 1 무법자
108840	실리콘 쿼드 랜카드 평 아시는 분 계신가요? (11)	이매망량2	2023-12	1624	0
실리콘 쿼드 랜카드 평 아시는 분 계신가… (11) 2023-12 1624 1 이매망량2
108839	[문의] 모니터 AD보드 수리 잘하시는곳 추천좀 (11)	인생의로망	2023-12	1624	0
[문의] 모니터 AD보드 수리 잘하시는곳 추… (11) 2023-12 1624 1 인생의로망
108838	LSI 9280 24i 4e 사용 중인데 포맷 실패 이후 엄청난 beep 음에 관하여 질문드립니다. (4)	검은콩	2023-07	1624	0
LSI 9280 24i 4e 사용 중인데 포맷 실패 … (4) 2023-07 1624 1 검은콩
108837	PFSense vs. OPNSense (17)	아마데우쓰	2024-07	1624	0
PFSense vs. OPNSense (17) 2024-07 1624 1 아마데우쓰
108836	Proxmox VE에 Windows 10 설치 중 에러 0x8007025D (6)	신우섭	2024-06	1624	0
Proxmox VE에 Windows 10 설치 중 에러 0x… (6) 2024-06 1624 1 신우섭