Ŭ¶ó¿ìµå ȯ°æ¿¡¼­ÀÇ µ¥ÀÌÅÍ ºÐ¼® °ü·Ã ¹®ÀÇ

   Á¶È¸ 1486   Ãßõ 0    

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다. 

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다. 

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다. 


혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
¼úÀÌ 2021-11
ºÐ¼®¾÷¹« MySQLÀ» ¾²´Âµ¥ ÀÖÀ»Áö ¸ð¸£°ÚÁö¸¸ ¾Æ¿¹ ¾øÀ»°Ì´Ï´Ù. ºÐ¼® ÇÁ·Î¼¼½º¸¦ ¼öÇàÇÏ´Â DB¼­¹öµéÀº ¾öû IO°¡ ½ÉÇÕ´Ï´Ù. ¿©±â ´ë±â¾÷µµ ¿À¶óŬ°ú Ƽº£·ÎÂʸ¸ ºÃ½À´Ï´Ù.
¹¹ ¾Ë°ÚÁö¸¸ À§ »óȲ¿¡¼­ Æ®·¯ºí ÇØ°áÇÒ·Á¸é ¾Æ¹«¸® MySQLÀ̶ó°í ÇÒÁö¶óµµ ÀΰǺñ¸¸ ¾ïÀÌ»ó µé°É·Î º¸ÀÔ´Ï´Ù.
ÀÛÀº ±Ô¸ð°¡ ¾Æ´Ï´Ï ÀÌÁ¦ ºÎÅÍ´Â
Á¦´ë·Î ÇؾßÁÒ..

ºÎºÐÀûÀ¸·Î ÇÊ¿äÇÑ ºÎºÐÀº Oracle·Î ¶¯°Ü°¡¼­ ÀÛ¾÷ÇؾßÁÒ..

-DATABASE ºÐ¸® ÂÉ°·
-DATABASE ÀÌÀü
-DBºÐ¼®¼­¹ö È®Ãæ(Local)
-Local ÀÌÀü °èȹ ¼ö¸³

³Ê¹« ºñ´ëÇØÁú¶§±îÁö AWS¿¡ ÀÖ¾ú´ø °ÍÀº ¾Æ´ÑÁö.. ´õ ´Ê±â Àü¿¡ »¡¸® ÇؾßÁÒ..


QnA
Á¦¸ñPage 1177/5680
2014-05   4945295   Á¤ÀºÁØ1
2015-12   1481990   ¹é¸Þ°¡
2021-11   1487   Risingdream
2003-12   9470   ¿¹º´±â
2014-09   7363   ȸ¿øK
2003-12   9549   ½ÅÁÖ¿±
2018-02   3810   À̼±±Ô
2003-12   11098   À̼ºÁß
2010-02   17367   À嵿°Ç2014
2013-03   6175   ¿ì½Â°î
2016-01   3094   ¹Ì´ÏTM
2023-07   2528   ¾È³çÇϼ¼¿ä7
2014-10   4938   ³ªÆÄÀÌ°­½ÂÈÆ
2021-11   2706   ¼ö¼ö¼ö±ø
2006-07   5430   ÃÖÀϼ·
2016-12   5595   ÇູÇϼ¼
2020-07   5439   ºÒ¹«°ñ
2023-07   3626   À̸ŸÁ·®2
2006-08   4683   ±è¿ë¼ö_
2013-04   4962   ÀÌÀ±ÁÖ
2014-10   3874   ³ªÆÄÀÌ°­½ÂÈÆ
2016-12   3980   ÇÁ·ç½Ã¾È