Ŭ¶ó¿ìµå ȯ°æ¿¡¼­ÀÇ µ¥ÀÌÅÍ ºÐ¼® °ü·Ã ¹®ÀÇ

   Á¶È¸ 1601   Ãßõ 0    

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다. 

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다. 

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다. 


혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
¼úÀÌ 2021-11
ºÐ¼®¾÷¹« MySQLÀ» ¾²´Âµ¥ ÀÖÀ»Áö ¸ð¸£°ÚÁö¸¸ ¾Æ¿¹ ¾øÀ»°Ì´Ï´Ù. ºÐ¼® ÇÁ·Î¼¼½º¸¦ ¼öÇàÇÏ´Â DB¼­¹öµéÀº ¾öû IO°¡ ½ÉÇÕ´Ï´Ù. ¿©±â ´ë±â¾÷µµ ¿À¶óŬ°ú Ƽº£·ÎÂʸ¸ ºÃ½À´Ï´Ù.
¹¹ ¾Ë°ÚÁö¸¸ À§ »óȲ¿¡¼­ Æ®·¯ºí ÇØ°áÇÒ·Á¸é ¾Æ¹«¸® MySQLÀ̶ó°í ÇÒÁö¶óµµ ÀΰǺñ¸¸ ¾ïÀÌ»ó µé°É·Î º¸ÀÔ´Ï´Ù.
ÀÛÀº ±Ô¸ð°¡ ¾Æ´Ï´Ï ÀÌÁ¦ ºÎÅÍ´Â
Á¦´ë·Î ÇؾßÁÒ..

ºÎºÐÀûÀ¸·Î ÇÊ¿äÇÑ ºÎºÐÀº Oracle·Î ¶¯°Ü°¡¼­ ÀÛ¾÷ÇؾßÁÒ..

-DATABASE ºÐ¸® ÂÉ°·
-DATABASE ÀÌÀü
-DBºÐ¼®¼­¹ö È®Ãæ(Local)
-Local ÀÌÀü °èȹ ¼ö¸³

³Ê¹« ºñ´ëÇØÁú¶§±îÁö AWS¿¡ ÀÖ¾ú´ø °ÍÀº ¾Æ´ÑÁö.. ´õ ´Ê±â Àü¿¡ »¡¸® ÇؾßÁÒ..


QnA
Á¦¸ñPage 253/5696
2015-12   1565001   ¹é¸Þ°¡
2014-05   5028410   Á¤ÀºÁØ1
2023-11   1590   ·Îº§¸®¾Æ
02-06   1590   piedPiper
05-01   1590   »ç½ÄÀÌ
06-07   1590   Çϼ¿È£ÇÁ
2022-06   1590   ÇູÇϼ¼
04-16   1590   ´ÙÀâ¾Æ
2023-02   1590   ȸ¿ø
05-20   1591   ºí·ç¸ð¼Ç
2023-05   1591   yummy
2023-02   1591   osthek83
2021-11   1591   GPGPU
2022-04   1591   song05
2022-09   1591   drama
05-23   1591   ²æ²æ²æ
05-28   1591   ³ª³ª³ª³ª³ª
2022-01   1591   ¿¥ºê¸®¿À
2023-10   1591   atozztoa
2022-05   1591   ¯´Ô
2023-11   1591   ÃÖâÇö
2022-03   1591   ÄĹÚ