Ŭ¶ó¿ìµå ȯ°æ¿¡¼­ÀÇ µ¥ÀÌÅÍ ºÐ¼® °ü·Ã ¹®ÀÇ

   Á¶È¸ 1916   Ãßõ 0    

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다. 

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다. 

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다. 


혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요
ªÀº±Û Àϼö·Ï ½ÅÁßÇϰÔ.
¼úÀÌ 2021-11
ºÐ¼®¾÷¹« MySQLÀ» ¾²´Âµ¥ ÀÖÀ»Áö ¸ð¸£°ÚÁö¸¸ ¾Æ¿¹ ¾øÀ»°Ì´Ï´Ù. ºÐ¼® ÇÁ·Î¼¼½º¸¦ ¼öÇàÇÏ´Â DB¼­¹öµéÀº ¾öû IO°¡ ½ÉÇÕ´Ï´Ù. ¿©±â ´ë±â¾÷µµ ¿À¶óŬ°ú Ƽº£·ÎÂʸ¸ ºÃ½À´Ï´Ù.
¹¹ ¾Ë°ÚÁö¸¸ À§ »óȲ¿¡¼­ Æ®·¯ºí ÇØ°áÇÒ·Á¸é ¾Æ¹«¸® MySQLÀ̶ó°í ÇÒÁö¶óµµ ÀΰǺñ¸¸ ¾ïÀÌ»ó µé°É·Î º¸ÀÔ´Ï´Ù.
ÀÛÀº ±Ô¸ð°¡ ¾Æ´Ï´Ï ÀÌÁ¦ ºÎÅÍ´Â
Á¦´ë·Î ÇØ¾ßÁÒ..

ºÎºÐÀûÀ¸·Î ÇÊ¿äÇÑ ºÎºÐÀº Oracle·Î ¶¯°Ü°¡¼­ ÀÛ¾÷ÇØ¾ßÁÒ..

-DATABASE ºÐ¸® Âɰ·
-DATABASE ÀÌÀü
-DBºÐ¼®¼­¹ö È®Ãæ(Local)
-Local ÀÌÀü °èȹ ¼ö¸³

³Ê¹« ºñ´ëÇØÁú¶§±îÁö AWS¿¡ ÀÖ¾ú´ø °ÍÀº ¾Æ´ÑÁö.. ´õ ´Ê±â Àü¿¡ »¡¸® ÇØ¾ßÁÒ..


QnA
Á¦¸ñPage 661/5729
2014-05   5258327   Á¤ÀºÁØ1
2015-12   1783161   ¹é¸Þ°¡
2021-09   2786   Àü¼³¼ÓÀǹ̡¦
2019-12   2786   FreeBSD
2023-03   2786   õ¹øµÕ°³
2019-05   2786   ½ÅÀº¿Ö
2020-02   2786   ´ÃÆÄ¶õ
2020-07   2786   °ËÀº±¸·æ
2020-01   2786   ÆÄ¸®´ë¿Õ
2019-06   2786   ¿ìÀ¯¸Ô´Â»ç½À
2023-11   2787   ½Ô¸ÇÆ®
2020-03   2787   heck
2019-03   2787   kcy72o8R
2022-12   2787   LevinF
2023-02   2787   Àϱ¹
2023-04   2787   DLis
2023-03   2787   azchoi
2018-12   2787   ommn
2021-10   2788   ¹®¿µ½Ä
2020-03   2788   ĸƾ¾Æ¸Þ¸®Ä«³ë
2024-05   2788   ¿¥ºê¸®¿À
2020-11   2789   ÀüÁø