Ŭ¶ó¿ìµå ȯ°æ¿¡¼­ÀÇ µ¥ÀÌÅÍ ºÐ¼® °ü·Ã ¹®ÀÇ

   Á¶È¸ 1623   Ãßõ 0    

안녕하세요. 현재 회사에서 aws를 사용 중이고 전체 데이터를 rds(aurora mysql)를 사용해서 서비스 중에 있습니다.

서비스 사용자는 약 10만명 정도 되고, 데이터 용량은 2tb에서 계속하여 증가 중에 있습니다. 문제는 용량보다는 건수인데요. 현재 약 10억건에서 급속도로 증가하고 있습니다. 아마 신기능 출시하면 데이터 용량도 기하급수적으로 증가하지 않을까 생각됩니다.

어찌됐던 현재 수준에서 rds와 s3로 어느정도 감당은 하고 있고 스케일업을 통해서 한동안 버틸 수는 있을 것 같습니다.

그런데 문제는 데이터 분석인데요. 복잡한 쿼리를 rds 에서 감당을 못합니다. Read replica를 만들어서 쿼리를 실행해도 수십분이 걸리거나 뻗어버리는 경우가 빈번해서 현재 분석 업무를 진행하지 못하고 있습니다. 

데이터를 로컬로 dump 뜨는 방법은 현재 망분리 등의 문제로 불가능한 상황입니다. 

때문에 athena, redshift를 알아보고 있는데 어느 방향이 맞는지 잘 모르겠습니다. 저희는 1) 대용량 데이터에 대한 복잡한 쿼리를 날려서 수분내 결과를 받아보고 싶은 니즈와 2) 추가적으로 머신러닝 모델 학습에 필요한 데이터를 간편하게 feeding하고 싶은 니즈가 있습니다. 


혹여나 경험이 있으신 분이 조언을 해주시면 너무나 감사하겠습니다.

안녕하세요
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
¼úÀÌ 2021-11
ºÐ¼®¾÷¹« MySQLÀ» ¾²´Âµ¥ ÀÖÀ»Áö ¸ð¸£°ÚÁö¸¸ ¾Æ¿¹ ¾øÀ»°Ì´Ï´Ù. ºÐ¼® ÇÁ·Î¼¼½º¸¦ ¼öÇàÇÏ´Â DB¼­¹öµéÀº ¾öû IO°¡ ½ÉÇÕ´Ï´Ù. ¿©±â ´ë±â¾÷µµ ¿À¶óŬ°ú Ƽº£·ÎÂʸ¸ ºÃ½À´Ï´Ù.
¹¹ ¾Ë°ÚÁö¸¸ À§ »óȲ¿¡¼­ Æ®·¯ºí ÇØ°áÇÒ·Á¸é ¾Æ¹«¸® MySQLÀ̶ó°í ÇÒÁö¶óµµ ÀΰǺñ¸¸ ¾ïÀÌ»ó µé°É·Î º¸ÀÔ´Ï´Ù.
ÀÛÀº ±Ô¸ð°¡ ¾Æ´Ï´Ï ÀÌÁ¦ ºÎÅÍ´Â
Á¦´ë·Î ÇؾßÁÒ..

ºÎºÐÀûÀ¸·Î ÇÊ¿äÇÑ ºÎºÐÀº Oracle·Î ¶¯°Ü°¡¼­ ÀÛ¾÷ÇؾßÁÒ..

-DATABASE ºÐ¸® ÂÉ°·
-DATABASE ÀÌÀü
-DBºÐ¼®¼­¹ö È®Ãæ(Local)
-Local ÀÌÀü °èȹ ¼ö¸³

³Ê¹« ºñ´ëÇØÁú¶§±îÁö AWS¿¡ ÀÖ¾ú´ø °ÍÀº ¾Æ´ÑÁö.. ´õ ´Ê±â Àü¿¡ »¡¸® ÇؾßÁÒ..


QnA
Á¦¸ñPage 258/5700
2015-12   1586455   ¹é¸Þ°¡
2014-05   5050151   Á¤ÀºÁØ1
2022-03   1623   ±ÇÅ¿µ
2023-07   1623   ´Þ±¤ÀÌ
2023-05   1623   ÄĸÍÁÖ´Ï
2024-03   1623   Æ縯
2021-11   1623   ¹Ù´Ù´Á´ë
2024-05   1623   À̸ŸÁ·®2
2022-05   1623   ¯´Ô
2023-01   1623   ºí·çÀ®
2023-11   1624   ¾îÄg
2021-11   1624   Risingdream
2024-07   1624   pilsuni
2023-06   1624   ¾¾Ç»ÁöÇ»
2023-01   1624   ¹«¹ýÀÚ
2023-03   1624   ³ª¿ì¸¶Å©
2023-02   1624   ¹«¹ýÀÚ
2023-12   1624   À̸ŸÁ·®2
2023-12   1624   ÀλýÀǷθÁ
2023-07   1624   °ËÀºÄá
2024-07   1624   ¾Æ¸¶µ¥¿ì¾²
2024-06   1624   ½Å¿ì¼·