예를 들어서 물건의 배송이 대략 얼마걸리는지를 알아보기 위해 1년치 데이터를 기준으로 뽑아 보려고 하는데...
가끔씩 예외 조건으로 튀는 값들이 있어서 이게 평균계산에 오차를 일으키네요.
가령 대부분 3~4일이면되는데 간혹1일 100일 뭐 이런데이터가 있어서 전체 평균에 영향을 주는....
이런데이터를 제외하고 평균을 뽑고 싶은데....통계쪽에 이런거 구하는게 분명 있을거 같은데...
키워드라도 알려주시면 감사하겠습니다.
예를 들어서 물건의 배송이 대략 얼마걸리는지를 알아보기 위해 1년치 데이터를 기준으로 뽑아 보려고 하는데...
가끔씩 예외 조건으로 튀는 값들이 있어서 이게 평균계산에 오차를 일으키네요.
가령 대부분 3~4일이면되는데 간혹1일 100일 뭐 이런데이터가 있어서 전체 평균에 영향을 주는....
이런데이터를 제외하고 평균을 뽑고 싶은데....통계쪽에 이런거 구하는게 분명 있을거 같은데...
키워드라도 알려주시면 감사하겠습니다.
Á¦ÀÏ ¸¸Á·½º·¯¿î°ÍÀº ÀÌÀü±îÁö 50ȸ°ªÀÇ Æò±Õ°ª¿¡¼ ¾ó¸¶³ª ¹þ¾î³ª´Â°¡ ¹¹ ±×·±·ù¾ú½À´Ï´Ù
ÀÚ¼¼È÷´Â ±â¾ïÀÌ ¾È³ª³×¿ä
µµ¿òÀÌ ¸øµÇ Á˼ÛÇÕ´Ï´Ù ¤Ð¤Ð
Mean Standard Deviation ¶Ç´Â Mean Absolute Deviation À» ±¸ÇÏ¿© ±×°Í¿¡¼ ¹þ¾î³ª´Â ¼ýÀÚµéÀ» ¹ö¸®°í °è»êÇϴ°ÍÀÌ ´õ Á¤È®ÇÑ ¹æ¹ýÀ̱ä ÇÏÁö¸¸ ¾à½ÄÀ¸·Î Á¦°¡ ¾ð±ÞÇÑ ¹æ½ÄÀ¸·Î ÇÏ´Â °æ¿ìµéµµ ÀÖ½À´Ï´Ù.
Ȥ ¿¹»ó ¼öÄ¡ÀÇ range¸¦ ¸ð¸£´Â »óŶó¸é, óÀ½ºÎÅÍ Æò±ÕÀ» °è¼Ó ±¸ÇÏ¸é¼ (loop¿¡¼) ±× ´ÙÀ½ ¼ýÀÚ°¡ ±× Æò±Õ¿¡¼ ³Ê¹« ¸Õ¼ýÀÚÀÌ¸é ¹ö¸®°í ±ÙóÀÌ¸é ¶Ç Æò±Õ¿¡ ³Ö´Â ¹æ¹ýµµ ÀÖ½À´Ï´Ù. Æò±Õ°ú ´ë·«ÀÇ standard deviationÀ» °è¼Ó °è»êÇÏ´Â loopÀ» µ¹¸®¸é¼ °Å±â¼ if ¸¦ ½á¼ Çϴ°ÅÁÒ.
pseudo code·Î ¾²¸é ´ëÃæ ¾Æ·¡¿Í ºñ½Á ÇÏÁö ¾ÊÀ»±î¿ä? ·ÎÁ÷Àº Á» È®ÀÎÇϼžßÇÒµíÇÕ´Ï´Ù ¤¾¤¾...
while loop (end of numbers)
{
if (mean - std_deviation < current_value < mean + std_deviation )
{
i = i + 1 ;
total = total + current_value ;
mean = current_value / i ;
total_deviation = total_deviation + squire_root ( (mean - current_value)^2 ) ;
std_deviation = total_deviation / i ;
}
}
±×·¸Áö ¾Ê°í, ´Ü¼øÈ÷ ±â´ë°ªÀ» °è»êÇϽô °ÍÀ̶ó¸é, Æò±Õ º¸´Ù´Â ÁßÀ§¼ö(median) ¸¦ »ç¿ëÇϼ¼¿ä.
üÁ¶ °æ±â Á¡¼ö ³»´Â °Í ó·³ sorting À» Çؼ »óÀ§ ¸îÇÁ·Î ÇÏÀ§ ¸îÇÁ·Î •û°í Æò±ÕÀ» ±¸Çصµ µÇ±¸¿ä.
±×¸®°í ¾Ë°í¸®ÁòµéÀÌ ÁÁ¾Æ¼ sortingÀ» Çϵç medianÀ» ÇÏµç »ó»óÇÏ´Â °Í º¸´Ù ½Ã°£Àº ¾ó¸¶ °É¸®Áö ¾ÊÀ» °Ì´Ï´Ù.