Æò±ÕÀ» ±¸ÇÏ·Á°í Çϴµ¥ °ªÀÌ Á» Æ¢´Â°Ô ÀÖÀ»¶§? Á¦¿ÜÇÏ°í °è»êÇϴ¹ý.

²¥¿ï   
   Á¶È¸ 8390   Ãßõ 1    

 예를 들어서 물건의 배송이 대략 얼마걸리는지를 알아보기 위해 1년치 데이터를 기준으로 뽑아 보려고 하는데...

가끔씩 예외 조건으로 튀는 값들이 있어서 이게 평균계산에 오차를 일으키네요. 

가령 대부분 3~4일이면되는데 간혹1일 100일 뭐 이런데이터가 있어서 전체 평균에 영향을 주는....

이런데이터를 제외하고 평균을 뽑고 싶은데....통계쪽에 이런거 구하는게 분명 있을거 같은데...

키워드라도 알려주시면 감사하겠습니다.

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
¿¡ºñ½¼ 2019-06
°áÃø°ª 󸮸¦ ÇÑ ÈÄ Åë°è µ¹¸®¸é µÉ°Å °°³×¿ä
     
²¥¿ï 2019-06
°áÃø°ªÀÌ ¹ºÁö °Ë»öÇغ¸´Ï Á» ¾Ë°Å °°Àºµ¥..¹®Á¦´Â ±× °áÃø°ªÀÌ ¾ó¸¶ÀÎÁö »Ì¾Æ³»´Â ·ÎÁ÷ÀÌ Àû´çÇÑ°Ô ¶°¿À¸£Áö ¾Ê³×¿ä.
±è»óÇõ2 2019-06
±âÁ¸¿¡ »ç¿ëÇϽôø µ¥ÀÌÅͼҽº (dbms,¿¢¼¿µéµî)°ú Åë°è¿¡»ç¿ëÇϽŠÇÁ·Î±×·¥ÀÌ ÀÖ´Ù¸é ÇÔ²² ¾Ë·ÁÁÖ½Ã´Â°Ô ´äº¯¿¡ µµ¿òÀÌ µÇ½Ç °Í °°½À´Ï´Ù
     
²¥¿ï 2019-06
µû·Î Åë°èÇÁ·Î±×·¥°°Àº°Ç ¾²Áö ¾Ê°í ÀÖ½À´Ï´Ù. °è»ê·ÎÁ÷ÀÌ ±Ã±ÝÇѰŶó DB´Â Å« ÀÇ¹Ì ¾øÀ»°Å °°±äÇÕ´Ï´Ù¸¸ ¿À¶óŬÀÔ´Ï´Ù.
¼­¿ÏÈ£ 2019-06
Àúµµ ±×·± °ªÀ» ±¸ÇÑ ÀûÀÌÀÖ¾ú´Âµ¥
Á¦ÀÏ ¸¸Á·½º·¯¿î°ÍÀº ÀÌÀü±îÁö 50ȸ°ªÀÇ Æò±Õ°ª¿¡¼­ ¾ó¸¶³ª ¹þ¾î³ª´Â°¡ ¹¹ ±×·±·ù¾ú½À´Ï´Ù
ÀÚ¼¼È÷´Â ±â¾ïÀÌ ¾È³ª³×¿ä

µµ¿òÀÌ ¸øµÇ Á˼ÛÇÕ´Ï´Ù ¤Ð¤Ð
Noman 2019-06
Æò±Õ¿¡ ¿µÇâÀ» ¹ÌÄ¥¼ö ÀÖ´Â ÀÚ·á´Â Ç¥ÁØÆíÂ÷¸¦ ±¸ÇÏ¿© ÆíÂ÷Ä¡°¡ Å«ÀڷḦ Á¦¿ÜÇÏ°í »ç¿ëÇß½À´Ï´Ù.
Àüü°ªµéÀ» sortÇÑ´ÙÀ½¿¡ lowest ¿Í highest ±×·ìÀ» Á¦¿ÜÇÑ ¼öµéÀÇ Æò±ÕÀ» ±¸ÇϸéµË´Ï´Ù.

Mean Standard Deviation ¶Ç´Â Mean Absolute Deviation À» ±¸ÇÏ¿© ±×°Í¿¡¼­ ¹þ¾î³ª´Â ¼ýÀÚµéÀ» ¹ö¸®°í °è»êÇϴ°ÍÀÌ ´õ Á¤È®ÇÑ ¹æ¹ýÀ̱ä ÇÏÁö¸¸ ¾à½ÄÀ¸·Î Á¦°¡ ¾ð±ÞÇÑ ¹æ½ÄÀ¸·Î ÇÏ´Â °æ¿ìµéµµ ÀÖ½À´Ï´Ù.
     
²¥¿ï 2019-06
µ¥ÀÌÅÍ°¡ ¸¹¾Æ¼­ sort¸¦ °É±âÀ§ÇØ ºÎÇÏ°¡ ²Ï °É¸®±ä Çϰڴµ¥ ÇöÀç Á¦¼öÁØ¿¡¼­´Â Á¦ÀÏ ÀÌÇØ°¡ ½±°í ±¸ÇöÀÌ ¿ëÀÌÇÑ°Å °°³×¿ä. ¼ÒÆ®ÈÄ »óÀ§ 5% ÇÏÀ§5%Á¤µµ °áÃø°ªÀ¸·Î Á¦¿ÜÇÏ°í Æò±ÕÀ» »Ì¾ÆºÁ¾ß°Ú½À´Ï´Ù.
          
µ¥ÀÌÅÍ°¡ ¸¹Àº °æ¿ìÀÌ°í ¿¹»ó¼öÄ¡°¡ ¾î¶² range¿¡ ÀÖ´Ù¸é, ÀÓÀÇ·Î max_valid ¿Í min_valid ¶ó´Â if statement¸¦ °É¾î¼­ ±× ¼ö´Â ¹ö¸®¸é µË´Ï´Ù.

Ȥ ¿¹»ó ¼öÄ¡ÀÇ range¸¦ ¸ð¸£´Â »óŶó¸é, óÀ½ºÎÅÍ Æò±ÕÀ» °è¼Ó ±¸Çϸ鼭 (loop¿¡¼­) ±× ´ÙÀ½ ¼ýÀÚ°¡ ±× Æò±Õ¿¡¼­ ³Ê¹« ¸Õ¼ýÀÚÀÌ¸é ¹ö¸®°í ±ÙóÀÌ¸é ¶Ç Æò±Õ¿¡ ³Ö´Â ¹æ¹ýµµ ÀÖ½À´Ï´Ù. Æò±Õ°ú ´ë·«ÀÇ standard deviationÀ» °è¼Ó °è»êÇÏ´Â loopÀ» µ¹¸®¸é¼­ °Å±â¼­ if ¸¦ ½á¼­ Çϴ°ÅÁÒ.

pseudo code·Î ¾²¸é  ´ëÃæ ¾Æ·¡¿Í ºñ½Á ÇÏÁö ¾ÊÀ»±î¿ä? ·ÎÁ÷Àº Á» È®ÀÎÇϼžßÇÒµíÇÕ´Ï´Ù ¤¾¤¾...

while loop (end of numbers)
{
  if (mean - std_deviation < current_value < mean + std_deviation )
  {
      i = i + 1 ;
      total = total + current_value ;
      mean = current_value / i ;
      total_deviation = total_deviation + squire_root ( (mean - current_value)^2 )  ;
      std_deviation = total_deviation / i ;
  }
}
ȸ±ÍºÐ¼® °°Àº °ÍÀ» ÀÌ¿ëÇϽô ¿ëµµ¶ó¸é, ÀÌ»óÄ¡ 󸮸¦ Çϼż­ ºÐ¼® ÀÛ¾÷À» ÁøÇà ÇÏ¼Å¾ß ÇÕ´Ï´Ù.
±×·¸Áö ¾Ê°í, ´Ü¼øÈ÷ ±â´ë°ªÀ» °è»êÇϽô °ÍÀ̶ó¸é, Æò±Õ º¸´Ù´Â ÁßÀ§¼ö(median) ¸¦ »ç¿ëÇϼ¼¿ä.
     
²¥¿ï 2019-06
°ú°Åµ¥ÀÌÅ͸¦ ÅëÇؼ­ ÇöÀç ¹è¼ÛÀϼö¸¦ ¿¹ÃøÇÏ·Á´Â ¿ëµµÀÔ´Ï´Ù. ÀÌÂü¿¡ ÁßÀ§¼ö ¾Ë¾Æ°©´Ï´Ù.
          
¹«¾Æ 2019-06
median °ªÀ» ¾²´Â °ÍÀÌ °¡Àå ÀûÇÕÇØ º¸ÀÔ´Ï´Ù.
üÁ¶ °æ±â Á¡¼ö ³»´Â °Í ó·³ sorting À» Çؼ­ »óÀ§ ¸îÇÁ·Î ÇÏÀ§ ¸îÇÁ·Î •û°í Æò±ÕÀ» ±¸Çصµ µÇ±¸¿ä.
±×¸®°í ¾Ë°í¸®ÁòµéÀÌ ÁÁ¾Æ¼­ sortingÀ» Çϵç medianÀ» ÇÏµç »ó»óÇÏ´Â °Í º¸´Ù ½Ã°£Àº ¾ó¸¶ °É¸®Áö ¾ÊÀ» °Ì´Ï´Ù.
º¯¼±ÁÖ 2019-06
boxplotÀ̳ª densitogram µîÀ¸·Î ÀÚ·á ºÐÆ÷¸¦ º» ÈÄ »óÀ§ ¹× ÇÏÀ§ ÀϺΠpercentileÀ» Á¦¿ÜÇÑ Áß°£ ºÎºÐÀÇ °ªÀ¸·Î Åë°èÄ¡¸¦ ÃßÁ¤ÇÏ½Ã¸é µÉ °Í °°½À´Ï´Ù.
±è¿ìÁø 2019-06
ÃÖ»óÀ§¿Í ÃÖÇÏÀ§ µ¥ÀÌŸ 3°³¾¿ °øÈ÷ Á¦¿ÜÇÏ°í °è»êÇϸé... (ÈÄ´Ù´Ú~)


QnA
Á¦¸ñPage 4083/5686
2014-05   4970516   Á¤ÀºÁØ1
2015-12   1506830   ¹é¸Þ°¡
2009-01   5273   ±èÀå¿ø
2019-06   8391   ²¥¿ï
2017-06   3372   ±è¹ÎöGC
2017-06   3343   ÀϷиӽºÅ©
2017-06   9179   À¸¶óÂ÷Â÷Â÷
2016-07   4458   ¸¼Àº¿©¸§
2017-07   3082   ¾öû³­x
2020-02   2437   ¼ÛÁö¸¸
2017-10   4584   Á¦ÀÌ·¹ºø
2017-03   4388   ¿¹°ü½Å±Ô½Ä
2019-10   3015   °¡»óÈ­°øºÎÁß
2017-05   5095   ¹Î»çÀå
03-20   1271   dateno1
2021-05   2405   GPGPU
2016-09   3542   ȸ¿øK
2017-10   4230   ¾îÄg
2010-01   7830   ¹Ú»ó¹ü
2016-12   4368   ±ô¦
2017-03   4587   ³ªÆÄÀÌ°­½ÂÈÆ
2016-05   5211   ȲÁø¿ì