딥러닝... 머신러닝... 데이터마이닝...

   조회 4236   추천 1    

과거에는 Machine Learning 이라고도 불렸고, 다른 용어로 DATA Mining이라고도 불렸습니다.


어떤 데이터를 처리하느냐에 따라 알고리즘 및 패키지들은 많은 차이가 있습니다.


가장 고전적인 방식이 Decision Tree 방식이죠. 이를 활용한 공개 Software가 C4.5 (씨포닷파이브 라고 읽습니다.) 였고 실제로 지금도 쓰여지고 있습니다. SPSS Clementine Package 및 SAS Enterprise Miner 도 Decision Tree 방식의 알고리즘을 사용합니다. 개인적으로는 C4.5 및 SAS Enterprise Miner를 사용한 연구를 진행한 적이 있습니다. 


최근 들어 각광받고 있는 것은 Neural Network 를 이용한 Deep learning 이고, google 의 tensorflow 가 가장 잘 알려진 예라고 할 수 있겠습니다. 


무조건 Neural Network를 활용하는 것이 정답은 아닙니다. 내가 분석하려는 데이터의 특성을 잘 알아야 합니다. 그리고 그에 맞는 방법론을 선택해야 합니다.


제 경우는 초음파 영상을 분석하기 위해 Tensorflow를 사용하기로 결정하고 테스트 중인데, 테스트 결과는 나쁘지 않습니다.

제 머신의 사양은 E5-2670 1ea + GTX 1060 6GB 1ea + 256G SSD + 48G Memory 입니다만, 100기가 가량의 영상 자료 분석 잘 해내고 있습니다. 

좀더 자세한 사항은 논문을 발표한 이후에 알려드리도록 하겠습니다. 

저도 원하는걸 해볼 수 있게 계획하고 코딩할 시간이 좀 있었으면 좋겠는데, 요즘 일이 바빠 도저히 시간이 안나네요. echocardiograph나 FAST 관련 영상 분석 이실거 같은데 굉장히 궁금합니다.. CNN으로 분석 하셨는지.. 데이터 뻥튀기 기법들은 뭘 쓰셨는지.. 다음글 기다리겠습니다..
     
악마라네 2017-03
ㅎㅎㅎ. ECHO나 FAST 아닙니다.

좀 기괴한걸 하고 있습니다. (사실, 이젠 다 정립 된 이론임에도, 기존 초음파 하시던 분들은 잘 인정안해주시죠.)
Lung US 관련 입니다.
          
pneumo시 보는  lung sliding 혹은 pulmonary edema의 sea-shore appearance.. 2개 밖엔 모르겠네요 ㅎㅎ
               
악마라네 2017-03
음. 육안으로 구분이 어려운 Finding이 있는데, 이걸 Machine Learning 으로 학습시키면 둘을 구분할 수 있을까? 하는 아이디어에서 시작한겁니다.
                    
NickName123 2017-03
라디오믹스가 생각나네요.
이하나 2017-03
요즘 관심이 많고 얼마 전에 이 분야로 사업 설명회도 다녀왔는데 다음 글 기다리겠습니다.
한방인생 2017-03
지금 근무하는 회사에서도 TensorFlow를 이용해서 여러가지를 활용중에 있습니다.
테스트 PC로 GTX 1060 6GB 꼽혀 있는걸 개개인이 가지고 있고,
학습용으로는 GTX 1080 8GB 2개 꼽혀 있는 것과 4개 꼽혀 있는 것을 사용중입니다.(4개짜리는 도커로 환경 세팅해서 활용중)
저희는 이미지를 주로 취급하다 보니 SSD랑 HDD는 여유 있게 용량 잡아서 사용중입니다.

예를 들어서 이미지 분류기를 만들기 위해서 TensorFlow의 SLIM을 이용해서 inception_v3 모델을 이용해서 학습하는데,
학습된 이미지에 대한 유사한 이미지를 넣으면 분류가 상당히 잘 되는 편입니다.
때로는 사람이 지정했었던 학습용 이미지가 애매할 경우, 사람보다 더 좋은 결과(사람의 실수)를 보여주기도 합니다.

머신러닝 관련해서 나름의 연구를 진행중이지만, 하면서 느끼는 점은 얼마나 데이터의 특성을 잘 파악하느냐인것 같습니다.
요즘 도구는 워낙 많아서 가장 적합한걸 가져다 쓰면 됩니다.

다만, 하나 경계해야하는건, 도구만 있으면 결과가 금방 나올 것이라고 예단하는 것인데, 잘 모르면 그럴수 있긴 하지만, 그렇지 않다는것도 알아야 하는거죠.
     
악마라네 2017-03
맞습니다. 데이타의 특징을 파악하는게 가장 중요합니다. 특성에 따라 어떤 기법을 쓸거냐를 결정하는게... 제일 중요하다고 생각합니다.




제목Page 6/7
2014-05   2916515   정은준1
2015-12   12811   백메가
2017-04   4825   백만스물하나
2017-04   3651   백만스물하나
2017-04   9418   stones
2017-04   3684   승후니도쿄
2017-04   3247   하셀호프
2017-04   3945   승후니도쿄
2017-04   2975   승후니도쿄
2017-04   2712   백만스물하나
2017-04   2212   백만스물하나
2017-04   3727   김은호
2017-04   6281   lymee
2017-04   3252   kcy72o8R
2017-04   5333   백만스물하나
2017-03   3588   분당김동수
2017-03   6016   한방인생
2017-03   3868   백만스물하나
2017-03   2894   백만스물하나
2017-03   2782   하셀호프
2017-03   5957   백만스물하나
2017-03   2539   회원K