한문서에서 텍스트 단위로 많이 쓰인 글자수 표시 할수 있는 방법이 있나요?

   조회 5618   추천 0    


어떤 사이트 또는 블로그 같은 곳에 보면 텍스트가 많이 쓰인 숫자대로 크고 어두운 색으로 표현하고 있더라구요...


제가 설문조사를 해봤는데... 불만사항에 대한 내용을 접수 받았는데요...

많이 나온 텍스트를 카운팅 할 수 있는 방법이 있나요?


작성은 엑셀로 했지만 엑셀이나 워드로 변환은 가능하구요...

엑셀에서나 혹시 기능이 있다던지 웹페이지에 기능이 있는곳 있나요?


설명이 좀 뭐같아도 잘 이해하고 도움 주실분 ^^; 감사합니다~~~~
Big "OS"
짧은글 일수록 신중하게.
무아 2014-10
텍스트의 범위가 어디까지를 말하는 것인지요?
1글자?
띄워쓰기 단위의 문자열?
1단어? 단어가 된다면 형태소 분석 기능도 있어야 할겁니다.

DB를 만들고
원하는 범위가 정해지면 해당 범위 단위 파싱하고 파싱된 단위의 것이 없으면 insert 해주고 있으면 update (물론 카운트하는 변수를 증가시키면서) 하는 로직을 짜야할 것 같은데요.
그리고 해당 단위의 것이 있으면 비율을 계산해서 색을 바꿔 뿌려주게..
엑셀이나 워드 같은데선 못봤습니다.

http://blog.daum.net/statsas/17202648
요런 식으로 나오는 것들은 이미 많이 나와있는 듯 하고요.
     
띄워쓰기 단위의 문자열입니다^^;
유닉스 계열에서는 기본 프로그램 grep 같은 명령어로도 처리가 가능 한것 같더라구요...

저는 일반 txt 파일에서 많이 쓰인 문자열과 문자열 사용빈도를 구해보고 싶거든요...
사실은 중복된 단어와 빈도가 맞겠네요^^; 댓글 감사드립니다~
          
무아 2014-10
grep 으론 힘들 것 같고 pcre 같은 것과 db 조합이면 될 것 같습니다.


QnA
제목Page 2566/5713
2015-12   1711373   백메가
2014-05   5177934   정은준1
2007-09   5619   김태경(인천)
2017-01   5619   태성기김
2017-07   5619   탁영길
2008-10   5619   김은호
2005-12   5619   박종대
2014-10   5619   필드테스터
2009-04   5619   나비섬
2017-02   5619   개백수28호
2005-07   5619   손재현
2008-07   5619   엄기원
2006-04   5619   김근희
2005-07   5619   최민철
2008-03   5619   김태성
2012-01   5619   최민재
2011-10   5619   예관신규식
2012-11   5619   HEUo김용민
2005-11   5619   서태희
2006-10   5619   윤호용
2008-08   5619   강성화
2016-12   5619   이재용입니다