자유게시판

파이썬을 이용한 워드클라우드 결과

분류: 수다, 글쓴이: 신현실주의, 20년 6월, 읽음: 82

 

 

브릿g에서는 개정판 연중이고, 문피아에서는 구버전 풀 연재한 제 글을 대상으로 파이썬 워드클라우드를 돌려봤습니다. 판타지라서 창작명사인 캐릭터 이름들이 많이 나오는군요.

돌리면서 느낀 소감은

1. 자기 글이 아니면 어렵다.

-등록된 사전을 기준으로 텍스트에 있는 글들을 분류하는 방식인데, 이게 좀 정확하지가 않습니다. 띄어쓰기에도 민감하고, 창작어나 신조어는 확인해서 없으면 넣어줘야 하고… 각 문장별로 추출된 명사나 형용사가 적합한지도 살펴봐야 합니다.

 

2. 조정이라는 이름의 노가다

-판타지라서 더 그런 것도 있겠습니다만, 이게 글쓴이 창작한 단어가 많거나 그러면 일일이 넣어줘야 합니다. 거기에 창작한 명사가 예알바고, 의미없는 형태소들 중에 알이 있으면 알을 못 지웁니다. 예알바라는 단어까지 같이 날라가니까요…

 

때문에 판타지보다는 일반 소설, 어반 판타지 같은 장르의 소설을 돌려 볼 때 더 엄정하게 나올 것 같습니다. 마침 제가 쓴 것 중에 열한번째 시간이라는 어반 판타지가 있으니, 이거로 확인하면 될 것 같네요.

혹시 파이썬이나 알을 좀 다루시는 분이 해당 과정 스크립트를 원하신다면 따로 보내드리겠습니다. 다른 분들 거 받아서 하는 건… 현재까지는 좀 어려워서 한 2~3분만 한정해서 좀 숙달되고 난 다음에 생각해보겠습니다.

신현실주의
목록