python library (2) 썸네일형 리스트형 Python-library [ wordninja ] / 단어분리(영어) 앞서 compound word 분리 방법인 hyphenate 라이브러리를 작성했었다. 비슷하지만 다른 라이브러리라 정리합니다. 간단히 설명하면 hyphenate는 wordninja는 작성기준으로 2.0.0이며 릴리즈일은 2019.08.10 임. 1. 설치 pip install wordninja 2. 사용방법 import wordninja wordninja.split('smartwatch') 간단한 샘플로 smartwatch를 검색했을 때 결괏값은 ['smart', 'watch']로 분리가 된다. 상세히 보면 단어 형태로 사전이 정의되어 있어서 단어를 추가하여 커스텀 화가 가능하다. 기본 세팅 값에서 korea를 검색 시 hyphenate에서는 kor, ea로 구분되는 반해 wordninja는 korea로.. Python-library [ hyphenate] / 단어분리(영어) 단어 토큰화를 하면서 단어 분리를 해야 하는 경우가 많다. 또한 복합어가 있어서 분류가 되어야 하는데 어려운 점이 있다. 영어 단어를 분리할 때 사용한다. 만약 smartwatch라는 단어가 있다고 했을 때 단어를 smart watch 이렇게 분리해야 하는 경우가 있다. 라이브러리를 보면 패턴을 통해서 분류 하고 있다. 사용한 라이브러리는 hyphyphenate 작성기준으로 1.1.0 버전이며 최근 릴리즈된 날짜는 2016.12.21. 1. 라이브러리 설치 pip install hyphenate 2. 사용 방법 from hyphenate import hyphenate_word print( hyphenate_word("smartwatch")) 사용 방법은 간단하다. 라이브러리 임포트 후 실행 끝. 결과는 .. 이전 1 다음