본문 바로가기

Dev/Python

Python-library[word2word]-단어번역

728x90
반응형

python 자연어를 하면서 알게 된 라이브러리입니다.

word2word는 단어를 번역하여 표시하게 됩니다.

 

word2words는 3,564개의 쌍으로 단어 번역을 쉽게 사용할 수 있습니다.

 

- 62개 고유 언어의 3,564개의 언어 쌍에 대해 자유롭고 공개적으로 사용할 수 있는 2개 언어 어휘 모음

- 코퍼스를 커스텀화 해서 사용가능.

- 멀티 프로세스 지원.

 

사용 가능한 언어는 아래에서 확인 가능해요.

opus.nlpl.eu/OpenSubtitles2018.php

 

OpenSubtitles

Bottom-left triangle: download filesces = sentence alignments in XCES format leftmost column language IDs = tokenized corpus files in XML TMX and plain text files (Moses): see "Statistics" below lower row language IDs = parsed corpus files (if they exist)U

opus.nlpl.eu

 

예를 들어 [apple]인 영문을 한국어로 한다면 ['사과', '캐러멜', '애플', '콩', '물으'] 라는 결과물이 나온다.

 

캐러멜과 콩, 물으가 나오는 건 왜인지 모르겠네요;;;

 

1. 라이브러리를 다운 받아요.

pip install word2word
or
git clone https://github.com/kakaobrain/word2word
python setup.py install

 

2. 라이브러리 사용 방법

from word2word import Word2word
en2kr = Word2word("en", "ko")

print(en2kr("apple"))

 

이러면 아까 위에서 예시한 단어들이 나와요~

 ['사과', '캐러멜', '애플', '콩', '물으']

 

sample을 넣어보니 ['샘플', '혈액', '채취', '표본', '분석'] 나오네요. 

 

 

자세한 정보는 아래에서 확인 가능해요.

pypi.org/project/word2word/

 

word2word

Easy-to-use word translations for 3,564 language pairs

pypi.org

 

728x90
반응형