본문 바로가기

Dev/Python

(16)
구글 Bard Api 오류!! SNlM0e value not found. Double-check __Secure-1PSID value or pass it as token='xxxxx'. 파이썬에서 구글 바드 API를 이용해서 잘 사용중에 있었는데... 갑자기... SNlM0e value not found. Double-check __Secure-1PSID value or pass it as token='xxxxx'. 메세지가.. 해결 방법은 크롬 새 시크릿 창 모드에서 재시작하고 다시 쿠키에서 값을 찾아서 넣어주면 처리가 된다!!!
[Python]URL 파라메터 추출(feat.urlparse) 크롤링을 하면서 파라메터에 따른 주소 창의 값들을 분석해야 하는 경우가 있다. 어떤키에 값이 있는지 체크를 할때 방법으로는 정규식으로 처리 또는 python 라이브러리인 urlparse를 사용하는 방법이다. urlparse를 사용하면 간단히 파라메터 값을 구할수 있다. 단 여기서 파라메터를 구하기 위해서는 get방식의 주소 값으로 되어 있어야 한다. http://example.com/test?id=xxx 이런식의 주소여야 한다. #URL 주소를 넣어줘야 한다. url_check = urlparse('http://www.example.com/test?id=1235') # parse_qsl 라이브러리르 통해서 분리 하고 dict로 저장 qs = dict(parse_qsl(url_check.query)) #q..
[python-library]py-hansepll 설치시 오류 한글 맞춤법 검사를 사용하기 위해 사용한 라이브러리 py-hanspell git 주소 github.com/ssut/py-hanspell ssut/py-hanspell 파이썬 한글 맞춤법 검사 라이브러리. (네이버 맞춤법 검사기 사용). Contribute to ssut/py-hanspell development by creating an account on GitHub. github.com 설치 방법은 2가지 방법이 있습니다. pip install 방법과 git으로 받아서 설치 방법 pip install 중 아래와 같은 오류가 발생하면 git clone으로 설치하면 됩니다. (Token) C:\Users\user\PycharmProjects\token>pip install py-hanspell Colle..
RuntimeError: The current Numpy installation (Feat.pandas-numpy) 판다스를 설치 후 갑자기 아래와 같은 오류가 발생했다. C:\Users\user\PycharmProjects\pythonOcrTest\venv\Scripts\python.exe C:/Users/user/PycharmProjects/pythonOcrTest/ocrTest/ocrTest.py Traceback (most recent call last): File "C:/Users/user/PycharmProjects/pythonOcrTest/ocrTest/ocrTest.py", line 1, in import pytesseract File "C:\Users\user\PycharmProjects\pythonOcrTest\venv\lib\site-packages\pytesseract\__init__.py", l..
python-웹크롤링(feat. BeautifulSoup)(한글깨짐 처리) 파이썬으로 웹 크롤링을 하고 있다. requests, BeautifulSoup 2개의 라이브러리를 통해서 구축을 하려고 한다. requests 라이브러리 사용 방법 - 설치 pip install requests - 소스 ## parser.py import requests ## HTTP GET Request req = requests.get('http://www.naver.com') ## html 소스 처리 html = req.text ## HTTP Header값 확인 header = req.headers ## HTTP Status 값 확인 (200: 정상) status = req.status_code ## HTTP처리 정상적 여부 (True/False) is_ok = req.ok 위의 처리로 하면 페이지..
Python-library [ wordninja ] / 단어분리(영어) 앞서 compound word 분리 방법인 hyphenate 라이브러리를 작성했었다. 비슷하지만 다른 라이브러리라 정리합니다. 간단히 설명하면 hyphenate는 wordninja는 작성기준으로 2.0.0이며 릴리즈일은 2019.08.10 임. 1. 설치 pip install wordninja 2. 사용방법 import wordninja wordninja.split('smartwatch') 간단한 샘플로 smartwatch를 검색했을 때 결괏값은 ['smart', 'watch']로 분리가 된다. 상세히 보면 단어 형태로 사전이 정의되어 있어서 단어를 추가하여 커스텀 화가 가능하다. 기본 세팅 값에서 korea를 검색 시 hyphenate에서는 kor, ea로 구분되는 반해 wordninja는 korea로..
Python-library [ hyphenate] / 단어분리(영어) 단어 토큰화를 하면서 단어 분리를 해야 하는 경우가 많다. 또한 복합어가 있어서 분류가 되어야 하는데 어려운 점이 있다. 영어 단어를 분리할 때 사용한다. 만약 smartwatch라는 단어가 있다고 했을 때 단어를 smart watch 이렇게 분리해야 하는 경우가 있다. 라이브러리를 보면 패턴을 통해서 분류 하고 있다. 사용한 라이브러리는 hyphyphenate 작성기준으로 1.1.0 버전이며 최근 릴리즈된 날짜는 2016.12.21. 1. 라이브러리 설치 pip install hyphenate 2. 사용 방법 from hyphenate import hyphenate_word print( hyphenate_word("smartwatch")) 사용 방법은 간단하다. 라이브러리 임포트 후 실행 끝. 결과는 ..
Python-library[word2word]-단어번역 python 자연어를 하면서 알게 된 라이브러리입니다. word2word는 단어를 번역하여 표시하게 됩니다. word2words는 3,564개의 쌍으로 단어 번역을 쉽게 사용할 수 있습니다. - 62개 고유 언어의 3,564개의 언어 쌍에 대해 자유롭고 공개적으로 사용할 수 있는 2개 언어 어휘 모음 - 코퍼스를 커스텀화 해서 사용가능. - 멀티 프로세스 지원. 사용 가능한 언어는 아래에서 확인 가능해요. opus.nlpl.eu/OpenSubtitles2018.php OpenSubtitles Bottom-left triangle: download filesces = sentence alignments in XCES format leftmost column language IDs = tokenized co..