본문 바로가기

Dev

(70)
Python-library [ hyphenate] / 단어분리(영어) 단어 토큰화를 하면서 단어 분리를 해야 하는 경우가 많다. 또한 복합어가 있어서 분류가 되어야 하는데 어려운 점이 있다. 영어 단어를 분리할 때 사용한다. 만약 smartwatch라는 단어가 있다고 했을 때 단어를 smart watch 이렇게 분리해야 하는 경우가 있다. 라이브러리를 보면 패턴을 통해서 분류 하고 있다. 사용한 라이브러리는 hyphyphenate 작성기준으로 1.1.0 버전이며 최근 릴리즈된 날짜는 2016.12.21. 1. 라이브러리 설치 pip install hyphenate 2. 사용 방법 from hyphenate import hyphenate_word print( hyphenate_word("smartwatch")) 사용 방법은 간단하다. 라이브러리 임포트 후 실행 끝. 결과는 ..
Python-library[word2word]-단어번역 python 자연어를 하면서 알게 된 라이브러리입니다. word2word는 단어를 번역하여 표시하게 됩니다. word2words는 3,564개의 쌍으로 단어 번역을 쉽게 사용할 수 있습니다. - 62개 고유 언어의 3,564개의 언어 쌍에 대해 자유롭고 공개적으로 사용할 수 있는 2개 언어 어휘 모음 - 코퍼스를 커스텀화 해서 사용가능. - 멀티 프로세스 지원. 사용 가능한 언어는 아래에서 확인 가능해요. opus.nlpl.eu/OpenSubtitles2018.php OpenSubtitles Bottom-left triangle: download filesces = sentence alignments in XCES format leftmost column language IDs = tokenized co..
ios-Swift WebView 오류 프로젝트를 하게 됐는데.. 어떡하다 보니.. App개발을 해야 하게 됐다 ㅡ.ㅡ 그래서 공부중 오류가 발생 ㅜ.ㅜ 아.. 진짜.. ios 까지 하게 될줄이야... 암튼 머.. Swift를 사용해서 개발 공부중에 있다. 그중에 WebView를 사용하는데 문제가 발생한 부분을 정리해본다. ExceptionNSException *"Could not instantiate class named WKWebView because no class named WKWebView was found; the class needs to be defined in source code or linked in from a library (ensure the class is part of the correct target)"0x000..
Python 2차원 배열 데이터를 읽고 배열에 값을 넣는 방법입니다. 배열 초기화를 위해 선언 전역변수 선언시 사용 list = [] list = None 2차원 배열 값을 넣고 초기화시 num_cols = 행의 갯수 num_rows = 열의 개수 list = [[0 for i in range(num_cols)] for j in range(num_rows)] or list = [['' for i in range(num_cols)] for j in range(num_rows)] 이렇게 선언하게 되면 num_cols=5, num_rows=5라면 [[0,0,0,0,0], [0,0,0,0,0], [0,0,0,0,0], [0,0,0,0,0], [0,0,0,0,0]] 이렇게 list의 변수에 2차원 배열로 사용가능하게 된다. 톱니바퀴형 리..
Python 엑셀파일 다루기(Feat.openpyxl & xlrd) 프로그램을 하면 엑셀 파일을 파싱하는 작업을 하는 경우가 종종 있다. java에선 poi를 통해서 하면 되지만.. 파이썬은 처음인지라.... 찾아보니 openpyxl 라이브러리를 알게 되었다 사용법도 간단한거 같아 사용했다. 1. 라이브러리 설치 pip install openpyxl 이후는 임포트해서 사용하면 된다. 사용법은 아래와 같다. from openpyxl import load_workbook def excel_test(request) : file = request.FILES['fileInput'] print("upload File", file) wb = openpyxl.load_workbook(filename=file, data_only=True) sheet_ranges = wb['Sheet1'..
Django-DATABASES init_command 멀티 설정 Django에서 DB 설정을 하게 되면 init_command를 사용해야 한다. init_command를 하나만 설정하는 경우는 적다. 여러 개를 입력해야 하는 경우가 발생한다. 그런 경우 아래의 코드처럼 하면 된다. DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'share_res', 'USER': 'root', 'PASSWORD': 'apmsetup', 'HOST': '127.0.0.1', 'PORT': '3306', 'OPTIONS': { 'init_command': 'SET sql_mode="STRICT_TRANS_TABLES"; set storage_engine=InnoDB;', 'autocommit': Fals..
Django-Mysql 엔진 설정 django는 기본적으로 sqlite를 사용하고 있다. 또한 mysql을 디폴트로 설정을 하게 되면 models를 통해 Table 생성 시 기본 엔진은 MyISAM으로 설정되어 있다. DB 엔진에 대한 구분은 여기서 논하지 않겠습니다. Mysql Inno를 사용하기 위해서 설정하는 방법입니다. 설정은 settings.py에서 설정을 하게 됩니다. DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'share_res', 'USER': 'root', 'PASSWORD': 'apmsetup', 'HOST': '127.0.0.1', 'PORT': '3306' } } 기본적으로 설정한 DB 정보이다. 이부분에서 OPTION을 추가하여..
Django-한국시간 설정 Django(이하 장고)에서 기본 Time Zone은 UTC이다.. UTC는 협정세계 시간으로 국제 표준시간이라 보면 된다. 국제 표준시간으로 한국 시간을 보면 시차는 +9:00이다.. 한국 시간이 오후 5:32분이면 국제 표준 시간은 오전 8:32분 이다. 암튼.. 장고에서 한국 시간으로 설정을 해야 한다. 이유는 기본세팅인 UTC로 하게 되면 DB 저장시에도 UTC 시간으로 저장이 되기 때문이다. DB에서의 Time과는 다르다. 시간을 설정하는 곳은 프로젝트 위치치 settings.py를 수정해야 한다. 그럼 settings.py에서 TIME_ZONE = 'UTC' 부분을 => TIME_ZONE = 'Asia/Seoul' 으로 변경 그리고 USE_TZ = True의 값을 USE_TZ =False로변경..