일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- deeplearning
- git
- tab
- cs231n
- error
- slideshare
- linux
- computer_setting
- nlp
- review
- computer
- paper_review
- Ai
- Statistics
- gensim
- install
- Stanford
- github
- machinelearning
- Vim
- seq2seq
- terminal
- natural_language_processing
- cs224n
- json
- Standford
- text
- language_model
- code
- pip
- Today
- Total
목록text (2)
NLP/AI/Statistics
자연어처리의 많은 task에서 활용되는 데이터, 혹은 대용량 말뭉치에 대하여 소개한다. 1) NSMC 2) Wikipedia 3) KorQuAD 4) AI-Hub 5) 세종 말뭉치 6) KCC 뉴스 데이터 7) 이외의 오픈 데이터셋 1) NSMC: 네이버 영화평 데이터 (긍정/부정) - 이진 분류 task github.com/e9t/nsmc e9t/nsmc Naver sentiment movie corpus. Contribute to e9t/nsmc development by creating an account on GitHub. github.com 2) Wikipedia: 한국어 위키백과의 문서 데이터 ko.wikipedia.org/wiki/%EC%9C%84%ED%82%A4%EB%B0%B1%EA%B3%..
자연어처리는 텍스트 데이터를 처리하는 연구이다. NLP 파트에서는 크게 아래와 같이 설명할 예정이다. 1) 텍스트를 처리하는 방법 2) 자연어처리에서 활용되는 인공지능 모델 3) 자연어처리에서 주된 Task 1)번의 텍스트를 처리하는 방법은 주로 임베딩(embedding)에 관한 설명일 것으로 예상되며, 임베딩을 위한 Bag of Words 부터, TF-IDF, Word2Vec 등에 대하여 설명한다. 2)번의 자연어처리에서 활용되는 인공지능 모델은 특히나 최근에 각광받고 있는 인공지능에서의 자연어처리에 대하여 설명할 예정이고, 인공지능에서의 주된 자연어처리 기술인 RNN, LSTM, BERT 등에 대하여 정리한다. 3)번의 자연어처리에서 주된 Task에 대한 설명은 아마 2번의 모델 설명과 함께 언급될 ..