Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- nlp
- json
- linux
- computer_setting
- natural_language_processing
- cs231n
- error
- deeplearning
- gensim
- text
- review
- git
- Ai
- Vim
- seq2seq
- cs224n
- terminal
- paper_review
- Statistics
- pip
- code
- Stanford
- github
- install
- machinelearning
- computer
- language_model
- slideshare
- tab
- Standford
Archives
- Today
- Total
NLP/AI/Statistics
Natural Language Processing 본문
자연어처리는 텍스트 데이터를 처리하는 연구이다.
NLP 파트에서는 크게 아래와 같이 설명할 예정이다.
1) 텍스트를 처리하는 방법
2) 자연어처리에서 활용되는 인공지능 모델
3) 자연어처리에서 주된 Task
1)번의 텍스트를 처리하는 방법은 주로 임베딩(embedding)에 관한 설명일 것으로 예상되며,
임베딩을 위한 Bag of Words 부터, TF-IDF, Word2Vec 등에 대하여 설명한다.
2)번의 자연어처리에서 활용되는 인공지능 모델은 특히나 최근에 각광받고 있는 인공지능에서의 자연어처리에 대하여 설명할 예정이고, 인공지능에서의 주된 자연어처리 기술인 RNN, LSTM, BERT 등에 대하여 정리한다.
3)번의 자연어처리에서 주된 Task에 대한 설명은 아마 2번의 모델 설명과 함께 언급될 것이며,
주된 자연어처리의 task인 classification이 주로 언급될 것으로 예상된다.
classificatoin 이외에 machine translation, NER(named entity recognition) 등에 대한 task 별 특징 및 주된 기술에 대하여 정리할 예정이다.
'NLP' 카테고리의 다른 글
Smoothing 기법: Laplace(add-one) smoothing, Back-off smoothing (0) | 2020.10.06 |
---|---|
Language Model: N-gram 언어모델 (0) | 2020.09.29 |
Language Model: 통계적 언어 모델 (0) | 2020.09.29 |
Tokenization: 어절, 형태소, 음절, 자모 단위 토큰화 (0) | 2020.09.22 |
한국어 데이터셋 (0) | 2020.09.22 |
Comments