강사명 | 차시 | 학습시간 | 샘플 |
---|---|---|---|
김동준 | 20 | 7 시간 |
본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다. |
한국어 자연어 처리 및 KoNLPy 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 KoNLPy 패키지 및 관련 라이브러리를 배우고자 하는 자 |
KoNLPy 패키지를 이용한 한국어 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 한국어를 분석할 수 있도록 목표한다 |
1. 강의개요 및 권장 학습순서와 한국어 분석 KoNLPY 2. 품사 분석을 통한 텍스트분석의 의미와 다양한 KoNLPY 형태소 분석기들 3. NLTK 패키지내 품사 분류표 - 암기하자 4. KoNLPY 설치시 필요한 것과 내pc에 설치하기 5. konlpy 형태소 분석기를 활용한 한국어 형태소 분석하기(1) 6. konlpy 형태소 분석기를 활용한 한국어 형태소 분석하기(2) 7. 한국어 형태소 분석의 어려움 및 자립형태소와 의존형태소 구분하기 8. KoNLPy에서 기본적으로 제공하는 말뭉치들 - kolaw, kobill 9. KoNLPy 말뭉치(corpus) 순회하면서 단어 수 및 중복제거한 명사 개수 구하기(1) 10. KoNLPy 말뭉치(corpus) 순회하면서 단어 수 및 중복제거한 명사 개수 구하기(2) 11. KoNLPy내 kobill 말뭉치 10개 텍스트파일별 품사 부착하기 - pos 태깅(1) 12. KoNLPy내 kobill 말뭉치 10개 텍스트파일별 품사 부착하기 - pos 태깅(2) 13. 한국어 동사 원형을 복원시켜서 출력하기 - stem 14. [하늘을 나는 종이비행기] 를 각 한국어 형태소 분석기는 어떻게 분석할까 15. 문재인 대통령 취임사 연설문 분석하기(1) 16. 문재인 대통령 취임사 연설문 분석하기(2) 17. 문재인 대통령 취임사 연설문 분석하기(3) 18. Counter() 함수를 이용하여 단어 빈도 수 계산하기 19. 단어구름(wordcloud)으로 출력 및 저장하기 20. KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(1) |