강사명 | 차시 | 학습시간 | 샘플 |
---|---|---|---|
김동준 | 16 | 5 시간 |
본 과정은 텍스트마이닝을 위한 정규식 re 과정입니다. 텍스트마이닝은 큰 범주에서 텍스트분석을 통해 여러 의미있는 정보를 도출해내는 과정이라고 말할 수 있습니다.그러한 과정에서 정규식의 사용은 텍스트분석에 있어서는 모르고서는 안되는 중요한 학습중에 하나입니다. 본 과정은 정규식의 기초부터 다양한 정규식까지 체계적으로 학습합니다. |
정규식 학습에 부담을 가지는 학습자 빠른 시간에 정규식 re 라이브러리를 배우고자 하는 자. |
정규식 문법에 자신감을 갖고 여러 다양한 정규식을 직접 짜고 분석할 수 있도록 목표한다. |
1. 과정개요 및 미니 테스트 2. 선수학습과 과정목표 3. 소스코드 전문 편집기 설치하기 4. 소스코드 전문 편집기 옵션 설정하기 5. 노트패드 플러그인 설치 및 테마 디자인과 여러 환경설정 바꿔주기 6. re 모듈을 이용한 패턴 검색 7. re 모듈을 이용한 검색시 원하는 값만 추출하기 8. re 모듈의 match 함수 3번째 인자 - re.I 9. re 모듈의 함수 3번째 인자 - re.S 10. Group 메서드와 인덱스를 사용하여 각 그룹별 문자열 반환하기 11. re 모듈의 다양한 함수 - match, findall, search 12. 정규식 특수문자와 메타문자의 사용법 및 의미 파악(1) 13. 정규식 특수문자와 메타문자의 사용법 및 의미 파악(2) 14. re 모듈을 이용한 정규식의 기초 - backslash 문제 15. re 모듈을 이용한 정규식의 기초 - raw 처리방식 이해 16. re 모듈을 이용한 정규식의 기초 - raw 정규식패턴 |