프레듀 원격평생교육원

과목정보

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.4_데이터수집 1

강사명 차시 학습시간 샘플
김동준 20 6 시간
모두보기
과정소개
학습대상
학습목표
학습내용

과정소개

본 과정은 텍스트마이닝을 위한 데이터수집에 대한 학습과정입니다. 영어나 또는 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 데이터를 수집해서 분석하는 경우가 많습니다. 이러한 데이터는 공개된 데이터를 기반으로도 하지만 목적이 있는 분석의 경우에는 대부분 직접 인터넷을 통해서 데이터수집을 해야합니다. 그러한 데이터수집을 어떻게 하는지에 대해서 학습하는 과정입니다.

학습대상

데이터수집 학습에 부담을 가지는 학습자 2. 빠른 시간에 데이터수집 및 관련 라이브러리를 배우고자 하는 자

학습목표

영어 및 한국어 텍스트 분석시 필요한 데이터수집을 인터넷으로 어떻게 하는지 학습하고 과정 이수 후 포털 사이트의 뉴스 기사 등을 스스로 할 수 있도록 목표한다

학습목표

1. 강의개요 및 권장 학습순서와 requests 라이브러리 설치
2. requests 라이브러리란
3. requests GET 방식 POST 방식 및 응답 상태 코드란
4. requests 실습(1) - GET 방식으로 서버에 요청넣고 응답받기
5. requests 실습(2) - POST 방식으로 서버에 요청넣고 응답받기
6. 종합실습
7. 응답 상태 코드에 따른 조건 처리
8. requests 테스트사이트 실습
9. 브라우저를 통한 헤더 정보 보기
10. 헤더정보에서 특정한 것만 보기
11. httpbin 테스트사이트를 통한 요청과 응답
12. 종합실습(1)
13. 종합실습(2)
14. 종합실습(3)
15. 클라이언트에서 서버로 데이터를 전송할 때, 서로 다른 Content-Type 설정값으로 보내기
16. 파일로 저장하기
17. 바이트 타입으로 리턴받아 파일로 저장하기
18. Beautiful soup이란 무엇이고 사용해야 하는 이유와 설치하기
19. 크롤링을 하기 위한 Beautiful soup의 다양한 검색 방법 익히기(1)
20. 크롤링을 하기 위한 Beautiful soup의 다양한 검색 방법 익히기(2)