Notice
Recent Posts
Recent Comments
Link
DevKim
[초보자를 위한 웹 크롤링 web crawling 기초 #1] 파이썬으로 웹 크롤링 시작하기 - 웹 크롤링이란? 본문
데이터 수집 [ Web crawling ]
[초보자를 위한 웹 크롤링 web crawling 기초 #1] 파이썬으로 웹 크롤링 시작하기 - 웹 크롤링이란?
on_doing 2020. 4. 20. 10:35728x90
본 포스팅은 파이썬3 버전을 기반으로 jupyter notebook을 사용합니다!
포스팅을 다짐하게된 이유
삼성화재 디지털마케팅교육 실습조교로 일하던때 웹크롤링에 대해 알게되었고 HTML 과 CSS, java script를 이미 배운적이 있는 나에게 파이썬으로 웹크롤링을 하는 과정이 그리 어렵게 느껴지지 않아 공부해보자고 다짐했다!!
웹크롤링은 최근 데이터 분석이 중요시되는 시점에서 비전공자들에게도 유용하다고 느꼈고 다른 코딩보단 비교적 쉽게 느껴져 잘 따라한다면 누구나 할 수 있다.
최대한 HTML 과 CSS를 모르는 초보자들을 위해 정말 기본적인것부터 차근차근 포스팅 해보려고한다 ㅎㅎ
※ 포스팅이 느릴수도있음..
1> 웹 크롤링이란 ?
- 인터넷 상에 있는 많은 자료(실시간 검색어,기사 댓글 등등)를 가져와 데이터분석에 쉬운 형태로 가공하는 작업이다. 한마디로 하자면 웹에 있는 내용들을 끌어오는것(크롤링)이다.
2> 웹 크롤링은 어디에 쓰일까?
- 웹크롤링은 데이터 수집, 마케팅 프로그램, 자동화작업 등 실제로 데이터를 많이 필요로 하는 분야에서 많이 쓰인다.
내가 참여했던 교육도 비전공자들을 위해 비교적 쉬운 파이썬 이라는 언어로 웹크롤링을 하는 프로젝트를 진행하였다. 비전공자들도 할 수 있는 코딩이기 때문에 차근차근 잘 따라오면 익숙해질것이다
다음 포스팅은 웹크롤링을 하기위한 기본 라이브러리 설치에 대해 알아보도록 하겠습니다
728x90
'데이터 수집 [ Web crawling ]' 카테고리의 다른 글
[Selenium] 간단한 실습 모음- 네이버 금융, SMB 환율 (0) | 2020.09.07 |
---|---|
[초보자를 위한 웹 크롤링 web crawling #5] 셀레니움설치/ 크롬드라이버 설치/ 셀레니움(selenium)으로 네이버 자동 로그인하기 실습 (0) | 2020.04.20 |
[초보자를 위한 웹 크롤링 web crawling #4] 네이버 영화 리뷰 크롤링 (0) | 2020.04.20 |
[초보자를 위한 웹 크롤링 web crawling #3] 네이버 실시간 검색순위 가져오기 (0) | 2020.04.20 |
[초보자를 위한 웹 크롤링 web crawling #2] 기본 라이브러리 설치 BeautifulSoup & requests (0) | 2020.04.20 |
Comments