DevKim

[초보자를 위한 웹 크롤링 web crawling 기초 #1] 파이썬으로 웹 크롤링 시작하기 - 웹 크롤링이란? 본문

데이터 수집 [ Web crawling ]

[초보자를 위한 웹 크롤링 web crawling 기초 #1] 파이썬으로 웹 크롤링 시작하기 - 웹 크롤링이란?

on_doing 2020. 4. 20. 10:35
728x90



본 포스팅은 파이썬3 버전을 기반으로 jupyter notebook을 사용합니다!


포스팅을 다짐하게된 이유
삼성화재 디지털마케팅교육 실습조교로 일하던때 웹크롤링에 대해 알게되었고 HTML 과 CSS, java script를 이미 배운적이 있는 나에게 파이썬으로 웹크롤링을 하는 과정이 그리 어렵게 느껴지지 않아 공부해보자고 다짐했다!!
웹크롤링은 최근 데이터 분석이 중요시되는 시점에서 비전공자들에게도 유용하다고 느꼈고 다른 코딩보단 비교적 쉽게 느껴져 잘 따라한다면 누구나 할 수 있다.

최대한 HTML 과 CSS를 모르는 초보자들을 위해 정말 기본적인것부터 차근차근 포스팅 해보려고한다 ㅎㅎ
※ 포스팅이 느릴수도있음..


1> 웹 크롤링이란 ?

- 인터넷 상에 있는 많은 자료(실시간 검색어,기사 댓글 등등)를 가져와 데이터분석에 쉬운 형태로 가공하는 작업이다. 한마디로 하자면 웹에 있는 내용들을 끌어오는것(크롤링)이다.

2> 웹 크롤링은 어디에 쓰일까?


- 웹크롤링은 데이터 수집, 마케팅 프로그램, 자동화작업 등 실제로 데이터를 많이 필요로 하는 분야에서 많이 쓰인다.

내가 참여했던 교육도 비전공자들을 위해 비교적 쉬운 파이썬 이라는 언어로 웹크롤링을 하는 프로젝트를 진행하였다. 비전공자들도 할 수 있는 코딩이기 때문에 차근차근 잘 따라오면 익숙해질것이다

다음 포스팅은 웹크롤링을 하기위한 기본 라이브러리 설치에 대해 알아보도록 하겠습니다


728x90
Comments