study/프로그래밍

[python 웹크롤링] BeautifulSoup

밥짓는사나이- 2020. 5. 5. 11:52
728x90

BeautifulSoup

 

웹크롤링(웹의 데이터를 받아올때) 사용하는 툴로 해당 페이지의 html내역을 긁어(?)올수 있다.

 

requests를 통해 해당 URL을 content로 변환하여  html 변수에 넣고 작업을 시작한다.

해당 html을 BeautifulSoup을 사용하여 html로 파싱하여 가져오게 되는데,

여러종류의 parser를 지원하고 있다. 두가지 소개해보면.

 

 

html.parser

별도로 설치할 필요가 없으며, 보통속도의 파서

시행방법 : BeautifulSoup(html, 'html.parser')

 

lxml

lxml 추가 설치가 필요하며, 빠른 속도

시행방법: BeautifulSoup(html,'lxml')

728x90
728x90