Beautiful soup 사용하기

Notice

암호가 걸려있는 글 비밀번호는 1234 입니다⋯

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

끄적끄적 코딩일지

Beautiful soup 사용하기 본문

Python

Beautiful soup 사용하기

BaekGyuHyeon 2022. 3. 23. 21:35

Web Crawling 이란?

사전적 의미로는 web 상을 기어다닌다는 의미인데 이는 web 상에서 필요한 정보를 수집하는 행위를 말한다. 이는 Web Scraping이라고도 하는데 소프트웨어 기술로 웹 사이트에서 원하는 정보를 추출하는 기술이다.

Beautiful Soup 이란?

Python을 사용하여 Web Crawling을 수행하는 라이브러리

Beautiful Soup 사용하기

사전에 Beautiful soup & requests 라이브러리 설치후 진행한다

pip install bs4
pip install requests

import requests
import bs4

webpage = requests.get("crawling할 url")
soup = bs4.BeautifulSoup(webpage.text,"html.parser") // html으로써 입력정보 분석

// 태그 타고 들어가기
body = soup.select('body > div > p ....')

// 특정 태그 검색하기
p = soup.find('p') // 가장 첫번째 p 태그 검색
plist = soup.find_all('p') // 전체 p 태그 검색

// 특정 class 검색하기
classes = soup.select('.classname')

// tag id로 검색하기
selects = soup.select('#tagId')

// 여러 attrs 를 사용하여 검색하기
ls = soup.find_all({'class':'classname','id':'tagId'})

// 택스트만 읽기
print(soup.select('#id').get_text())

'Python' 카테고리의 다른 글

Jinja2를 사용해서 페이지를 만들어보자 (0)	2022.05.11
[python] APScheduler 사용하기 (0)	2022.05.10
BeautifulSoup + Selenium을 이용한 동적 페이지 크롤링 (0)	2022.05.10
Flask 사용하기 (0)	2022.03.24
MongoDB 시작하기 (0)	2022.03.23

'Python' Related Articles

끄적끄적 코딩일지

Beautiful soup 사용하기 본문

Beautiful soup 사용하기

Web Crawling 이란?

Beautiful Soup 이란?

Beautiful Soup 사용하기

'Python' 카테고리의 다른 글

티스토리툴바