본문 바로가기
python/코드조각

[python][bs4] BeautifulSoup 사용 예제

by hs_seo 2019. 9. 27.

beautifulsoup을 이용하여 HTML을 파싱하는 방법을 알아보겠습니다.

bs4의 주요 객체

<html>
  <!-- HTML 문서 예제 -->
  <p>A</p>
  B
  <p>C</p>
</html>
  • Tag
    • HTML Tag 객체
    • <p>로 둘러쌓인 객체
  • NavigableString
    • Tag 밖의 문자, 개행 문자
    • 문자 B
  • Comment 등
    • HTML 주석
  • BeautifulSoup
    • HTML 문서 그 자체

예제

  • 태그의 id, class 정보를 이용하여 찾는 방법
  • 태그 애트리뷰트 정보를 이용하여 찾는 방법 
  • Tag객체의 정보를 확인하는 방법
반응형