티스토리 뷰

beautifulsoup을 이용하여 HTML을 파싱하는 방법을 알아보겠습니다.

bs4의 주요 객체

<html>
  <!-- HTML 문서 예제 -->
  <p>A</p>
  B
  <p>C</p>
</html>
  • Tag
    • HTML Tag 객체
    • <p>로 둘러쌓인 객체
  • NavigableString
    • Tag 밖의 문자, 개행 문자
    • 문자 B
  • Comment 등
    • HTML 주석
  • BeautifulSoup
    • HTML 문서 그 자체

예제

  • 태그의 id, class 정보를 이용하여 찾는 방법
  • 태그 애트리뷰트 정보를 이용하여 찾는 방법 
  • Tag객체의 정보를 확인하는 방법
반응형
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함