java

[java][jsoup] HTML 파싱을 위한 jsoup 라이브러리 예제

hs_seo 2016. 11. 9. 17:33

자바에서 HTML 파싱을 위해서 jsoup 라이브러리를 이용하면 된다. 


이 라이브러리를 이용하면 html 을 get, post 방식으로 가져오는 것부터 

파싱하는 것까지 한번에 처리할 수 있다. 


Jsoup 홈페이지(https://jsoup.org/)에서 다운로드 해도 되고, 

메이븐으로 디펜던시를 추가해도 된다. 


<dependencies>

<dependency>

<!-- jsoup HTML parser library @ http://jsoup.org/ -->

<groupId>org.jsoup</groupId>

<artifactId>jsoup</artifactId>

<version>1.10.1</version>

</dependency>

</dependencies>





이 라이브러리를 이용하여 다음의 해외축구 사이트의 순위표를 파싱하여 처리해보면

다음과 같이 처리할 수 있다. 


http://score.sports.media.daum.net/record/soccer/epl/trnk.daum






반응형