< / o : p>< / span >< / div>
parseBodyFragment 메서드는 빈 문서를 만들고 구문 분석된 HTML을 본문에 삽입합니다. 를 사용하는 경우 Jsoup.parse(String html), 당신은 동일 결과이지만 출력을 본문 조각은 제공된 모든 요소가 구문 분석되었는지 확인합니다.
Document.body() 메서드는 요소를 검색합니다 하체(자식) 본체, doc.getElementsByTag("본문").
회복하다 스크립트가 포함된 사이트의 데이터 악성. 의 설명서 보기 whitelist 그리고 주문 clean(문자열 html, 화이트리스트 화이트리스트). 4- URL에서 문서로드
웹에서 HTML 문서를 검색 및 구문 분석하고 데이터를 찾으려면 Jsoup.connect(문자열 url).
문서 문서 = Jsoup.connect( "http://siteweb.com/"< / span >< / span>).get();
String title = doc.title();
connect(String url)은 새 connexion get()은 HTML 파일을 검색하고 구문 분석합니다. 만약에 a 검색 중에 오류가 발생하면 예외가 발생합니다. being 트리거됨.
인터페이스 connexion 디자인 chaining 구체적인 답변은 :
문서 문서 = Jsoup.connect("http://siteweb.com")
.data("query", "Java")
.userAgent("모질라")
.cookie("auth", "token")
.timeout(3000)
.post();
이 방법은 http 및 https 프로토콜의 URL만 지원합니다. 파일을 업로드해야 하는 경우 parse(파일 위치, 문자열 charsetName).
5- 파일에서 문서로드
HTML이 포함된 파일이 있는데 파일을 로드한 다음 분석하고 데이터를 추출하여 조작하려고 합니다. Jsoup.parse(File in, String encoding, String Uri).
파일 입력 = new 파일("/temp/siteinput.html");
문서 < / b>< / span> 문서 < / span> = < / span> < / span>Jsoup < / b>< / span>.< / span>parse < / span> (siteinput, "UTF-8", "http://siteweb.com/");
Uri 매개 변수는 < 요소 앞에 있는 문서의 상대 URL을 확인하는 데 사용됩니다 href입니다> 찾을 수 있습니다. 빈 String.
또 다른 유사한 메소드 parse(File in, String encoding) 가 있습니다. parse() 메서드는 파일 경로를 Uri로 사용합니다. 이 방법은 로컬 서버에서 작업할 때 효과적입니다.