html="<段落";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();
parseBodyFragment メソッドは、空のドキュメントを作成し、解析された HTML を本文に挿入します。もし、Jsoup.parse(String html)の場合、 同じ 結果は、出力を ボディフラグメントは、指定されたすべての要素が解析されたことを保証します.
Document.body() メソッドは要素を取得します 下(子)体は、以下と同等です。doc.getElementsByTag("body").
次の場合は注意を怠らないことをお勧めします。回復するスクリプトを含むサイトからのデータ潑。のドキュメントを見るwhitelist そして、注文 clean(String html, Whitelist whitelist). 4- URLからドキュメントを読み込む
Web から HTML ドキュメントを検索して解析し、データを見つけるには、Jsoup.connect(String url).
Document doc = Jsoup.connect("http://siteweb.com/").get();
String title = doc.title();
span style="color: #990000;" メソッド>connect(String url) は、新しいconnexion get() は HTML ファイルを検索して解析します。a エラーが表示された場合、例外はbeing triggered.
インターフェース connexion は chaining 具体的な回答はこちら :
Document doc = Jsoup.connect("http://siteweb.com")
.data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.post();
このメソッドは、http プロトコルと https プロトコルの URL のみをサポートします。ファイルをアップロードする必要がある場合は、parse(File in, String charsetName).
5-ファイルからドキュメントを読み込みます
HTMLを含むファイルがあり、それをロードし、分析し、データを抽出して操作します。メソッド Jsoup.parse(File in, String encoding, String Uri).
File input = new File("/temp/siteinput.html");
Document doc = Jsoup.parse(siteinput