HTMLをパースしてテーブルの中の値を取得する

高瀬 裕介 616views 更新:2013年12月13日
      HttpClient client = new HttpClient();
      client.getParams().setCookiePolicy(CookiePolicy.BROWSER_COMPATIBILITY);
      String url = "http://yoursite.com/";
      GetMethod get = new GetMethod(url);
      get.addRequestHeader("Accept-Language", "ja");
      client.executeMethod(get);

      DOMParser parser = new DOMParser();

      BufferedReader reader0 = new BufferedReader(new InputStreamReader(
          get.getResponseBodyAsStream(), "UTF-8"));
      InputSource source = new InputSource(reader0);

      parser.setFeature("http://xml.org/sax/features/namespaces", false);
      parser.parse(source);
      Node node0 = parser.getDocument();
      reader0.close();

      String xpath0 = "//TABLE//TR/TD[3]";
      NodeList nodeList0 = XPathAPI.selectNodeList(node0, xpath0);
      
      for (int i = 0; i < nodeList0.getLength(); i++) {
        String value = nodeList0.item(i).getTextContent();
        System.out.println(value):
      }

ログイン / 新規登録してコメントする

このソースコードをストックして後で利用したり、作業に利用したソースコードをまとめることができます。

こちらもお役に立つかもしれません