开发者社区> 问答> 正文

如何获取html中的文本

<html> 
<head>  
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
        <title>Dom遍历</title>  
    </head>  
    <body> 
 
           ####1
 
        <div id="frm0">  
           ####2
        <div id="frm1">  
            ####3
        <div id="frm2">  
     
        </div>  
            ####4
        </div>  
     
        </div>  
    </body>  
</html>

将####1、2、3、4...这些位置的文本单独提取出来,javascript可以么,或者有什么其他语言解析库支持

展开
收起
a123456678 2016-07-12 15:53:24 1911 0
1 条回答
写回答
取消 提交回答
  • jsoup提供了传统的DOM 方式的元素解析,下面是个例子:
    File input = new File("D:/test.html");
    Document doc = Jsoup.parse(input, "UTF-8","网址/");
    Element content =doc.getElementById("content");
    Elements links = content.getElementsByTag("a");
    for (Element link : links) {
    String linkHref =link.attr("href");
    String linkText =link.text();
    }
    2019-07-17 19:55:06
    赞同 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
《零基础HTML入门教程》 立即下载
天猫 HTML5 互动技术实践 立即下载
天猫HTML5互动技术实践 立即下载