开发者社区> 问答> 正文

如何解决利用Jsoup解析网页偶然出现问号乱码的问题?

利用Jsoup解析网页文章,有时获取结果中部分文章的标题会出现问号乱码(???)的问题,试过指定编码解析,还是不能解决?
另外还有一个奇怪的地方,将含有乱码的字符串在android上的控件setText(),乱码会自动消失,恢复正常,谁有遇到过这种问题不?

展开
收起
蛮大人123 2016-02-27 13:39:07 3641 0
1 条回答
写回答
取消 提交回答
  • 我说我不帅他们就打我,还说我虚伪

    采取Document document = Jsoup.parse(new URL(url).openStream(), "UTF-8", url);的方式获取,不要先获取网页html的文本,采用Jsoup.parse(html)的方式(即使在读html时设置了UTF-8,sb.append(new String(buf, 0, len, "UTF-8")); 这样也无效的)

    2019-07-17 18:48:45
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
神龙云服务器产品及技术深度解析 立即下载
弹性创造价值:基于ECS的最佳性价比实践解析 立即下载
又快又稳:阿里云下一代虚拟交换机解析 立即下载

相关镜像