ObjC解码汉字网页乱码问题

简介:
入股读取的中文网页编码集是gb2312用UTF8的编码得到的结果只能是nil,换用ASCII得到的结果是中文编乱码。
只能这样:
NSURL *url = [NSURL URLWithString:urlStr];
NSData *data = [NSData dataWithContentsOfURL:url];    
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);    
NSString *retStr = [[NSString alloc] initWithData:data encoding:enc];

So EASY!

 
欢迎加群互相学习,共同进步。QQ群:iOS: 58099570 | Android: 330987132 | Go:217696290 | Python:336880185 | 做人要厚道,转载请注明出处!
相关文章
|
JavaScript 前端开发 Java
Unicode转义(\uXXXX)的编码和解码
  在涉及Web前端开发时, 有时会遇到\uXXXX格式表示的字符, 其中XXXX是16进制数字的字符串表示形式, 在js中这个叫Unicode转义字符, 和\n \r同属于转义字符. 在其他语言中也有类似的, 可能还有其它变形的格式.
2394 0
|
10月前
|
存储 Windows
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
“浅入深处“编码历史,字符串编码(ASCII, GBK, ANSI, Unicode, UTF-8编码),为什么记事本默认ANSI编码,Unicode和UTF8有什么区别
|
存储 编解码 前端开发
正确的认识乱码与编码
编码将《内存字节》作用于《磁盘文件或者网络文件》的过程,也是将《磁盘文件/网络文件》反解析成《内存字节》的过程. 这个过程中如果 内存字符串到 “字节数组”的编码 与 网络/磁盘文件的之间转化的编解码方式不一致或者不兼容就 会产生乱码. 在一次网络数据访问的过程中,可能有多次这两个步骤的转化.
131 0
给一个网页指定编码
给一个网页指定编码
68 0
|
JavaScript
nodejs使用axios 读取gbk编码乱码转化
在通过axios读取页面的时候,经常会碰到gbk的编码,如果不进行转化的话,在获取信息或读取上都会很麻烦。
nodejs使用axios 读取gbk编码乱码转化
|
存储 安全 关系型数据库
为什么编码不同会出现乱码?
本章节通过情景模拟,和大家一起探讨为什么编码不同会出现乱码
|
安全 Java
再谈java乱码:GBK和UTF-8互转尾部乱码问题分析
一直以为,java中任意unicode字符串,可以使用任意字符集转为byte[]再转回来,只要不抛出异常就不会丢失数据,事实证明这是错的。
1786 0
解决全站字符乱码(POST和GET中文编码问题)
乱码问题: 获取请求参数中的乱码问题;   POST请求:request.setCharacterEncoding(“utf-8”); GET请求:newString(request.getParameter(“xxx”).getBytes(“iso-8859-1”), “utf-8”); 响应的乱码问题:response.setContextType(“text/html;charset=
2685 0
|
存储 关系型数据库 Java
编码,解码,乱码,问题详解
编码解码核心 字符 内码 字符集 系统编码 windows Linux Python中的编码问题 系统编码 Python编码 方式一 方式二 方式三 文件编码 实例一 实例二 Python中字符串和Unicode的区别 PHP中的编码 ...
1474 0