Python3 urllib.parse 常用函数示例-阿里云开发者社区

Python3 urllib.parse 常用函数示例

2017-11-08 1065

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

1、获取url参数。

 
  
    
      
      
        >>> 
        from 
        urllib 
        import 
        parse 
       
 
        >>> url 
        = 
        r
        'https://docs.python.org/3.5/search.html?q=parse&check_keywords=yes&area=default' 
       
 
        >>> parseResult 
        = 
        parse.urlparse(url) 
       

        >>> parseResult
       
 
        ParseResult(scheme
        =
        'https'
        , netloc
        =
        'docs.python.org'
        , path
        =
        '/3.5/search.html'
        , params
        =
        '
        ', query='
        q
        =
        parse&check_keywords
        =
        yes&area
        =
        default
        ', fragment='
        ') 
       
 
        >>> param_dict 
        = 
        parse.parse_qs(parseResult.query) 
       

        >>> param_dict
       
 
        {
        'q'
        : [
        'parse'
        ], 
        'check_keywords'
        : [
        'yes'
        ], 
        'area'
        : [
        'default'
        ]} 
       
 
        >>> q 
        = 
        param_dict[
        'q'
        ][
        0
        ] 
       

        >>> q
       

        'parse'
       

        #注意：加号会被解码，可能有时并不是我们想要的
       
 
        >>> parse.parse_qs(
        'proxy=183.222.102.178:8080&task=XXXXX|5-3+2'
        ) 
       
 
        {
        'proxy'
        : [
        '183.222.102.178:8080'
        ], 
        'task'
        : [
        'XXXXX|5-3 2'
        ]} 
       
 
    

   
 

2、parse_qs/parse_qsl

 
  
    
      
      
        >>> 
        from 
        urllib 
        import 
        parse 
       
 
        >>> parse.parse_qs(
        'action=addblog&job=modify&tid=1766670'
        ) 
       
 
        {
        'tid'
        : [
        '1766670'
        ], 
        'action'
        : [
        'addblog'
        ], 
        'job'
        : [
        'modify'
        ]} 
        #注意和第三个并不一样 
       
 
        >>> parse.parse_qsl(
        'action=addblog&job=modify&tid=1766670'
        ) 
       
 
        [(
        'action'
        , 
        'addblog'
        ), (
        'job'
        , 
        'modify'
        ), (
        'tid'
        , 
        '1766670'
        )] 
       
 
        >>> 
        dict
        (parse.parse_qsl(
        'action=addblog&job=modify&tid=1766670'
        )) 
        #注意和第一个并不一样 
       
 
        {
        'tid'
        : 
        '1766670'
        , 
        'action'
        : 
        'addblog'
        , 
        'job'
        : 
        'modify'
        } 
       
 
    

   
 

3、urlencode

 
        >>> 
        from 
        urllib 
        import 
        parse 
       
        >>> query 
        = 
        { 
       
        'name'
        : 
        'walker'
        , 
       
        'age'
        : 
        99
        , 
       
        } 
       
        >>> parse.urlencode(query)
       
        'name=walker&age=99'

4、quote/quote_plus

 
        >>> 
        from 
        urllib 
        import 
        parse 
       
        >>> parse.quote(
        'a&b/c'
        )    
        #未编码斜线 
       
        'a%26b/c'
       
        >>> parse.quote_plus(
        'a&b/c'
        )    
        #编码了斜线 
       
        'a%26b%2Fc'

5、unquote/unquote_plus

 
        from 
        urllib 
        import 
        parse 
       
        >>> parse.unquote(
        '1+2'
        )    
        #不解码加号 
       
        '1+2'
       
        >>> parse.unquote(
        '1+2'
        )    
        #把加号解码为空格 
       
        '1 2'

　　如果你还想问为什么没有urldecode——再把示例1看五遍。^_^

Python3 urllib.parse 常用函数示例

热门文章

最新文章

相关课程

相关电子书

相关实验场景