Python正则表达式re库的使用

简介: 指导思想:正则表达式只是一个工具,学会其中一种使用方法即可1. ()和re.findall结合使用({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1(.*)表示匹配任意长度的所有字符([0-9]*)表示匹配任意长度的数字([0-9,a-z])表示匹配长度为1的数字和小写字母re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。

指导思想:正则表达式只是一个工具,学会其中一种使用方法即可

1. ()和re.findall结合使用

({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;
第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1
(.*)表示匹配任意长度的所有字符
([0-9]*)表示匹配任意长度的数字
([0-9,a-z])表示匹配长度为1的数字和小写字母
re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.findall函数返回结果的数据类型为列表,列表中的第1个元素的数据类型为元祖。

示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "11房5厅8卫"
    sourceStr2 = "a房b厅3卫"
    pattern_all = "(.*)房(.*)厅(.*)卫"
    pattern_number = "([0-9]*)房([0-9]*)厅([0-9]*)卫"
    pattern_numberAndLetter = "([0-9,a-z])房([0-9,a-z])厅([0-9,a-z])卫"
    print("正则表达式找出中间的字符:")
    result = re.findall(pattern_all, sourceStr)
    print(result,type(result),type(result[0]))
    print(re.findall(pattern_all,sourceStr2))
    print("正则表达式找出中间的数字")
    print(re.findall(pattern_number,sourceStr))
    print(re.findall(pattern_number,sourceStr2))
    print("正则表达式找出中间的数字和字母")
    print(re.findall(pattern_numberAndLetter, sourceStr))
    print(re.findall(pattern_numberAndLetter, sourceStr2))

上面一段代码的运行结果如下:

正则表达式找出中间的字符:
[('11', '5', '8')] <class 'list'> <class 'tuple'>
[('a', 'b', '3')]
正则表达式找出中间的数字
[('11', '5', '8')]
[]
正则表达式找出中间的数字和字母
[('1', '5', '8')]
[('a', 'b', '3')]

2. 正则表达式中的元字符

\s 用于匹配单个空格符,包括tab键和换行符; 
\S 用于匹配除单个空格符之外的所有字符; 
\d 用于匹配从0到9的数字; 
\w 用于匹配字母,数字或下划线字符; 
\W 用于匹配所有与\w不匹配的字符; 
.  用于匹配除换行符之外的所有字符。
例如上一节中的([0-9]*)与([\d]*)作用相同

3. ()和re.search结合使用

re.search函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.search函数返回结果的数据类型是sre.SRE_Match对象,span=(3,9)是匹配结果的索引,从索引3开始,不包括索引9。
把re.search函数返回结果赋值给result,通过result.group函数获取匹配结果,result.group函数需要传入1个参数,参数的数据类型为无符号整型,参数为0时,为正则表达式匹配到的长句内容;参数为1时,为正则表达式匹配到的第1个小括号中的内容;参数为2时,为正则表达式匹配到的第2个小括号中的内容,依此类推。
示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "户型:3室2厅2卫"
    pattern_all = "([\d]*)室(.)厅(.)卫"
    result = re.search(pattern_all,sourceStr)
    print(result)
    print(result.group(0))
    print(result.group(1))
    print(result.group(2))
    print(result.group(3))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(3, 9), match='3室2厅2卫'>
3室2厅2卫
3
2
2

4 re.match的使用

re,match在实际应用中很少,不建议使用。
re.match能够匹配的前提是必须字符串索引0的位置能够匹配到。

import re
if __name__ == "__main__":
    re1 = "hel."
    re2 = ".el"
    re3 = ".hel"
    re4 = "el"
    sourceStr = "hello"
    print(re.match(re1,sourceStr))
    print(re.match(re2,sourceStr))
    print(re.match(re3,sourceStr))
    print(re.match(re3,sourceStr))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(0, 4), match='hell'>
<_sre.SRE_Match object; span=(0, 3), match='hel'>
None
None

目录
相关文章
|
5天前
|
Python
在Python中绘制K线图,可以使用matplotlib和mplfinance库
使用Python的matplotlib和mplfinance库可绘制金融K线图。mplfinance提供便利的绘图功能,示例代码显示如何加载CSV数据(含开盘、最高、最低、收盘价及成交量),并用`mpf.plot()`绘制K线图,设置类型为&#39;candle&#39;,显示移动平均线(mav)和成交量信息。可通过调整参数自定义图表样式,详情参考mplfinance文档。
15 2
|
5天前
|
机器学习/深度学习 边缘计算 TensorFlow
【Python机器学习专栏】Python机器学习工具与库的未来展望
【4月更文挑战第30天】本文探讨了Python在机器学习中的关键角色,重点介绍了Scikit-learn、TensorFlow和PyTorch等流行库。随着技术进步,未来Python机器学习工具将聚焦自动化、智能化、可解释性和可信赖性,并促进跨领域创新,结合云端与边缘计算,为各领域应用带来更高效、可靠的解决方案。
|
6天前
|
Serverless Python
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例:加载CSV数据,计算5日、10日和20日MA,然后在K线图上绘制。通过`rolling()`计算平均值,`plot()`函数展示图表,`legend()`添加图例。可利用matplotlib参数自定义样式。查阅matplotlib文档以获取更多定制选项。
16 1
|
6天前
|
数据采集 SQL 数据挖掘
Python数据分析中的Pandas库应用指南
在数据科学和分析领域,Python语言已经成为了一种非常流行的工具。本文将介绍Python中的Pandas库,该库提供了强大的数据结构和数据分析工具,使得数据处理变得更加简单高效。通过详细的示例和应用指南,读者将了解到如何使用Pandas库进行数据加载、清洗、转换和分析,从而提升数据处理的效率和准确性。
|
6天前
|
SQL 关系型数据库 MySQL
使用Python的pymysql库连接MySQL,执行CRUD操作
使用Python的pymysql库连接MySQL,执行CRUD操作:安装pymysql,然后连接(host=&#39;localhost&#39;,user=&#39;root&#39;,password=&#39;yourpassword&#39;,database=&#39;yourdatabase&#39;),创建游标。查询数据示例:`SELECT * FROM yourtable`;插入数据:`INSERT INTO yourtable...`;更新数据:`UPDATE yourtable SET...`;删除数据:`DELETE FROM yourtable WHERE...`。
13 0
|
6天前
|
机器学习/深度学习 算法 数据挖掘
机器学习--K近邻算法,以及python中通过Scikit-learn库实现K近邻算法API使用技巧
机器学习--K近邻算法,以及python中通过Scikit-learn库实现K近邻算法API使用技巧
|
6天前
|
存储 Python Windows
轻松学会openpyxl库,Python处理Excel有如神助
轻松学会openpyxl库,Python处理Excel有如神助
|
7天前
|
NoSQL Python
在Python中,我们可以使用许多库来处理Excel文件
Python处理Excel常用pandas和openpyxl库。pandas的`read_excel`用于读取文件,`to_excel`写入;示例展示了数据框操作。openpyxl则用于处理复杂情况,如多工作表,`load_workbook`加载文件,`iter_rows`读取数据,`Workbook`创建新文件,写入单元格数据后保存。
14 1
|
7天前
|
Python
使用Seaborn库创建图形的使用案例
【4月更文挑战第29天】该代码段首先导入seaborn和matplotlib库,然后加载名为&quot;titanic&quot;的数据集。接着,它创建一个画布并设定子图大小。通过seaborn的FacetGrid以&quot;Attrition_Flag&quot;为列进行分组,映射数据到网格上,用histplot展示&quot;Customer_Age&quot;的直方图分布。同样,也使用boxplot方法生成&quot;Freq&quot;的箱线图。最后展示所有图形。
8 2
|
9天前
|
数据可视化 数据挖掘 数据处理
statsmodels, Python 统计分析工具库!
statsmodels, Python 统计分析工具库!
25 1