扩展正则表达式及应用

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 第1章 扩展正则表达式 1.1  + 前一个字符连续出现了1次或1次以上 egrep  "0+" oldboy.txt  1次或1次以上 >=1 egrep  "0*" oldboy.txt  0次或0次以上 >=0 1.

第1章 扩展正则表达式

1.1  + 前一个字符连续出现了1次或1次以上

egrep  "0+" oldboy.txt  1次或1次以上 >=1

egrep  "0*" oldboy.txt  0次或0次以上 >=0

1.1.1 找到文本中的0

[root@znix ~]# egrep  "0+" oldboy.txt

my qq num is 49000448.

not 4900000448.

[root@znix ~]# egrep -o  "0+" oldboy.txt

000

00000

 

1.1.2 取出文件中的大写字母

[root@znix ~]# grep -o "[A-Z]" oldboy.txt

I

I

I

O

L

D

B

O

Y

1.1.3 取出连续出现的大写字母

[root@znix ~]# egrep -o "[A-Z]+" oldboy.txt

I

I

I

OLDBOY

1.1.4 显示所有的单词

[root@znix ~]# egrep -o "[A-Za-z]+" oldboy.txt

I

am

oldboy

teacher

1.2  | 或者

表示找其中的一个或者是另外一个。

[root@znix ~]# egrep "oldboy|oldbey" oldboy.txt  -o

oldboy

oldboy

oldbey

/etc/services 中的两个端口

[root@znix ~]# egrep "3306|1521" /etc/services

mysql           3306/tcp                        # MySQL

mysql           3306/udp                        # MySQL

ncube-lm        1521/tcp                # nCube License Manager

ncube-lm        1521/udp                # nCube License Manager

       找其中的A或者B或者C

[root@znix ~]# egrep "A|B|C" oldboy.txt

my god ,i am not oldbey,but OLDBOY!

       找到12或者56替换成空。

[root@znix ~]# echo 123456|sed -r 's#12|56##g'

34

1.3 () 小括号 反向引用

小括号里面的内容是一个整体,相当于是一个字符 

1.3.1 表示一个整体

[root@znix ~]# egrep "oldb(o|e)y" oldboy.txt

I am oldboy teacher!

my blog is http://oldboy.blog.51cto.com

my god ,i am not oldbey,but OLDBOY!

1.3.2 反向引用

       sed -r 使用扩展正则

[root@znix ~]# echo 123456|sed -r 's#..(..)..#\1#g'

34

       点表示任意一个字符,\2表示第二个括号。

[root@znix ~]# echo 123456|sed -r 's#(.).(..).(.)#\2#g'

34

1.4 {} 大括号(花括号)

0{n,m} 数字0连续出现了至少n,最多m

[root@znix ~]# egrep "[a-z]{3,6}" oldboy.txt

I am oldboy teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but OLDBOY!

 

[root@znix ~]# egrep "[a-zA-Z]{3,6}" oldboy.txt

I am oldboy teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is http://oldboy.blog.51cto.com
our site is http://www.etiantian.org
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but OLDBOY!
[root@znix ~]#

1.4.1 大括号的不同方法

 0{3,6}   >=3 <=6

 0{3}     ==3

 0{3,}    >=3

 0{,6}    >=0 <=6

1.5  

前一个字符连续出现了 0次或1

1.5.1 环境

[root@znix ~]# cat a.log

good

gd

god

goood

1.5.2 o连续出现0次或1

[root@znix ~]# egrep "gd|god" a.log

gd
god

[root@znix ~]# egrep "go?d" a.log

gd
god

1.6 正则表达式分类

1.6.1 基础正则

^       以……开头

$       以……结尾

^$     空行

.*      所有

[abc]   表示abc

[a-z]   表示az

[A-Z]   表示A-Z

[^abc]  表示排除abc

1.6.2 扩展正则表达式

+      连续出现 1次或1次以上

|       或者

()      小括号里面的内容是一个整体,相当于是一个字符

{}      0{n,m} 数字0连续出现了至少n,最多m

?       前一个字符连续出现了 0次或1

 

第2章 取出eth0网卡的ip地址

2.1 思路

1)先定位 取出第二行

2)取出ip地址

2.1.1 eth0的内容

[root@znix ~]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:A8:E4:14 

          inet addr:10.0.0.201  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fea8:e414/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:86884 errors:0 dropped:0 overruns:0 frame:0

          TX packets:74978 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:14324203 (13.6 MiB)  TX bytes:26220378 (25.0 MiB)

2.2 方法一 sed 去头去尾

sed命令,将其中不需要显示的,逐步替换。

[root@znix ~]#  ifconfig eth0|sed -n '2p'|sed 's#^.*dr:##g'|sed 's# .*$##g'

10.0.0.201

2.3 方法二sed 反向引用 

反向替换,使用()把ip地址保护起来,\1方向选择,显示出来ip

[root@znix ~]# ifconfig eth0|sed -nr '2s#^.*dr:(.*)  Bc.*$#\1#gp'

10.0.0.201

       简写

[root@znix ~]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*dr:(.*)Bc.*$#\1#g'

10.0.0.201 

2.4 方法三

使用把[^0-9.]之外的替换成空格,使用awk取出第一列。

[root@znix ~]# ifconfig eth0|sed -n '2s#[^0-9.]# #gp'|awk '{print $1}'

10.0.0.201

2.5 方法四

awk 指定分隔符,将空格和分号都定为分隔符,然后取列。

[root@znix ~]# ifconfig eth0|sed -n '2p'|awk -F "[ :]+" '{print $4}'

10.0.0.201

第3章 第三关练习题

3.1 如何取得/etiantian文件的权限对应的数字内容,如-rw-r--r--644,要求使用命令取得644 这样的数字。

 

3.1.1 方法一 反向引用

使用反向引用,保护要取出的内容。

[root@znix ~]# stat /etc/services |sed -nr '4s#^.*\(0(.*)/-.*$#\1#gp'

644

3.1.2 方法二 掐头去尾

两个sed 将不需要的东西替换为空。

[root@znix ~]# stat /etc/hosts |sed -n '4s#^.*(0##gp'|sed 's#/.*$##g'

644

3.1.3 方法三 排除

[^0-7] 除了07以外的替换成空格

[root@znix ~]#  stat /etc/hosts |sed -n '4s#[^0-7]##gp'

064400

[root@znix ~]# stat /etc/hosts|sed -nr '4s#[^0-7]+# #gp'

 0644 0 0

 

第4章 特殊符号通配符

4.1 特殊符号

&&   并且 前面的执行对了执行后面

||   或者 前面命令执行失败了再执行后面的

>>   追加输出重定向

>   标准输出重定向

/     路径的分隔符

$    取变量的内容

.    当前目录

..   当前目录的上一级目录

~    家目录

|    管道

!    取反 find awk

#    注释

4.2 通配符

* {}    找出文件

4.3 正则表达式(三剑客grep sed awk使用)

^

$

^$

.*

[abc]   一个整体 abc

        正则表达式认为只要是在中括号里面的就是一样的.

[^abc]  abc之外

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
5月前
|
人工智能 机器人 Unix
正则表达式的应用
正则表达式的应用
60 0
|
2月前
|
数据格式 Python
Python中的正则表达式:基础与应用
Python中的正则表达式:基础与应用
|
3月前
|
机器学习/深度学习 Rust JavaScript
Rust 笔记:Rust 语言中应用正则表达式
Rust 笔记:Rust 语言中应用正则表达式
150 1
|
3月前
|
Python
Python 的其他应用: 解释什么是正则表达式(Regular Expression)?在 Python 中如何使用正则表达式?
Python 的其他应用: 解释什么是正则表达式(Regular Expression)?在 Python 中如何使用正则表达式?
|
4月前
|
自然语言处理 算法 Python
【Python自然语言处理】正则表达式(RE)的讲解及实战应用(图文解释 附源码)
【Python自然语言处理】正则表达式(RE)的讲解及实战应用(图文解释 附源码)
45 0
|
8月前
|
Python
【从零学习python 】65. Python正则表达式修饰符及其应用详解
【从零学习python 】65. Python正则表达式修饰符及其应用详解
52 2
|
8月前
|
Shell
shell中正则表达式中字符的应用具体实例以及详解
shell中正则表达式中字符的应用具体实例以及详解
94 3
|
10月前
|
运维 自然语言处理 Shell
shell脚本应用——正则表达式
shell脚本应用——正则表达式
|
10月前
|
XML 数据格式 Python
【Python】正则表达式应用
【Python】正则表达式应用
123 0
|
10月前
|
机器学习/深度学习 C语言 数据安全/隐私保护
『正则表达式』概念 及在grep、awk、sed、C语言、Python中的简单应用
正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式。它可以用来检查一个字符串是否符合某个规则,或者从一个字符串中提取出符合某个规则的子串。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文本时要匹配的一个或多个字符串。