python文件基础之（文件操作）-阿里云开发者社区

在之前学习了python的列表、元组、集合等知识，接下来将python的文件相关的知识做一总结和分析。

一 open函数

在我们用word、excel、vim对文件操作时，肯定要先打开文件，同样在编程里面也是需要将文件打开，然后再对文件操作，操作完对文件进行关闭。文件打开使用open()函数，同时创建一个相关的对象。

、基本语法：

 
        open
        (
        file
        , mode
        =
        'r'
        , buffering
        =
        None
        , encoding
        =
        None
        , errors
        =
        None
        , newline
        =
        None
        , closefd
        =
        True
        ) 
       
        参数介绍：
       
        file
        ：表示文件名，可以使用绝对路径和相对路径，还有可以根据mode方式决定文件的追加或者覆盖 
       
        mode:表示打开文件的模式
       
        buffering:设置缓存模式。
        0
        表示不缓存，
        1
        表示缓存；如果大于
        1
        则表示缓冲区的大小，以字节为单位。 
       
        encoding:表示打开文件的编码格式
       
        errors:参数errors是用来指明编码和解码错误时怎么样处理。不能在二进制的模式下使用。
       
        1
        ）当指明为’strict’时，编码出错则抛出异常ValueError。 
       
        2
        ）当指明为’ignore’时，忽略错误。 
       
        3
        ）当指明为’replace’时，使用某字符进行替代模式，比如使用’?’来替换出错的。 
       
        4
        ）其它相应还有surrogateescape
        /
        xmlcharrefreplacs
        /
        backslashreplace。 
       
        newline:
       
        参数newline是用来控制文本模式之下，一行的结束字符。可以是
        None
        ，’’，\n，\r，\r\n等。 
       
        当在读取模式下，如果新行符为
        None
        ，那么就作为通用换行符模式工作，意思就是说当遇到\n， 
       
        \r或\r\n都可以作为换行标识，并且统一转换为\n作为文本输入的换行符。当设置为空’’时，
       
        也是通用换行符模式工作，但不作转换为\n，输入什么样的，就保持原样全输入。当设置为其它相应
       
        字符时，就会判断到相应的字符作为换行符，并保持原样输入到文本。
       
        当在输出模式时，如果新行符为
        None
        ，那么所有输出文本都是采用\n作为换行符。如果设置为’’ 
       
        或者\n时，不作任何的替换动作。如果是其它字符，会在字符后面添加\n作为换行符。
       
        closefd:是用来当给一个文件句柄传进来时，而当退出文件使用时，而不对文件句柄进行关闭。如果传
       
        递一个文件名进来，这个参数无效，必定为
        True
        方式。

关于上面提到的mode模式种类比较多，我们做以下相关介绍和总结，

模式	描述
r	打开一个文件为只读。文件指针置于该文件的开头。这是默认模式。
rb	打开一个文件只能以二进制格式读取。文件指针置于该文件的开头。这是默认模式。
r+	打开用于读取和写入文件。文件指针将会在文件的开头。
rb+	打开用于读取和写入二进制格式的文件。文件指针将会在文件的开头。
w	打开一个文件只写。覆盖该文件，如果该文件存在。如果该文件不存在，则创建用于写入一个新的文件。
wb	打开一个文件只能以二进制格式写入。覆盖该文件，如果该文件存在。如果该文件不存在，则创建用于写入一个新的文件。
w+	打开用于写入和读取的文件。覆盖现有的文件，如果文件存在。如果该文件不存在，则创建读取和写入新的文件。
wb+	打开用于写入和读取的二进制格式的文件。覆盖现有的文件，如果文件存在。如果该文件不存在，则创建读取和写入新的文件。
a	将打开追加文件。文件指针是在文件的结尾。也就是说，该文件是在附加模式。如果该文件不存在，它创造了写入一个新的文件。
ab	将打开追加的二进制格式的文件。文件指针在该文件的结束。也就是说，该文件为追加模式。如果该文件不存在，它创建并写入一个新的文件。
a+	打开为追加和读取文件。文件指针在该文件的结束。该文件将为追加模式。如果该文件不存在，它创建并读取和写入的新文件。
ab+	打开两个追加和读取的二进制格式的文件。文件指针在该文件的结束。该文件将在追加模式。如果该文件不存在，它创建并读取和写入的新文件。

二进制在我们处理图像等信息时使用比较多，而其他部分在我们操作字符串等内容比较多。

简单的示例：

 
        示例文件内容：
       
        我曾经问个不休 你何时跟我走
       
        可你却总是笑我 一无所有
       
        我要给你我的追求 还有我的自由
       
        可你却总是笑我 一无所有
       
        噢 你何时跟我走
       
        噢 你何时跟我走
       
        脚下的地在走 身边的水在流
       
        可你却总是笑我 一无所有
       
        为何你总笑个没够 为何我总要追求
       
        难道在你面前 我永远是一无所有
       
        Process finished with exit code 
        0 
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        readline
        =
        a_File.read() 
       
        print
        (readline） 
       
        结果：
       
        我曾经问个不休 你何时跟我走
       
        可你却总是笑我 一无所有
       
        我要给你我的追求 还有我的自由
       
        可你却总是笑我 一无所有
       
        噢 你何时跟我走
       
        噢 你何时跟我走
       
        脚下的地在走 身边的水在流
       
        可你却总是笑我 一无所有
       
        为何你总笑个没够 为何我总要追求
       
        难道在你面前 我永远是一无所有
       
        上面使用的r模式打开，我们采取尝试写入文件，写入内容为字符串openstack\nMYSQLDBA
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        readline
        =
        a_File.read() 
       
        print
        (readline) 
       
        a_File.write(
        "openstack\nMYSQLDBA"
        ) 
       
        a_File.close()
       
        结果：文件不可写
       
        Traceback (most recent call last):
       
        File 
        "D:/project/myapp/hello.py"
        , line 
        6
        , 
        in 
        <module> 
       
        a_File.write(
        "openstack\nMYSQLDBA"
        ) 
       
        io.UnsupportedOperation: 
        not 
        writable 
       
        我们再尝试用二进制方式打开文件查看内容：
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "rb"
        ) 
        #去掉了编码格式 
       
        readline
        =
        a_File.read()  
       
        print
        (readline) 
       
        #a_File.write("openstack\nMYSQLDBA")
       
        a_File.close()
       
        结果：
       
        b'\xe6\x88\x91\xe6\x9b\xbe\xe7\xbb\x8f\xe9\x97\xae\xe4\xb8\xaa\xe4\xb8\x8d\xe4\xbc\x91 \xe4\xbd\xa0\xe4\xbd\x95\xe
       
        其他内容繁多，因此不再演示其他的mode模式

在研究完我们如何将文件打开后，我们就要考虑如何处理打开的文件，主要涉及到文件对象的一些方法。

序号	方法以及描述与应用
1	open()可以创建一个对象打开某个文件，这一部分涉及内容比较多，下一部分介绍，打开的方式以及编码格式等
2	file.close()关闭文件关闭文件后不能再进行读写操作
3	file.read([size])从文件读取指定的字节数，要是未指定或为负则读取所有
4	file.readline([size])读取整行包括”\n”换行
5	file.readlines()读取文件里的所有行并返回列表，若sizeint>0返回总行约为sizeint字节的行，实际读取的值可能比sizeint较大，因为需要缓冲区
6	file.next()返回文件下一行
7	file.isatty()如果文件连接一个终端设备返回Ture 否则返回False
8	file.flush()刷新文件内部缓冲，直接把内部缓存区的数据写入文件，而不是被动的等待输出缓存区写入
9	file.fileno()返回一个整型的文件描述符（file descriptor FD）可以用在os模块的read方法等的底层操作
10	file.seek(offset[whencr])设置文件的当前位置
11	file.tell()返回文件的当前位置
12	file.truncate([size])截取文件，截取的字节通过size指定，默认当前位置开始
13	file.write(str)将字符串写入文件没有返回值
14	file.writelines(sequence)向文件写入一个序列字符串列表，如果需要换行则需要自己加入换行符

下面根据不同的方法做简单介绍以及相关示例

读操作：读的有file.read() filereadline() filereadlies()等三种方法

1、file.read()方法

里面的参数是size，表示从文件中读取size大小字节，当默认为空或者为负值时表示读取所有的字节，

示例：

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果1"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.read(
        -
        1
        )) 
       
        结果：
       
        ###############################################测试结果1################################################
       
        我曾经问个不休 你何时跟我走
       
        可你却总是笑我 一无所有
       
        我要给你我的追求 还有我的自由
       
        可你却总是笑我 一无所有
       
        噢 你何时跟我走
       
        噢 你何时跟我走
       
        脚下的地在走 身边的水在流
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果2"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.read()) 
       
        结果：
       
        ###############################################测试结果2################################################
       
        我曾经问个不休 你何时跟我走
       
        可你却总是笑我 一无所有
       
        我要给你我的追求 还有我的自由
       
        可你却总是笑我 一无所有
       
        噢 你何时跟我走
       
        噢 你何时跟我走
       
        脚下的地在走 身边的水在流
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果3"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.read(
        3
        )) 
       
        结果：
       
        ###############################################测试结果3################################################
       
        我曾经
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果4"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.read(
        15
        )) 
       
        结果：
       
        ###############################################测试结果4################################################
       
        我曾经问个不休 你何时跟我走

可以发现read方法是受字节数量控制的，字节数量的控制影响其输出

2、readline()方法

读取整行包括”\n”换行，参数也是[size]控制,其和read()的区别就是当readline()某行中的字符不够时，只读取改行，而read（）会读取其他行的内容。

示例（两者的区别）

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果1"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.read(
        50
        )) 
       
        print
        (
        "测试结果2"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readline(
        100
        )) 
       
        结果：
       
        ###############################################测试结果1################################################
       
        我曾经问个不休 你何时跟我走
       
        可你却总是笑我 一无所有
       
        我要给你我的追求 还有我的自由
       
        可你却总是笑
       
        ###############################################测试结果2################################################
       
        我 一无所有

readline()方法默认值和负值的相关示例

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果1"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readline()) 
       
        print
        (
        "测试结果2"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readline(
        -
        1
        )) 
       
        print
        (
        "测试结果3"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readline(
        4
        )) 
       
        print
        (
        "测试结果4"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readline(
        10
        )) 
       
        结果：
       
        ###############################################测试结果1################################################
       
        我曾经问个不休 你何时跟我走
       
        ###############################################测试结果2################################################
       
        可你却总是笑我 一无所有
       
        ###############################################测试结果3################################################
       
        我要给你
       
        ###############################################测试结果4################################################
       
        我的追求 还有我的自

3、readlines()取文件里的所有行并返回列表，若sizeint>0返回总行约为sizeint字节的行，实际读取的值可能比sizeint较大，因为需要缓冲区。则读取指定长度的字节, 并且将这些字节按行分割。

例如：

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果1"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readlines(
        14
        )) 
       
        ###############################################测试结果1################################################
       
        [
        '我曾经问个不休 你何时跟我走\n'
        ] 
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        'utf-8'
        ) 
       
        #readline=a_File.read(1)
       
        print
        (
        "测试结果1"
        .center(
        100
        ,
        '#'
        )) #为了更好的展现测试结果分割 
       
        print
        (a_File.readlines(
        14
        )) 
       
        [
        '我曾经问个不休 你何时跟我走\n'
        , 
        '可你却总是笑我 一无所有\n'
        ] 
       
        当我们设置sizeint值大于行中的字符时才能显示其他行的内容

4、file.close()

关闭文件关闭文件后不能再进行读写操作文件对象的close()方法刷新未写入的信息，并关闭该文件的对象，在这之后没有数据内容可以执行写入。

Python自动关闭，当文件的引用对象被重新分配给另外一个文件。它是使用close()方法来关闭文件是一个很好的做法。

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile2.txt"
        ,
        "w+"
        ) 
       
        #readline=a_File.read(1)
       
        a_File.write(
        "winnerlookopenatck"
        ) 
       
        a_File.close()
       
        将文件写入
       
        写入内容：
       
        winnerlookopenatck

5、flie.write()

write()方法写入字符串到任何一个打开的文件。要注意的是Python字符串可以具有二进制数据，而不仅仅是文字。

write()方法不要将换行字符（' '）添加到字符串的结尾。在文件关闭前或缓冲区刷新前，字符串内容存储在缓冲区中，这时你在文件中是看不到写入的内容。

例如：

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        a_File
        =
        open
        (
        "D:\\pythonfile2.txt"
        ,
        "w+"
        ) 
       
        #readline=a_File.read(1)
       
        a_File.write(
        "winnerlookopenatck"
        ) 
       
        a_File.close()

6、file.writelines()

file.writelines()方法用于向文件中写入一序列的字符串。这一序列字符串可以是由迭代对象产生的，如一个字符串列表。换行需要制定换行符 \n。

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ]
        #定义列表 
       
        a_File
        =
        open
        (
        "D:\\pythonfile2.txt"
        ,
        "w+"
        ) 
       
        #readline=a_File.read(1)
       
        a_File.writelines(sed)
       
        a_File.close()
       
        结果：
       
        openstack: 
        1 
       
        docker 
        2 
       
        mysqlDBA 
        3 
       
        KVM 
        4

7、file.flush()

flush() 方法是用来刷新缓冲区的，即将缓冲区中的数据立刻写入文件，同时清空缓冲区，不需要是被动的等待输出缓冲区写入。

一般情况下，文件关闭后会自动刷新缓冲区，但有时你需要在关闭前刷新它，这时就可以使用 flush() 方法。没有返回值

例如

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        a_File
        =
        open
        (
        "D:\\pythonfile2.txt"
        ,
        "w+"
        ) 
       
        #readline=a_File.read(1)
       
        a_File.writelines(sed)
       
        a_File.flush()
       
        a_File.close()

8、file.next()

next() 方法在文件使用迭代器时会使用到，在循环中，next()方法会在每次循环中调用，该方法返回文件的下一行，如果到达结尾(EOF),则触发 StopIteration

示例:

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        aFile
        =
        open
        (
        "D:\\pythonfile2.txt"
        ,
        "w+"
        ) 
       
        for 
        index  
        in  
        range
        (
        3
        ): 
       
        line 
        = 
        next
        (aFile) 
       
        print
        (
        "第%d行-%s" 
        % 
        (index,line))

9、file.tell()

file.tell()方法返回文件的当前位置，即文件指针当前位置。

语法：

 
        fileObject.tell(offset[, whence])

返回值当前文件指针

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        aFile
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        "utf-8"
        ) 
       
        print
        (aFile.readline(
        30
        )) 
       
        print
        (aFile.tell()) 
       
        我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾
       
        86
       
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        aFile
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        "utf-8"
        ) 
       
        print
        (aFile.readline()) 
       
        print
        (aFile.tell()) 
       
        我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走
       
        162

10、file.isatty()

file.isatty()方法检测文件是否连接到一个终端设备，如果是返回 True，否则返回 False

用法：

fileObject.isatty()

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]

aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
print(aFile.isatty()) 
False

11、file.seek()

seek() 方法用于移动文件读取指针到指定位置，没有返回值

seek() 方法语法如下：

fileObject.seek(offset[, whence])

offset -- 开始的偏移量，也就是代表需要移动偏移的字节数

whence：可选，默认值为 0。给offset参数一个定义，表示要从哪个位置开始偏移；0代表从文件开头开始算起，1代表从当前位置开始算起，2代表从文件末尾算起。

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        aFile
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        "utf-8"
        ) 
       
        print
        (aFile.readline(
        10
        )) 
       
        print
        (aFile.readline(
        10
        )) 
       
        aFile.seek(
        0
        ,
        0
        )
        #设置起始位置为0  
       
        print
        (aFile.readline(
        10
        )) 
       
        结果：
       
        我曾经问个不休 你何
       
        时跟我走我曾经问个不
       
        我曾经问个不休 你何
       
        总结打印完第一行后，下次打印从上次的位置接上，而重新设置其位置后在开始位置打印

12、file.fileno()

方法返回一个整型的文件描述符(file descriptor FD 整型)，可用于底层操作系统的 I/O 操作。返回值为一个文件描述符：

 
        #!/usr/bin/env python
       
        #_*_coding:utf-8_*_
       
        sed
        =
        [
        "openstack: 1\n"
        ,
        "docker 2\n"
        ,
        "mysqlDBA 3\n"
        ,
        "KVM 4\n"
        ] 
       
        aFile
        =
        open
        (
        "D:\\pythonfile.txt"
        ,
        "r"
        ,encoding
        =
        "utf-8"
        ) 
       
        print
        (aFile.fileno()) 
       
        结果：
       
        3

13、file.truncate()

truncate() 方法用于截断文件，如果指定了可选参数 size，则表示截断文件为 size 个字符。如果没有指定 size，则从当前位置起截断；截断之后 size 后面的所有字符被删除

truncate() 方法语法如下：

fileObject.truncate( [ size ])
参数

本文转自 tianya1993 51CTO博客，原文链接：http://blog.51cto.com/dreamlinux/1910955，如需转载请自行联系原作者

python文件基础之（文件操作）

热门文章

最新文章

相关课程

相关电子书

相关实验场景