python文件操作二

  1. 云栖社区>
  2. 博客>
  3. 正文

python文件操作二

余二五 2017-11-15 14:21:00 浏览764
展开阅读全文

1、常用函数:

  1. fileObject.read([size])
    size为读取的长度,以byte为单位。如果不指定参数,表示一次性读取全部
    内容,以字符串形式返回,并且每一行结尾会有一个"\n"符号。
    代码示例1:
    with open("text.txt","r") as pf:
    content = pf.read()
    print content

结果:
abcede
123
this is a test文件操作jfedcba

代码示例2:

with open("text.txt","r") as pf:
    content = pf.read(2)
    print content

结果:
读取:ab

  1. fileObject.readline( [size] )
    一行,如果给定了size,有可能返回的只是一行的一部分,以字符串的形式返
    回,并且结尾会有一个换行符"\n"。读完一行,文件操作标记移动到下一行的
    开头
    列题1
with open("text.txt","r") as pf:
    content = pf.readline()
    print content

结果:
大学之道,在明明德,在亲民,在止于至善。
列题 1:

with open("text.txt","r") as pf:
    content = pf.readline(15)
    print content

结果:
大学之道,

  1. fileObject.readlines( [size] )
    把文件每一行作为一个list的一个成员,是一个字符串,并且结尾会一个换行符"\n",并返回这个list。这个函数的内部是通过循环调用readline()来实现的。如果指定了size参数,表示读取文件指定内容的长度,此时就有可能只能读取文件的一部分

with open("text.txt","r") as pf:
    content = pf.readlines()
    print content
    for line in content:
        print line

结果:
python文件操作二

  1. fileObject.write( str )
    把str写到文件中,默认是不加换行符的,所以如果想换行的话,得手动加入换行符'
with open("test.txt","w") as pf:
    pf.write("我是最帮的!!\n学习文件写入操作")

结果:
我是最帮的!!
学习文件写入操作

  1. fileObject.writelines( seq )
    把seq(序列)的内容全部写到文件中(多行一次性写入)。也不会自动加入换行符
    如:
content = "我是最帮的!!\n学习文件写入操作,加油!!!"
with open("test.txt","a") as pf:
    pf.writelines(content)

结果:
我是最帮的!!
学习文件写入操作我是最帮的!!
学习文件写入操作,加油!!!

  1. fileObject.close()
    File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()方法关闭文件是一个很好的习惯。如果文件关闭后,还对文件进行操作就会产生ValueError错误,但如果不及时关闭文件,有可能产生句
    柄泄露,丢失数据
    #打开文件准备写文件
fp = open( "c:\\test.txt",'w')
print u"文件名:", fp.name
#关闭文件
fp.close()
print u"文件是否关闭:", fp.closed

结果:
文件名: test.txt
文件是否关闭: True

  1. fileObject.flush()
    该函数是将缓冲区中的内容写入硬盘

  2. fileObject.tell()
    返回文件操作标记的当前位置,以文件的开头为基准点
with open("test.txt","r") as pf:
    print u"当前文件操作标记位置为:", pf.tell()
    line = pf.readline()
    print u"读取一行后文件操作标记位置为:", pf.tell()

结果:
当前文件操作标记位置为: 0
读取一行后文件操作标记位置为: 23

  1. fileObject.seek( offset[, from ] )
    tell()方法告诉你文件内的当前位置;换句话说,下一次的读写会发生在文件开头这么多字节之后。seek(offset [,from])这是一个文件定位函数,该方法改变当前文件的位置。 Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。如果from被设为0(默认值),这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将为参考位置。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。测试文件test.txt,内容如下:
with open("test.txt","r") as fp:
    str = fp.read(18)
    print u"读取的字符串是 : ", str
    # 查找当前位置
    position = fp.tell()
    print u"当前文件位置 : ", position
    # 把指针再次重新定位到文件开头
    position = fp.seek(0, 0)
    str = fp.read(18)
    print u"重新读取字符串 : ", str

结果:
读取的字符串是 : 我是最帮的!
当前文件位置 : 18
重新读取字符串 : 我是最帮的!

fileObject.truncate( [size] )
把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

with open("test.txt","r") as fp:
    print "Name of the file: ", fp.name
    line = fp.readline()
    print "Read Line: %s" % (line)
    print fp.tell()
    # Try to read file now
    remainingLine = fp.readline()
    print "Read Line: %s" % (remainingLine)
  • linecache
    模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单
    个文件读取多行。
  • linecache.getlines(filename)
    从名为 filename 的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,
    并以 linenum-1 为元素在列表中的位置存储
  • linecache.getline(filename,lineno)
    从名为 filename 的文件中得到第 lineno 行。这个函数从不会抛出一个异常–产生错误时它将
    返回”(换行符将包含在找到的行里)。
    如果文件没有找到,这个函数将会在 sys.path 搜索。
  • linecache.clearcache()
    清除缓存,如果你不再需要先前从 getline() 中得到的行
  • linecache.checkcache(filename)
    检查缓存的有效性。如果在缓存中的文件在硬盘上发生了变化,并且你需要更新版本,使用
    这个函数,执行此函数会讲淘汰的内容删除。如果省略 filename,将检查缓存里的所有条目。
  • linecache.updatecache(filename)
    更新文件名为 filename 的缓存。如果 filename 文件更新了,使用这个函数可以更新
  • linecache.getlines(filename)
    返回的列表。如果出错,则返回空列表。

    1. 删除空行的方法
    fp = open(r'test.txt')
    aList = []
    for item in fp:
        if item.strip():
            aList.append(item)
    fp.close()
    fp = open(r'test2.txt', 'w')
    fp.writelines(aList)
def delblankline(infile, outfile):
    """ Delete blanklines of infile """
    infp = open(infile, "r")
    outfp = open(outfile, "w")
    lines = infp.readlines()
    for li in lines:
    if li=='\n': #不同操作系统下可能会有不同
    print u'空行'
    if li.split():
        outfp.write(li)
    infp.close()
    outfp.close()

if __name__ == "__main__":
delblankline("c:\\1.txt","c:\\2.txt")

列题:
数据文件:data.log
20160215 000148|0|collect info job start|success|
20160215000153|0|collect info job
end|success|resultcode = 0000
20160216000120|0|collect info job start|success|
20160216000121|0|collect info job
end|success|resultcode = 0000
20160217000139|0|collect info job start|success|
20160217000143|0|collect info job
end|success|resultcode = 0000
数据分析需求:
每行内容需要生成以每行
首年月日为名称的文件,
文件内容写入|0|后的所有
行内容(也包括|0| )

算法分析:
遍历每一行,每行取头8个字母
新建文件,文件名为首8个字母,然后把第15字符后的所有字
符拷贝到文件中
关闭文件

fp =open("e:\\data.log")
for line in fp.readlines():
    filename = line[:14]
    content = line[14:]

    with open("e:\\"+filename+".txt","w") as fp2:
        fp2.write(content+"\n")

fp.close()









本文转自 知止内明 51CTO博客,原文链接:http://blog.51cto.com/357712148/2060672,如需转载请自行联系原作者

网友评论

登录后评论
0/500
评论
余二五
+ 关注