python标准库学习9

简介:

fileinput 模块允许你循环一个或多个文本文件的内容

使用 fileinput 模块循环一个文本文件

import  fileinput
import  sys
 
for  line in  fileinput. input ( "samples/sample.txt" ):
     sys.stdout.write( "-> " )
     sys.stdout.write(line)
 
- > We will perhaps eventually be writing only small
- > modules which are identified by name as they are
- > used to build larger ones, so that devices like
- > indentation, rather than delimiters, might become
- > feasible for  expressing local structure in  the
- > source language.
- >      - -  Donald E. Knuth, December 1974

  你也可以使用 fileinput 模块获得当前行的元信息 (meta information). 其中包括 isfirstline , filename , lineno

使用 fileinput 模块处理多个文本文件

import  fileinput
import  glob
import  string, sys
 
for  line in  fileinput. input (glob.glob( "samples/*.txt" )):
     if  fileinput.isfirstline(): # first in a file?
         sys.stderr.write( "-- reading %s --\n"  %  fileinput.filename())
     sys.stdout.write( str (fileinput.lineno()) +  " "  +  string.upper(line))
 
- -  reading samples\sample.txt - -
1  WE WILL PERHAPS EVENTUALLY BE WRITING ONLY SMALL
2  MODULES WHICH ARE IDENTIFIED BY NAME AS THEY ARE
3  USED TO BUILD LARGER ONES, SO THAT DEVICES LIKE
4  INDENTATION, RATHER THAN DELIMITERS, MIGHT BECOME
5  FEASIBLE FOR EXPRESSING LOCAL STRUCTURE IN THE
6  SOURCE LANGUAGE.
7     - -  DONALD E. KNUTH, DECEMBER 1974

  文本文件的替换操作很简单. 只需要把 inplace 关键字参数设置为 1 , 传递给 input 函数, 该模块会帮你做好一切.

使用 fileinput 模块将 CRLF 改为 LF

import  fileinput, sys
 
for  line in  fileinput. input (inplace = 1 ):
     # convert Windows/DOS text files to Unix files
     if  line[ - 2 :] = =  "\r\n" :
         line =  line[: - 2 ] +  "\n"
     sys.stdout.write(line)

  shutil 实用模块包含了一些用于复制文件和文件夹的函数.

使用 shutil 复制文件

import  shutil
import  os
 
for  file  in  os.listdir( "." ):
     if  os.path.splitext( file )[ 1 ] = =  ".py" :
         print  file
         shutil.copy( file , os.path.join( "backup" , file ))
 
aifc - example - 1.py
anydbm - example - 1.py
array - example - 1.py
...

  copytree 函数用于复制整个目录树 (与 cp -r 相同), 而 rmtree 函数用于删除整个目录树 (与 rm -r )

使用 shutil 模块复制/删除目录树

import  shutil
import  os
 
SOURCE =  "samples"
BACKUP =  "samples-bak"
 
# create a backup directory
shutil.copytree(SOURCE, BACKUP)
 
print  os.listdir(BACKUP)
 
# remove it
shutil.rmtree(BACKUP)
 
print  os.listdir(BACKUP)
 
[ 'sample.wav' , 'sample.jpg' , 'sample.au' , 'sample.msg' , 'sample.tgz' ,
...
Traceback (most recent call last):
  File  "shutil-example-2.py" , line 17 , in  ?
    print  os.listdir(BACKUP)
os.error: No such file  or  directory

  tempfile 模块允许你快速地创建名称唯一的临时文件供使用.

使用 tempfile 模块创建临时文件

import  tempfile
import  os
 
tempfile =  tempfile.mktemp()
 
print  "tempfile" , "=>" , tempfile
 
file  =  open (tempfile, "w+b" )
file .write( "*"  *  1000 )
file .seek( 0 )
print  len ( file .read()), "bytes"
file .close()
 
try :
     # must remove file when done
     os.remove(tempfile)
except  OSError:
     pass
 
tempfile = > C:\TEMP\~ 160 - 1
1000  bytes

  TemporaryFile 函数会自动挑选合适的文件名, 并打开文件而且它会确保该文件在关闭的时候会被删除. (在 Unix 下, 你可以删除一个已打开的文件, 这 时文件关闭时它会被自动删除. 在其他平台上, 这通过一个特殊的封装类实现.)

使用 tempfile 模块打开临时文件

import  tempfile
 
file  =  tempfile.TemporaryFile()
 
for  i in  range ( 100 ):
     file .write( "*"  *  100 )
 
file .close() # removes the file!

   StringIO 模块的使用. 它实现了一个工作在内存的文件对象 (内存文件). 在大多需要标准文件对象的地方都可以使用它来替换.

使用 StringIO 模块从内存文件读入内容

import  StringIO
 
MESSAGE =  "That man is depriving a village somewhere of a computer scientist."
 
file  =  StringIO.StringIO(MESSAGE)
 
print  file .read()
 
That man is  depriving a village somewhere of a computer scientist.

  StringIO 类实现了内建文件对象的所有方法, 此外还有 getvalue 方法用来返回它内部的字符串值

 使用 StringIO 模块向内存文件写入内容

import  StringIO
 
file  =  StringIO.StringIO()
file .write( "This man is no ordinary man. " )
file .write( "This is Mr. F. G. Superman." )
 
print  file .getvalue()
 
This man is  no ordinary man. This is  Mr. F. G. Superman.

  

使用 StringIO 模块捕获输出

import  StringIO
import  string, sys
 
stdout =  sys.stdout
 
sys.stdout =  file  =  StringIO.StringIO()
 
print  """
According to Gbaya folktales, trickery and guile
are the best ways to defeat the python, king of
snakes, which was hatched from a dragon at the
world's start. -- National Geographic, May 1997
"""
 
sys.stdout =  stdout
 
print  string.upper( file .getvalue())
 
ACCORDING TO GBAYA FOLKTALES, TRICKERY AND GUILE
ARE THE BEST WAYS TO DEFEAT THE PYTHON, KING OF
SNAKES, WHICH WAS HATCHED FROM A DRAGON AT THE
WORLD'S START. - -  NATIONAL GEOGRAPHIC, MAY 1997

  cStringIO 是一个可选的模块, 是 StringIO 的更快速实现. 它的工作方式和 StringIO 基本相同, 但是它不可以被继承

使用 cStringIO 模块

import  cStringIO
 
MESSAGE =  "That man is depriving a village somewhere of a computer scientist."
 
file  =  cStringIO.StringIO(MESSAGE)
 
print  file .read()
 
That man is  depriving a village somewhere of a computer scientist.

  为了让你的代码尽可能快, 但同时保证兼容低版本的 Python ,你可以使用一个小技巧在 cStringIO 不可用时启用 StringIO 模块,

 后退至 StringIO

try :
     import  cStringIO
     StringIO =  cStringIO
except  ImportError:
     import  StringIO
 
print  StringIO
 
<module  'StringIO'  (built - in )>

  mmap 模块提供了操作系统内存映射函数的接口,  映射区域的行为和字符串对象类似, 但数据是直接从文件读取的.

 使用 mmap 模块

import  mmap
import  os
 
filename =  "samples/sample.txt"
 
file  =  open (filename, "r+" )
size =  os.path.getsize(filename)
 
data =  mmap.mmap( file .fileno(), size)
 
# basics
print  data
print  len (data), size
 
# use slicing to read from the file
# 使用切片操作读取文件
print  repr (data[: 10 ]), repr (data[: 10 ])
 
# or use the standard file interface
# 或使用标准的文件接口
print  repr (data.read( 10 )), repr (data.read( 10 ))
 
<mmap object  at 008A2A10 >
302  302
'We will pe'  'We will pe'
'We will pe'  'rhaps even'

  在 Windows 下, 这个文件必须以既可读又可写的模式打开( `r+` , `w+` , 或 `a+` ), 否则 mmap 调用会失败.

对映射区域使用字符串方法和正则表达式

mport mmap
import  os, string, re
 
def  mapfile(filename):
     file  =  open (filename, "r+" )
     size =  os.path.getsize(filename)
     return  mmap.mmap( file .fileno(), size)
 
data =  mapfile( "samples/sample.txt" )
 
# search
index =  data.find( "small" )
print  index, repr (data[index - 5 :index + 15 ])
 
# regular expressions work too!
m =  re.search( "small" , data)
print  m.start(), m.group()
 
43  'only small\015\012modules '
43  small

  


  


==============================================================================
本文转自被遗忘的博客园博客,原文链接:http://www.cnblogs.com/rollenholt/archive/2011/11/27/2264946.html,如需转载请自行联系原作者
相关文章
|
5天前
|
Python
在Python中绘制K线图,可以使用matplotlib和mplfinance库
使用Python的matplotlib和mplfinance库可绘制金融K线图。mplfinance提供便利的绘图功能,示例代码显示如何加载CSV数据(含开盘、最高、最低、收盘价及成交量),并用`mpf.plot()`绘制K线图,设置类型为&#39;candle&#39;,显示移动平均线(mav)和成交量信息。可通过调整参数自定义图表样式,详情参考mplfinance文档。
16 2
|
6天前
|
机器学习/深度学习 边缘计算 TensorFlow
【Python机器学习专栏】Python机器学习工具与库的未来展望
【4月更文挑战第30天】本文探讨了Python在机器学习中的关键角色,重点介绍了Scikit-learn、TensorFlow和PyTorch等流行库。随着技术进步,未来Python机器学习工具将聚焦自动化、智能化、可解释性和可信赖性,并促进跨领域创新,结合云端与边缘计算,为各领域应用带来更高效、可靠的解决方案。
|
6天前
|
机器学习/深度学习 分布式计算 物联网
【Python机器学习专栏】联邦学习:保护隐私的机器学习新趋势
【4月更文挑战第30天】联邦学习是保障数据隐私的分布式机器学习方法,允许设备在本地训练数据并仅共享模型,保护用户隐私。其优势包括数据隐私、分布式计算和模型泛化。应用于医疗、金融和物联网等领域,未来将发展更高效的数据隐私保护、提升可解释性和可靠性的,并与其他技术融合,为机器学习带来新机遇。
|
6天前
|
机器学习/深度学习 自然语言处理 搜索推荐
【Python机器学习专栏】迁移学习在机器学习中的应用
【4月更文挑战第30天】迁移学习是利用已有知识解决新问题的机器学习方法,尤其在数据稀缺或资源有限时展现优势。本文介绍了迁移学习的基本概念,包括源域和目标域,并探讨了其在图像识别、自然语言处理和推荐系统的应用。在Python中,可使用Keras或TensorFlow实现迁移学习,如示例所示,通过预训练的VGG16模型进行图像识别。迁移学习提高了学习效率和性能,随着技术发展,其应用前景广阔。
|
6天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习中的Bagging与Boosting
【4月更文挑战第30天】本文介绍了集成学习中的两种主要策略:Bagging和Boosting。Bagging通过自助采样构建多个基学习器并以投票或平均法集成,降低模型方差,增强稳定性。在Python中可使用`BaggingClassifier`实现。而Boosting是串行学习,不断调整基学习器权重以优化拟合,适合弱学习器。Python中可利用`AdaBoostClassifier`等实现。示例代码展示了如何在实践中运用这两种方法。
|
6天前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习专栏】关联规则学习:Apriori算法详解
【4月更文挑战第30天】Apriori算法是一种用于关联规则学习的经典算法,尤其适用于购物篮分析,以发现商品间的购买关联。该算法基于支持度和置信度指标,通过迭代生成频繁项集并提取满足阈值的规则。Python中可借助mlxtend库实现Apriori,例如处理购物篮数据,设置支持度和置信度阈值,找出相关规则。
|
6天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】集成学习算法的原理与应用
【4月更文挑战第30天】集成学习通过组合多个基学习器提升预测准确性,广泛应用于分类、回归等问题。主要步骤包括生成基学习器、训练和结合预测结果。算法类型有Bagging(如随机森林)、Boosting(如AdaBoost)和Stacking。Python中可使用scikit-learn实现,如示例代码展示的随机森林分类。集成学习能降低模型方差,缓解过拟合,提高预测性能。
|
6天前
|
Serverless Python
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例:加载CSV数据,计算5日、10日和20日MA,然后在K线图上绘制。通过`rolling()`计算平均值,`plot()`函数展示图表,`legend()`添加图例。可利用matplotlib参数自定义样式。查阅matplotlib文档以获取更多定制选项。
18 1
|
6天前
|
数据采集 SQL 数据挖掘
Python数据分析中的Pandas库应用指南
在数据科学和分析领域,Python语言已经成为了一种非常流行的工具。本文将介绍Python中的Pandas库,该库提供了强大的数据结构和数据分析工具,使得数据处理变得更加简单高效。通过详细的示例和应用指南,读者将了解到如何使用Pandas库进行数据加载、清洗、转换和分析,从而提升数据处理的效率和准确性。
|
6天前
|
SQL 关系型数据库 MySQL
使用Python的pymysql库连接MySQL,执行CRUD操作
使用Python的pymysql库连接MySQL,执行CRUD操作:安装pymysql,然后连接(host=&#39;localhost&#39;,user=&#39;root&#39;,password=&#39;yourpassword&#39;,database=&#39;yourdatabase&#39;),创建游标。查询数据示例:`SELECT * FROM yourtable`;插入数据:`INSERT INTO yourtable...`;更新数据:`UPDATE yourtable SET...`;删除数据:`DELETE FROM yourtable WHERE...`。
15 0