发布时间:2022-06-29 文章分类:编程知识 投稿人:赵颖 字号: 默认 | | 超大 打印

Python模块学习 ---- fileinput

分类: Python 1240人阅读 评论(1) 收藏 举报

这几天有这样一个需求,要将用户登陆系统的信息统计出来,做成一个报表。当用户登陆成功的时候,服务器会往日志文件里写一条像下面这种格式的记录:”日期时间@用户名@IP“,这样的日志文件第天生成一个。所以,我们只要编历这些日志文件,将所有的登陆信息提取出来,并重新组织数据格式就可以了。用python写一个分析工具非常简单,你会说,用glob获取所有的日志文件,然后对每个日志文件都open(logfile),再一行一行的读取;或者用os.walk,也很简单。其实,标准库提供了另一个辅助模块,我们可以非常方便的完成这个工作,那就是fileinput。下面我们就通过fileinput来编历所有的D盘下的文本文件,将每一行的长度打印出来:

[python] view plaincopyprint?

  1. importfileinput
  2. fromglobimportglob
  3. forlineinfileinput.input(glob(r'd:/*.txt')):
  4. printfileinput.lineno(),u'文件:',fileinput.filename(),/
  5. u'行号:',fileinput.filelineno(),u'长度:',len(line.strip('/n'))
  6. fileinput.close()
import fileinput
from glob import glob
for line in fileinput.input(glob(r'd:/*.txt')):
print fileinput.lineno(), u'文件:', fileinput.filename(), /
u'行号:', fileinput.filelineno(), u'长度:', len(line.strip('/n'))
fileinput.close()

代码非常简单明了。input()接受要编历的所有文件路径的列表,通过filename()返回当前正在读取的文件的文件名,filelineno()返回当前读取的行的行号,而lineno()返回当前已经读取的行的数量(或者序号)。其实,模块内部通过FileInput类来实现文件的编历读取,input()在内部创建了该类的一个对象,当处理完数据行之后,通过fileinput.close()来关闭这个内部对象。

模块非常简单,详细的内容可以参数标准库手册。