Python札记2_IO文件操作

在编程工作中,时常需要对各种文件进行操作。读写文件是最常见的IO编程,Python中内置了读写文件的函数。读写文件是请求系统打开一个文件对象,通常称为文件描述符;然后通过操作系统提供的接口从这个文件对象中读取数据,或者将数据写入文件对象。
菜鸟课程
廖雪峰官方课程—IO编程

打开文件

打开文件使用open()函数,用读的模式打开返回的是文件对象,它是可迭代的;如果不存在就会报错IOError,标准的语法为:

open(name[,mode[,buffering]])

open函数的文件名是必须的,模式和缓冲参数是可选:

f = open('c:\text\a.txt','r')  # 用读的模式打开

关闭文件

文件使用完毕必须关闭,因为文件对象会占用操作系统的资源,调用close()函数关闭文件

f.close()

如果读写文件出错,close()函数就不会被调用执行。为了保证文件能够正确关闭文件,使用try...finally实现:

try:
    f = open('/path/to/file', 'r')
    print(f.read())
finally:
    if f:
        f.close()

不同模式

文件打开模式r、w、a对应基本的只读、只写、追加模式b、t、+、U对应二进制模式、文本模式、读写模式、通用换行符。

英文 中文 文件是否存在 是否清空 打开位置
r 只读 报错 文件开头
r+ 读+写 报错 文件开头
w 只写 创建 清空 文件开头
w+ 写+读 创建 清空 文件开头
a 追加写 创建 文件结尾
a+ 追加写+读 创建 文件结尾

读取文件

读取文件对象有3种方式:readreadlinereadlines,每种方法接受一个变量以限制每次读取的数据量。3种方法都会把每行末尾的\n读进来,通过strip()进行去除空格。

file = open('/home/ubuntu/PycharmProjects/test.txt', 'w')
print(file)   
file.close()

# 结果显示为文件对象,用于读操作
<_io.TextIOWrapper name='/home/ubuntu/PycharmProjects/test.txt' mode='w' encoding='UTF-8'>

以test.txt文件为例

Hello python
this is a test file

count = 0 
sum = 0
while count < 3:
    sum += 1
    print("hello linux)"
    count += 1
print("hello python")

1、read
每次读取整个文件,将文件内容放入一个字符串中。如果文件较大,用read(size),指定每次最多读取size个字节。

file = open('/home/ubuntu/PycharmProjects/test.txt', 'r')
res1 = file.read()
file.close()

结果

Hello python
this is a test file

count = 0 
sum = 0
while count < 3:
    sum += 1
    print("hello linux)"
    count += 1
print("hello python")          # str形式

2、readline
每次只读取一行数据,相比较于readlines慢,读取时候占用内存小,适合于大文件,返回的是字符串对象。如果对同一个文件进行多次读取,将会在上次的基础上再进行读取下一行。

file = open('/home/ubuntu/PycharmProjects/test.txt', 'r')

res2 = file.readline()
res2 = file.readline()
res2 = file.readline()   # 空行也算
res2 = file.readline()
print(res2)
file.close()

结果

count = 0    # 结果为第四行的数据,具体看test文件   str形式

3、readlines
读取全部文件内容,自动将文件分成一个行的列表,可用于for...in...迭代获取里面的每个数据。适合读取配置文件

file = open('/home/ubuntu/PycharmProjects/test.txt', 'r')
res3 = file.readlines()
print(res3)
file.close()

结果

['Hello python\n', 'this is a test file\n', '\n', 'count = 0 \n', 'sum = 0\n', 'while count < 3:\n', '    sum += 1\n', '    print("hello linux)"\n', '    count += 1\n', 'print("hello python")\n']    # list形式

去掉空行,并用for...in...进行遍历

file = open('/home/ubuntu/PycharmProjects/test.txt', 'r')
res3 = file.readlines()
for i in res3:
    print(i.strip())    # 去掉空格
file.close()

结果

Hello python
this is a test file

count = 0
sum = 0
while count < 3:
sum += 1
print("hello linux")
count += 1
print("hello python")

with open(...) as f

Python中引入了with语句来自动调用close()方法;传入encodingerrors参数处理编码问题

with open('/path/to/file', 'r', encoding='gbk', errors='ignore') as f:    # 写入特定编码的文件,传入encoding和error参数
    print(f.read())    # 不必再调用close方法

题目

两个文件中,每个有多行的IP地址,找出两个文件中相同的IP地址

import bisect

with open('test1.txt', 'r') as f1:
    list1 = f1.readlines()
for i in range(0, len(list1)):
    list1[i] = list1[i].strip('\n')
with open('test2.txt', 'r') as f2:
    list2 = f2.readlines()
for i in range(0, len(list2)):
    list2[i] = list2[i].strip('\n')

list2.sort()
length_2 = len(list2)
same_data = []
for i in list1:
    pos = bisect.bisect_left(list2, i)
    if pos < len(list2) and list2[pos] == i:
        same_data.append(i)
same_data = list(set(same_data))
print(same_data)


写文件

写文件用write()writelines()来进行操作,用法同readreadlines对应。

write()方法是将字符串写入到文件中。

  • w模式从头开始写入文件
  • a模式从结尾追加文件

writelines()方法是针对列表的操作。它接收一个字符串列表作为参数,将他们写入到文件中,换行符不会自动的加入,因此,需要显式的加入换行符。

f1 = open('test1.txt', 'w')
f1.writelines(["1", "2", "3"])   # 内容为:123

f1 = open('test1.txt', 'w')
f1.writelines(["1\n", "2\n", "3\n"]) 

#    1
#    2        
#    3

编码

  • ASCII:

      - 最早密码本,只包含字母、数字、特殊字符
      - 一个字符一个字节
    
  • Unicode

      - 万国码
      - 一个字符需要4个字节
      - 浪费资源
    
  • utf-8

      - 最小用8位也就是一个字节表示一个字符
      - 字母:一个字节,映射ASCII码
      - 欧洲的文字:两个字节
      - 中文:三个字节
    
  • gbk

      - 国标:每个国家都有自己的国标
      - 字母:一个字节,映射ASCII码
      - 中文:两个字节
    
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,646评论 4 366
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,979评论 1 301
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,391评论 0 250
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,356评论 0 215
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,740评论 3 293
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,836评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,022评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,764评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,487评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,728评论 2 252
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,200评论 1 263
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,548评论 3 260
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,217评论 3 241
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,134评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,921评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,919评论 2 283
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,766评论 2 274