第二十八课:文件:因为懂你,所以更永恒

96
无罪的坏人
2018.08.02 23:48* 字数 1235

内容来源于网络,本人只是在此稍作整理,如有涉及版权问题,归小甲鱼官方所有。

练习题(来自小甲鱼官方论坛)

0. 下边只有一种方式不能打开文件,请问是哪一种,为什么?

>>> f = open('E:/test.txt','w') #A
>>> f = open('E:\test.txt','w') #B
>>> f = open('E://test.txt','w') #C
>>> f = open('E:\\test.txt','w') #D

答:B不能打开文件。
Windows在路径名中既可以接受斜线(/)也可以接受反斜线(\),不过如果使用反斜线作为路径名的分隔符的话,要注意使用双
行转义,否则Python会将反斜线进行转义,例如(\n)看成一个换行符,(\t)看作一个制表符等。


1. 打开一个文件我们使用open()函数,通过设置文件的打开模式,决定打开的文件具有那些性质,请问默认的打开模式是什么呢?

答:open()函数默认的打开模式是' rt',即可读、文本的模式打开。


2. 请问 >>> open(' E: \Test.bin' , ' xb' ) 是以什么样的模式打开文件的?

答:以“可写入以及二进制模式”打来文件“E:\Test.bin”。
这里要注意的是' x'和' w'均是以“可写入”的模式打开文件,但以' x'模式打开的时候,如果路径下已经存在相同的文件名,会抛出异常,而'w'模式的话会直接覆盖同名文件。
因此,' w'模式打开文件会比较危险,容易导致此前的内容遗失,因此使用' w'模式打开文件前先检查该文件名是否已经存在显得非常重要!下节课小甲鱼会教你如何安全的打开一个文件。


3.尽管Python有所谓的“垃圾回收机制”,但对于打开了的文件,在不需要用到的时候我们仍然使用f. close()将文件对象“关闭”,这是为什么呢?

答:Python拥有垃圾收集机制,会在文件对象的引用计数降至零的时候自动关闭文件,所以在Python编程里,如果忘记关闭文件并不会带来什么危险。
但并不是说就可以不要关闭文件,如果你对文件进行了写入操作,那么你应该在完成写入之后进行关闭文件。因为Python可能会缓存你写入文件中的数据,如果这中间断电了神马的,那些缓存的数据根本就不会写入到文件中。所以,为了安全起见,要养成使用完文件后立刻关闭的优雅习惯。


4. 如何将一个文件对象(f)中的数据存放进列表中?

答:list(f)即可。


5. 如何迭代打印出文件对象(f)中的每一行数据?

答:直接使用for语句把文件对象迭代出来即可:

f.seek(0, 0)
for each_line in f:
    print(each_line)

6. 文件对象的内置方法f. read([size=-1])作用是读取文件对象内容,size参数是可选的,那如果设置了size=10,例如f. read(10),将返回什么?

答:将返回从文件指针开始(注意这里并不是文件头哦)的连续10个字符。


7.如何获得文件对象(f)当前文件指针的位置?

答:f.tell()即可。


8. 还是视频中的那个演示文件(record. txt),请问为何f. seek(45, 0)不会出错,但f. seek(46)就出错了呢?

>>> f.seek(46)
46
>>> f.readline()
Traceback (most recent call last):
    Flie "<pyshell#18>", line 1, in <module>
        f.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe3 in possition 4:illegal multibyte sequence

答:因为使用f. seek()定位的文件指针是按字节为单位进行计算的,演示文件(record. txt)是以GBK进行编码的,按照规则,一个汉字需要两个字节,f. seek(45)的位置位于字符“小”的开始位置,因此可以正常打印,而f. seek(46)的位置刚好位于字符“小”的中间位置,因此按照GBK的编码规则将无法将其解码!


编程题

0.试尝试将文件(OpenMe.mp3)打印到屏幕上。

答:直接使用打开文本文件的形式打开即可。

f = open('OpenMe.mp3')
for each_line in f:
    print(each_line , end='')
f.close()

输出结果:

长期使用Windows操作系统的朋友很容易被扩展名所误导,认为扩展名决定文件类型,其实这种观念是错误的!

其实这就跟一个姓张的坏人,尽管把名字改为了“张好人”,但他还是一个坏人是一个道理的^_^

关于文件的扩展名,初学者容易走进的误区:

误区一:文件扩展名是一个文件的必要构成部分

一个文件可以有或没有扩展名,对于打开文件操作,没有扩展名的文件需要选择程序去打开它,有扩展名的文件会自动用设置好的程序(如有)去尝试打开(是“尝试打开”,而不是“打开”的原因参看下面的第2个误区),文件扩展名是一个常规文件的构成部分,但一个文件并不一定需要一个扩展名。

误区二:文件扩展名表明了该文件是何种类型

文件扩展名可以人为设定,扩展名为TXT的文件有可能是一张图片,同样,扩展名为M-P3的文件,依然可能是一个视频。

1. 编写代码,将上一题中的文件(OpenMe.mp3)保存为新文件(OpenMe. txt)

答:

# 第一种方法:
f1 = open('D:\Python\Python3\OpenMe.mp3')
f2 = open('D:\Python\Python3\OpenMe.txt','x')
for each_line in f1:
    f2.write(each_line)
f1.close()
f2.close()

#第二种方法
f1 = open('D:\Python\Python3\OpenMe.mp3')
f2 = open('D:\Python\Python3\OpenMe2.txt','x')
f2.write(f1.read())
f1.close()
f2.close() 

2.请写下这一节课你学习到的内容:格式不限,回忆并复述是加强记忆的好方式!

  • 利用help(open)可以看到open()函数的定义:open(file,mode='r',buffering=1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
    默认打开模式是'rt',也就是只读和文本模式。
打开模式 执行操作
'r' 以只读方式打开文件(默认)
'w' 以写入的方式打开文件,会覆盖已存在的文件(有风险**)
'x' 如果文件已经存在,使用此模式打开将引发异常
'a' 以写入模式打开,如果文件存在,则在末尾追加写入
'b' 以二进制模式打开文件
't' 以文本模式打开(默认)
'+' 可读写模式(可添加到其他模式中使用)
'U' 通用换行符支持
  • 文件对象的方法
文件对象的方法 执行操作
close() 关闭文件
read(size=-1) 从文件读取size个字符(单位是字节,中文算2个字节),当未给定size或给定负值的时候,读取剩余的所有字符,然后作为字符串返回(注意这里的读取是从文件指针开始读取,而不是从初始位置)
readline() 从文件中读取一整行字符串(包括末尾的换行'\n')
write(str) 将字符串str写入文件
writelines(seq) 向文件写入字符串序列seq,seq应该是一个返回字符串的可迭代对象
seek(offset, from) 在文件中移动文件指针,从from(0代表文件起始位置,1代表当前位置,2代表文件末尾)偏移offset个字节
tell() 返回当前文件指针在文件中的位置
# 打开文件
fo = open("D:\Python\Python3\c.txt", "x")
print("文件名为: ", fo.name)
seq = ["菜鸟教程 1\n", "菜鸟教程 2"]
fo.writelines( seq )  
# 关闭文件
fo.close()
# 输出就是写入以下内容到c.txt中:
菜鸟教程 1
菜鸟教程 2

Web note ad 1