Python 文件读写与操作详解
文件处理的基本步骤
在 Python 中进行文件操作通常遵循三个核心步骤:
- 调用
open()函数打开文件,获取文件对象(也称为文件句柄)。 - 使用该句柄对文件内容执行读取、写入或修改等操作。
- 完成操作后关闭文件,释放系统资源。推荐使用
with语句自动管理文件生命周期,避免手动调用close()可能遗漏的问题。
读取文件内容
从文件中提取数据是许多应用的基础,如日志分析、配置加载和文本处理。Python 提供了多种方式来读取文件内容,适应不同场景需求。
一次性读取全部内容
使用 read() 方法可以将整个文件内容作为字符串加载到内存中:
with open("poem.txt", "r", encoding="utf-8") as f:
content = f.read()
print(content.rstrip()) # 去除末尾可能的空行
上述代码中的 rstrip() 用于清除字符串末尾的空白字符,防止输出时多出一行空行——这是因为 read() 在到达文件结尾时会包含一个换行符。
按行读取并存储为列表
若需逐行处理且后续复用各行数据,可使用 readlines() 将每行保存为列表元素:
with open("poem.txt", "r", encoding="utf-8") as f:
lines = f.readlines()
for line in lines:
print(line.strip())
注意:虽然 f.readlines() 在 with 块内执行,但变量 lines 在块外仍可访问,便于延迟处理。
逐行迭代大文件
对于大型文件,不宜一次性加载全部内容以免占用过多内存。此时应直接遍历文件对象:
with open("large_file.log", "r", encoding="utf-8") as f:
for index, line in enumerate(f, start=1):
if index == 10:
print("---------- 分割线 ----------")
continue
print(line.strip())
这种方式每次只读取一行,效率高且内存友好。
文件指针操作
文件读取本质是文件指针的移动。可通过以下方法控制位置:
tell():返回当前指针位置(字节数)。seek(offset):将指针移动至指定偏移量处。
with open("poem.txt", "r", encoding="utf-8") as f:
print(f.tell()) # 输出: 0
print(f.read(10)) # 读取前10个字符
print(f.tell()) # 输出: 10
f.seek(0) # 指针回到开头
print(f.readline()) # 再次读取第一行
写入与更新文件
向文件写入数据是持久化信息的关键手段。Python 支持多种写入模式:
覆盖写入新内容
以 'w' 模式打开文件会清空原内容;若文件不存在则自动创建:
with open("output.txt", "w", encoding="utf-8") as f:
f.write("泰戈尔,大哥\n")
f.write("我爱北京天安门\n")
f.write("天安门上太阳升\n")
追加内容到文件末尾
使用 'a' 模式可在不删除原有内容的前提下添加新数据:
with open("output.txt", "a", encoding="utf-8") as f:
f.write("歌声响彻天地间\n")
读写结合模式
某些模式支持同时读写:
r+:可读可写,文件必须存在。w+:可读可写,无论是否存在都会创建新文件并清空内容。a+:附加读写,写入总是在末尾进行。
强制刷新缓冲区
有时需要立即将内容写入磁盘而非等待系统缓存,例如实现进度条效果:
import sys
import time
with open("progress.tmp", "w") as f:
for i in range(20):
f.write("#")
f.flush() # 立即写入磁盘
time.sleep(0.1)
类似地,终端进度条可通过刷新标准输出实现:
for i in range(20):
sys.stdout.write("#")
sys.stdout.flush()
time.sleep(0.1)
截断文件内容
truncate() 方法可用于缩短文件长度:
with open("draft.txt", "r+", encoding="utf-8") as f:
f.truncate(50) # 仅保留前50个字符
若未指定参数,则从当前位置截断至末尾。
修改现有文件内容
由于无法直接"就地"修改文件,常见做法有两种:
方式一:全量加载并在内存中替换
适用于小文件:
with open("config.txt", "r", encoding="utf-8") as f:
data = f.read().replace("old_ip", "192.168.42.111")
with open("config.txt", "w", encoding="utf-8") as f:
f.write(data)
方式二:边读边写入临时文件
更安全且适合大文件:
with open("config.txt", "r", encoding="utf-8") as src, \
open("config_new.txt", "w", encoding="utf-8") as dst:
for line in src:
updated_line = line.replace("old_ip", "192.168.42.111")
dst.write(updated_line)
# 替换原文件(可选)
import os
os.replace("config_new.txt", "config.txt")
常用文件方法总结
| 方法 | 说明 |
|---|---|
seek(offset, whence) | 移动文件指针。whence=0(起始)、1(当前)、2(末尾),后两者仅适用于二进制模式。 |
tell() | 获取当前指针位置。 |
truncate(n) | 截断文件至 n 字节;无参则截断到当前位置。 |
readline(n) | 读取单行,最多 n 个字节。 |
readlines() | 返回所有行组成的列表。 |
read() | 读取全部内容为字符串。 |
文件打开模式对比
- r: 只读,文件不存在时报错。
- r+: 可读可写,不创建新文件。
- w: 覆盖写,文件存在则清空,不存在则创建。
- w+: 可读可写,行为同 w。
- a: 追加写,只能在末尾写入。
- a+: 追加读写,读操作不受限,写始终在末尾。