当前位置:首页 > 技术 > 正文内容

Python 文件读写与操作详解

访客 技术 2026年6月24日 1

文件处理的基本步骤

在 Python 中进行文件操作通常遵循三个核心步骤:

  1. 调用 open() 函数打开文件,获取文件对象(也称为文件句柄)。
  2. 使用该句柄对文件内容执行读取、写入或修改等操作。
  3. 完成操作后关闭文件,释放系统资源。推荐使用 with 语句自动管理文件生命周期,避免手动调用 close() 可能遗漏的问题。

读取文件内容

从文件中提取数据是许多应用的基础,如日志分析、配置加载和文本处理。Python 提供了多种方式来读取文件内容,适应不同场景需求。

一次性读取全部内容

使用 read() 方法可以将整个文件内容作为字符串加载到内存中:

with open("poem.txt", "r", encoding="utf-8") as f:
    content = f.read()
    print(content.rstrip())  # 去除末尾可能的空行

上述代码中的 rstrip() 用于清除字符串末尾的空白字符,防止输出时多出一行空行——这是因为 read() 在到达文件结尾时会包含一个换行符。

按行读取并存储为列表

若需逐行处理且后续复用各行数据,可使用 readlines() 将每行保存为列表元素:

with open("poem.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()

for line in lines:
    print(line.strip())

注意:虽然 f.readlines()with 块内执行,但变量 lines 在块外仍可访问,便于延迟处理。

逐行迭代大文件

对于大型文件,不宜一次性加载全部内容以免占用过多内存。此时应直接遍历文件对象:

with open("large_file.log", "r", encoding="utf-8") as f:
    for index, line in enumerate(f, start=1):
        if index == 10:
            print("---------- 分割线 ----------")
            continue
        print(line.strip())

这种方式每次只读取一行,效率高且内存友好。

文件指针操作

文件读取本质是文件指针的移动。可通过以下方法控制位置:

  • tell():返回当前指针位置(字节数)。
  • seek(offset):将指针移动至指定偏移量处。
with open("poem.txt", "r", encoding="utf-8") as f:
    print(f.tell())           # 输出: 0
    print(f.read(10))         # 读取前10个字符
    print(f.tell())           # 输出: 10
    f.seek(0)                 # 指针回到开头
    print(f.readline())       # 再次读取第一行

写入与更新文件

向文件写入数据是持久化信息的关键手段。Python 支持多种写入模式:

覆盖写入新内容

'w' 模式打开文件会清空原内容;若文件不存在则自动创建:

with open("output.txt", "w", encoding="utf-8") as f:
    f.write("泰戈尔,大哥\n")
    f.write("我爱北京天安门\n")
    f.write("天安门上太阳升\n")

追加内容到文件末尾

使用 'a' 模式可在不删除原有内容的前提下添加新数据:

with open("output.txt", "a", encoding="utf-8") as f:
    f.write("歌声响彻天地间\n")

读写结合模式

某些模式支持同时读写:

  • r+:可读可写,文件必须存在。
  • w+:可读可写,无论是否存在都会创建新文件并清空内容。
  • a+:附加读写,写入总是在末尾进行。

强制刷新缓冲区

有时需要立即将内容写入磁盘而非等待系统缓存,例如实现进度条效果:

import sys
import time

with open("progress.tmp", "w") as f:
    for i in range(20):
        f.write("#")
        f.flush()  # 立即写入磁盘
        time.sleep(0.1)

类似地,终端进度条可通过刷新标准输出实现:

for i in range(20):
    sys.stdout.write("#")
    sys.stdout.flush()
    time.sleep(0.1)

截断文件内容

truncate() 方法可用于缩短文件长度:

with open("draft.txt", "r+", encoding="utf-8") as f:
    f.truncate(50)  # 仅保留前50个字符

若未指定参数,则从当前位置截断至末尾。

修改现有文件内容

由于无法直接"就地"修改文件,常见做法有两种:

方式一:全量加载并在内存中替换

适用于小文件:

with open("config.txt", "r", encoding="utf-8") as f:
    data = f.read().replace("old_ip", "192.168.42.111")

with open("config.txt", "w", encoding="utf-8") as f:
    f.write(data)

方式二:边读边写入临时文件

更安全且适合大文件:

with open("config.txt", "r", encoding="utf-8") as src, \
     open("config_new.txt", "w", encoding="utf-8") as dst:
    for line in src:
        updated_line = line.replace("old_ip", "192.168.42.111")
        dst.write(updated_line)

# 替换原文件(可选)
import os
os.replace("config_new.txt", "config.txt")

常用文件方法总结

方法说明
seek(offset, whence)移动文件指针。whence=0(起始)、1(当前)、2(末尾),后两者仅适用于二进制模式。
tell()获取当前指针位置。
truncate(n)截断文件至 n 字节;无参则截断到当前位置。
readline(n)读取单行,最多 n 个字节。
readlines()返回所有行组成的列表。
read()读取全部内容为字符串。

文件打开模式对比

  • r: 只读,文件不存在时报错。
  • r+: 可读可写,不创建新文件。
  • w: 覆盖写,文件存在则清空,不存在则创建。
  • w+: 可读可写,行为同 w。
  • a: 追加写,只能在末尾写入。
  • a+: 追加读写,读操作不受限,写始终在末尾。

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。