当前位置:首页 > 技术 > 正文内容

多字符串替换导致索引错乱问题及解决方案(含代码)

代码老兵 技术 35

一、问题背景

对字符串中的多个位置进行替换

比如:

s = "abcdefg"

# (起始位置, 长度, 替换内容)
replacements = [
   (1, 2, "XX"),
   (4, 2, "YY")
]

直觉写法通常是这样:

for start, length, new_str in replacements:
   s = s[:start] + new_str + s[start+length:]

但运行后会发现:

结果是错的!


二、问题本质

原因很简单但非常隐蔽:

字符串被修改后,长度发生变化,导致后续索引失效

举个例子:

原始:  abcdefg
替换1: aXXdefg   (长度变化了)
替换2: 还在用原来的 index=4 → 已经错位了

这就是典型的:

Index Shift(索引偏移)问题


三、解决方案

思路

从后往前替换,避免影响前面的索引

实现

s = "abcdefg"

replacements = [
   (1, 2, "XX"),
   (4, 2, "YY")
]

# 按起始位置倒序排序
replacements.sort(key=lambda x: x[0], reverse=True)

for start, length, new_str in replacements:
   s = s[:start] + new_str + s[start+length:]

print(s)

优点

  • 简单直观

  • 不需要额外变量

  • 适合绝大多数场景


四、解决方案二:引入 offset 偏移量

思路

每次替换后记录长度变化,动态修正后续位置

实现

s = "abcdefg"

replacements = [
   (1, 2, "XXXX"),
   (4, 2, "YY")
]

offset = 0

for start, length, new_str in replacements:
   real_start = start + offset
   
   s = s[:real_start] + new_str + s[real_start+length:]
   
   offset += len(new_str) - length

print(s)

适用场景

  • 替换顺序必须固定

  • 有业务逻辑依赖顺序


五、解决方案三:构造新字符串

思路

不修改原字符串,而是重新“拼接”一个新字符串

实现

s = "abcdefg"

replacements = [
   (1, 2, "XX"),
   (4, 2, "YY")
]

result = []
prev = 0

for start, length, new_str in sorted(replacements):
   result.append(s[prev:start])
   result.append(new_str)
   prev = start + length

result.append(s[prev:])

final = "".join(result)

print(final)

优点

  • 不会出现索引错乱

  • 性能更好(避免反复复制字符串)

  • 适合大规模文本处理


标签: Python

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。