在 re.sub() repr 表达式中的函数调用中,不能使用 '\1' 反向引用来捕获组
- 2025-04-15 09:20:00
- admin 原创
- 29
问题描述:
我有一个字符串S = '02143'
和一个列表A = ['a','b','c','d','e']
。我想将'S'中的所有数字替换为列表中相应的元素A
。
例如,替换0
为A[0]
,2
替换为A[2]
等等。最终输出应为S = 'acbed'
。
我试过:
S = re.sub(r'([0-9])', A[int(r'g<1>')], S)
但是这会导致错误ValueError: invalid literal for int() with base 10: '\g<1>'
。我猜它把反向引用当成了'g<1>'
字符串。我该如何解决这个问题,尤其是使用re.sub
捕获组,还是其他什么方法?
解决方案 1:
re.sub(r'([0-9])',A[int(r'g<1>')],S)
不起作用的原因是g<1>
(这是第一个反向引用的明确表示,否则写为)反向引用仅在用于字符串替换模式时才有效。如果将其传递给另一个方法,它将“看到”的只是
g<1>
文字字符串,因为re
模块当时没有任何机会对其进行评估。re
引擎仅在匹配期间对其进行评估,但该部分在引擎尝试查找匹配A[int(r'g<1>')]
之前就进行了评估。re
这就是为什么可以使用内部回调方法re.sub
作为替换参数:您可以将匹配的组值传递给任何外部方法进行高级操作。
请参阅re
文档:
re.sub(pattern, repl, string, count=0, flags=0)
如果
repl
是一个函数,则每当 不重叠 出现时都会调用它pattern
。该函数接受一个匹配对象参数,并返回替换字符串。
使用
import re
S = '02143'
A = ['a','b','c','d','e']
print(re.sub(r'[0-9]',lambda x: A[int(x.group())],S))
查看Python 演示
请注意,您不需要用括号捕获整个模式,您可以使用访问整个匹配x.group()
。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD