Python split() 不删除分隔符[重复]
- 2025-02-18 09:24:00
- admin 原创
- 91
问题描述:
这段代码几乎满足了我的需要。
for line in all_lines:
s = line.split('>')
除了它删除了所有“>”分隔符之外。
所以,
<html><head>
变成
['<html','<head']
有没有办法使用 split() 方法但保留分隔符,而不是删除它?
有了这些结果..
['<html>','<head>']
解决方案 1:
d = ">"
for line in all_lines:
s = [e+d for e in line.split(d) if e]
解决方案 2:
如果您使用拆分来解析 HTML,那么您很可能做错了,除非您正在编写针对固定且安全的内容文件的一次性脚本。如果它应该适用于任何 HTML 输入,那么您将如何处理类似这样的事情<a title='growth > 8%' href='#something'>
?
无论如何,以下对我有用:
>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']
解决方案 3:
这个怎么样:
import re
s = '<html><head>'
re.findall('[^>]+>', s)
解决方案 4:
只需将其拆分,然后为数组/列表中的每个元素(最后一个元素除外)添加尾随“>”。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD