Python 匹配 HTML tag 的时候，＜.＞和＜.?＞区别

飞熊 • 2023年5月10日下午10:55 • 后端笔记 • 阅读 278

命运对每个人都是一样的，不一样的是各自的努力和付出不同，付出的越多，努力的越多，得到的回报也越多，在你累的时候请看一下身边比你成功却还比你更努力的人，这样，你就会更有动力。

导读：本篇文章讲解 Python 匹配 HTML tag 的时候，＜.*＞和＜.*?＞区别，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

二者区别：

<.*>是贪婪匹配，会从第一个“<”开始匹配，直到最后一个“>”中间所有的字符都会匹配到，中间可能会包含 “<>”。
<.*?>是非贪婪匹配，从第一个“<”开始往后，遇到第一个“>”结束匹配，这中间的字符串都会匹配到，但是不会有“<>”。

在形式上非贪婪模式有一个“？”作为该部分的结束标志。

在功能上贪婪模式是尽可能多的匹配当前正则表达式，可能会包含好几个满足正则表达式的字符串，非贪婪模式，在满足所有正则表达式的情况下尽可能少的匹配当前正则表达式。

示例代码：

import re

s = "<html><head><title>MyPageTitle</title></head><body><table><tr><th>AAAAAA</th></tr><tr><td>BBBBBB</td></tr><tr><td>CCCCCC</td></tr><tr><td>DDDDDDD</td></tr></table></body></html>"

res = re.findall(r'<tr>(.*?)</tr>', s)[0]
print(res)
res = re.findall(r'<tr>(.*)</tr>', s)[0]
print(res)
res = re.findall(r'<tr>(.?)</tr>', s)
print(res)

运行结果：

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之家整理，本文链接：https://www.bmabk.com/index.php/post/142766.html

赞 (0)

0 0

后端笔记

sqli-labs靶场安装

000402

飞熊
2023年4月16日
后端笔记

Java基础堆和栈的概念和区别

000235

Java光头强
2023年2月19日
后端笔记

git命令行推送本地分支到远程仓库

000427

飞熊
2023年8月4日
后端笔记

Socket编程：实现网络通信的基础知识与技巧

000300

飞熊
2023年12月11日
后端笔记

Docker离线安装详解

000302

飞熊
2023年5月10日
后端笔记

探索HTTP错误码302 Found：原理、应用与解决方法

000579

飞熊
2023年12月11日
后端笔记

Vue组件之间的通信-父传子-子传父

000310

seven_
2023年3月1日
后端笔记

【机器学习】“冷启动” 问题

000344

seven_
2023年2月26日
后端笔记

一个简单的python异常重试

000252

飞熊
2023年12月11日
后端笔记

Java-“equals“ 与 “==“详解

000243

飞熊
2023年7月24日
后端笔记

信息摘要、数字签名、数字证书、对称加密与非对称加密详解

000323

seven_
2023年2月27日
后端笔记

Flask框架笔记

000213

seven_
2023年2月27日

发表回复

登录后才能评论

极客之家——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！