问?(.*?)在python中和java中表现不一样?
最近在学习爬虫,对html字符串用python的re解析后,发现结果和预期不太一样,代码和结果如下

python代码
然后用java对同一段html字符串进行测试,发现结果符合预期。

java代码
结论:如果正则表达式包含(xxx),re会对结果进行了优化,自动去除非(xxx)以外的内容(注:xxx为具体的正则表达式)
问?(.*?)在python中和java中表现不一样?
最近在学习爬虫,对html字符串用python的re解析后,发现结果和预期不太一样,代码和结果如下
然后用java对同一段html字符串进行测试,发现结果符合预期。
结论:如果正则表达式包含(xxx),re会对结果进行了优化,自动去除非(xxx)以外的内容(注:xxx为具体的正则表达式)