import re
string ='万科A(000002):万科2018年'
p1 = re.compile(r'[<em>](.*?)[</em>]', re.S)#最小匹配
p2 = re.compile(r'[<em>](.*)[</em>]', re.S)#贪婪匹配
print(re.findall(p1, string))
print(re.findall(p2, string))
结果:
['', '', '', '', 'A(', '', '000002', '', '):', '', '万科', '']
['em>万科</em>A(<em>000002</em>):<em>万科</em']