⼀.获取字符串中:
a.所有的正整数
b.所有的负整数
c.所有的浮点数
d.所有的⾮负浮点数
import re
# 所有的正整数
def is_positive_integer(string):
pattern = r[^\-\.\d](\d+)[^\.\d]*'
result = re.findall(pattern, string)
if result:
return result
else:
return False
# 所有的负整数
def is_negative_integer(string):
pattern = r'-[1-9]\d*'
result = re.findall(pattern, string)
if result:
return result
else:
return False
# 所有的浮点数
def is_float(string):
pattern = r'-?[1-9]\d*\.\d*'
result = re.findall(pattern, string)
if result:
return result
else:
return False
# 所有的⾮负浮点数
def is_negative_float(string):
pattern = r'-[1-9]\d*\.\d*'
result = re.findall(pattern, string)
if result:
return result
else:
return False
if __name__ == '__main__':
pass
⼆、不定项选择题
- 能够完全匹配字符串“(010)-62661617”和字符串“01062661617”的正则表达式包括(b )
A. “(?\d{3})?-?\d{8}”
B. “[0-9()-]+”
C. “[0-9(-)]\d”
D. “[(]?\d[)-]\d*” - 能够完全匹配字符串“c:\rapidminer\lib\plugs”的正则表达式包括( bc)
A. “c:\rapidminer\lib\plugs”
B. “c:\\rapidminer\\lib\\plugs”
C. “(?i)C:\\RapidMiner\\Lib\\Plugs” ?i:将后⾯的内容的⼤写变成⼩写
D. “(?s)C:\\RapidMiner\\Lib\\Plugs” ?s:单⾏匹配 - 能够完全匹配字符串“back”和“back-end”的正则表达式包括(ac ) 短路操作:前⾯的为真了,就不会再执⾏后边的操作
A. “\w{4}-\w{3}|\w{4}” B. “\w{4}|\w{4}-\w{3}” C. “\S+-\S+|\S+” D. “\w\b-\b\w|\w*” - 能够完全匹配字符串“go go”和“kitty kitty”,但不能完全匹配“go kitty”的正则表达式包括(acd )
:\1就是重复前⾯第⼀个()/组合⾥⾯的内容
:\2就是重复前⾯第⼆个()/组合⾥⾯的内容
A. “\b(\w+)\b\s+\1\b”
B. “\w{2,5}\s*\1”
C. “(\S+) \s+\1”
D. “(\S{2,5})\s{1,}\1” - 能够在字符串中匹配“aab”,⽽不能匹配“aaab”和“aaaab”的正则表达式包括( b)
A. “a?b”
B. “a{,2}b”
C. “aa??b”
D. “aaa??b”
三.观察下⾯双引号内的⽂本”
中⽂名: ⻉拉克·侯赛因·奥巴⻢
外⽂名: Barack Hussein Obama II
别 名 :欧巴⻢
国籍: 美国
⺠ 族: 德裔族
出⽣地: 美国夏威夷州檀⾹⼭
出⽣⽇期: 1961年8⽉4⽇
职 业: 政治家、律师、总统
毕业院校: 哥伦⽐亚⼤学,哈佛⼤学
信 仰 :新教
主要成就: 1996年伊利诺伊州参议员 主要成就美国第56届、57届总统2009年诺⻉尔和平奖获得者 时代周刊年度⻛云⼈物2008、2011 任期内清除本·拉登
代表作品 :《我相信变⾰》《我⽗亲的梦想》《⽆畏的希望》
所属政党美国⺠主党
⾎ 型 AB型
学 院⻄⽅学院
妻 ⼦: ⽶歇尔·拉沃恩·奥巴⻢
性 别 男
”
a. (此题为示范题)当使⽤正则表达式“中⽂名\s+(\S+)\s+”抽取美国总统奥巴⻢的中⽂名时,替换字符串“1”的赋值为需要抽取的中⽂名。 b. 当使⽤正则表达式“_____[A-Z][a-z]*\s[A-Z][a-z]*\s[A-Z][a-z]*\s[A-Z]*______”抽取美国总统奥巴⻢的外⽂名时,替换字符串“1”的赋值为需要抽取的
外⽂名。
c. 当使⽤正则表达式“_________\d{4}.\d{1,2}.\d{1,2}._________”抽取美国总统奥巴⻢的出⽣⽇期时,替换字符
串“1”的赋值为需要抽取的出⽣⽇期。 d. 使⽤正则表达式“__________\d{4}[^\d]\d{1,2}[^\d]\d{1,2}[^\d]______________”抽取美国总统奥巴⻢的职业时,替换字符串“1”的赋值
为需要抽取的职业。
e. 使⽤正则表达式“_____:(\s\d{4}.·..)_______”抽取美国总统奥巴⻢的主要成就时,替换字符
串“1”的赋值为需要抽取的主要成就。 f. 使⽤正则表达式“_____________.{3}·.{3}·.{3}_________________”抽取美国总统奥巴⻢的妻⼦姓名时,替换字符 串“1”的赋值为需要抽取的姓名。