python 使用正则表达式提取字符串中的 url
给定一个字符串,里面包含 url 地址,需要我们使用正则表达式来获取字符串的 url。
实例
import re
def find(string):
# findall() 查找匹配正则表达式的字符串 url = re.findall('https?://(?:[-w.]|(?:%[da-fa-f]{2}))+', string) return url
string = '51frw 的网页地址为:https://www.51frw.cn,google 的网页地址为:https://www.google.com' print("urls: ", find(string))
?: 说明:
(?:x)
匹配 x 但是不记住匹配项。这种括号叫作非捕获括号,使得你能够定义与正则表达式运算符一起使用的子表达式。看看这个例子 /(?:foo){1,2}/。如果表达式是 /foo{1,2}/,{1,2} 将只应用于 'foo' 的最后一个字符 'o'。如果使用非捕获括号,则 {1,2} 会应用于整个 'foo' 单词。
执行以上代码输出结果为:
urls: ['https://www.51frw.cn', 'https://www.google.com']
【说明】:本文章由站长整理发布,文章内容不代表本站观点,如文中有侵权行为,请与本站客服联系(QQ:254677821)!