从Python中删除URL中的utm_ *参数

我一直在尝试从URL列表中删除所有utm_ *参数. 我发现的最接近的是: https://gist.github.com/626834. 有任何想法吗? 它有点长,但使用url *模块,并避免重复. from urllib import urlencodefrom urlparse import urlparse, parse_qs, urlunparseurl = http://

我一直在尝试从URL列表中删除所有utm_ *参数.

我发现的最接近的是:
https://gist.github.com/626834.

有任何想法吗?

解决方法

它有点长,但使用url *模块,并避免重复.

from urllib import urlencode
from urlparse import urlparse,parse_qs,urlunparse

url = 'http://whatever.com/somepage?utm_one=3&something=4&utm_two=5&utm_blank&something_else'

parsed = urlparse(url)
qd = parse_qs(parsed.query,keep_blank_values=True)
filtered = dict( (k,v) for k,v in qd.iteritems() if not k.startswith('utm_'))
newurl = urlunparse([
    parsed.scheme,parsed.netloc,parsed.path,parsed.params,urlencode(filtered,doseq=True),# query string
    parsed.fragment
])

print newurl
# 'http://whatever.com/somepage?something=4&something_else'

作者: dawei

【声明】:永州站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

为您推荐

联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部