如下:
links.extend(link for link in get_links(html) if re.match(link_regex, link)) # 上面的语句分开写,如下 # 但下面需要使用links.append,如果依然使用links.extend会出现错误的结果 for link in get_links(html): if re.match(link_regex, link): links.append(link)
让我们用ipython做个实验:
由上图可以看出,for in if 连击推导式隐式的将link由str转变为了list,而分开写是不会帮我们转换的,所以需要使用append把整个str加入到list.
补充:python的for i in list 陷阱
d = [1,2,3,4,5] for i in d: d.remove(i) print d
结果是 :
[2, 4]
这个陷阱比较隐蔽,我再用白盒子测试的时候,发现了这个bug,大致原因就是remove d[0]之后,i 自动变成了 d[1], 但是 d已经变成了 d[2,3,4,5],所以i=d[1]就悲催的指向了3,跳过了2!
看来python还是要注意了解底层实现啊!
解决办法是
d = [1,2,3,4,5] for i in d[:]: d.remove(i) print d
就可以实现边遍历边删除了
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。