fatiherikli

php'deki strip_tags fonksiyonu gibi bir şeye ihtiyacım vardı. oturupta reguler expression kasmaya üşendim. zaten yapmışlardır dedim ki yapmışlar. aşağıdaki gibi bir ifade işinizi görecektir.

def strip_tags(data):

p = re.compile(r'<.*?>')

return p.sub(", data)

ayrıca aşağıdaki de işinizi kolaylaştırabilir. ekstra boşlukları temizliyor. html parse işlemi yaparken arayacağınız tool'lardan biri.

def clean(data):

p = re.compile(r'\s+')

return p.sub(' ', data)

betiğinizin başınde import re demeyi unutmayın. öptüm.

comments powered by Disqus