python - Regular expression unicode replace not working -
i have following example in python, , it's not working:
>>> replace = re.compile(ur'најавени', flags=re.ignorecase) >>> doctext = replace.sub("најавени1",doctext) >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал >>> doctext = replace.sub(u"најавени1",doctext) >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал >>> doctext = replace.sub(u"најавени1",doctext,re.ignorecase) >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал any hints? want make replace of string in text, it's working in english not in native language.
second attempt:
>>> doctext = "трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал" >>> replace = re.compile(ur'Најавени', flags=re.ignorecase) >>> doctext = replace.sub(u"најавени1",doctext,re.ignorecase) >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал
you need specify unicode aware strings , regular expressions so:
>>> import re >>> replace = re.compile(ur'најавени', flags=re.ignorecase | re.unicode) >>> doctext = u"трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал" >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал >>> doctext = replace.sub(u"најавени1",doctext) >>> print doctext трендафилов во мвр се најавени1 нови смени поврзани со безбедноста и борбата против организираниот криминал
Comments
Post a Comment