python - Regular expression unicode replace not working -


i have following example in python, , it's not working:

>>> replace = re.compile(ur'најавени', flags=re.ignorecase)  >>> doctext = replace.sub("најавени1",doctext)  >>> print doctext  трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал  >>> doctext = replace.sub(u"најавени1",doctext)  >>> print doctext  трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал  >>> doctext = replace.sub(u"најавени1",doctext,re.ignorecase)  >>> print doctext  трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал 

any hints? want make replace of string in text, it's working in english not in native language.

second attempt:

>>> doctext = "трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал" >>> replace = re.compile(ur'Најавени', flags=re.ignorecase) >>> doctext = replace.sub(u"најавени1",doctext,re.ignorecase) >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал 

you need specify unicode aware strings , regular expressions so:

>>> import re >>> replace = re.compile(ur'најавени', flags=re.ignorecase | re.unicode) >>> doctext = u"трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал" >>> print doctext трендафилов во мвр се Најавени нови смени поврзани со безбедноста и борбата против организираниот криминал >>> doctext = replace.sub(u"најавени1",doctext) >>> print doctext трендафилов во мвр се најавени1 нови смени поврзани со безбедноста и борбата против организираниот криминал 

Comments

Popular posts from this blog

java - Play! framework 2.0: How to display multiple image? -

gmail - Is there any documentation for read-only access to the Google Contacts API? -

php - Controller/JToolBar not working in Joomla 2.5 -