正则表达式匹配中文

正则匹配中文,中文的 unicode 编码范围 主要在 [u4e00-u9fa5],这里说主要是因为这个范围并不完整,比如没有包括全角(中文)标点
示例:
import re

title = u’你好,hello,世界’
pattern = re.compile(ur’[\u4e00-\u9fa5]+’)
result = pattern.findall(title)