"正则匹配中文，中文的 unicode 编码范围主要在 [u4e00-u9fa5]，这里说主要是因为这个范围并不完整，比如没有包括全角（中文）标点示例： import re title = u’你好，hello，世界’ pattern = ...."

经验动态下载提问活动应用互动学院最新优选官网

5ioi1jth57

Rpa 13914 号会员
python基础网页处理 • 3 回帖 • 845 浏览 • 2021-03-25 10:29:41

正则表达式匹配中文

正则匹配中文，中文的 unicode 编码范围主要在 [u4e00-u9fa5]，这里说主要是因为这个范围并不完整，比如没有包括全角（中文）标点
示例：
import re

title = u’你好，hello，世界’
pattern = re.compile(ur’[\u4e00-\u9fa5]+’)
result = pattern.findall(title)

3 回帖

快速了解RPA

RPA RPA技术 RPA软件 RPA培训 RPA应用 RPA机器人

0 0 0 0