python匹配某个中文字符

python2.7对中文的支持不好是众所周知的,现在遇到这样一个需求,要匹配某个中文字符。查了一个资料,思路就是转化为unicode进行比较,记录如下:

line = \'参考答案: A\'
# gbk -> unicode
# 看需要,这里是把gbk转化为unicode,也可以把utf-8转换为unicode
line = line.decode(\'gbk\').strip()

# 匹配 \'参考答案\' 四个字
if re.match(u\'^\u53c2\u8003\u7b54\u6848\', line):
   q_answer = line
   print q_answer

这就ok了.

对了,可以这样查看中文的unicode编码:

 

版权声明:本文为cool-fire原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/cool-fire/p/6418565.html