问题/需求:

  需要将字符串切分,但是分隔符在整个字符串中并不一致

  (即:需要用多个分隔符切分字符串

 

str.split()方法不可行:

  只支持单一分隔符不支持正则及多个切割符号不感知空格的数量

 

解决办法:

  re.split()

  适用:多个 分隔符,切割功能非常强大

  语法: re.split(pattern, string, maxsplit=0)

  通过正则表达式将字符串分离。如果用括号将正则表达式括起来,那么匹配的字符串也会被列入到list中返回。maxsplit是分离的次数,maxsplit=1分离一次,默认为0,不限制次数。

  例子:

>>> import re
>>> line = 'aaa bbb ccc;ddd   eee,fff'
>>> line
'aaa bbb ccc;ddd   eee,fff'

  

  单字符切割:

>>> re.split(r';',line)
['aaa bbb ccc', 'ddd\teee,fff']

  

  两个字符以上切割,放在 [ ] 中(不保留分隔符):

>>> re.split(r'[;,]',line)
['aaa bbb ccc', 'ddd\teee', 'fff']

  

  使用 ( ) 捕获分组(保留分割符):

>>> re.split(r'([;,])',line)
['aaa bbb ccc', ';', 'ddd   eee', ',', 'fff']

  

 

版权声明:本文为liangmingshen原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/liangmingshen/p/11302487.html