基于《PythonCookbook》的学习(1)——针对任意多的分隔符拆分字符串

    xiaoxiao2021-04-17  39

    问题:需要将字符串拆分为不同的字段,但是分隔符(以及分隔符之间的空格)在整个字符串中并不一致

    re.split() 方法比 str.split() 方法更为灵活,可以为分隔符指定多个模式 re.split() 方法返回一个 list

    目标字符串:

    In [15]: line Out[15]: 'asdasdsadas ,,,, sdfdsfi ///ds...ds/essd// sdf..sdds ___ ___ sadads ___sa asdsa'

    str.split() 测试:

    In [17]: line.split(' ') Out[17]: ['asdasdsadas', ',,,,', 'sdfdsfi', '///ds...ds/essd//', '', '','sdf..sdds', '', '___', '', '', '___', 'sadads', '', '___sa', '', 'asdsa']

    re.split() 测试:

    In [16]: re.split(r'[\W_\s]*',line) Out[16]: ['asdasdsadas', 'sdfdsfi', 'ds','ds', 'essd', 'sdf', 'sdds', 'sadads', 'sa', 'asdsa']

    匹配模式 patterns 中建议使用 字符集 [] ,不建议使用 捕获组 ()

    转载请注明原文地址: https://ju.6miu.com/read-674012.html

    最新回复(0)