正则表达式 处理 pdf 复制之后的段内换行和段内空格问题 问题导向!!!!
————恢复内容开始————
不要让工具支配自己!
- 一定是在先导标号之后
- 在某个范围内的
这样可以获得一个范围
- 在标号之后的每一行
- 直到一个连续的空行
可以看到[\S\s]的作用
但是这不太符合要求
这样的范围可以匹配一个不含\n的段落
需要扩大这个范围
这样可以匹配一个大块
shit!三个小时,终于弄出来了!问题导向!!一定要先解决问题,就算是点亮技能点,也不要随意去探索,应该有目的地去研究,从实际问题入手!!!
行内空格
(?<=[^•○\s]) (?=\S)
————恢复内容结束————