正则表达式及其应用

 2023-09-11 阅读 24 评论 0

摘要:【一】、正则表达式的规则 % 匹配行首 – 表明要搜索的字符串一定在行首.$ 匹配行尾 – 表明要搜索的字符串一定在行尾? 匹配除换行符外的任一单个字符.* 匹配任意个数的字符出现任意次数(不包括换行符)+ 匹配前导字符或者表达式出现一次或者更多次(

【一】、正则表达式的规则

  • % 匹配行首 – 表明要搜索的字符串一定在行首.
  • $ 匹配行尾 – 表明要搜索的字符串一定在行尾
  • ? 匹配除换行符外的任一单个字符.
  • * 匹配任意个数的字符出现任意次数(不包括换行符)
  • + 匹配前导字符或者表达式出现一次或者更多次(不包括换行符)
  • ++ 匹配前导字符或者表达式不出现或者出现一次以上(不包括换行符)
  • ^b 匹配页中断符
  • ^p 匹配DOS文件的换行符
  • ^r 匹配MAC文件的换行符(CR Only)
  • ^n 匹配UNIX文件的换行符 (LF Only)
  • ^t 匹配一个制表符
  • [ ] 匹配方括号中的单个的字符

【二】、常用的正则表达式

  • 删除空行: 替换 %[ ^t]++^p 为 空串
  • 删除回车换行 : 替换 ^r^n 为 空串
  • 删除行尾空格: 替换 [ ^t]+$ 为 空串
  • 删除行首空格: 替换 %[ ^t]+ 为 空串
  • 每行设置为固定的4个空格开头: 替换 %[ ^t]++^([~ ^t^p]^) 为 ” ^1″
  • 每段设置为固定的4个空格开头: 替换 %[ ^t]+ 为 ” ”   (如果一行是以空格开始的,则视之为一段的开始行)
  • 将一段合并为一行: 替换 [ ^t]++^p^([~ ^t^p]^) 为 ^1   (注意: 此处假定文本是以DOS方式回车换行 – CR/LF)
  • 去掉HTML TAG: 替换 ^{<*>^}^{<*^p*>^} 为 空串
  • 删除HTML中的所有: 替换 <[ ]++a *[ ]++href[ ]++=*> 为 空串
  • 删除文本中指定的前2列字符: 替换 %?? 为 空串
  • 在第4列后插入2列空白字符: 替换 %^(????^)^(?^) 为 “^1 ^2″
  • 查找所有的数字: [0-9]+[.]++[0-9]+
  • 查找所有的单词: [a-z]+
  • 查找所有的网址: http://[a-z0-9^~`_./^-^?=&]+

转载于:https://www.cnblogs.com/GmrBrian/p/6241938.html

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/4/45255.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息