精灵采集器
首页
产品功能
购买价格
建站教程
当前位置 :
HTML/JavaScript基础
>
正文
使用正则表达式抽取新闻网页的URl

正则表达式的语法一般如下(js),两条斜线中间是正则主体,这部分可以有很多字符组成;i部分是修饰符,i的意思表示忽略大小写

/^abc/i

匹配新闻路径时通常存在包含“/20201201/”形式日期的数字路径,只要使用正则表达式“/\/[0-9]{8}\//”就可以判断链接指向是不是一个新闻。

其他形式的的日期可能会"/"分割开中间的年份和月份,比如"/2020/1201/",使用正则表达市"/\/[0-9]{4}\/[0-9]{4}\//"。



姓名:
评论

vvv

2020-12-05 11:12:36

dd

©2018-2020 h5spirit.cn  | 京ICP备19057243号-1 | QQ群:694364182