| 采集常用技巧 |
| 1、过滤文章内容的链接: |
| 广告过滤正则设置:“<a [!--ad--]>,</a>” |
| 2、同上得出,过滤font之类的标签: |
| 广告过滤正则:“<font[!--ad--]>,</font>”,其他依此类推。 |
| 3、同一链接的页面如何重复采集: |
| 到“管理采集节点”那清空节点即可重复采集已入库的页面。 |
| 4、采集内容分页正则说明: |
| 如果是全部列表式,则只需看第一页的页面HTML代码。 |
|
| 常见问题 |
1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in 答:你的采集正则变量名写错导致,请检查你的正则变量。 |
|
|
|
|