中国站长站 For Dede4.0 采集规则

转载请注明出自落伍,本贴地址:?tid=1991813只差两分就落伍了,特献出中国站长站ForDede4.0的采集规则,希望大家能够支持我落伍,谢谢了!!!下面的规则为网站运营搜索优化的采集规则,其他栏目的规则只要把“来源网址”和“文章网址需包含”这两项改成你想采
转载请注明出自落伍,本贴地址:?tid=1991813
只差两分就落伍了,特献出中国站长站 For Dede4.0 的采集规则,希望大家能够支持我落伍,谢谢了!!!

下面的规则为网站运营  >> 搜索优化 的采集规则,其他栏目的规则只要把“来源网址”和“文章网址需包含”这两项改成你想采集栏目的网址和目录。

如想采集站长在线 >> 好站推荐 这个栏目,你只要做如下更改:
来源网址:[url][/url]
文章网址需包含:/RecSite/0
其他的不需要更改!

==================采集规则=================
{!-- 节点基本信息 --}

{dede:item name='搜索引擎'
        imgurl='/upimg' imgdir='../upimg' language='gb2312'
        isref='no' refurl='' exptime='10'
        typeid='1' matchtype='string'}
{/dede:item}

{!-- 采集列表获取规则 --}

{dede:list source='var' sourcetype='list' 
           varstart='' varend=''}
  {dede:url value=''}{/dede:url}        
  {dede:need}/Seo/0{/dede:need}
  {dede:cannot}{/dede:cannot}
  {dede:linkarea}<div id="list_container">[var:区域]var contents = document.getElementsByClassName('list_news_content');{/dede:linkarea}
{/dede:list}

{!-- 网页内容获取规则 --}

{dede:art}
{dede:sppage sptype='next'}<b>1</b>[var:分页区域]<font face="webdings">4{/dede:sppage}

  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'
   isunit='' isdown=''}

    {dede:match}<h1>[var:内容]</h1>{/dede:match}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'
   isunit='1' isdown='1'}

    {dede:match}<div class="text_body" id="textbody">[var:内容]<div class="text_tag">{/dede:match}
        {dede:trim}<div align="center">(.*)</div>{/dede:trim}
    {dede:trim}CHINAZ{/dede:trim}
    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'
   isunit='' isdown=''}

    {dede:match}者:[var:内容]| 时{/dede:match}
        {dede:trim}<a([^>]*)>{/dede:trim}
    {dede:trim}</a>{/dede:trim}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.source' value='[var:内容]' comment='文章来源'
   isunit='' isdown=''}

    {dede:match}来源:[var:内容] | 作{/dede:match}
        {dede:trim}<a([^>]*)>{/dede:trim}
    {dede:trim}</a>{/dede:trim}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'
   isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'
   isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = time();{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'
   isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = @litpic;{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'
   isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = time();{/dede:function}

  {/dede:note}
{/dede:art}
本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

至此,分页内容匹配进行完毕。文章内容匹配、分页内容匹配都进行完后,最后就只有“过滤”了,包括分页区域过滤和文章内容过滤。据本人的感觉,上面的两个规则都好写,只要找到全部链接中的“唯一性”代码就搞定,但过滤规则里却是欲说还休,道不尽的无穷奥妙
本文旨在以一个有代表性的文字分页的取样规则和过滤规则为蓝本,通过简单的变通和改动,解决一般性文字分页的采集问题一、范例部分范例分页区域代码:范例分页区域代码:=700)window.open('/upload/20074321296309.gif');"src=""onload=
如果这个官方的模板解释看的太抽象的,可以参考一下:解析引擎概述模板设计规范代码参考标记参考:arclist(artlist,likeart,hotart,imglist,imginfolist,coolart,specart)fieldchannelmytagvotefriendlinkmynewsloopchannelartlistpagelistpagelistpagebreakf