发表日期:2021-12-03 16:28:00 浏览次数:2818
上篇《搜索引擎工作的基本原理-蜘蛛的爬行》中我们详细介绍了蜘蛛是如何爬行工作的,现在小编想跟大家聊一下蜘蛛的抓取。
理论上,蜘蛛的爬行可以遍布整个互联网的全部页面,但是实际上,蜘蛛做不到这些,也不需要去做到,因为整个互联网每天出现的新页面是以万亿级计数的,其中有大量的垃圾内容,这里所指的垃圾是指垃圾网站出现大量无关内容,例如相亲网上出现赌博六合彩的信息,出现一两次还可以忍受,出现次数多了会对搜索引擎用户体验造成很大的伤害,严重的影响搜索引擎的盈利。
既然知道了蜘蛛爬行并不会爬行和抓取所有的页面,我们为了更多页面被收录,就要学着讨好蜘蛛,蜘蛛的使命就是尽量抓取重要页面。我们就在这方面讨好它,凡是方便利于蜘蛛爬行和抓取的行为都是好行为。
蜘蛛的抓取一般喜欢以下几种行为:
蜘蛛喜欢的行为一:网站和页面的权重尽可能的高,蜘蛛抓取的过程中首先考虑这种网站,因为在蜘蛛看来,质量高、建站时间长的网站才会有比较高的权重。高权重的网站甚至可以达到秒收录的效果。
蜘蛛喜欢的行为二:页面更新频率要高,如果不经常更新页面,蜘蛛也就没必要经常过来抓取页面内容了,只有我们经常更新,蜘蛛才会更加频繁的光顾我们的网站网页内容。所以网站维护期最好做到每日更新,不仅是原创内容,也可以转载一些时效性强的资讯。
蜘蛛喜欢的行为三:高质量的内外链建设,高质量的内外链建设能使得蜘蛛的爬行深度增加,要被蜘蛛抓取,就必须有导入链接进页面,否则蜘蛛根本就爬行不到该页面,更不要说抓取以及收录了。这里就是高质量内外链的重要性的体现了,这也是人们常说的“内容为王,外链为后”这句话的依据。蜘蛛的爬行时沿着链接爬行的,如果有高质量的外部链接,蜘蛛爬行的深度会加深,很可能多爬几层,让我们的页面更多的被蜘蛛抓取。
蜘蛛喜欢的行为四:距离首页点击距离。这里说的距离首页点击距离一般是因为首页的权重最高,蜘蛛爬行到首页次数也最多,每通过一次链接叫一次点击,距离首页点击距离越近代表了页面权越重高,蜘蛛就喜欢这些短距离高权重的页面。页面权重还可以通过URL结构来直观体现,URL结构短、层次浅代表的页面权重就相对高。
通过了解搜索引擎工作的基本原理-蜘蛛的抓取,就应该明白搜索引擎蜘蛛喜欢什么样的网站,这也就是我们SEO工作人员努力的目标。
日期:2022-03-26 11:14:35浏览次数:2247
日期:2022-03-25 12:49:34浏览次数:2270
日期:2022-03-24 11:03:21浏览次数:2168
日期:2022-03-23 10:00:04浏览次数:2102
日期:2022-03-22 16:27:56浏览次数:2145
日期:2022-03-21 16:18:15浏览次数:2269
日期:2022-03-20 16:21:54浏览次数:2188
日期:2022-03-19 12:41:01浏览次数:1928
日期:2022-03-18 15:27:02浏览次数:1821
日期:2022-03-17 10:02:51浏览次数:1848
日期:2022-03-16 17:05:14浏览次数:1757
日期:2022-03-15 17:49:38浏览次数:1839
日期:2022-03-14 12:19:46浏览次数:2030
日期:2022-03-13 14:29:47浏览次数:1790
日期:2022-03-12 14:01:30浏览次数:1803