搜索引擎对网页的收录原则:“为什么同一篇文章我的就容易被百度收录你的不容易呢?”要回答这个问题,我们需要先弄明白,搜索引擎对网络的收录原则,即在哪些情况下网页对搜索引擎是友好的易于被搜索引擎收录的?
通常,搜索引擎收录快的原则主要集中在以下方面:
百度在给站长的建站建议当中说:“百度更喜欢独特的原创内容。”搜索引擎首先通过标题来进行判断,其次,爬虫会继续深入文章内部通过一些关键词或字来判断标题与内容是否相符合问题,这一点是为了防止某些不良站长进行作弊。在内容相同的情况下,网络编辑们普遍采用的是对标题重新做过的方式,让搜索引擎误认为其为原创新闻;
在相同条件下(内容和标题相同),搜索引擎更相信 PR 高的网站,因为它一贯表现的便是权威性足。在 Google当中,网站排序依次是:(1)新华网(2)新浪网(3)中国政府网(4)中国广播网(5)新华报业网(6)腾讯网(7)长江网(8)人民网(9)百度新闻在百度的收录当中,网站的排序依次是:(1)中国政府网(2)新浪网(3)京华网我们会发现,搜索引擎更看重网站的政府背景,这也就是很多站长在谈到网站的 SEO 对外链接时更倾向于内容相同的政府或者教育类网站做友情链接的原因;
这一点搜索引擎自有其判断标准,当然,网络编辑或者站长在操作过程当中也不是不可以作弊。例如,在 PJBLOG上,我们会发现,在发表文章,有一个时间设置,在这在一定程度上会影响到搜索引擎对文章发布时间的判断;
部分专家认为,网页的容量大小*好不超过 50K,比较理想的网页不要超过 15K,网页一大既不利于搜索引擎的收录也不利于客户的访问。
例如,针对在第二点当中谈到的例子,我们会发现其在百度的收录当中排名如上,同时网页(文件)的大小为:(1)中国政府网 网页大小 20K(2)新浪网 网页大小 30K(3)京华网 网页大小 48K
如果你的网站长时间不更新,那么搜索引擎爬虫在来过几次之后便会减缓对你网站的收录速度,当你重新发布你的网站消息时,搜索引擎可能并不知道,在这期间,别人转载了你的文章,而转载你文章的站,新闻更新具备较强的规律性,即每天都会在同一时间段发布内容,那么搜索引擎对他站的收录速度将比你自己的站收录速度要快。
此外,对网页收录的影响还有许多,在次,我们只列出以上 5 点,作为*常见的原则进行考虑。这个就暂且分享到这里吧,后续接着分享。
专注爱采购服务
广东 安徽 四川 北京 浙江 云南 福建 山东 河北 河南 湖南 天津 黑龙江 江西 山西 湖北 上海 重庆 广西 陕西 贵州