一谈到seo工作,很多同学难免会提及关键词、TDK、站内结构、外链建设、日志分析等一些老生常谈的问题。这些工作也的确是seoer必须的工作,但是如果遇上一个爱思考的seo,难免会想这些工作背后的原因是什么?为什么要这么做?深入研究下去就会触及搜索引擎的原理。
一名SEO应该了解哪些基本原理性的知识呢?
首先,从网站的收录方面来说,SEO应该了解搜索引擎的抓取系统,说的直白一点就是下载网页的环节。但如果仅仅知道有这个环节存在还是不够的,因为互联网有上亿的页面,搜索引擎不可能一次性全部下载下来。
这自然会涉及到抓取的优先级问题,所以搜索引擎在抓取方面也会有一些策略,比如广度优先,深度优先等,了解这些策略才能对工作中的一些现象做出合理的解释。
其次,搜索引擎对抓取下来的网页预处理环节,也是需要了解的。这个环节最重要的是有一个建立倒排索引的过程,即单词—文档矩阵,也就是说搜索引擎,是按照词语来进行索引的,而不是单个字。一个网页看上去是一篇通顺的文章,实际上是一批词语组合而成。
如果明白这一点,那么可以分析出来:为什么早期一些垃圾文章胡乱组合也能被收录。所以一些SEO现象建立在搜索引擎原理的角度,才能更加深刻的理解。当然,随着自然语言处理技术的发展,搜索引擎愈加智能,这些情况出现的越来越少了。
再次,搜索引擎的查询排序系统大恐怕是大家最为熟悉的了。每天打开百度搜索一个词然后看网页的排名,但是有些人会默认输入的搜索词就是关键词。
事实上稍微懂点中文分词常识的人,都知道这理解是不对的。大家可以多搜集此类材料看看,搜索引擎在对于查询词的处理技术方面,是有非常深入的分析的,笔者在此不做赘述,也没有能力叙述全面。
以上只是一些非常简单的常识,在SEO工作中,很多同学不清楚搜索引擎的一些知识,按照一些流程化的操作比如上内容,买链接,换友链等等也能坐上一些词的排名。
但是搜索引擎作为互联网上最复杂的机器,如果对于它的了解仅仅停留在表面,那么SEO方面恐怕难以有深入独到的认识,也不是一名合格的SEOer。
版权声明:本站原创,转载必究。
阅读原文:https://www.seotop.com/article/230.html