搜索引擎分词技术精讲-SEO培训原创秘笈(一)

📁 软文 #搜索引擎

搜索引擎分词技术精讲-SEO培训原创秘笈(一)

本文为国内著名网络营销、SEO培训机构:广州新川教育SEO培训组原创教程,网络转载请注明出处,如果随意复制必究。本节课来给大家讲解一下搜索引擎分词的一些问题。

作为一个SEOER,我们必须面对搜索引擎分词原理,那么搜索引擎是如何分词的呢?笔者把搜索引擎按中西文分为两类,一种是中文的搜索引擎如百度,360,搜狗等,一类是英文搜索引擎如google,yahoo,bing等,这两类搜索引擎的分词方法区别与处理方法如下:

  1. 英文搜索引擎的分词方法是非常简单的,因为每个英文词与词之间有一空格,那么英文搜索引擎会根据空格分词,这是最原始的方法,比如关键词是"seo trainign",英文搜索引擎会根据空格将之分为"seo"和"training"两个关键词,但问题是网页的关键词就是"seo training",而不能将之分开,我们网站SEOER应该怎么做呢?
  2. 处理办法也不复杂,搜索引擎有一个原则叫“统计概率匹配”,什么意思呢?如果你要想让搜索引擎认为你的关键词是design training而不是design和training,你只需要在你的网页正文中或者相关的重要标签如title,keywords,deion,H类等标签中大量出现seo training就可以了,当然,有些读者就要疑惑了,如果这样大量出现同一个词组,会不会让用户的体验度不好?(因为我们的网页是做给两个对象看的,一个是搜索本身,这也是我们为什么要做SEO的原因,第二个是做给我们的用户看的,如果用户体验度不好,他进入我们的网页马上就跑了,我们的SEO做得再好又有什么用呢?),其实这个问题不用太担心,首先,我们的用户的体验度永远是放在第一位的,第二,如果我们要多出现design training这样的关键词,不要忘记了搜索引擎有两种关键词的匹配模式,一种叫“完全匹配”,另一种叫“不完全匹配”,完全匹配就是我们的关键词出现是以"seo training"这种方式,不完全匹配是指"seo"和"training"可以分开出现。当然,关键词出现的密度与布局问题我们这节课就不讨论了,我们将在明天的SEO培训教程里同大家讨论这个问题。
  3. 中文的搜索引擎的分词方法与英文搜索引擎的分词方法有一些区别,因为中文词与词之间不像英文词与词之间一样,有个空格,所以搜索引擎判断你的句子中哪个是词就会稍微麻烦一些,这就涉及到“中文分伺”,“中文分词”是中文搜索引擎特有的现象,它的分词方法分为如下两种情况:
  4. 1)基于词典匹配,什么意思呢?就是说搜索引擎会根据我们习惯的词典里有没有这个词来判定句子中的词是否是一个词,比如"广州番禺新川教育SEO培训"这个句子中,中文搜索引擎会判定广州,番禺,新川,教育,Seo,培训等是词,因为词典里有这个词;
  5. 2)这时,我们同样面临英文搜索引擎所面对的问题,比如上一句"广州番禺新川教育SEO培训"中,我们的关键词是"SEO培训",而不能将之拆开为"SEO"和"培训",那么余下的做法就与英文的搜索引擎相同了,我们要做的就是“统计概率匹配”了;

那么搜索引擎分词带给我们的启发还有什么呢?做过SEO的人都知道,一个网站的域名,网页的名字中如果包含有关键词的中文拼音或者英文,是对SEO有利的,或者网站中文件夹、文件的名字包含有关键词的中文拼音或者英文也是对SEO优化有利的,那么我们要如何写这些文件的名字呢?大家只要明白上面的搜索引擎的分词原理就应该知道了,比如我们的网页名字可以起名为"SEO-training.html",注意,中间要有一个短横线,为什么呢?因为没有短横线,SEOtraining就是一个字了,同理,中文拼音也要有短横线,比如"SEO -peixun.html"或者字与字之间用其它符号隔开。当然,短横线是最好的选择,因为短横线会被解释为空格。

呵呵,看了以上的文字,希望对SEOER有一些帮助,笔者是广州新川教育的SEO培训老师,每天早上起得很早,我就想,如果醒了在床上呆着,不如起来写一些关于自己的SEO专业的文章,看看能不能帮助到大家,这样的生活应该更有意义,所以这就是接下来的系列SEO培训文章的由来,希望大家能支持我,让我有继续写下去的动力。再次感谢阁下耐心看完这篇关于搜索引擎健分词原理的文章。