国产自操久久,9999在线观看,日韩中文字幕,中文字幕精品视频在线,5151精品国产人成在线观看,狠狠色综合久久婷婷色天使 ,国产精品一区二区男人吃奶

實用文檔>SEO優(yōu)化實戰(zhàn)的經驗總結

SEO優(yōu)化實戰(zhàn)的經驗總結

時間:2024-07-22 13:34:04

SEO優(yōu)化實戰(zhàn)的經驗總結范文

SEO優(yōu)化實戰(zhàn)的經驗總結范文

SEO優(yōu)化實戰(zhàn)的經驗總結范文

  最早的中文分詞辦法是由北京航天航空大學的梁南元教授提出的一種基于“”的分詞辦法。該方法是把整個句子讀一遍,然后把字典里有的詞都單獨標示出來,當遇到復合詞的時候(例如北京大學),就找到最長的詞匹配。遇到不認識的字符串就分割成單個文字。

  例如:“著名導演張藝謀說國慶節(jié)晚上將安排十萬人到天安門聯(lián)歡!

  根據該辦法,可以切分為:

  “著名 | 導演 | 張藝謀 | 說 | 國慶節(jié) | 晚上 | 將 | 安排 | 十萬人 | 到 | 天安門 | 聯(lián)歡”

  這樣的分詞辦法雖然說可以應付很多的句子,但是由于細分的太多,在真正搜索引擎使用的過程中,到底哪一個詞才是重點就無法表述,從而搜索引擎搜索出的結果也不能達到最大的相關度。

  在80年代,哈爾濱工業(yè)大學計算機博士生導師王曉龍博士提出了“最少詞數”的分詞理論,即為,一句話應該是分詞最少的字符串,這樣會更多的讓搜索引擎更明白這句話到底是什么意思。但是它對于例如“二義性”的關鍵詞組,就不能說最長的分割就是最好的結果。

  例如:“吉利大學城書店”

  這個關鍵詞正確的分詞應該是“吉利 | 大學城 | 書店”而不是詞典中的“吉利大學 | 城 | 書店 ”

  目前,主流的分詞辦法有兩種,一種是基于統(tǒng)計模型的文字處理,另外一種是基于字符串匹配的逆向最大匹配法。

  基于統(tǒng)計模型的文字處理

  從形式上看,詞是穩(wěn)定的字的組合,因此在上下文中,相鄰的字同時出現的次數越多,就越有可能構成一個詞。因此字與字相鄰共現的頻率或概率能夠較好的反映成詞的可信度?梢詫φZ料中相鄰共現的各個字的組合的頻度進行統(tǒng)計,計算它們的互現信息。定義兩個字的互現信息,計算兩個漢字X、Y的相鄰共現概率;ガF信息體現了漢字之間結合關系的緊密程度。當緊密程度高于某一個閾值時,便可認為此字組可能構成了一個詞。這種方法只需對語料中的字組頻度進行統(tǒng)計,不需要切分詞典,因而又叫做無詞典分詞法或統(tǒng)計取詞方法。但這種方法也有一定的局限性,會經常抽出一些共現頻度高、但并不是詞的常用字組,例如“這一”、“之一”、“有的”、“我的”、“許多的”等,并且對常用詞的識別精度差,時空開銷大。實際應用的統(tǒng)計分詞系統(tǒng)都要使用一部基本的分詞詞典(常用詞詞典)進行串匹配分詞,同時使用統(tǒng)計方法識別一些新的詞,即將串頻統(tǒng)計和串匹配結合起來,既發(fā)揮匹配分詞切分速度快、效率高的特點,又利用了無詞典分詞結合上下文識別生詞、自動消除歧義的優(yōu)點。

  基于字符串匹配的逆向最大匹配法

  一般來說,在SEO中使用最多的分詞辦法就是基于字符串匹配的逆向最大匹配法。這種方法就是從句子的后面往前(從右向左)進行分詞。

  在搜索引擎運行的機制中,有很多種中文分詞的辦法,例如正向最大匹配分詞、逆向最大分析、基于統(tǒng)計的分詞等。但是在實際的搜索引擎運行過程中,分詞的辦法卻沒有這么簡單了。因為搜索引擎不僅僅要去考慮到分詞結果的正確性,還需要考慮到對于分不出來的詞的處理。

  首先我們來討論分詞結果的準確度,一般來說,搜索引擎是使用多種分詞的方式構成一個混合分詞方式來進行分詞的,因為這樣可以讓詞匯最大化的、更準確的分開;旌戏衷~的原理是:先使用專業(yè)詞典進行分詞,之后再使用普通詞庫進行一次分詞。

  那么對于分不出來的詞,搜索引擎又是如何操作的呢?

  一般來說,搜索引擎遇到這樣的關鍵詞時,會采取一元分詞+二元分詞+混合分詞+不分詞的方式來解決這樣的問題。

  例如:“草泥馬是一種食草動物”

  一元分詞結果:“草泥馬是一種食草動物”或者“草泥馬是一種食草動物”或者“草泥馬是一種食草動物”

  二元分詞結果:“草泥泥馬是一種食草動物”。

  第三種方式——干脆不分,以保持新詞的完整性。

  在經過了這一系列的分詞程序后,實際分詞的結果是:草泥泥馬草泥馬是一種食草食草動物食草動物。

【SEO優(yōu)化實戰(zhàn)的經驗總結】相關文章:

學習經驗總結05-29

關于家教經驗總結03-20

小學音樂教學經驗總結02-17

css的調試方法與經驗總結03-20

老司機實用開車的經驗總結03-20

高一數學經驗總結03-19

雙色茉莉開花的經驗總結03-20

《優(yōu)化》優(yōu)秀教學設計(通用12篇)02-20

100個日常交際的技巧經驗總結08-02

班級管理經驗總結(精選14篇)04-28

用戶協(xié)議
鲁甸县| 嫩江县| 吉安市| 安泽县| 嘉义市| 开平市| 东辽县| 莱西市| 突泉县| 南康市| 客服| 武清区| 竹北市| 青岛市| 屯昌县| 双辽市| 分宜县| 琼海市| 大埔县| 科技| 新邵县| 上思县| 岳普湖县| 定陶县| 绥中县| 忻州市| 商南县| 陵水| 夏邑县| 和田市| 忻城县| 彭州市| 桦川县| 当雄县| 丰镇市| 两当县| 华池县| 商水县| 吉隆县| 阳曲县| 和硕县|