新聞中心
SEO基礎(chǔ)教程:索引文字和中文分詞
搜索引擎抓取了大量的原始頁面后并不能直接用來排名,用戶搜索的時(shí)候開程序來計(jì)算排名無法在1秒2秒內(nèi)算出結(jié)果,是以抓取了之后必須先預(yù)處理這樣來為存庫之后的查詢做準(zhǔn)備。首先進(jìn)行的第一步就是提取文字,搜索引擎發(fā)展至今還是主要以文字為主,當(dāng)一大串代碼的時(shí)候,搜索引擎一般會抓取Mete標(biāo)簽中的文字,圖片ALT文字,錨文字,網(wǎng)頁中的文字等。中文分詞是針對中文特有的一種分詞方式,英文來說一般都有分隔符,搜索引擎可以直接根據(jù)分隔符來判斷詞。而中文一般一句話都是連接在一起的是以需要分詞。比如SEO基礎(chǔ)服務(wù)這個(gè)詞,就有可能被分為SEO、基礎(chǔ)、服務(wù)這三個(gè)詞。分詞有兩種基于詞典的方式講一段漢字吧按照事先準(zhǔn)備好的詞典按照掃描長度混合匹配最后出來最大的匹配度,而統(tǒng)計(jì)的方法則是在于根據(jù)幾個(gè)相鄰次在這個(gè)互聯(lián)網(wǎng)上出現(xiàn)的次數(shù)比例來分詞。通過谷歌搜索搜索引擎優(yōu)化查看快照會發(fā)現(xiàn)谷歌會把詞分成 搜索 殷勤 優(yōu)化 三個(gè)詞,而百度則會顯示為搜索引擎優(yōu)化顯然百度的出現(xiàn)更為合理。 純Linux環(huán)境下高端免備案[香港獨(dú)立IP地址]?php空間,僅僅只需199元一年起。商務(wù)中國域名核心代理直銷50元注冊國際頂級域名
本文地址:http://m.love62.cn/seo/4621.html
![1](/wp-content/themes/starow_z/img/o-1.png)
![1](/wp-content/themes/starow_z/img/o-2.png)
![1](/wp-content/themes/starow_z/img/o-3.png)
![1](/wp-content/themes/starow_z/img/o-4.png)
![1](/wp-content/themes/starow_z/img/o-5.png)
![1](/wp-content/themes/starow_z/img/o-6.png)
![1](/wp-content/themes/starow_z/img/o-7.png)