新聞中心
SEO基礎(chǔ)教程:搜索引擎預(yù)處理規(guī)則
作者 / 無憂主機 時間 2011-11-25 07:26:39
預(yù)處理中必不可少的一個環(huán)節(jié)是去停止詞,不管是中文還是英文中總是有一些詞在文章中必須出現(xiàn)但是又沒有意義的存在,比如中文文章中經(jīng)常出現(xiàn)的“的”、“地”、“得”這些助詞,又或者一些感嘆詞比如嘿、哈、哇,還有一些副詞和介詞的比如,從而、以、卻。英文文章中經(jīng)常出現(xiàn)的這類詞有 the、a、an、to、of這樣的詞統(tǒng)一被我們稱之為停止詞,搜索引擎在爬行文章的時候第一步就是去掉這些詞,獲得文章中德精髓。一個是減少數(shù)據(jù)存儲,另外可以讓數(shù)據(jù)更加精準。處理完了這些進行的下一步就是消除噪聲,我們大部分網(wǎng)站中總有那么些無用的內(nèi)容,比如版權(quán)聲明,導(dǎo)航,廣告之類的內(nèi)容這類對用戶搜索起來沒有任何的意義并且只能干擾網(wǎng)站主題內(nèi)容的提取,在經(jīng)歷消除噪聲后剩下的就是頁面內(nèi)的真正內(nèi)容。 純Linux環(huán)境下高端免備案[香港獨立IP地址]?php空間,僅僅只需199元一年起。商務(wù)中國域名核心代理直銷50元注冊國際頂級域名
本文地址:http://m.love62.cn/seo/4625.html
![1](/wp-content/themes/starow_z/img/o-1.png)
![1](/wp-content/themes/starow_z/img/o-2.png)
![1](/wp-content/themes/starow_z/img/o-3.png)
![1](/wp-content/themes/starow_z/img/o-4.png)
![1](/wp-content/themes/starow_z/img/o-5.png)
![1](/wp-content/themes/starow_z/img/o-6.png)
![1](/wp-content/themes/starow_z/img/o-7.png)