? 关于抓取和收录的几点个人想法 - 金戈铁马SEO培训网
當前位置 : 超級SEO培訓網 / 案例研究

關于抓取和收錄的幾點個人想法

金戈鐵馬SEO培訓網   http://www.sdcdrg.com/   June-10 11:37:25

搜索引擎從誕生到發展至今天的目的始終沒有改變:為所有的web信息建立索引,幫助用戶進行信息檢索。
我們做SEO工作的本質就是幫助搜索引擎索引我們的網站,并設法通過搜索引擎連接用戶。



我個人一直覺得SEO工作的內容可以根據搜索引擎的工作流程分成三個部分:
1. 抓取:幫助搜索引擎更快更多的訪問網站內容
2. 收錄:幫助搜索引擎更好的識別網頁內容,并加以收錄
3. 索引:幫助搜索引擎更好的分析理解網頁內容,以提供給用戶



至于多年來SEO前輩和從業者所研究發現的各種SEO工作技巧,萬變不離其蹤,都涵蓋在以上的流程中。

好了回到正題, 最近幾個月一直忙于“抓取”這一塊工作,涉及到的內容概括如下:
1. Web performance: 讓速度更快,哪怕只有0.1秒,關于技巧大家可以搜索各種WPO知識,并使用Google和Yahoo提供的一些小工具。
2. link structure: 搜索引擎抓取網站的主流方式有兩種,一是偏向深度型,較少顧及橫向結構的內容;二是橫向抓取,偏向縱深尋找信息,Google就是這樣的。所以大家可以利用各種技巧將同級別的頁面串聯起來,結構類似初中物理書中的串聯電路。
3. duplicate: 就是去除重復內容,不但包括URL造成的重復信息,還包括盡量減少兩個頁面有非常相似的內容,還有減少頁面被重復抓取的概率。
4. 最后就是綜合上面三點,并結合內鏈結構調整和一些技巧,讓更多內容被搜索引擎發現。


下面說說關于收錄的想法:
搜索引擎是如果決定是否收錄一個網頁的呢?
我們先看工作流程:這里我打一個比方,可能不太恰當,但是可以幫助理解問題 :)。搜索引擎爬取網站就像一個人在逛超市,推著購物車,并快速瀏覽貨架上的商品,當發現想要買的商品的時候,就取到購物車中。
因此,假設我們的網站是一個貨架,網頁是我們擺在貨架上的商品。
我們可以做的事情,就是讓搜索引擎知道我們貨架上是什么,這樣它才能判斷是否需要這個商品。
好了,現在假設搜索引擎看見一個產品,看見了名字之后它想看看說明書,卻很難在產品包裝找到產品使用說明,那么這顯然會影響它識別這個產品。



我們回到我們的網頁,怎么告訴搜索引擎這個網頁上那一部分是我們的主體內容?
我的建議是:
1. 調整HTML,盡量將主要內容放在一個框架內,比如放在一個DIV內
2. 讓內容更容易被發現,可以盡量讓內容離<body>標簽近一些
3. 利用代碼體現內容的時候,使我們的內容更像一篇文章:假設一個HTML文件內的某個DIV內有h1, h2, 一些<p>內集中了網頁上的大部分文本內容。那么這樣爬蟲會相對容易的撇開網頁上的噪音,找到我們的主體內容
4. 從title到內容到各個標簽,盡量保持相關性
5. 高質量內容頁面內鏈,如果一個質量一般的頁面獲得了站內其他的一些高質量的頁面的內鏈,這樣這個低質量頁面被收錄的概率就大了很多。


本文來自金戈鐵馬SEO培訓網(www.sdcdrg.com),轉摘請注明出處。

體驗版課程下載

學員成果分享

安徽快3走势 919网赚是真的不 王者彩票开户 吉林快3走势 北京快3 博盈彩票开户 三分快3计划 爱投彩票开户 9号棋牌APP 网赚兼职平台