如果我們從搜索引蜘蛛的角度去看待一個網站,在抓取、索引和排名時會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的設計
1.搜索引蜘蛛不能找到網頁
要讓搜索引擎發現網站首頁,就必須要有外部鏈接到首頁,找到首頁后,蜘蛛沿著內部鏈接找到更深的內容頁,所以要求網站要有良好的結構,符合邏輯并且所有頁面可以通過可爬行的普通HTML鏈接達到,Javascript鏈接、Flash中的鏈接等搜索引擎蜘蛛一般不能跟蹤爬行,就會造成收錄問題。
網站所有頁面離首頁點擊距離不能太遠,最好在四五次點擊之內。要被搜索引擎收錄,頁面需要最基本的權重,良好的網站鏈接結構可以適當傳遞權重,使盡量多的頁面達到收錄門檻。
2.找到網頁后能不能抓取頁面內容
URL必須是可以被抓取的。數據庫動態生成、帶有過多參數的URL、整個頁面都是Flash、框架結構、可疑的轉向、大量復制內容等都可能使搜索引擎敬而遠之。某些文件站長不希望被收錄,除了不鏈接到這些文件,更保險的方法是使用 ROBOTS.TXT或者 meta robots標簽禁止收錄。
3.抓取頁面后怎樣提取有用信息
關鍵詞在頁面重要位置的合理分布、重要標簽的編寫、HTML代碼精精簡、起碼的兼容性等可以幫助搜索引擎理解頁面,提取有用信息。只有搜索引擎能順利找到所有頁面,抓取這些頁面并提取其中真正相關性的內容,網站才可以被視為搜索引友好的設計。
既然找到了問題的根源,那么怎么進行網頁設計才能最大程度提升搜索引擎的友好度呢?
(1)目錄結構和URL。
URL是統一資源定位,即每個網頁的網址、路徑。網站文件的目錄結構直接體現于URL。清晰簡短的目錄結構和規范的命名不僅有利于用戶體驗和網址傳播,更是搜索引擎友好的體現。
(2)目錄層次。
對于一個小型網站來說,一般只有一層子目錄
如:http://www.yoursite.com/dirl/page.htm
www.yoursite.com是域名,dirl是一級目錄名,page是文件名。對搜索引擎而言,這種單一的目錄結構最為理想,即扁平結構(Fat)。
(3)目錄和文件命名。
根據關鍵字無所不在的原則,可以在目錄名稱和文件名稱中使用到關鍵詞。但如果是關鍵詞組,則需要用分隔符分開。
(4)絕對URL和相對URL。
絕對URL:即網頁路徑使用包含頂級域名在內的完整的URL。
如:www.yoursite.com/pagel/index.html是一個絕對路徑,其中/pagel/in-dex.html則為相對路徑,由瀏覽器自動在該鏈接前加上www.yoursite.com。總體上,Google在排名時并不在意URL使用的是相對路徑還是絕對路徑。
(5)導航結構。
網站導航是對引導用戶訪問網站的欄目、菜單、在線幫助、布局結構等形式的統稱。其主要功能在于引導用戶方便地訪問網站內容,是評價網站專業度、可用度的重要指標。同時對搜索引也產生諸多提示作用。概括地講,網站在導航方面應注意以下幾點:
①主導航醒目清晰。
②“面包屑型( Breadcrumbs)”路徑。
③首頁突出重要內容。
④使用網站地圖。
(6)框架結構。
框架型網站的優越性體現在頁面的整體一致性和更新方便上。尤其對于那些大型網站而言,框架結構的使用可以使網站的維護變得相對容易。但框架對搜索引摹來說是一個很大的問題,這是由于大多數搜索引擎都無法識別框架,也沒有什么興趣去抓取框架中的內容。此外,某些瀏覽器也不支持框架頁面。
(7)圖像優化。
一般而言,搜索引擎只識讀文本內容,對圖像是不可見的。同時,圖像文件直接延緩頁面加載時間,如果超過20秒網站還不能加載,用戶和搜索引擎極有可能離開你的網站。
(8)Alt屬性。
每個圖像標簽中都有Alt屬性,搜索引擎會讀取該屬性以了解圖像的信息。因此,最好在所有插圖的Alt屬性中都有文字描述,并帶上該頁關鍵字在其中。
(9)文本說明。
除了Alt屬性文字,還可以考慮以下方法直接優化圖像,使之被搜索到:
①在圖片上方或下方加上包含關鍵詞的描述文本。
②在代碼中增加一個包含關鍵詞段的 heading標題標簽,然后在圖片下方增加文字描述。
③在圖片下方或旁邊增加如“更多某某”鏈接,包含關鍵詞。
④創建一些既吸引用戶又吸引搜索引擎的文本內頁,先把流量吸引到這些頁面,再提供文本鏈接指向你的圖片頁面。
(10)Gif和JPGE圖像優化。
對圖片文件優化的目的是在盡量不影響圖像畫面效果的情況下,將其文件大小降到最低,以加快頁面整體下載速度。
(11)FLASH優化。
FLASH優化可以從以下三個方面來考慮:
①做一個輔助HTML版本;
②將Flash內嵌HTML文件,付費登錄搜索引擎。
(12)表格使用。
如果某個網頁采用了大段的長篇文本,除了可以將一頁文本分成多面,還可以考慮將文本置入不同表格中,這樣不僅管理方便,也使得該頁加載時每個表格內容依次加載,這樣訪問者就可以一邊看已下載內容一邊等待剩余部分加載,而不是等待很久之后才一齊加載出來。表格之內套嵌太多表格也不利于頁面加載,因瀏覽器是先加載完大表格之后再加載內嵌的小表格,因此內嵌表格會最終降低整頁加載速度。
(13)網頁減肥。
代碼不妥不僅延長網頁加載時間,也嚴重影響蜘蛛程序對網頁內容的抓取。去掉臃腫雜亂的代碼,減小網頁文件大小,能夠加快網頁加載速度,讓蜘蛛快速索引到重要內容。
(14)Javascript
采用Javascript技術的網頁往往在頁面一開始就堆積大量JAVA代碼,以至META及關鍵字遲遲不能出現,被推至頁面底部,對搜索引擎很不友好。有兩種方法可以使之得以改善:
①將腳本移至頁面底部。
②將JAVA腳本置入一個,js擴展名的文件。
(15)301水久重定向。
301水久重定向頁面也叫301轉向或者301跳轉,它的作用就是將域名永久地轉移到另一域名上去。可別小看了這個簡單的功能,在許多時候起著不可替代的作用,比如:網站更換域名,網頁批量跳轉,更重要的是301頁面對于網站的SEO方面。
301跳轉會告訴搜索引,網址已經遷移。這時搜索引擎會對新的網址進行抓取,同日時還會將舊網址的原有連接和外鏈逐步轉移至新的網址下,這就意味著新域名可以得到老域名的權重,從而將域名更換的影響降到最低。
不過從實踐來看,情況并不像理論上那么好。301起作用還是比較緩慢的,有的網站設置301跳轉將近半年,可百度依然將老域名排在前面,新域名則落在了老域名的后面。
(16)404錯誤頁面。
當用戶輸入了錯誤的鏈接時,將返回404錯誤頁面給用戶,這個頁面是為了提醒用戶地址不存在而設置的
對于搜索引擎來說,如果蜘蛛訪問的某個URL卻返返回了404錯誤的頁面,這時蜘蛛就知道這個頁面是不存在的,便不再抓取這個頁面,同時會向搜索引整的數據中心提交這個URL,從而將這個網址從索引中刪除。
(17)500服各器內部錯誤提示頁面
服務器、數據庫出錯總是無法預料的,如果這些地方先出出了故障,并且正好搜索引擎的蜘蛛抓取到了這個返回了404的頁面,那對于搜索引擎將會產生非常不好的印象。怎么才能解決這個問題呢?500頁面就是個很好的方法。
500頁面是一個帶有草屋描述的頁面,它告訴搜索引擎該網站目前出現了個暫時性的小技術性問題,或許是數據庫出錯,或許是網站維護。這樣蜘蛛就不用吃閉門羹,自然會友好很多。
(18)友好錯誤頁面。
IS默認的錯誤頁是很不友好的,很多人看到默認的錯誤頁時都會說:網站打不開了!白白損失了這部分流量。而如果錯誤頁直接跳轉到首頁又對搜索引擎很不友好,搞不好首頁還會被封掉。所以根據情況,有兩個方法解決這個問題如果是博客等內容型的網站,可以返回一個帶有404錯誤的搜索框讓訪客搜索,若是電子商務:%%%%%%%%%型網站,則可以返回一個帶有404錯誤的進度條進行跳轉。這兩種方法既照顧了訪客又顧及到了SEO。可以 Google webmaster tools中查看自己網站錯誤頁有多少。
修改默認錯誤頁的方法很簡單:在IS中右鍵單擊要管理的網站,在自定義錯誤中設置404為相應的錯誤信息:htp:/ww.………&&&.com.cn/enews/頁這里有兩種方式:
①如果“消息類型”你選擇的是“文件”,則則只能使用.html或htm結尾的文件,否則用戶訪問錯誤頁時會出現:http:/product.……&&&.com.cn/pnce plist32_2535. shtml碼。用這種方式設置的錯誤頁,雖然.hml文件中沒有輸出404狀態,但IS執行后會自動輸出404狀態。
②如果“消息類型”你選擇了“URL",則必須用asp文件(因為只有在asp文件中才能設置404狀態),否則訪問錯誤頁時會返回200狀態碼。如果你希望定時跳轉到首頁,則也有兩種方法
①利用meta標簽的 refresh進行跳轉。據Google中文博客管理員介紹, Yahoo就使用的此方法進行跳轉。
②使用講行跳轉。我感覺使用is的方法t好一些搜索引擎會識別為“200”或“302”。
常常看到許多網站的自定義404錯誤頁面采取類似這樣的形式:首先顯示一段錯誤信息,然后,通過 Meta Refresh將頁面跳轉到網站首頁、網頁地圖或其他類似頁。根據具體實現方式不同,這類404頁面可能返回“200”狀態碼,也可能返回“302臨時重定向”,但不論哪種,從SEO技術角度看,均不是一種合適的選擇。
制作中文友好網頁同樣是一種討好搜索引擎非常重要的方方法,當你按照上述方法對網站制作進行修改和設計后,是否發現蜘蛛一下子跟你親呢了很多?你在搜索主頁的排名是不是開始穩穩上升了?
本文地址:http://m.knowyourextract.com//article/3411.html