不是由于網址規范化造成的同站內復制內容,解決的最好方法是選取一個版本允許收錄,其他版本禁止搜索引擎抓取或收錄,既可以使用robots文件禁止抓取,也可以使用noindex meta robots 標簽禁止索引.連向不希望收錄的復制內容的鏈接使用 NoFollowJavaScript 等阻止蜘蛛爬行。
另一個解決復制內容的方法是使用canonical標簽.canonical標簽既可以應用在網址規范化引起的復制內容上,也可以用在其他情況下,比如網站上同一個款式的鞋子可能分為不同型號,型號之間唯 "的區別只是顏色,這些型號生成多個網址,產品說明也幾乎完全一樣,只是說明顏色的地方不一樣.這時就可以使用canonical標簽,用戶不會被轉向,還是看到不同頁面,但搜索引擎會把權重集中到其中一個型號上,從而避免復制內容。
帶有Session ID的頁面也可以使用canonical標簽,如頁面http://www.example.com/page-a.htm!放上代碼:
l<1inkrel-"canonical"hre"http://www.example.com/page-a.html"s這樣,后面無論生成什么Session ID:
http://www.example.com/page-a.html?sessionid-123456hutp://www.exanmple.com/page-a.html?sessionid456789
上面的URL.都會被搜索引擎把權重集中到http://www.example.com/page-a.html不同網站之間復制內容解決起來就比較麻煩,因為其他網站上的內容是無法控制的能夠做的只有兩點,一是在頁面中加入版權聲明,要求轉載的網站保留版權聲明及指向原出處的鏈接。有些聚合網站會抓取feed自動生成內容,所以在feed中也要加入版權聲明和鏈接。一般來說,原創版本的外部鏈接會比轉載多一些,就算在中文互聯網這個對版權極不重視的環境下,也還會有一些站長轉載時保留原出處鏈接。對搜索引擎來說,指向原出處的鏈接是判斷原創的最重要信號。
另一點就是堅持原創,假以時日必定能夠增加網站權重,使網站上內容被判斷為原創的機會增加。
如果有其他網站制作中大量抄襲,造成原創內容不能獲得排名,也可以考慮聯系對方,要求加上版權鏈接或刪除抄襲內容,或者向對方主機,域名提供商投訴,向搜索引擎投訴等。
本文地址:http://m.knowyourextract.com//article/2779.html