有個(gè)做布料的外貿(mào)企業(yè),建站時(shí)產(chǎn)品上傳的文字內(nèi)容幾乎一模一樣,不同系列的內(nèi)容描述也只是更換了一個(gè)系列名稱。
從用戶角度看,80%的人會(huì)認(rèn)為這家企業(yè)不太可靠,連網(wǎng)站都做的這么粗糙。從谷歌站內(nèi)seo的角度,這樣也是不行的。谷歌官方雖未明確說(shuō)重復(fù)內(nèi)容會(huì)帶來(lái)任何懲罰或負(fù)面信號(hào),但早已明確不會(huì)索引收錄重復(fù)的內(nèi)容。
一、什么是重復(fù)頁(yè)面?
在seo業(yè)界都有這樣的共識(shí),url是頁(yè)面的唯一標(biāo)識(shí)符,類似身份證id一樣,一個(gè)人只能有一個(gè)身份證id,如果出現(xiàn)了多了,這個(gè)人,多半是有問(wèn)題的。同理,在搜索引擎當(dāng)中,搜索引擎更加青睞標(biāo)識(shí)符明確、并且唯一的頁(yè)面。這樣搜索引擎可以更好地理解你的網(wǎng)站。
為了避免不必要的抓取和索引工作,谷歌會(huì)嘗試根據(jù)網(wǎng)站url來(lái)預(yù)測(cè)頁(yè)面可能包含相似或重復(fù)的內(nèi)容。當(dāng)google抓取具有相似url的頁(yè)面并發(fā)現(xiàn)它們包含相同的內(nèi)容時(shí),它隨后可以確定具有該url結(jié)構(gòu)的所有其他頁(yè)面也具有相同的內(nèi)容,進(jìn)而將這些頁(yè)面判定為重復(fù)頁(yè)面,不予抓取收錄。
二、重復(fù)頁(yè)面較多,會(huì)有什么樣的后果呢?
1、蜘蛛爬取網(wǎng)站的時(shí)間是有限的,過(guò)多的相同內(nèi)容頁(yè)面會(huì)消耗大量的抓取時(shí)間,加上后期搜索引擎會(huì)過(guò)濾重復(fù)頁(yè)面,最終導(dǎo)致網(wǎng)站被索引的數(shù)量極少,后期排名更難做了。
2、鏈接到這些重復(fù)頁(yè)面的鏈接權(quán)重被浪費(fèi),最終權(quán)重整體下降。
3、搜索引擎沒(méi)辦法了解哪個(gè)是你需要展示的頁(yè)面,很有可能你不希望被抓取的頁(yè)面反而被收錄,最終展現(xiàn)給客戶的頁(yè)面不是特色頁(yè)面,一定程度上減少了網(wǎng)站流量。
三、如何糾正此問(wèn)題?
1、找到重復(fù)的頁(yè)面
找到重復(fù)頁(yè)面是很有必要的,可以使用siteliner以及copyscape這一類的工具為網(wǎng)站做一個(gè)系統(tǒng)的診斷,找到重復(fù)度非常高的頁(yè)面,自己先做取舍,再讓谷歌搜索引擎抓取、收錄、排名。
2、301跳轉(zhuǎn)
如果你有4組不同url但是內(nèi)容相同,從url中選擇一條標(biāo)準(zhǔn)的,將剩余的3組鏈接301跳轉(zhuǎn)到第一個(gè)頁(yè)面url上。因?yàn)?01跳轉(zhuǎn)屬于帶權(quán)重跳轉(zhuǎn),可以將4組url的權(quán)重統(tǒng)一。這樣,搜索引擎不光可以識(shí)別唯一的頁(yè)面,同時(shí),唯一的那個(gè)頁(yè)面也可以獲得更好的排名。
總之,除了不可避免的重復(fù)以外,還是建議網(wǎng)站做成內(nèi)容豐富且區(qū)別明顯的頁(yè)面,增加原創(chuàng)性的文章輸出,讓搜索引擎可以從網(wǎng)站上找到相關(guān)性高的各類信息。