熱門標簽
網站被采集該怎么辦
采集已經成為了建站的規則。講究點的會帶上版權標記文章出處,不講究的為了捏造一個偽原創來欺騙蜘蛛,甚至干脆亂改一通,往上一傳。
一個地方網站在當地小有人氣,每天分類信息都被好多個本地網站采集粘貼。更有甚者,有人竟用采集程序直接獲取網站的內容。我不反對別人從我的網站復制內容來豐富他的網站。原因有三:
一、這是對我網站的認可,復制我網站的內容,說明他對我的網站信息和人氣的認可。而這種認可和復制行為并無惡意。
二、這種行為本身,也是我網站價值的一個提升:有助于站內信息的傳播,對于到我網站里發布信息的人來說,可以達到更多的效果。
三、我們作為比較成功的站長,應該幫助后進的同學。要有個學長的樣兒~!我的態度是:如果我們成功了,那就更要有一個成功者的風度~!
我特別厭惡采集程序,我的網站就曾多次被采集程序騷擾,它的可惡之處就在于沒有人工參與,自動完成所有信息的復制。完全不尊重別人的勞動,而且時間全盤復制,實在太不厚道了。我也曾遇到這樣的網站直接采集我的網站內容。針對其采集程序,我規納了幾種防采集的兩種方法
一、加入干擾代碼:寫一個生成字母和數字的小程序,然后隨機生成一串字符,將這段字符放于標題或內容文字的前一個html元素之中。舉例說一下吧:
原碼:<td height=25>這里是標題</td><td height=200>這里是要采集的內容</td>
改后:<td height=25 id="asdfwq">這里是標題</td><td height=200 id="qtqwrq">這里是要采集的內容</td>
加入了id值這個干擾因素之后,采集程序基本就歇菜了。
二、封鎖相關服務器的ip地址,這個比較狠,基本就是不允許訪問了。但這個很有針對性,只有你知道某個網站在采集你的程序時有效。
關于防采集程序,有幾種方法是在網上介紹的,比如判斷一段時間內ip訪問次數,這個千萬不能用,會把搜索引擎的蜘蛛也給誤傷到。還有諸如腳本加密,更不太適合,也不利于搜索引擎收錄??傊痪湓?,不管是采集者和被采集者,做一個大家都喜歡的站長,才會做出人氣,做大家都喜歡的站長,也一定是有風度的站長。不論你是采集者還是被采集者。
附:隨機字符串生成代碼
'fcount為要生成的字符數量,引用時<%=Fcj(6)%>,即生成6個小寫字母的字符串
Function Fcj(fcount)
Ftemp=""
For Fi=1 to fcount
Ftemp=Ftemp&Rnd_Chr()
Next
Fcj=Ftemp
End Function
Function Rnd_Chr()
Randomize
Rnd_Chr = Chr(Int((122 - 97 + 1) * Rnd + 97))
End Function,我們可以通過下面的方法對付他!
我們應該怪百度嗎?我覺得不應該,這種算是比較人性化的一種權重辨別模式!當然也有一些站長利用這些來采集別人的文章,要知道任何事情都難以,有人利用這個漏洞是在正常不過的事情了。當然任何事情都會有解決的辦法,關鍵是不要灰心喪氣,我們的網站遲早也會有權重高的一天,那么我們是不是要去抄襲別人的文章了?作為一個有過這種遭遇的人我不會這樣做!相信你們也不會。