1. 怎樣不讓百度搜到我的網站!
什麼是spider?
spider是網路搜索引擎的一個自動程序。它的作用是訪問互聯網上的html網頁,建立索引資料庫,使用戶能在網路搜索引擎中搜索到您網站的網頁。
spider對一個網站伺服器造成的訪問壓力如何?
spider會自動根據伺服器的負載能力調節訪問密度。在連續訪問一段時間後,spider會暫停一會,以防止增大伺服器的訪問壓力。所以在一般情況下,spider對您網站的伺服器不會造成過大壓力。
為什麼spider不停的抓取我的網站?
對於您網站上新產生的或者持續更新的頁面,spider會持續抓取。此外,您也可以檢查網站訪問日誌中spider的訪問是否正常,以防止有人惡意冒充spider來頻繁抓取您的網站。 如果您發現spider非正常抓取您的網站,請反饋至[email protected],並請盡量給出spider對貴站的訪問日誌,以便於我們跟蹤處理。
我不想我的網站被spider訪問,我該怎麼做?
spider遵守互聯網robots協議。您可以利用robots.txt文件完全禁止spider訪問您的網站,或者禁止spider訪問您網站上的部分文件。 注意:禁止spider訪問您的網站,將使您的網站上的網頁,在網路搜索引擎以及所有網路提供搜索引擎服務的搜索引擎中無法被搜索到。
關於robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法
為什麼我的網站已經加了robots.txt,還能在網路搜索出來?
因為搜索引擎索引資料庫的更新需要時間。雖然spider已經停止訪問您網站上的網頁,但網路搜索引擎資料庫中已經建立的網頁索引信息,可能需要二至四周才會清除。 另外也請檢查您的robots配置是否正確。
我希望我的網站內容被網路索引但不被保存快照,我該怎麼做?
spider遵守互聯網meta robots協議。您可以利用網頁meta的設置,使網路顯示只對該網頁建索引,但並不在搜索結果中顯示該網頁的快照。
和robots的更新一樣,因為搜索引擎索引資料庫的更新需要時間,所以雖然您已經在網頁中通過meta禁止了網路在搜索結果中顯示該網頁的快照,但網路搜索引擎資料庫中如果已經建立了網頁索引信息,可能需要二至四周才會在線上生效。
網路蜘蛛在robots.txt中的名字是什麼?
「Baispider」 首字母B大寫,其餘為小寫。
spider多長時間之後會重新抓取我的網頁?
網路搜索引擎每周更新,網頁視重要性有不同的更新率,頻率在幾天至一月之間,spider會重新訪問和更新一個網頁。
spider抓取造成的帶寬堵塞?
spider的正常抓取並不會造成您網站的帶寬堵塞,造成此現象可能是由於有人冒充的spider惡意抓取。如果您發現有名為Baispider的agent抓取並且造成帶寬堵塞,請盡快和我們聯系。您可以將信息反饋至[email protected],如果能夠提供您網站該時段的訪問日誌將更加有利於我們的分析。