无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 經(jīng)驗 > 關(guān)鍵詞  > 網(wǎng)站資源最新資訊  > 正文

    互聯(lián)網(wǎng)網(wǎng)站的反爬蟲策略淺析

    2009-08-19 15:01 · 稿源:javaeye

    《互聯(lián)網(wǎng)網(wǎng)站的反爬蟲策略淺析》文章已經(jīng)歸檔,站長之家不再展示相關(guān)內(nèi)容,下文是站長之家的自動化寫作機器人,通過算法提取的文章重點內(nèi)容。這只AI還很年輕,歡迎聯(lián)系我們幫它成長:

    一些智能的搜索引擎爬蟲的爬取頻率比較合理,對網(wǎng)站資源消耗比較少,但是很多糟糕的網(wǎng)絡(luò)爬蟲,對網(wǎng)頁爬取能力很差,經(jīng)常并發(fā)幾十上百個請求循環(huán)重復(fù)抓取,這種爬蟲對中小型網(wǎng)站往往是毀滅性打擊,特別是一些缺乏爬蟲編寫經(jīng)驗的程序員寫出來的爬蟲破壞力極強...

    對于一個原創(chuàng)內(nèi)容豐富,URL結(jié)構(gòu)合理易于爬取的網(wǎng)站來說,簡直就是各種爬蟲的盤中大餐,很多網(wǎng)站的訪問流量構(gòu)成當中,爬蟲帶來的流量要遠遠超過真實用戶訪問流量,甚至爬蟲流量要高出真實流量一個數(shù)量級...

    如果一個爬蟲非要針對你的網(wǎng)站進行處心積慮的爬取,那么他可能會采用分布式爬取策略,比方說尋找?guī)装偕锨€國外的代理服務(wù)器瘋狂的爬取你的網(wǎng)站,從而導(dǎo)致網(wǎng)站無法訪問,那么你再分析日志是不可能及時解決問題的...

    ......

    本文由站長之家用戶“javaeye”投稿,本平臺僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時間超過平臺更新維護時間,為了保證文章信息的及時性,內(nèi)容觀點的準確性,平臺將不提供完整的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請聯(lián)系作者獲取原文。

    舉報

    • 相關(guān)推薦

    熱文

    • 3 天
    • 7天