5價錢
價錢 , 這個當然是需要考慮的內容 , 若是一個代辦署理非論是響應速度仍是不變性都出格不錯 , 可是價錢很是很是高 , 這也是不成接管的 。
6平安性
這簡直也是需要考慮的身分 , 好比一旦不小心把代辦署理提取的 API 泄露出去了 , 別人就肆意利用我們的 API 提代替理利用 , 而一向花費的是我們的套餐 。 別的一旦別人經由過程某些手段獲取了我們的代辦署理列表 , 而這些代辦署理是沒有平安驗證的 , 這也會導致別人偷偷利用我們的代辦署理 。 在出產情況上 , 這方面尤其需要注重 。
7利用頻率
有些代辦署理套餐在 API 挪用提代替理時有頻率限制 , 有的代辦署理套餐則會限制請求頻率 , 這些身分城市或多或少影響爬蟲的效率 , 這部門身分我們也需要考慮進來 。
8測評尺度
要做尺度的測評 , 那就必需在尺度的測評情況下進行 , 且盡可能解除一些雜項的干擾 , 如收集波動、傳輸延遲等一系列的影響 。
9本家兒機拔取
因為我的小我筆記本是利用 WiFi 上彀的 , 所以可能會有收集波動 , 并且現實帶寬其實并不太好把控 , 是以它并不適合來做尺度評測利用 。 評測需要在一個收集不變的前提下進行 , 并且多個代辦署理的評測情況必需不異 , 在此我選擇了一臺騰訊云本家兒機作為測試 , 本家兒機設置裝備擺設如下:
如許我們就可以包管一個尺度同一的測試情況了 。

10現取現測
別的在評測時還需要遵循一個原則 , 那就是現取現測 , 即取一個測一個 。 此刻良多付費代辦署理網站都供給了 API 接口 , 我們可以一次性提取多個代辦署理 , 可是如許會導致一個問題 , 每個代辦署理在提掏出來的時辰 , 商家是會盡量包管它的可用性的 , 但過一段時候 , 這個代辦署理可能就欠好用了 , 所以假如我們一次性提掏出來了 100 個代辦署理 , 可是這 100 個代辦署理并沒有同時介入測試 , 后面的代辦署理就會履歷一個的期待期 , 過一段時候再測這些代辦署理的話 , 必定會影響后半部門代辦署理的有用性 , 所以這里我們將提取的數目同一設置當作 1 , 即請求一次接口獲取一個代辦署理 , 然后當即進行測試 , 如許可以包管測試的公允性 , 解除了分歧代辦署理有用期的干擾 。
11時候計較
因為我們有一項是測試代辦署理的響應速度 , 所以我們需要計較法式請求之前和獲得響應之后的時候差 , 這里我們利用的測試 Python 庫是 requests , 所以我們就計較倡議請乞降獲得響應之間的時候差即可 , 時候計較方式如下所示:
這里 used_time 就是利用代辦署理請求的耗時 , 如許測試的就僅僅是倡議請求到獲得響應的時候 。

12超時限制
在測試時免不了的會碰到代辦署理請求超時的問題 , 所以這里我們也需要同一一個超不時間 , 這里設置為 60 秒 , 若是利用代辦署理請求百度 , 60 秒還沒有獲得響應 , 那就視為該代辦署理無效 。
猜你喜歡
- 如何用Photoshop來對圖片進行局部換色
- 電腦如何對磁盤進行分析
- 地球上的水究竟是怎么來的?
- 如何在SPSS中對個案等級排序
- 如何對word文檔進行大綱級別設定?
- 裝扮少女玩偶派對怎么過攻略
- 人生如茶,空杯以對
- 每天喝蜂蜜水的好處和用法?
- 如何寫綜述論文
- 長期喝茶對腎有影響嗎?利大于弊還是弊大于利?
