HttpIdentity 功能


HttpIdentity id = new HttpIdentity();
id.NetworkUsername = "username";
id.NetworkPassword = "pwd";
HttpIdentity id = new HttpIdentity();
id.NetworkUsername = "username";
id.NetworkPassword = "pwd";
Dim id As New HttpIdentity()
id.NetworkUsername = "username"
id.NetworkPassword = "pwd"
在 IronWebScraper 中最令人印象深刻和强大的功能之一,是能够使用数千种独特的 (用戶的憑證和/或瀏覽器引擎) 利用多重登入會話來欺騙或抓取網站。

public override void Init()
    License.LicenseKey = " LicenseKey ";
    this.LoggingLevel = WebScraper.LogLevel.All;
    this.WorkingDirectory = AppSetting.GetAppRoot() + @"\ShoppingSiteSample\Output\";
    var proxies = "IP-Proxy1: 8080,IP-Proxy2: 8081".Split(',');
    foreach (var UA in IronWebScraper.CommonUserAgents.ChromeDesktopUserAgents)
        foreach (var proxy in proxies)
            Identities.Add(new HttpIdentity()
                UserAgent = UA,
                UseCookies = true,
                Proxy = proxy
    this.Request("http://www.Website.com", Parse);
  • NetworkDomain:用於用戶身份驗證的網域。支援 Windows、NTLM、Kerberos、Linux、BSD 和 Mac OS X 網路。 必須與 (網絡用戶名和網絡密碼)
  • NetworkUsername: 用於用戶驗證的網絡/HTTP用戶名。支持Http、Windows網絡、NTLM、Kerberos、Linux網絡、BSD網絡和Mac OS。
  • NetworkPassword: 用於用戶驗證的網絡/HTTP密碼。支持Http、Windows網絡、NTLM、Kerberos、Linux網絡、BSD網絡和Mac OS。
  • Proxy: 設置代理設置
  • UserAgent: 設置瀏覽器引擎 (Chrome 桌面版、Chrome Mobile、Chrome 平板版、IE 和 Firefox 等。)
  • HttpRequestHeaders :用於此身份將使用的自訂標頭值,並接受字典物件(字典<string,string>)
  • UseCookies : 啟用/禁用使用 Cookie

IronWebScraper 使用隨機身份運行爬蟲。如果我們需要指定使用特定身份來解析頁面,我們可以這樣做。

此功能用於快取請求的頁面。它通常在開發和測試階段使用;讓開發人員可以在更新代碼後快取所需的頁面以供重用。這使您能夠在重新啟動 Web 爬取工具後在快取頁面上執行代碼,而不需要每次都連接到實時網站。 (即時回放)你可以在初始化中使用它() 方法



`EnableWebCache(時限到期)它會將您的快取數據保存到工作目錄文件夾下的 WebCache 文件夾

IronWebScraper 也具有在重新啟動代碼後通過使用 Start 設置引擎啟動過程名稱來使您的引擎繼續抓取的功能。(爬行ID)

執行請求和回應將被保存到工作目錄內的 SavedState 資料夾中。



  • MaxHttpConnectionLimit

    允許打開的 HTTP 請求總數 (線程)

  • RateLimitPerHost

    最小禮貌延遲或暫停 (以毫秒計算) 在請求到特定域名或 IP 地址之間

  • OpenConnectionLimitPerHost

    允許的同時 HTTP 請求數量 (線程)

  • 限速模式

    使 WebScraper 不僅按主機名稱,還按主機伺服器的 IP 地址智能地調節請求速率。這樣做是為了禮貌地考慮到多個被抓取的域名可能託管在同一台機器上。

