Name: IronWebScraper
Brand: Iron Software
Availability: InStock
Rating: 4.72 (37 reviews)

C#網路爬蟲程式庫

超越基本的HTML解析。在.NET 10上進行自動化的網頁爬取，並結合多執行緒，以大規模地提取和匯出結構化資料。

使用 CSS選擇器、XPath和JavaScript渲染進行爬取

多執行緒處理數百個同時請求

支援限速、代理伺服器、使用者代理和robots.txt

免費30天試用，功能完整，無需信用卡

C# Web Scraper

using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}

Install-Package IronWebScraper

下一步：開始免費試用

無水印的完全功能

30 天試用 - 不需要信用卡

下一步：開始免費試用

無水印的完全功能

30 天試用 - 不需要信用卡

跨平台支援

設計用於C#, F#, & VB.NET運行於.NET 10, 9, 8, 7, 6, 5, Core, Standard或Framework

廣泛的爬取能力

使用CSS選擇器或XPath表達式進行解析;jQuery風格的語法。
渲染JavaScript頁面，而不僅僅是靜態HTML。
輸出到C#類別實例、JSON或下載的檔案。

結果： 一個程式庫涵蓋您的應用程式所需的每個爬網工作流程。

5分鐘內即可上手

PM >
Install-Package IronWebScraper

→ 5分鐘快速入門。
簡單API：Request(url, Parse), response.Css(".selector"), Scrape(data).
智能預設：多執行緒、禮貌性和快取由框架處理。

結果： 在此衝刺期間交付一個爬蟲，不要等到下季度。

企業效能

.NET 10、Core、Standard或Framework
C#、VB.NET、F# 支援。DigiCert 簽署的二進位檔。
部署於任何地方：Windows、Linux、macOS、Docker、Azure、AWS。

結果： 從單一部落格爬取擴展到數百萬頁面，無需重寫您的執行緒模型。

禮貌，韌性強，易於審計

內建限速、代理支援、使用者代理和robots.txt遵從。
虛擬使用者身份：每次請求的使用者代理、Cookie、登入和IP。
自動儲存工作在例外情況、崩潰或停電後恢復。

View Code Examples

開發者優先支援與授權

永久授權一次購買，永久使用。可選更新和續費。
24/5 工程師支援（Premium中的24/7）。真實的人類，聊天中位回應時間少於1分鐘。
30天退款保證不合適？全額退款，無需詢問。

Chat With an Engineer

建築商

您實際會使用的功能：
- CSS選擇器 & XPath
- multithreaded crawling
- 代理與使用者端輪換
- 虛擬使用者身份
- auto-resume on crash
- JavaScript呈現
- 限制和禮貌
- robots.txt合規
- action replay (offline)
- JSON 或類別輸出
無所不在：Windows、Linux、macOS、Docker、Azure、AWS。

(30 days, fully-functional product)

對於買家

受到Iron Suite數百萬工程師的信賴。
為真實工作負載而設計：系統遷移、競爭分析、搜尋索引、資料挖掘。
採購友好：永久授權、可選續約、可提供發票、多種付款選項（包括本地選項：Amazon Pay、支付寶、Apple Pay、IDEAL、SEPA、ACH）。
30天退款保證。

See Licensing

開始使用：C# 程式碼範例

C# Web Scraper

using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}

Imports IronWebScraper

Public Class Program
	Public Shared Sub Main(ByVal args() As String)
		Dim ScrapeJob = New BlogScraper()
		ScrapeJob.Start()
	End Sub
End Class

Public Class BlogScraper
	Inherits WebScraper

	Public Overrides Sub Init()
		LoggingLevel = LogLevel.All
		Request("https://www.zyte.com/blog/", AddressOf Parse)
	End Sub

	Public Overrides Sub Parse(ByVal response As Response)
		For Each title_link As HtmlNode In response.Css(".oxy-post-title")
			Dim strTitle As String = title_link.TextContentClean
			Scrape(New ScrapedData() From {
				{ "Title", strTitle }
			})
		Next title_link

		If response.CssExists("div.oxy-easy-posts-pages > a[href]") Then
			Dim next_page As String = response.Css("div.oxy-easy-posts-pages > a[href]")(0).Attributes("href")
			Request(next_page, AddressOf Parse)
		End If
	End Sub
End Class

Install-Package IronWebScraper

IronWebScraper提供了一個強大的框架，讓您可以使用C#程式碼從網站提取資料和檔案。

使用NuGet將IronWebScraper安裝到您的專案中。
建立一個擴展WebScraper的類別。
建立一個Request方法解析至少一個URL。
建立一個Request更多頁面。使用response.Css來使用jQuery風格的CSS選擇器操作HTML元素。
在您的應用程式中，建立您的網頁抓取類別的實例並調用Start();方法。
閱讀我們的C#網頁抓取教程，了解如何使用IronWebScraper建立高級網頁爬蟲。

發現如何使用C#抓取線上電影網站

直接從我們的開發團隊獲得人工支援

無論是產品、整合還是授權的問題，Iron產品開發團隊隨時在此支持您的所有問題。請與Iron聯繫並開啟對話，以充分利用我們的程式庫於您的專案中。

提出問題

Powerful Scraping Engine related to C#網路爬蟲程式庫

強大的爬取引擎由您掌控

只需編寫一個C#網頁抓取類別，即可將數千甚至數百萬個網頁抓取為C#類別實例、JSON或下載的文件。IronWebScraper允許您編寫簡潔的線性工作流程，模擬人類的瀏覽行為。IronWebScraper將您的程式作為一群虛擬網頁瀏覽器運行，並且在大規模並行的同時，保持禮貌並具備容錯能力。

開始使用文件

Simple Flexible Logic related to C#網路爬蟲程式庫

簡單、靈活的邏輯

IronWebScraper必須被程式化以瞭解如何處理所遇到的每個「型別」頁面。這可以透過CSS選擇器或XPath表達式以非常簡潔的方式達成，並可以在C#中完全自訂。這種自由度讓您可以決定要抓取網站中的哪些頁面，以及如何處理提取的資料。每個方法都可以在Visual Studio中整齊地進行除錯和觀察。

遵循教程