C#ウェブスクレイピングライブラリ

基本的なHTML解析の枠を超えて。.NET 10向けの自動Webスクレイピングをマルチスレッド対応で提供し、大規模に構造化データを抽出してエクスポートできます。

CSSセレクタ、XPath、JavaScriptレンダリングを使用したスクレイピング。

マルチスレッド処理による数百の同時リクエスト

サポート スロットリング、プロキシ、ユーザーエージェント、および robots.txt

無料 30日間トライアル、フル機能、クレジットカード不要

C# ウェブスクレイパー

using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}

Install-Package IronWebScraper

次のステップ無料トライアルを開始する

透かしのない完全な機能

30日間トライアル - クレジットカード不要

次のステップ無料トライアルを開始する

透かしのない完全な機能

30日間トライアル - クレジットカード不要

クロスプラットフォームのサポート

C#, F#, & VB.NET 用に設計されており、.NET 10, 9, 8, 7, 6, 5, Core, Standard, または Framework 上で動作します

始めましょう: C# コード例

C# ウェブスクレイパー

using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}

Install-Package IronWebScraper

IronWebScraperは、C#コードを使用してウェブサイトからデータやファイルを抽出するための強力なフレームワークを提供します。

NuGetを使用してプロジェクトにIronWebScraperをインストールします。
WebScraper を拡張するクラスを作成します。
Request メソッドを使用して少なくとも 1 つの URL を解析する Init メソッドを作成します。
リクエストを処理するメソッドを作成し、さらにページを作成します。 jQuery スタイルの CSS セレクターを使用して HTML 要素を操作するには、response.Css を使用します。
アプリケーションで、Web スクレイピングクラスのインスタンスを作成し、Start(); メソッドを呼び出します。
IronWebScraperを使用して高度なウェブクローラーを作成する方法を学ぶには、私たちのC#ウェブスクレイピングチュートリアルをお読みください。

C#でオンライン映画ウェブサイトをスクレイピングする方法を学ぶ

Human Support related to C#ウェブスクレイピングライブラリ | IronWebScraper. C#ウェブスクレイピン...

当社の開発チームからの直接的な人間サポート

製品、統合、またはライセンスの問い合わせであろうと、Ironの製品開発チームはすべての質問に対応します。Ironと対話を始め、このライブラリをプロジェクトで最大限に活用してください。

質問をする

Powerful Scraping Engine related to C#ウェブスクレイピングライブラリ | IronWebScraper. C#ウェブスク�...

強力なスクレイピングエンジンを自分の手で制御

数千、いや数百万のウェブページをC#クラスインスタンス、JSON、またはダウンロードファイルにスクレイプするために、単一のC#ウェブスクレイパークラスを書くことだけです。IronWebScraperを利用すると、人間のブラウジング行動をシミュレートする簡潔かつ直線的なワークフローをコーディングすることができます。IronWebScraperは、仮想ウェブブラウザの群れとしてコードを実行し、非常に並行的でありながら丁寧で故障耐性があります。

ドキュメントで始めましょう

Simple Flexible Logic related to C#ウェブスクレイピングライブラリ | IronWebScraper. C#ウェブスクレ�...

シンプルで柔軟なロジック

IronWebScraperは、出会う各「タイプ」のページをどのように扱うかを知るためにプログラムされる必要があります。これは、CSSセレクタやXPath式を使用して非常に簡潔に実現され、C#で完全にカスタマイズできます。この自由により、ウェブサイト内でスクレイプするページを決定し、抽出したデータをどのように扱うかを決定できます。各メソッドはVisual Studioで整理されてデバッグおよび監視されることができます。

チュートリアルに従ってください

Fast And Polite Behavior related to C#ウェブスクレイピングライブラリ | IronWebScraper. C#ウェブスク�...

高速で丁寧な動作

IronWebScraperは、マルチスレッドとウェブリクエストを扱い、開発者が管理することなく数百の同時スレッドを可能にします。丁寧さはリクエストのスロットリングに設定でき、ターゲットウェブサーバーへの過剰な負荷のリスクを減らします。

WebScraperのセットアップ

Create Virtual User Identities related to C#ウェブスクレイピングライブラリ | IronWebScraper. C#ウェブ�...

仮想ユーザーアイデンティティを作成

IronWebScraperは、一つ以上の「アイデンティティ」– 実世界の人間のリクエストをシミュレートするセッションを使用できます。各リクエストはプログラム的またはランダムに独自のアイデンティティ、ユーザーエージェント、クッキー、ログインさらにはIPアドレスを割り当てることができます。リクエストはURL、解析メソッド、およびポスト変数の組み合わせで自動ユニークに設定されます。

See API Reference