クロスプラットフォームサポート

向けに設計された C#、F#、およびVB.NET で稼働 .NET 8、7、6、Core、Standard、またはFramework

.NETロゴ
Visual Studio ロゴ Visual Studio ロゴ
NuGetロゴ NuGetロゴ
リシャープ
ウィンドウズロゴ
Linuxロゴ
マックロゴ
Docker ロゴ Docker ロゴ
Azureロゴ Azureロゴ
AWSロゴ AWSロゴ
C#ウェブスクレイパー
using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}
Imports IronWebScraper

Public Class Program
	Public Shared Sub Main(ByVal args() As String)
		Dim ScrapeJob = New BlogScraper()
		ScrapeJob.Start()
	End Sub
End Class

Public Class BlogScraper
	Inherits WebScraper

	Public Overrides Sub Init()
		LoggingLevel = LogLevel.All
		Request("https://www.zyte.com/blog/", AddressOf Parse)
	End Sub

	Public Overrides Sub Parse(ByVal response As Response)
		For Each title_link As HtmlNode In response.Css(".oxy-post-title")
			Dim strTitle As String = title_link.TextContentClean
			Scrape(New ScrapedData() From {
				{ "Title", strTitle }
			})
		Next title_link

		If response.CssExists("div.oxy-easy-posts-pages > a[href]") Then
			Dim next_page As String = response.Css("div.oxy-easy-posts-pages > a[href]")(0).Attributes("href")
			Request(next_page, AddressOf Parse)
		End If
	End Sub
End Class

IronWebScraper (アイアンウェブスクレイパー)は、C# (シーシャープ)コードを使用してウェブサイトからデータやファイルを抽出するための強力なフレームワークを提供します。

  1. を使用して IronWebScraper をプロジェクトにインストールします。 NuGet

  2. WebScraper` を継承したクラスを作成する

  3. 少なくとも一つの URL を解析するために Request メソッドを使用する Init メソッドを作成する。

  4. リクエストを処理するために Parse メソッドを作成し、さらにページを Request する。 response.Cssを使用して、jQueryスタイルのCSSセレクタを使用してHTML要素を操作する

  5. アプリケーションでウェブスクレイピングクラスのインスタンスを作成し、`Start()メソッド

  6. 私たちの記事を読む C#(シーシャープ)チュートリアル IronWebScraper (アイアンウェブスクレイパー) を使って高度なウェブクローラーを作成する方法を学ぶ。

開発チームによる直接サポート

製品、統合、ライセンスに関するご質問がある場合、Iron製品開発チームがお客様のご質問に対応いたします。Ironと連絡を取り、プロジェクトでライブラリを最大限に活用するための対話を始めましょう。

質問する

あなたの手中に強力なスクレイピングエンジン

1つのC#ウェブスクレイパークラスで、数千または数百万のウェブページをC#クラスインスタンス、JSON、またはダウンロードされたファイルにスクレイピングします。IronWebscraperを使用すると、人間のブラウジング行動をシミュレートする簡潔で直線的なワークフローをコード化することができます。IronWebscraperは、仮想ウェブブラウザ群としてコードを実行し、大量に並列処理しながらも、丁寧で故障耐性があります。

ドキュメントの使用を開始する

シンプルでフレキシブルなロジック

IronWebScraperは、遭遇した各「タイプ」のページを処理する方法をプログラムする必要があります。これは、CSSセレクタまたはXPath式を使用して非常に簡潔に達成され、C#で完全にカスタマイズ可能です。この自由度により、Webサイト内でスクレイピングするページを選択し、抽出したデータの処理方法を決定することができます。各メソッドはVisual Studioで整然とデバッグおよび監視することができます。

チュートリアルに従う

迅速かつ丁寧な動作

IronWebScraperは、開発者がスレッドを管理する必要なく、数百の同時スレッドを可能にするためにマルチスレッドとウェブリクエストを処理します。ターゲットのウェブサーバーへの過剰な負荷のリスクを減らすために、リクエストのレートを制限する礼儀正しさが設定できます。

WebScraper 入門

仮想ユーザーIDを作成する

IronWebScraperは、複数の「アイデンティティ」―実世界の人間のリクエストをシミュレートするセッション―を使用することができます。それぞれのリクエストは、プログラム上またはランダムに独自のアイデンティティ、ユーザーエージェント、クッキー、ログインおよびIPアドレスまで割り当てることができます。リクエストは、URL、解析メソッド、ポスト変数の組み合わせで自動的にユニークに設定されます。

See API Reference

アクションリプレイ

IronWebScraperは、インターネットに接続せずに、コードを「オンザフライ」で変更し、前回のすべてのリクエストを再実行できる高度なキャッシングを使用しています。すべてのスクレイプジョブは自動的に保存され、例外や停電が発生した場合でも再開できます。

WebScraperセットアップ手順
Visual Studio用PDF作成およびコンテンツ編集ライブラリ。

Microsoft Visual Studio での迅速なインストール

IronWebScraper は Visual Studio インストーラーで Web スクレイピングツールを迅速に提供します。Visual Studio 内の NuGet から直接インストールする場合でも、DLL をダウンロードする場合でも、すぐに設定が完了します。必要なのはたった1つの DLL で、他に依存関係はありません。

PM > Install-Package IronWebScraper DLLをダウンロード
サポート:
  • .NET Framework 4.0 以降のバージョンはC#、VB、F#をサポートしています
  • マイクロソフト・ビジュアル・スタジオ. .NET開発IDEアイコン
  • Visual Studio 用 NuGet インストーラーサポート
  • JetBrains ReSharper C# 言語アシスタント対応
  • Microsoft Azure C# .NET ホスティングプラットフォーム互換

.NET Webscraping コミュニティチュートリアル

チュートリアル + コード例 .NETでのウェブスクレイピング | VB.NETおよびASP.NET PDF

VB C# ASP.NET

C#およびVB.NETプロジェクトにおけるWebスクレイピング

Ahmedが自身のプロジェクトでIronWebScraperを使用して、あるサイトから別のサイトへコンテンツを移行する方法をご覧ください。eコマースおよびブログサイトのスクレイピング用のサンプルプロジェクトとコードも提供されています。

アフメド・アブレルマグド.NETソフトウェアエンジニア アーメドのWebScrapingチュートリアルを見る
お客様はIronWebScraperを使用して...

会計および金融システム

  • # レシート
  • # レポーティング
  • # 請求書の印刷
ASP.NET会計および財務システムにPDFサポートを追加

ビジネスデジタル化

  • # ドキュメント
  • # 注文およびラベリング
  • # ペーパー置換
C# ビジネスデジタル化のユーザーケース

エンタープライズコンテンツ管理

  • # コンテンツ制作
  • # ドキュメント管理
  • # コンテンツ配信
.NET CMS PDFサポート

データおよびレポート作成アプリケーション

  • # パフォーマンストラッキング
  • # トレンドマッピング
  • # レポート
C# PDFレポート
今日から参加しましょう
Iron Software企業.NETコンポーネント開発者

数千の企業、政府機関、中小企業、および開発者がIron Software製品を信頼しています。

Ironのチームは、.NETソフトウェアコンポーネント市場で10年以上の経験を有しています。

Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン
Iron Softwareカスタマーアイコン

世界クラスのエンジニアリング
24時間サポート

専門家に相談する

準備はできましたか? バージョン: 2024.9 新発売

無料のNuGetダウンロード 総ダウンロード数: 89,017 View Licenses >