跳至页脚内容

跨平台支持

为在.NET 10, 9, 8, 7, 6, 5, Core, Standard, or Framework上运行的C#, F#, & VB.NET而设计

NET 标志
Visual Studio 标志 Visual Studio 标志
NuGet 标志 NuGet 标志
ReSharper
Windows 标志
Linux 标志
Mac 标志
Docker 标志 Docker 标志
Azure 标志 Azure 标志
AWS 标志 AWS 标志
C# 网页抓取器
using IronWebScraper;

public class Program
{
    private static void Main(string[] args)
    {
        var ScrapeJob = new BlogScraper();
        ScrapeJob.Start();
    }
}

public class BlogScraper : WebScraper
{
    public override void Init()
    {
        LoggingLevel = LogLevel.All;
        Request("https://www.zyte.com/blog/", Parse);
    }

    public override void Parse(Response response)
    {
        foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
        {
            string strTitle = title_link.TextContentClean;
            Scrape(new ScrapedData() { { "Title", strTitle } });
        }

        if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
        {
            string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
            Request(next_page, Parse);
        }
    }
}
Imports IronWebScraper

Public Class Program
	Public Shared Sub Main(ByVal args() As String)
		Dim ScrapeJob = New BlogScraper()
		ScrapeJob.Start()
	End Sub
End Class

Public Class BlogScraper
	Inherits WebScraper

	Public Overrides Sub Init()
		LoggingLevel = LogLevel.All
		Request("https://www.zyte.com/blog/", AddressOf Parse)
	End Sub

	Public Overrides Sub Parse(ByVal response As Response)
		For Each title_link As HtmlNode In response.Css(".oxy-post-title")
			Dim strTitle As String = title_link.TextContentClean
			Scrape(New ScrapedData() From {
				{ "Title", strTitle }
			})
		Next title_link

		If response.CssExists("div.oxy-easy-posts-pages > a[href]") Then
			Dim next_page As String = response.Css("div.oxy-easy-posts-pages > a[href]")(0).Attributes("href")
			Request(next_page, AddressOf Parse)
		End If
	End Sub
End Class
Install-Package IronWebScraper

IronWebScraper 提供了一个强大的框架来使用 C# 代码从网站中提取数据和文件。

  1. 使用NuGet将 IronWebScraper 安装到您的项目中。
  2. 创建一个继承 WebScraper 的类。
  3. 创建一个 Init 方法,使用 Request 方法解析至少一个 URL。
  4. 创建一个 Parse 方法来处理请求,并确实 Request 更多页面。 使用 response.Css 使用 jQuery 风格的 CSS 选择器来处理 HTML 元素。
  5. 在您的应用程序中,创建您的网站抓取类的实例并调用 Start(); 方法。
  6. 阅读我们的 C# 抓取教程,学习如何使用 IronWebScraper 创建高级网络爬虫。

了解如何使用 C# 抓取在线电影网站

Human Support related to C#网页抓取库

直接来自我们开发团队的人工支持

无论是产品、集成还是授权问题,Iron 产品开发团队随时准备回答您所有问题。立即联系并与 Iron 开始对话,以便在您的项目中充分利用我们的库。

提问
Powerful Scraping Engine related to C#网页抓取库

强大的抓取引擎掌控在您手中

只需编写一个C#网页抓取器类即可将成千上万甚至百万网页抓取为C#类实例、JSON或下载文件。IronWebScraper允许您编写简洁、线性的工作流程,模拟人类浏览行为。IronWebScraper将作为一群虚拟网络浏览器并行运行您的代码,既有礼貌又具容错性。

从文档开始
Simple Flexible Logic related to C#网页抓取库

简单、灵活的逻辑

必须编程IronWebScraper以了解如何处理它遇到的每种类型的页面。这是通过使用CSS选择器或XPath表达式以非常简洁的方式实现的,并且可以在C#中完全自定义。这种自由让您可以决定在网站上抓取哪些页面,以及对抓取的数据进行什么操作。每种方法都可以在Visual Studio中干净地调试和观看。

跟随教程
Fast And Polite Behavior related to C#网页抓取库

快速而有礼貌的行为

IronWebScraper处理多线程和网络请求,以便同时处理数百个并发线程,而无需开发人员去管理它们。礼貌可以设置为调节请求,从而减少对目标Web服务器的过度负载的风险。

与WebScraper一起启动和运行
Create Virtual User Identities related to C#网页抓取库

创建虚拟用户身份

IronWebScraper可以使用一个或多个“身份” - 模拟实际世界中人类请求的会话。每个请求可以通过编程方式或随机分配其自己的身份、用户代理、Cookie、登录甚至IP地址。请求通过URL、解析方法和POST变量的组合设置为自动唯一。

See API Reference
Action Replay related to C#网页抓取库

动作重放

IronWebScraper使用高级缓存技术,允许开发者在不联机的情况下“现场”更改代码并重放每一个先前的请求。每个抓取作业都会自动保存,并且在出现异常或停电时可以恢复。

WebScraper设置说明
Visual Studio库用于PDF创建和内容编辑。

通过Microsoft Visual Studio快速安装

IronWebScraper通过Visual Studio安装程序迅速将网页抓取工具掌控在您的手中。无论是在Visual Studio中直接通过NuGet安装还是下载DLL,您都可以迅速完成设置。只需一个DLL,没有依赖项。

PM > Install-Package IronWebScraper 下载DLL
支持:
  • .NET Framework 4.0 及以上版本支持 C#、VB、F#
  • Microsoft Visual Studio。 .NET 开发 IDE 图标
  • NuGet 安装程序支持 Visual Studio
  • JetBrains ReSharper C# 语言助手兼容
  • Microsoft Azure C# .NET 托管平台兼容

.NET网页抓取社区教程

教程 + 代码示例 .NET中的网页抓取 | VB.NET 和 ASP.NET PDF

VB C# ASP.NET

C#和VB.NET项目中的网页抓取

了解Ahmed如何在他的项目中使用IronWebScraper将内容从一个站点迁移到另一个站点。提供用于抓取电子商务和博客网站的示例项目和代码

Ahmed Aboelmagd .NET 软件工程师 查看Ahmed的网页抓取教程
我们的客户使用IronWebScraper...

会计和金融系统

  • # 收据
  • # 报告
  • # 发票打印
向ASP.NET会计和金融系统添加PDF支持

业务数字化

  • # 文档
  • # 订购和标签
  • # 纸质替代
C#业务数字化用例

企业内容管理

  • # 内容制作
  • # 文档管理
  • # 内容分发
.NET CMS PDF支持

数据和报告应用程序

  • # 性能跟踪
  • # 趋势映射
  • # 报告
C# PDF报告
今天就加入他们
Iron Software企业.NET组件开发者

数千家企业、政府、中小企业和开发者信赖Iron软件产品。

Iron团队在.NET软件组件市场拥有超过10年的经验。

Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
Iron Software客户图标
一流的工程,
24小时支持
  • Support Team Member 2 related to C#网页抓取库
  • Support Team Member 4 related to C#网页抓取库
  • Support Team Member 6 related to C#网页抓取库
  • Support Team Member 7 related to C#网页抓取库
  • Support Team Member Iron related to C#网页抓取库
联系专家
准备开始了吗?
Nuget 下载 122,916 | 版本: 2025.11 刚刚发布