using IronWebScraper;
public class Program
{
private static void Main(string[] args)
{
var ScrapeJob = new BlogScraper();
ScrapeJob.Start();
}
}
public class BlogScraper : WebScraper
{
public override void Init()
{
LoggingLevel = LogLevel.All;
Request("https://www.zyte.com/blog/", Parse);
}
public override void Parse(Response response)
{
foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
{
string strTitle = title_link.TextContentClean;
Scrape(new ScrapedData() { { "Title", strTitle } });
}
if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
{
string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
Request(next_page, Parse);
}
}
}
Imports IronWebScraper
Public Class Program
Public Shared Sub Main(ByVal args() As String)
Dim ScrapeJob = New BlogScraper()
ScrapeJob.Start()
End Sub
End Class
Public Class BlogScraper
Inherits WebScraper
Public Overrides Sub Init()
LoggingLevel = LogLevel.All
Request("https://www.zyte.com/blog/", AddressOf Parse)
End Sub
Public Overrides Sub Parse(ByVal response As Response)
For Each title_link As HtmlNode In response.Css(".oxy-post-title")
Dim strTitle As String = title_link.TextContentClean
Scrape(New ScrapedData() From {
{ "Title", strTitle }
})
Next title_link
If response.CssExists("div.oxy-easy-posts-pages > a[href]") Then
Dim next_page As String = response.Css("div.oxy-easy-posts-pages > a[href]")(0).Attributes("href")
Request(next_page, AddressOf Parse)
End If
End Sub
End Class
Install-Package IronWebScraper
Drapacz sieciowy C#
IronWebScraper zapewnia potężny framework do pobierania danych i plików ze stron internetowych za pomocą kodu C#.
Zainstaluj IronWebScraper do swojego projektu używając NuGet.
Utwórz klasę rozszerzającą WebScraper.
Utwórz metodę Init, która wykorzystuje metodę Request do analizowania co najmniej jednego adresu URL.
Utwórz metodę Parse do przetwarzania żądań oraz Request więcej stron. Użyj response.Css, aby pracować z elementami HTML przy użyciu selektorów CSS w stylu jQuery.
W aplikacji utwórz instancję klasy do scrapowania stron internetowych i wywołaj metodę Start();.
Przeczytaj nasz C# web scraping tutorials, aby nauczyć się tworzyć zaawansowane web crawlers używając IronWebScraper.
Czy chcesz szybko dowodu? PM > Install-Package IronWebScraper uruchom przykład obserwuj, jak twoja docelowa strona przekształca się w dane strukturalne.