워터마크 없이 실제 운영 환경에서 테스트해 보세요.
필요한 곳 어디에서든 작동합니다.
모든 기능을 갖춘 제품을 30일 동안 사용해 보세요.
몇 분 안에 설치를 완료하고 작동시킬 수 있습니다.
제품 체험 기간 동안 당사 지원 엔지니어링 팀에 대한 모든 접근 권한을 확보할 수 있습니다.
using IronWebScraper;
public class Program
{
private static void Main(string[] args)
{
var ScrapeJob = new BlogScraper();
ScrapeJob.Start();
}
}
public class BlogScraper : WebScraper
{
public override void Init()
{
LoggingLevel = LogLevel.All;
Request("https://www.zyte.com/blog/", Parse);
}
public override void Parse(Response response)
{
foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
{
string strTitle = title_link.TextContentClean;
Scrape(new ScrapedData() { { "Title", strTitle } });
}
if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
{
string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
Request(next_page, Parse);
}
}
}
Install-Package IronWebScraper
.NET 10, 9, 8, 7, 6, 5, Core, Standard 또는 Framework 에서 실행되는 C#, F#, VB.NET 용으로 설계되었습니다.
using IronWebScraper;
public class Program
{
private static void Main(string[] args)
{
var ScrapeJob = new BlogScraper();
ScrapeJob.Start();
}
}
public class BlogScraper : WebScraper
{
public override void Init()
{
LoggingLevel = LogLevel.All;
Request("https://www.zyte.com/blog/", Parse);
}
public override void Parse(Response response)
{
foreach (HtmlNode title_link in response.Css(".oxy-post-title"))
{
string strTitle = title_link.TextContentClean;
Scrape(new ScrapedData() { { "Title", strTitle } });
}
if (response.CssExists("div.oxy-easy-posts-pages > a[href]"))
{
string next_page = response.Css("div.oxy-easy-posts-pages > a[href]")[0].Attributes["href"];
Request(next_page, Parse);
}
}
}
Imports IronWebScraper
Public Class Program
Public Shared Sub Main(ByVal args() As String)
Dim ScrapeJob = New BlogScraper()
ScrapeJob.Start()
End Sub
End Class
Public Class BlogScraper
Inherits WebScraper
Public Overrides Sub Init()
LoggingLevel = LogLevel.All
Request("https://www.zyte.com/blog/", AddressOf Parse)
End Sub
Public Overrides Sub Parse(ByVal response As Response)
For Each title_link As HtmlNode In response.Css(".oxy-post-title")
Dim strTitle As String = title_link.TextContentClean
Scrape(New ScrapedData() From {
{ "Title", strTitle }
})
Next title_link
If response.CssExists("div.oxy-easy-posts-pages > a[href]") Then
Dim next_page As String = response.Css("div.oxy-easy-posts-pages > a[href]")(0).Attributes("href")
Request(next_page, AddressOf Parse)
End If
End Sub
End Class
Install-Package IronWebScraper
IronWebScraper는 C# 코드를 사용하여 웹사이트에서 데이터와 파일을 추출하는 강력한 프레임워크를 제공합니다.
WebScraper를 확장하는 클래스를 생성하십시오.Request 메서드를 사용하여 적어도 하나의 URL을 파싱하는 Init 메서드를 생성하십시오.Request 페이지를 추가로 처리하는 Parse 메서드를 생성하십시오. jQuery 스타일 CSS 셀렉터를 사용하여 HTML 요소와 작업하려면 response.Css를 사용하십시오.Start(); 메서드를 호출하십시오.
제품, 통합 또는 라이선스 관련 문의 사항이 있으시면 Iron 제품 개발팀이 언제든지 지원해 드립니다. 지금 바로 Iron에 연락하여 프로젝트에 Iron 라이브러리를 최대한 활용하는 방법을 알아보세요.
질문하기단일 C# 웹-스크래퍼 클래스를 작성하여 수천 개에서 수백만 개의 웹 페이지를 C# 클래스 인스턴스, JSON 또는 다운로드된 파일로 스크래핑하십시오. IronWebScraper는 인간의 브라우징 행동을 시뮬레이션하여 간결하고 직선적인 워크플로우를 코드화할 수 있도록 합니다. IronWebScraper는 가상의 웹 브라우저 무리처럼 실행되어 대규모 병렬 처리이면서도 정중하고 오류에 저항력 있습니다.
문서와 함께 시작하기
IronWebScraper는 만나는 각 '페이지 유형'을 처리하는 방법을 프로그래밍해야 합니다. 이는 CSS 선택자나 XPath 표현식을 사용하여 매우 간결한 방식으로 달성할 수 있으며 C#에서 완전히 사용자 정의할 수 있습니다. 이러한 자유는 웹 사이트 내에서 어떤 페이지를 스크래핑할 것인지 그리고 추출된 데이터를 어떻게 처리할 것인지 결정할 수 있게 합니다. 각 메서드는 Visual Studio에서 깔끔하게 디버깅되고 감시될 수 있습니다.
튜토리얼 따라하기IronWebScraper는 멀티스레딩과 웹 요청을 처리하여 개발자가 이를 관리할 필요 없이 수백 개의 동시 스레드를 허용합니다. 정중함은 요청의 속도를 늦출 수 있어 대상 웹 서버에 과도한 부하가 걸릴 위험을 줄입니다.
WebScraper로 시작하고 실행하는 방법
IronWebScraper는 하나 또는 여러 개의 ‘신원’ - 실세계의 인간 요청을 시뮬레이션하는 세션을 사용할 수 있습니다. 각 요청은 프로그래밍적으로 또는 무작위로 자신의 신원, 사용자 에이전트, 쿠키, 로그인 및 심지어 IP 주소를 할당할 수 있습니다. 요청은 URL, 구문 분석 메서드 및 포스트 변수를 결합하여 자동 고유로 설정됩니다.
See API ReferenceIronWebScraper는 개발자가 ‘온더플라이’로 코드를 변경하고 이전 요청을 인터넷에 접속하지 않고도 재생할 수 있도록 고급 캐싱을 사용합니다. 모든 스크래핑 작업은 자동으로 저장되며 예외나 정전이 발생하면 다시 실행될 수 있습니다.
WebScraper 설치 지침IronWebScraper는 Visual Studio 설치 프로그램으로 웹 스크래핑 도구를 신속하게 제공합니다. Visual Studio 내에서 직접 NuGet을 통해 설치하거나 DLL을 다운로드하든지 간에 금방 설치할 수 있습니다. 단 하나의 DLL 및 종속성 없음.
PM > Install-Package IronWebScraper DLL 다운로드
VB C# ASP.NET
Ahmed가 자신의 프로젝트에서 IronWebScraper를 사용하여 한 사이트에서 다른 사이트로 콘텐츠를 이동하는 방법을 보십시오. 전자상거래 및 블로그 웹사이트 스크래핑을 위한 샘플 프로젝트 및 코드 제공
Ahmed의 웹 스크래핑 튜토리얼 보기
아이언의 팀은 .NET 소프트웨어 구성 요소 시장에서 10년 이상의 경험을 보유하고 있습니다.