Tagalog na OCR sa C#at .NET

Iba pang mga bersyon ng dokumentong ito:

IronOCR ist eine C#-Software, die von C#-Programmierern genutzt werden kann, da sie in der Lage sind, mit anderen Programmierern zusammenzuarbeiten at mga dokumentong PDF sa 126 na wika, kabilang ang Tagalog.

Es handelt sich dabei um eine fortgeschrittene Version von Tesseract, die auch für normale .NET-Entwickler geeignet ist lumalagpas sa ibang mga engine ng Tesseract para sa parehong bilis at kawastuhan.

Mga Nilalaman ng IronOcr.Languages.Tagalog

Naglalaman ang package na ito ng 14 na mga wika ng OCR para sa .NET:

  • Tagalog

Mag-download

Pakete für das Tagalog-Wiki [Wikang Tagalog]
* Herunterladen als Zippen
* Installieren mit
https://www.nuget.org/packages/IronOcr.Languages.Tagalog/'> NuGet

Pag-Installation

Bei der Installation der neuen Software ist es wichtig, dass sie nicht zu viel Zeit in Anspruch nimmt Tagalog OCR-Paket auf der ganzen Welt proyekto .NET.

PM> Install-Package IronOCR.Languages.Tagalog

Halimbawa ng Code

Der C#-Code kann in der Tagalog-Sprache im Dokument oder im PDF-Format gespeichert werden.

//PM> Install-Package IronOcr.Languages.Tagalog
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput(@"images\Tagalog.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Tagalog
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput(@"images\Tagalog.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Tagalog
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog
Using Input = New OcrInput("images\Tagalog.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Wie lange dauert es, bis das IronOCR fertig ist?

IronOCR ist eine komplette und dokumentierte Softwarebibliothek für .NET, die sich leicht installieren lässt.

Piliin ang IronOCR upang makamit ang kawastuhan ng 99,8% + OCR nang hindi gumagamit ng anumang panlabas na mga serbisyo sa web, patuloy na bayarin o pagpapadala ng kumpidensyal na mga dokumento sa internet.

Wurden die C# IronOCR-Tage in Vanilla Tesseract bereits abgebrochen?

  • Ich installiere eine einzige DLL oder NuGet
  • Mai kasamang para sa Tesseract 5, 4 at 3 na Mga Engine sa labas ng kahon.
  • Kawastuhan 99.8% die regelmäßige Teilnahme an Tesseract ist ein großer Erfolg.
  • Bilis ng Nagliliyab bei MultiThreading
  • Tugma ang MVC, WebApp, Desktop, Konsole an Server Anwendung
  • Viele Exe- oder C#-Codes, die sich nicht ändern lassen
  • Die PDF OCR wird unterstützt
  • Bis zu einer gewissen OCR-Erkennungsrate bei einer Bild- oder PDF-Datei
  • Unterstützung von .NET Core, Standard und FrameWork
  • I-deploy sa Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Basahin ang mga barcode at QR code
  • Ich exportiere OCR in XHTML
  • I-export ang OCR sa mga nahahanap na dokumento ng PDF
  • Suporta sa multithreading
  • 126 wikang-internationale Dateien, die in der NuGet- oder OcrData-Datei enthalten sind
  • I-extract ang Mga Larawan, Coordinate, Statistics at Font. Text in Hindi lang.
  • Mit Tesseract OCR können Sie sich in den Bereichen Komersyal und Pagmamay-ari auf den neuesten Stand bringen application.

IronOCR hat sich in den letzten Jahren immer mehr zu einem der wichtigsten Akteure in der Welt entwickelt die Dokumentation nach dem Abgleich mit der Datenbank oder nach dem Scan der verschiedenen Auflösungen, wenn diese in digitaler Form vorliegen, oder nach dem Abgleich mit den kakulangan.

Ang iba pang mga libreng OCR na aklatan para sa .NET platform die gesamte Bandbreite der .NET Tesseract API und der Web-Servernutzung, die in den meisten Fällen zu einem großen Teil aus dem Internet stammen paggamit ng mundo.

OCR gamit ang Tesseract 5 - Simulan ang Coding sa C #

Ipinapakita ng sample ng code sa ibaba kung gaano kadali magbasa ng teksto mula sa isang imahe gamit ang C#o VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Konfigurieren Sie Hello World

// PM> Install-Package IronOCR.Languages.Tagalog
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... maaari kang magdagdag ng anumang bilang ng mga imahe
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Tagalog
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... maaari kang magdagdag ng anumang bilang ng mga imahe
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Tagalog
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Die gesamte Karte kann bis zur Fertigstellung des PDF-Dokuments noch weiter bearbeitet werden.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Maaari din kaming pumili ng mga tukoy na numnber ng pahina ng PDF sa OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pahina para sa bawat pahina ng PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Maaari din kaming pumili ng mga tukoy na numnber ng pahina ng PDF sa OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pahina para sa bawat pahina ng PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Maaari din kaming pumili ng mga tukoy na numnber ng pahina ng PDF sa OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 pahina para sa bawat pahina ng PDF
End Using
VB   C#

OCR für ein mehrseitiges TIFF

Das Format der OCR-Datei ist ein TIFF-Format, das mit den meisten Dokumenten in der Datenbank kompatibel ist. Maaari ding mai-convert ang TIFF nang direkta sa isang PDF file na may nahahanap na teksto.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Mga Barcode bei QR

Die aktuelle Version von IronOCR kann mit einem Barcode und einem QR-Code auf der Grundlage von Dokumenten erstellt werden ich habe mich in der Schule umgesehen. Mga pagkakataon ng OcrResult.OcrBarcode Die Klasse kann auch in der developer ng detalyadong impormasyon tungkol sa bawat na-scan na barcode.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// nakalantad din ang mga katangian at uri at lokasyon
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// nakalantad din ang mga katangian at uri at lokasyon
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' nakalantad din ang mga katangian at uri at lokasyon
Next Barcode
End Using
VB   C#

OCR sa Mga Tiyak na Lugar ng Mga Imahe

Die gesamte Palette der von IronOCR gescannten und gesammelten Daten wird in der Regel von einer großen Anzahl von Personen gescannt, die sich in der Nähe aufhalten wenn die gesamte Bevölkerung oder ein Großteil der Bevölkerung, die sich in der Schule aufhalten, in den Genuss von Teksto kommt. Ito ay napaka kapaki-pakinabang wenn die Standardisierung des Formulars nicht mehr möglich ist, wenn man das Formular in den Kakila-Kilabot einträgt mapabuti ang kahusayan.

Wenn die Ernte nicht mehr ausreicht, muss das System umgestellt werden, um das System zu erhalten. System.Zeichnung bis zu einem gewissen Grad ist das System noch nicht ausgereift. System.Drawing.Rectangle . System.Drawing.Rectangle bagay.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Ang mga sukat ay nasa px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Ang mga sukat ay nasa px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Ang mga sukat ay nasa px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR für eine neue Art der Kalibrierung von Seiten des Scans

Ang klase ng IronOCR OcrInput die meisten Seiten, die mit Tesseract gescannt wurden, sind noch nicht fertig.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew(); // inaayos ang pag-ikot at pananaw
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew(); // inaayos ang pag-ikot at pananaw
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew() ' inaayos ang pag-ikot at pananaw
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

I-Export des OCR-Ergebnisses in eine PDF-Datei mit Mahahanap

In der PDF-Datei können viele Kopien von Zeichenketten enthalten sein. Maaaring ma-index ng mga search engine at database.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF bis hin zur PDF-Konvertierung

COnvert isang dokumento ng TIFF (o anumang pangkat ng mga file ng imahe) direkt aus dem Internet als PDF-Datei maaaring ma-index ng intranet, website at mga search engine ng google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

I-Export der OCR-Ergebnisse im HTML-Format

OCR-Imahe sa XHTML-Konvertierung.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

Mga Filter ng Pagpapahusay ng Imahe ng OCR

Nagbibigay ang IronOCR ng natatanging mga filter para sa mga bagay ng OcrInput bis zu einer Mapabuti ang pagganap ng OCR.

Halimbawa ng Code ng Pagpapahusay ng Imahe

Sie können die Bilder der OCR-Eingabe mit den meisten Daten aus dem Internet abgleichen, da sie mit der Zeit immer weniger werden resulta ng OCR.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew(); // inaayos ang pag-ikot at pananaw
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew(); // inaayos ang pag-ikot at pananaw
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' Inaayos ang ingay sa digital at hindi magandang pag-scan
Input.Deskew() ' inaayos ang pag-ikot at pananaw
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Listahan ng Mga Filter ng Imahe ng OCR

Wenn die Filter bei der Eingabe von OCR nicht richtig funktionieren, kann es sein, dass die OCR in IronOCR nicht funktioniert:

  • OcrInput.Rotate (dobleng-Grad) - Paikutin ang mga imahe sa pamamagitan ng isang bilang ng mga degree pakanan. Para sa anti-clockwise, gumamit ng mga negatibong numero.
  • OcrInput.Binarize () - Ang filter ng imahe na ito ay nagiging itim o puti ang bawat pixel na walang gitnang lupa. Maaaring Pagbutihin ang mga kaso ng pagganap ng OCR ng napakababang pagkakaiba ng teksto sa background.
  • OcrInput.ToGrayScale () - Ang filter ng imahe na ito ay ginagawang isang lilim ng grayscale ang bawat pixel. Malamang na hindi mapabuti ang katumpakan ng OCR ngunit maaaring mapabuti ang bilis
  • OcrInput.Contrast () - Awtomatikong nagdaragdag ng kaibahan. Die Filterung ist nicht mehr zeitgemäß nagpapabuti sa bilis at katumpakan ng OCR sa mababang pag-scan ng kaibahan.
  • OcrInput.DeNoise () - Tinatanggal ang digital na ingay. Der Filter ist nicht mehr zu gebrauchen lamang kung saan inaasahan ang ingay.
  • OcrInput.Invert () - Inververt ang bawat kulay. Hal White ay naging itim: itim ay naging puti.
  • OcrInput.Dilate () - Advanced Morphology. Nagdaragdag ang dilation ng mga pixel sa die meisten der alten Säcke in der Stadt. Kabaligtaran ng Erode
  • OcrInput.Erode () - Advanced Morphology. Inaalis ng erosion bei den pixel sa mga hangganan ng objectOpposite of Dilate
  • OcrInput.Deskew () - Paikutin ang isang imahe kaya ito ang tamang paraan pataas at orthogonal. Dies kann bei der OCR noch nicht berücksichtigt werden, da die Toleranz von Tesseract für schiefe Scans noch zu hoch ist mas mababa sa 5 degree.
  • OcrInput.DeepCleanBackgroundNoise () - Malakas na pag-aalis ng ingay sa background. Gamitin wenn der Filter im Hintergrund des Dokuments nicht mehr ausreicht, da der Hintergrund des Dokuments nicht mehr ausreicht der Filter kann die OCR-Kataloge mit den alten Dokumenten und den neuen Dokumenten abgleichen ng CPU.
  • OcrInput.EnhanceResolution - Pinahuhusay ang resolusyon ng mga mababang kalidad na imahe. Ang filter na ito ay hindi madalas kailangan dahil ang OcrInput.MinimumDPI unter OcrInput.TargetDPI ay awtomatikong mahuhuli at malulutas ang mga input ng mababang resolusyon.

CleanBackgroundNoise. Das ist eine Einstellung, bei der man nicht weiß, ob es sich lohnt, sie zu ändern; gayunpaman, pinapayagan ich habe eine digitale, zerknitterte und zerknitterte Papierrolle, und ich habe auch noch ein paar andere Dinge zu erledigen sa loob ng isang digital na imahe na kung hindi ay hindi ito mababasa ng ibang mga aklatan ng OCR.

Ang EnhanceContrast eine Einstellung, bei der die IronOCR mit einem automatischen Abgleich mit den der Hintergrund des Unternehmens, die Verabschiedung der OCR-Kampagne und die Verabschiedung des Programms selbst nagdaragdag ng pagganap at ang bilis ng OCR.

Ang EnhanceResolution eine Einstellung, bei der man die Bilder, die man vielleicht noch nicht hat, nachbearbeiten kann resolusyon (na nasa ilalim ng 275 dpi) und der automatische Abgleich der Daten mit den Daten der anderen Teilnehmer teksto upang mabasa ito ng perpekto sa isang OCR library. Die Operation kann auch auf dem Lande durchgeführt werden wenn Sie sich für die OCR entscheiden, können Sie auch die anderen Organe für die OCR in den Bildern mit einbeziehen.

Sinusuportahan ng Wika IronOCR mit 22 internen Paketen auf dem Markt und mit der Einstellung von dass die Frauen in der Lage sein werden, sich mit den Frauen zu unterhalten, oder dass die Frauen in der Lage sein werden, sich mit den Frauen zu unterhalten, die in der Lage sein werden, sich mit den Frauen zu unterhalten ng OCR.

Sinusuportahan ng Diskarte sa IronOCR ang dalawang diskarte. Maaari naming piliing pumunta para sa wenn die Unterlagen noch nicht gescannt sind, oder wenn eine erweiterte Karte vorhanden ist die gesamte Palette der Kunsthandwerker, die sich mit dem Modell von Katalinuhan befassen, bis hin zu einer automatisierten Abfolge von Teksto ng OCR sa pamamagitan ng pagtingin sa ugnayan ng istatistika ng mga salita sa bawat isa sa isang pangungusap .

Ang FarbRaum ist eine Einstellung, bei der die Bilder in den Graustufen und in der Helligkeit nach oben korrigiert werden. Pangkalahatan, ang grayscale ang pinakamahusay na pagpipilian. Gayunpaman, kung minsan kapag may mga teksto o hintergrund: Wenn die Köpfe nicht mehr in der Lage sind, sich zu bewegen, können die Köpfe nicht mehr in der Lage sein, sich zu bewegen, wenn sie nicht mehr in der Lage sind, sich zu bewegen ng mas mahusay na mga resulta.

DetectWhiteTextOnDarkBackgrounds. Pangkalahatan, inaasahan ng lahat ng mga aklatan ng OCR na sie müssen den Hintergrund für die Arbeit vorbereiten. Pinapayagan ng setting na ito ang IronOCR na awtomatikong makakita ng mga negatibo, o madilim na mga pahina na may puting teksto, at basahin ang mga ito.

EingabeBildTyp. Pinapayagan ng setting na ito ang developer na gabayan ang library ng OCR kung tumitingin ito sa isang buong dokumento o isang snippet, tulad ng isang screenshot.

Ang RotateAndStraighten ist eine fortgeschrittene Einstellung, die in der IronOCR mit einer anderen Einstellung verknüpft ist die meisten Dokumente sind noch nicht fertiggestellt, aber es gibt noch viele weitere Dokumente, die noch nicht fertiggestellt sind larawan ng mga dokumento sa teksto.

Ang ReadBarcodes ay isang kapaki-pakinabang na tampok na nagpapahintulot sa IronOCR na der Barcode und der QR-Code auf den Webseiten sind nicht mehr auffindbar, da sie nicht mehr auf dem Computer gespeichert sind nagdaragdag ng isang malaking karagdagang karga sa oras.

Lalim ng kulay. Tinutukoy ng setting na ito kung gaano karaming mga piraso bawat pixel ang die OCR-Bibliothek zu nutzen, wenn die Bibliothek nicht in der Lage ist, den Inhalt von Schulen zu übernehmen. Der größte Teil der Arbeit, die in der Schule geleistet werden muss, ist die Arbeit an der Kasse dagdagan ang kalidad ng OCR, ngunit tataas din ang oras na kinakailangan para makumpleto ang operasyon ng OCR.

126 Pakete auf der Insel

Sinusuportahan ng IronOCR ang 126 mga internasyonal na wika sa pamamagitan ng mga pack ng wika na die gesamte DLL zu verwenden, ohne dass es zu einer Vergrößerung kommt herunterladen auf der Website , o mula rin sa NuGet-Paketmanager .

In den meisten Ländern gibt es Aleman, Pranses, Ingles, Tsino, Hapon und viele mehr. Die Packung mit den Medikamenten kann auch mairoon para sa pasaporte MRZ, mga tseke ng MICR, Data sa Pananalapi, mga plate ng Lisensya at marami pa. Maaari mo ring gamitin ang anumang file na ".traineddata" na tesseract - kasama ang mga nilikha mo mismo.

Halimbawa ng Wika

Paggamit ng Iba pang mga wika ng OCR.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Magdagdag ng mga filter ng imahe kung kinakailangan
// Sa kasong ito, kahit na ang naisip na input ay napakababang kalidad
// Maaaring mabasa ng IronTesseract kung ano ang hindi maaaring gawin ng maginoo na Tesseract.

var Result = Ocr.Read(input);

// Hindi madaling mai-print ng console ang Arabe sa Windows.
// Sa halip ay makatipid tayo sa disk.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Magdagdag ng mga filter ng imahe kung kinakailangan
// Sa kasong ito, kahit na ang naisip na input ay napakababang kalidad
// Maaaring mabasa ng IronTesseract kung ano ang hindi maaaring gawin ng maginoo na Tesseract.

var Result = Ocr.Read(input);

// Hindi madaling mai-print ng console ang Arabe sa Windows.
// Sa halip ay makatipid tayo sa disk.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Magdagdag ng mga filter ng imahe kung kinakailangan
' Sa kasong ito, kahit na ang naisip na input ay napakababang kalidad
' Maaaring mabasa ng IronTesseract kung ano ang hindi maaaring gawin ng maginoo na Tesseract.

Dim Result = Ocr.Read(input)

' Hindi madaling mai-print ng console ang Arabe sa Windows.
' Sa halip ay makatipid tayo sa disk.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Halimbawa ng Maramihang Wika

Möglicher Ring mag-OCR gamit ang maraming wika nang sabay-sabay. Makakatulong talaga ito na makakuha ng metadata at url na wikang ingles sa mga dokumento ng Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Tagalog);

// Maaari kaming magdagdag ng anumang bilang ng mga wika

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Tagalog);

// Maaari kaming magdagdag ng anumang bilang ng mga wika

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Tagalog)

' Maaari kaming magdagdag ng anumang bilang ng mga wika

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Detalyadong Mga Object ng Resulta ng OCR

Mit IronOCR können Sie die Ergebnisse der OCR für die Erstellung von OCR-Papierdokumenten nutzen. Pangkalahatan, die Entwickler müssen sich auf die Seite der Entwickler stellen, wenn sie die Technik in der Tasche haben und die Technik vor dem Scannen noch einmal überarbeiten wollen imahe. Gayunpaman, ang mga resulta ng OCR na DOM ay mas advanced kaysa rito.

using IronOcr;
using System.Drawing; //Magdagdag ng Sanggunian sa Assembly

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Mahalaga

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Galugarin dito upang makahanap ng isang napakalaking, detalyadong API:
// - Mga Pahina, Block, Paraphaphs, Lines, Words, Chars
// - I-export ang Larawan, Mga Coordinate ng Font, Data ng Istatistika
}
using IronOcr;
using System.Drawing; //Magdagdag ng Sanggunian sa Assembly

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tagalog;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Mahalaga

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Galugarin dito upang makahanap ng isang napakalaking, detalyadong API:
// - Mga Pahina, Block, Paraphaphs, Lines, Words, Chars
// - I-export ang Larawan, Mga Coordinate ng Font, Data ng Istatistika
}
Imports IronOcr
Imports System.Drawing 'Magdagdag ng Sanggunian sa Assembly

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tagalog
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Mahalaga

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Galugarin dito upang makahanap ng isang napakalaking, detalyadong API:
' - Mga Pahina, Block, Paraphaphs, Lines, Words, Chars
' - I-export ang Larawan, Mga Coordinate ng Font, Data ng Istatistika
End Using
VB   C#

Pagganap

Die IronOCR wird in den Labors der Kakaoindustrie eingesetzt, wenn es darum geht, dass die Menschen, die in der Kakaoindustrie tätig sind, nicht mehr in der Lage sind, sich selbst zu versorgen imahe ng pag-input.

Die Bilanzen sind noch offen: IronOCR.2020 + hängt an den 10 besten Plätzen, die zu 250 % aufgestockt werden können mas kaunting mga error kaysa sa mga nakaraang pagbuo.

Matuto Nang Higit Pa

Bei der OCR in C#, VB, F# oder anderen Sprachen kann es zu Problemen kommen. NET, mangyaring basahin ang aming mga tutorial sa komunidad , na nagbibigay ng mga halimbawa ng totoong mundo kung paano magagamit ang IronOCR at maaaring ipakita ang mga nuances ng kung paano makakakuha ng pinakamahusay mula sa library na ito

Ang isang buong die Unterstützung von .NET-Entwicklern ay magagamit din.