Wie man Bilder liest
OCR (Optical Character Recognition) ist eine Technologie, die zur Erkennung und Extraktion von Text aus Bildern verwendet wird. Diese Technologie ist besonders nützlich für die Digitalisierung gedruckter Dokumente, da sie es Ihnen ermöglicht, den Textinhalt aus gescannten Seiten, Fotos oder anderen Bilddateien zu extrahieren und zu bearbeiten.
IronOCR unterstützt verschiedene Bildformate, darunter jpg, png, gif, tiff und bmp. Es sind auch Bildfilter verfügbar, um die Lesefähigkeit zu verbessern.
Legen Sie los mit IronOCR
Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.
Wie man Bilder liest
- Download einer C#-Bibliothek zum Lesen von Bildern
- Unterstützung von Bildern in verschiedenen Formaten, einschließlich jpg, png, gif, tiff und bmp
- Instanziieren Sie die OcrImageInput klasse zur Eingabe eines Bildes
- Verwenden Sie die
Lesen Sie
verfahren zur Durchführung von OCR auf dem Eingangsbild - Geben Sie den Beschnittbereich an, um den Lesebereich zu definieren
Bilder lesen Beispiel
Beginnen Sie mit der Instanziierung der IronTesseract-Klasse, um OCR zu aktivieren. Verwenden Sie die 'using'-Anweisung, um ein OcrImageInput-Objekt zu erstellen und geben Sie den Pfad der Bilddatei an. Dies gewährleistet die ordnungsgemäße Entsorgung von Ressourcen, wenn sie nicht mehr benötigt werden. IronOCR unterstützt Eingabebilder in verschiedenen Formaten, darunter jpg, png, gif, tiff und bmp. Verwenden Sie schließlich die Methode Read
, um OCR durchzuführen.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.png")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
Besuchen Sie dieLesen von Multi-Frame/Page GIFs und TIFFs artikel, um mehr über das Lesen von TIFF- und GIF-Bildern zu erfahren.
Bilder als Bytes importieren
Neben dem einfachen alten Dateipfad akzeptiert die Klasse OcrImageInput auch Bildinformationen in Form von Bytes, AnyBitmap, Stream und Image. Die AnyBitmap ist ein Bitmap-Objekt derIronSoftware.Drawing.AnyBitmap.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");
// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")
' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
Scanbereich festlegen
Ein CropRectangle wird auch bei der Instanziierung der Klasse OcrImageInput akzeptiert. Hier können Sie festlegen, welcher Bereich des Bilddokuments mit OCR bearbeitet werden soll. Je nach Bildvorlage kann die Angabe des zu scannenden Bereichs die Leistung erheblich verbessern. In dem von mir bereitgestellten Codebeispiel gebe ich an, dass nur die Kapitelnummer und der Titel gelesen werden sollen.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);
// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)
' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Output the result to console
Console.WriteLine(ocrResult.Text)