Wie man Bilder liest

This article was translated from English: Does it need improvement?
Translated
View the article in English

von Chaknith Bin

OCR (Optical Character Recognition) ist eine Technologie, die zur Erkennung und Extraktion von Text aus Bildern verwendet wird. Diese Technologie ist besonders nützlich für die Digitalisierung gedruckter Dokumente, da sie es Ihnen ermöglicht, den Textinhalt aus gescannten Seiten, Fotos oder anderen Bilddateien zu extrahieren und zu bearbeiten.

IronOCR unterstützt verschiedene Bildformate, darunter jpg, png, gif, tiff und bmp. Es sind auch Bildfilter verfügbar, um die Lesefähigkeit zu verbessern.

Legen Sie los mit IronOCR

Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.

Erster Schritt:
green arrow pointer



Bilder lesen Beispiel

Beginnen Sie mit der Instanziierung der IronTesseract-Klasse, um OCR zu aktivieren. Verwenden Sie die 'using'-Anweisung, um ein OcrImageInput-Objekt zu erstellen und geben Sie den Pfad der Bilddatei an. Dies gewährleistet die ordnungsgemäße Entsorgung von Ressourcen, wenn sie nicht mehr benötigt werden. IronOCR unterstützt Eingabebilder in verschiedenen Formaten, darunter jpg, png, gif, tiff und bmp. Verwenden Sie schließlich die Methode Read, um OCR durchzuführen.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.png")

' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#
PNG-Bild lesen

Besuchen Sie dieLesen von Multi-Frame/Page GIFs und TIFFs artikel, um mehr über das Lesen von TIFF- und GIF-Bildern zu erfahren.

Bilder als Bytes importieren

Neben dem einfachen alten Dateipfad akzeptiert die Klasse OcrImageInput auch Bildinformationen in Form von Bytes, AnyBitmap, Stream und Image. Die AnyBitmap ist ein Bitmap-Objekt derIronSoftware.Drawing.AnyBitmap.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");

// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")

' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#

Scanbereich festlegen

Ein CropRectangle wird auch bei der Instanziierung der Klasse OcrImageInput akzeptiert. Hier können Sie festlegen, welcher Bereich des Bilddokuments mit OCR bearbeitet werden soll. Je nach Bildvorlage kann die Angabe des zu scannenden Bereichs die Leistung erheblich verbessern. In dem von mir bereitgestellten Codebeispiel gebe ich an, dass nur die Kapitelnummer und der Titel gelesen werden sollen.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);

// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)

' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Output the result to console
Console.WriteLine(ocrResult.Text)
VB   C#

OCR-Ergebnis

Spezifische Region lesen
Chaknith related to OCR-Ergebnis

Chaknith Bin

Software-Ingenieur

Chaknith ist der Sherlock Holmes der Entwickler. Zum ersten Mal kam ihm der Gedanke, dass er eine Zukunft in der Softwareentwicklung haben könnte, als er zum Spaß an Code Challenges teilnahm. Sein Schwerpunkt liegt auf IronXL und IronBarcode, aber er ist stolz darauf, Kunden mit jedem Produkt zu helfen. Chaknith nutzt sein Wissen aus direkten Gesprächen mit Kunden, um die Produkte selbst weiter zu verbessern. Sein anekdotisches Feedback geht über Jira-Tickets hinaus und unterstützt die Produktentwicklung, die Dokumentation und das Marketing, um das Gesamterlebnis der Kunden zu verbessern.Wenn er nicht im Büro ist, lernt er über maschinelles Lernen, programmiert und wandert.