Zum Fußzeileninhalt springen
OCR-WERKZEUGE

Bestes OCR für Mac [Kostenlose Online-Tools]

1.0 Einführung

Die Verwendung von gescannten Dokumenten in der zeitgenössischen digitalen Umgebung hat sich dank der OCR-Technologie (Optical Character Recognition) revolutionär verändert. Diese Technologie ermöglicht es Computern, Text aus verschiedenen Quellen zu erkennen und zu extrahieren, einschließlich gescannter PDF-Dokumente, wodurch wir PDF-Dokumente schnell bearbeiten und mit ihnen interagieren können. Es ist schnell und einfach, Text aus gescannten Dokumenten mithilfe von optischer Zeichenerkennung (OCR)-Software wie Adobe Acrobat in bearbeitbare PDFs oder durchsuchbare, bildbasierte PDFs zu extrahieren und umzuwandeln.

Entwickler können modernste Algorithmen nutzen, die es ihnen ermöglichen, die Technologie der optischen Zeichenerkennung vollständig auszuschöpfen, indem sie die robusten Tools und APIs kombinieren, die von OCR-Bibliotheken wie Tesseract und IronOCR mit Techniken des maschinellen Lernens angeboten werden. Diese Bibliotheken ermöglichen eine genaue Texterkennung, was es einfacher macht, nützliche Daten aus sowohl neu erstellten als auch bereits gescannten Dokumenten zu organisieren und zu extrahieren. Die Maximierung des Potenzials von gescannten Dokumenten und Seitenbildern mit OCR ermöglicht eine nahtlose Inhaltsanalyse und unterstützt sowohl die Produktivitätsoptimierung von Einzelpersonen als auch von Unternehmen. Die OCR-Scannung verwandelt Bilder in durchsuchbare PDFs, was OCR zu einem wichtigen Werkzeug in der zeitgenössischen Technologie macht. Es wird verwendet, um papierbasierte Aufzeichnungen zu digitalisieren, Daten aus Rechnungen zu extrahieren und die Zugänglichkeit von Dokumenten zu verbessern.

2.0 OCR-Tools

In diesem Artikel werden wir einige der besten OCR-Software-Tools für Mac-Nutzer besprechen. * /: Division

  1. Adobe Acrobat Pro DC
  2. ABBYY FineReader PDF
  3. Readiris 17
  4. IronOCR

2.1 Adobe Acrobat Pro DC

Das ursprüngliche Dokumentenscan-OCR-Programm und unsere erste Wahl für Mac OCR-Software im Jahr 2023 ist Adobe Acrobat Pro. Es ist keine Überraschung, dass Adobe Acrobat Pro das einzige verfügbare Programm für Mac ist, das die Erstellung und Bearbeitung von PDF-Dokumenten sowie die Konvertierung von PDF-Dateien in bearbeitbare oder durchsuchbare Formate erleichtert. Das PDF-Format wurde ursprünglich von Adobe entwickelt. Obwohl es mittlerweile viele andere Produkte auf dem Markt gibt, die in der Lage sind, eine Vielzahl von PDF-Aufgaben zu bewältigen, bleibt Adobe Acrobat Pro DC außergewöhnlich robust. Trotz der Verfügbarkeit von Adobe Document Cloud, um Adobe Acrobat Pro DC online zu nutzen, sticht der Mac-Desktop-Client in seiner Exzellenz heraus. Notably, Adobe Acrobat ist das einzige OCR-Programm, das mit den neuesten M1- und M2-Macs kompatibel ist, was seine Attraktivität noch weiter steigert.

  1. Zuerst starten Sie Acrobat und öffnen eine PDF-Datei.
  2. Wählen Sie im Fenster auf der rechten Seite das Werkzeug 'PDF bearbeiten'. Acrobat verwandelt das Dokument schnell in eine vollständig bearbeitbare Kopie Ihres PDFs, nachdem es automatisch einen Scan zur optischen Zeichenerkennung (OCR) durchgeführt hat.

Bestes OCR für Mac, Abbildung 1 - Eine PDF-Datei mit 'Seite 1' geöffnet in Adobe Acrobat.

Klicken Sie auf ein Element, um es zu bearbeiten. Jeder von Ihnen hinzugefügte Text wird dem Stil der Originalschrift entsprechen. Um Ihr neu geändertes Dokument zu speichern, wählen Sie Datei > Speichern unter.

Weitere Informationen zur Installation von Adobe Acrobat DC finden Sie auf der Adobe Acrobat-Website.

2.2 ABBYY FineReader PDF für Mac

Die ABBYY FineReader PDF OCR-Software für Mac ist seit fast 20 Jahren verfügbar, obwohl sie die meiste Zeit als ABBYY FineReader Pro gebrandmarkt war. ABBYY aktualisierte die FineReader-Produktlinie mit der Einführung von macOS Big Sur, um FineReader PDF einzuführen. Leider funktioniert es nur nativ mit Intel-Macs. ABBYY FineReader PDF für Mac ist mit M1- und M2-Macs kompatibel, jedoch nur, wenn es mit Rosetta verwendet wird, einem Programm in macOS, das Software konvertiert, die für Intel-Prozessoren entwickelt wurde, um auf Apple-Silicon-Chips zu laufen. Es gibt keine Mac-Version von FineReader PDF, die nativ mit M1/M2-Chips kompatibel ist. Nichtsdestotrotz bleibt ABBYY FineReader PDF eines der besten Desktop-OCR-Programme sowohl für Mac als auch für PC.

Während die Qualität des Originaldokuments die Genauigkeitsrate beeinflusst, ist die OCR-Texterkennungsfähigkeit von FineReader PDF außergewöhnlich und zweifellos die beste auf dem Markt. Das ursprüngliche Format des gescannten Dokuments, einschließlich Textgröße, Schriftarten, Fotos, Tabellen und Layouts, bleibt erhalten. Es zeichnet sich auch dadurch aus, Text schnell und präzise zu erkennen. Im Folgenden sind die Schritte zur Durchführung von OCR aufgeführt:

  1. Starten Sie ABBYY FineReader PDF.
  2. Wählen Sie die Option "Durchsuchbares PDF", mit der Sie ein PDF öffnen und in ein durchsuchbares PDF konvertieren können. Sie können auch die konvertierten PDF-Dateien speichern.

!Bestes OCR für Mac, Abbildung 2 - Der ABBYY FineReader-Dialog.

Um mehr über ABBYY FineReader zu erfahren, besuchen Sie deren Website.

2.3 Readiris 17

Mac-Benutzer können ReadIris 17 als OCR-Lösung verwenden. Trotz seines primären Einsatzes auf Windows hat ReadIris einen PDF-Reader und -Editor mit OCR-Funktion für Mac-Benutzer entwickelt.

Mit ReadIris 17 können Benutzer PDFs einfach zusammenführen, teilen, schützen und signieren. Die Offline-Mac-OCR-Software ermöglicht die Konvertierung von PDF-Dateien in Word, Excel, durchsuchbares PDF oder PowerPoint, wobei das Dokumentenformat erhalten bleibt. Die Freemium-Version beschränkt jedoch die Anzahl der gleichzeitig zu scannenden Seiten.

Bestes OCR für Mac, Abbildung 3 - Eine PDF in ReadIris 17 mit dem Text 'Hello world!'.

Ich habe ein Bild in die Software eingegeben und versucht, Text daraus zu extrahieren. Es hat auch die sichtbaren Bildelemente auf dem Bildschirm erfasst. Einige Nachbearbeitungen könnten erforderlich sein.

Um mehr zu erfahren, besuchen Sie die Iris-Website.

2.4 IronOCR

IronOCR verbessert Tesseract im Vergleich zur Standard-Tesseract-Bibliothek, indem eine native C#-OCR-Bibliothek mit verbesserter Genauigkeit, Leistung und Stabilität bereitgestellt wird. Es ermöglicht die Extraktion von Text aus PDFs und Bildern mithilfe von .NET-Tools und -Websites. IronOCR unterstützt eine Vielzahl von Fremdsprachen und kann als Klartext oder strukturierte Daten ausgeben. Es kann Barcodes und Bilder mit eingebettetem Text lesen. In Dot NET-Konsole, Web-, MVC- und Desktop-Anwendungen entwickelbare Anwendungen können die Iron Software OCR-Bibliothek nutzen. Das Entwicklungsteam bietet direkten Support für kommerzielle Implementierungen. IronOCR ist kompatibel mit den neuesten Versionen von Visual Studio.

Vorteile von IronOCR

  1. Mit dem modernen Tesseract-5-Engine kann IronOCR Papierdokumente, Barcodes und QR-Codes aus verschiedenen Bildern oder PDF-Dateien scannen. Dieses Paket vereinfacht die Integration von OCR in Desktop-, Konsolen- und Webanwendungen.
  2. Mit der Hilfe von IronOCR können wir OCR durchführen und gescannte PDFs in durchsuchbare PDFs umwandeln.
  3. IronOCR unterstützt 125 verschiedene Sprachen weltweit sowie benutzerdefinierte Sprachen und Wortlisten.
  4. Die Software kann über 20 verschiedene Arten von Barcodes und QR-Codes lesen.
  5. IronOCR bietet sowohl Barcode-Daten als auch Klartext-Ausgabe. Entwickler können auf alle Inhalte für die direkte Eingabe in ein System durch ein alternatives paradigmatisches strukturierte Datenobjekt zugreifen. Dazu gehören logisch organisierte Überschriften, Absätze, Zeilen, Worte und Zeichen in Online-Anwendungen.

Weitere Informationen finden Sie auf der IronOCR-Website.

OCR-Verarbeitung mit IronOCR

IronOCR, eine robuste OCR-Bibliothek, ermöglicht die Umwandlung von PDF-Dokumenten und den Datenzugriff. Es erleichtert die Transformation in maschinenlesbaren Text für effiziente Analyse und Verarbeitung, ohne die Datensicherheit zu gefährden. Hier ist ein Beispiel, wie IronOCR benutzt wird, um Text aus einem Bild mittels OCR zu extrahieren:

// Instantiate IronTesseract object to use IronOCR capabilities
var Ocr = new IronTesseract();

// Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest;

// Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Use an OcrInput object to add images for OCR processing
using (OcrInput ocrInput = new OcrInput("Demo.gif"))
{
    // Perform OCR and obtain the result containing extracted text
    OcrResult ocrResult = Ocr.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
// Instantiate IronTesseract object to use IronOCR capabilities
var Ocr = new IronTesseract();

// Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest;

// Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Use an OcrInput object to add images for OCR processing
using (OcrInput ocrInput = new OcrInput("Demo.gif"))
{
    // Perform OCR and obtain the result containing extracted text
    OcrResult ocrResult = Ocr.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
' Instantiate IronTesseract object to use IronOCR capabilities
Dim Ocr = New IronTesseract()

' Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest

' Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

' Use an OcrInput object to add images for OCR processing
Using ocrInput As New OcrInput("Demo.gif")
	' Perform OCR and obtain the result containing extracted text
	Dim ocrResult As OcrResult = Ocr.Read(ocrInput)

	' Print the extracted text to the console
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Im bereitgestellten Code-Snippet verbessert IronTesseract die OCR-Funktionen. Ein OcrInput-Objekt erstellt eine einfache Schnittstelle zum Hinzufügen von Bildern zur Textextraktion. Der angegebene Bildpfad wird verwendet, um den OCR-Prozess zu initialisieren, wobei IronOCR die Bilder liest und Text in ein String-Format extrahiert.

Bestes OCR für Mac, Abbildung 4 - Eine PDF geöffnet in Adobe Acrobat mit dem Text 'Hello world!'.

Die untenstehende Ausgabe zeigt den aus dem bereitgestellten Bild extrahierten Text, was bestätigt, dass die richtige Extraktion durchgeführt wurde. IronOCR unterstützt auch verschiedene Ausgabeformate zum Speichern der Ergebnisse.

!Bestes OCR für Mac, Abbildung 5 - Der Text 'Hello world!' wird auf der Befehlszeile angezeigt.

Abschluss

Mehrere OCR-Tools auf dem Markt ermöglichen die Datenverarbeitung von Rechnungen. OCR-Prozessierung von Bildern ermöglicht die Übersetzung von Textdaten aus bereitgestellten Bildern. Die ersten beiden OCR-Tools ermöglichen automatisiertes Scannen und Datenvalidierung durch Verarbeitung von Rechnungsdaten ohne manuelle Dateneingabe. Diese Tools tendieren dazu, teuer zu sein und erfordern oft eine aktive Internetverbindung, was ihre Einsatzmöglichkeiten in bestimmten Umgebungen einschränkt.

Andererseits unterstützt IronOCR verschiedene .NET-Projekte, einschließlich .NET Framework Standard 2, .NET Framework 4.5 und .NET Core 2, 3 und 5. Es funktioniert auch mit zeitgenössischen Technologien wie Xamarin, Azure, MAC und Mono. IronOCR verbessert die Ausgabe von Tesseract und korrigiert mit IronOCR-Methoden falsch gescannte Wörter oder Bilder. Das komplexe Tesseract-Wörterbuchsystem wird vom NuGet-Paket verwaltet. Die Iron OCR-Bibliothek wird zur Erstellung eines OCR-Tools verwendet. Daher ist IronOCR die ideale Rechnungs-OCR-Software zur Automatisierung von Rechnungen und Extraktion von Daten mit minimalem Codierungsaufwand.

Unterstützend zahlreiche Bildformate, PDF-Dateien und MultiFrame TIFF, bietet IronOCR eine nahtlose Erfahrung ohne zusätzliche Setups. Es geht über die optische Zeichenerkennung hinaus und bietet Barcode-Identifikationsfähigkeiten zur Extraktion von Daten aus Bildern, die Barcodes enthalten. Eine kostenlose Testversion der kostengünstigen IronOCR-Entwicklungsausgabe ist verfügbar und eine lebenslange Lizenz ist beim Kauf des IronOCR-Bundles enthalten. Das IronOCR-Bundle bietet ein exzellentes Preis-Leistungs-Verhältnis, da es eine einzige Preisgestaltung für mehrere Systeme bietet. Weitere Informationen zu den Kosten von IronOCR finden Sie bitte auf der IronOCR-Website.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen