10 productos API de .NET para tus documentos de oficina
Valor total de la suite:
$7,192 USD
En el panorama digital acelerado de hoy, la automatización desempeña un papel fundamental en la mejora de la eficiencia y la precisión. Una tarea común en la automatización legal es convertir una colección de archivos HTML en un único documento PDF con capacidad de búsqueda.
En esta guía, exploraremos cómo Iron Suite, un poderoso conjunto de herramientas para desarrolladores diseñado para entornos .NET, puede simplificar este proceso.
IronSoftware's Iron Suite es una colección integral de componentes de software .NET diseñados para agilizar los procesos de desarrollo y mejorar la productividad de los desarrolladores que trabajan con varios marcos de trabajo .NET. IronSoftware, un proveedor líder de herramientas de software .NET, ofrece Iron Suite como una solución integral para desarrolladores que buscan componentes de alta calidad para tareas que van desde la manipulación de documentos hasta la generación de códigos de barras y más allá.
En el corazón de Iron Suite se encuentra una rica selección de bibliotecas y herramientas diseñadas para abordar los desafíos comunes que se encuentran en los proyectos de desarrollo de software. Aquí tienes un vistazo a algunos de los componentes clave de Iron Suite:
Considere un escenario donde se le asigna la tarea de procesar un archivo zip que contiene archivos HTML, y su objetivo es convertir estos archivos HTML en formato PDF para un análisis posterior de OCR (Reconocimiento Óptico de Caracteres). Para llevar a cabo esta tarea de manera eficiente y efectiva, aprovechar las capacidades de las tres bibliotecas esenciales de Iron Suite es la solución óptima. Hagamos un breve resumen de cada una de las bibliotecas.
Al simplificar la compresión y extracción de archivos, IronZIP permite un manejo sin problemas de archivos zip dentro de aplicaciones C#. Su API intuitiva permite la fácil extracción de archivos HTML desde nuestro archivo zip.
Algunas características clave de IronZIP:
Como una biblioteca robusta de representación y manipulación de PDF, IronPDF facilita la creación y manipulación de documentos PDF directamente dentro del código C#. Con características como la conversión de HTML a PDF, es perfecto para nuestra tarea de convertir archivos HTML a formato PDF.
Algunas características clave de IronPDF DLL:
Una herramienta invaluable para la extracción de texto, IronOCR se especializa en extraer texto de diversas fuentes, incluidos documentos escaneados y archivos PDF. Su versatilidad lo hace ideal para extraer texto searchable de nuestro documento PDF generado.
Algunas características clave de IronOCR:
Para comenzar, crea un nuevo proyecto de Visual Studio para nuestra tarea de automatización legal. Asegúrate de tener el entorno necesario configurado para el desarrollo de .NET. Sigue los pasos para crear un proyecto en Visual Studio:
Abra Visual Studio y haga clic en la opción "Crear un nuevo proyecto".
Elija la plantilla de proyecto adecuada según sus requisitos (por ejemplo, Aplicación de consola, Aplicación de formularios de Windows).
Especifique el nombre y la ubicación del proyecto y haga clic en "Siguiente".
En Información adicional, seleccione la última versión de .NET Framework.
¡A continuación, seleccione el marco .NET y haga clic en Crear.
A continuación, instala las tres bibliotecas esenciales: IronZIP, IronPDF e IronOCR en tu proyecto. Puedes hacer esto fácilmente descargando los respectivos paquetes desde el sitio web de Iron Software o utilizando el Administrador de paquetes de NuGet dentro de Visual Studio.
Para integrar las bibliotecas en su proyecto .NET:
En la ventana del Administrador de Paquetes NuGet, busca "IronZIP".
Seleccione "IronZip" de los resultados de búsqueda y haga clic en el botón "Instalar".
En la ventana del Administrador de Paquetes NuGet, busque "IronPDF".
Seleccione "IronPDF" de los resultados de búsqueda y haga clic en el botón "Instalar".
IronOCR
En la ventana del gestor de paquetes NuGet, busque "IronOCR".
Ahora, para convertir fácilmente HTML a PDF y posteriormente realizar OCR, hemos configurado las bibliotecas de Iron Suite, cada una ofreciendo funcionalidades únicas adaptadas a nuestra tarea. El siguiente archivo zip que contiene múltiples archivos de páginas web HTML se utilizará para extraer archivos HTML y luego convertir los archivos HTML al formato de archivo PDF para análisis OCR:
¡Archivo ZIP "website.zip" que contiene tres archivos HTML
El archivo Zip mostrado en la captura de pantalla anterior contiene 3 páginas web HTML de un sitio web simple. Las páginas HTML contienen código HTML sencillo que se pasará al método del convertidor de PDF para convertir los archivos HTML en un único documento PDF. Luego se aplicará OCR para analizar los elementos HTML en el documento PDF generado y se imprimirá todo el contenido HTML en la ventana de la consola.
Para utilizar las funcionalidades ofrecidas por Iron Suite en nuestro proyecto de C#, necesitaremos hacer referencia a los espacios de nombres apropiados para cada biblioteca. Aquí se muestra cómo incluirlos en nuestro archivo Program.cs:
using IronZip;
using IronPdf;
using IronOcr;
using IronZip;
using IronPdf;
using IronOcr;
Imports IronZip
Imports IronPdf
Imports IronOcr
Primero, utilizaremos la API intuitiva de IronZIP para extraer archivos HTML del archivo zip. Con una simple llamada al método, podemos extraer de manera eficiente los archivos necesarios para continuar con el proceso de conversión.
// Extract ZIP
IronZipArchive.ExtractArchiveToDirectory("assets/website.zip", "extracted");
// Extract ZIP
IronZipArchive.ExtractArchiveToDirectory("assets/website.zip", "extracted");
' Extract ZIP
IronZipArchive.ExtractArchiveToDirectory("assets/website.zip", "extracted")
Para sacar más provecho de la biblioteca IronZIP, por favor visite esta página de documentación.
En segundo lugar, utilizaremos las potentes capacidades de IronPDF para convertir fácilmente todos los archivos HTML extraídos en un único documento PDF. Con su API sencilla, podemos generar fácilmente PDFs de alta calidad directamente dentro de nuestro código C#.
// Create a ChromePdfRenderer object for rendering HTML to PDF (consider using IronHtmlRenderer for better HTML to PDF conversion)
ChromePdfRenderer renderer = new ChromePdfRenderer();
// Initialize an empty list to store the individual PDF documents
List<PdfDocument> pdfs = new List<PdfDocument>();
// Get all HTML files with the .html extension from the "extracted" folder
var htmlFiles = Directory.EnumerateFiles("extracted", "*.html");
// Loop through each HTML file
foreach (var htmlFile in htmlFiles)
{
// Render the current HTML file as a PDF document using the ChromePdfRenderer
var pdf = renderer.RenderHtmlFileAsPdf(htmlFile);
// Add the generated PDF document to the list
pdfs.Add(pdf);
}
// Merge all the individual PDF documents in the list into a single PDF document
var document = PdfDocument.Merge(pdfs);
// Save the merged PDF document as "HtmlToPDF.pdf"
document.SaveAs("HtmlToPDF.pdf");
// Create a ChromePdfRenderer object for rendering HTML to PDF (consider using IronHtmlRenderer for better HTML to PDF conversion)
ChromePdfRenderer renderer = new ChromePdfRenderer();
// Initialize an empty list to store the individual PDF documents
List<PdfDocument> pdfs = new List<PdfDocument>();
// Get all HTML files with the .html extension from the "extracted" folder
var htmlFiles = Directory.EnumerateFiles("extracted", "*.html");
// Loop through each HTML file
foreach (var htmlFile in htmlFiles)
{
// Render the current HTML file as a PDF document using the ChromePdfRenderer
var pdf = renderer.RenderHtmlFileAsPdf(htmlFile);
// Add the generated PDF document to the list
pdfs.Add(pdf);
}
// Merge all the individual PDF documents in the list into a single PDF document
var document = PdfDocument.Merge(pdfs);
// Save the merged PDF document as "HtmlToPDF.pdf"
document.SaveAs("HtmlToPDF.pdf");
' Create a ChromePdfRenderer object for rendering HTML to PDF (consider using IronHtmlRenderer for better HTML to PDF conversion)
Dim renderer As New ChromePdfRenderer()
' Initialize an empty list to store the individual PDF documents
Dim pdfs As New List(Of PdfDocument)()
' Get all HTML files with the .html extension from the "extracted" folder
Dim htmlFiles = Directory.EnumerateFiles("extracted", "*.html")
' Loop through each HTML file
For Each htmlFile In htmlFiles
' Render the current HTML file as a PDF document using the ChromePdfRenderer
Dim pdf = renderer.RenderHtmlFileAsPdf(htmlFile)
' Add the generated PDF document to the list
pdfs.Add(pdf)
Next htmlFile
' Merge all the individual PDF documents in the list into a single PDF document
Dim document = PdfDocument.Merge(pdfs)
' Save the merged PDF document as "HtmlToPDF.pdf"
document.SaveAs("HtmlToPDF.pdf")
IronPDF no solo permite la conversión de PDF a partir de un archivo HTML, formulario HTML, cadena HTML o URL, sino también desde otros formatos a PDF. Para obtener información más detallada y fragmentos de código de muestra listos para usar, visite esta página de documentación y de ejemplos de código.
El PDF de salida muestra claramente el contenido de cada página HTML en una página PDF separada utilizando el potente motor de conversión HTML de Chromium de IronPDF.
Además de esto, también puedes usar IronPrint for .NET - La Biblioteca de Impresión de C# para imprimir el archivo PDF generado. IronPrint envía eficientemente los PDFs o imágenes a la impresora predeterminada para su impresión.
Para obtener más información sobre cómo imprimir un documento usando IronPrint, por favor visite esta página de documentación.
Finalmente, emplee IronOCR para extraer texto con capacidad de búsqueda del documento PDF generado. Al utilizar las avanzadas funciones de extracción de texto de IronOCR, podemos asegurar que el texto extraído sea preciso y esté listo para su procesamiento posterior.
El siguiente fragmento de código toma el archivo PDF generado por IronPDF y realiza con éxito OCR para un análisis posterior:
// Create an IronTesseract object for Optical Character Recognition (OCR)
var ocrTesseract = new IronTesseract();
// Create an OcrInput object to specify the input for OCR processing
using var ocrInput = new OcrInput();
// Load the PDF document for text extraction
ocrInput.LoadPdf("HtmlToPdf.pdf");
// Perform OCR on the loaded PDF using the IronTesseract engine
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
// Create an IronTesseract object for Optical Character Recognition (OCR)
var ocrTesseract = new IronTesseract();
// Create an OcrInput object to specify the input for OCR processing
using var ocrInput = new OcrInput();
// Load the PDF document for text extraction
ocrInput.LoadPdf("HtmlToPdf.pdf");
// Perform OCR on the loaded PDF using the IronTesseract engine
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
' Create an IronTesseract object for Optical Character Recognition (OCR)
Dim ocrTesseract = New IronTesseract()
' Create an OcrInput object to specify the input for OCR processing
Dim ocrInput As New OcrInput()
' Load the PDF document for text extraction
ocrInput.LoadPdf("HtmlToPdf.pdf")
' Perform OCR on the loaded PDF using the IronTesseract engine
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
Para un análisis más detallado del texto, visite esta página de ejemplos de código listos para usar aquí.
El resultado habla por sí mismo: Rápido, Preciso y Sin Errores, respaldando la eficiencia de IronOCR.
Iron Suite se destaca como una suite .NET líder en el mercado para tus documentos de oficina, ofreciendo varias razones convincentes para su superioridad.
Con Iron Suite, obtienes acceso a los nueve productos de IronSoftware por el precio de solo dos productos individuales. Esta increíble propuesta de valor garantiza que tenga un conjunto de herramientas completo a su disposición sin gastar una fortuna.
Iron Suite está diseñado para funcionar sin problemas en múltiples plataformas, incluidas Windows, macOS, Linux, Docker, Azure y AWS. Ya sea que esté desarrollando aplicaciones para entornos de escritorio, web o en la nube, Iron Suite lo tiene cubierto.
Desde el momento en que descargas Iron Suite hasta su implementación en producción, puedes estar en funcionamiento en tan solo cinco minutos. El proceso de instalación sencillo y las API intuitivas permiten a los desarrolladores comenzar a aprovechar las capacidades del conjunto con un tiempo de configuración mínimo.
Di adiós a las conjeturas y al ensayo y error. Iron Suite viene con documentación extensa y ejemplos para cada componente, asegurando que los desarrolladores tengan orientación clara y recursos a su alcance para maximizar la productividad.
¿Necesita ayuda o tiene preguntas sobre el uso de Iron Suite? El equipo dedicado de ingenieros está disponible las 24 horas del día, cinco días a la semana, para brindar soporte técnico y resolver cualquier problema que pueda encontrar. Tenga la seguridad de que la ayuda siempre está a solo un mensaje de distancia.
Iron Suite ofrece una garantía de devolución de dinero de 30 días. Si por alguna razón no estás completamente satisfecho con tu compra, simplemente informa al equipo de Iron dentro de los 30 días y te reembolsarán el pago sin hacer preguntas.
¿Listo para experimentar el poder y la versatilidad de Iron Suite por ti mismo? Comience su prueba gratuita hoy y descubra cómo el conjunto completo de herramientas de documentos .NET puede optimizar sus flujos de trabajo de desarrollo y desbloquear nuevas posibilidades para sus proyectos.
En conclusión, Iron Suite ofrece a los desarrolladores de .NET un conjunto de herramientas integral para agilizar tareas de automatización legal, como la generación de PDF y la conversión de archivos HTML a documentos PDF buscables. Al aprovechar el poder de IronZIP, IronPDF y IronOCR, los desarrolladores pueden automatizar y optimizar sus flujos de trabajo, mejorando en última instancia la eficiencia y precisión en el procesamiento de documentos legales. Con Iron Suite a su disposición, las posibilidades de automatización son infinitas.
Para la tarea de conversión de HTML a PDF, utilizamos las tres bibliotecas esenciales de Iron Suite: IronZIP, IronPDF y IronOCR. IronPrint también puede ser un posible candidato para esta tarea si se requiere una instalación de impresión. Si se compraran individualmente, estas cuatro bibliotecas tendrían un costo total de $749 * 4 = $2,996.
Sin embargo, con Iron Suite, obtienes acceso no solo a tres o cuatro, sino a nueve poderosas bibliotecas por el precio de solo dos productos individuales. Esa es una propuesta de valor increíble, que te ofrece un conjunto completo de herramientas para todas tus necesidades de desarrollo .NET. Por solo $1,498, IronSuite ofrece un valor excepcional, ahorrándole tanto tiempo como dinero mientras le proporciona una amplia gama de herramientas para optimizar sus flujos de trabajo de desarrollo.