Conector Form Recognizer

<< Clic para mostrar Tabla de Contenidos >>

Navegación:  Bizagi Studio > Integrar aplicaciones externas desde Bizagi > Conectores de Inteligencia Artificial AI >

Conector Form Recognizer

Menú de navegación

Introducción

Cómo funciona Form Recognizer

Tipos de modelos de extracción de datos en Form Recognizer

Restricciones

Cómo empezar a utilizar el conector de Form Recognizer

 

Introducción

El reconocimiento óptico de caracteres (OCR) es una tecnología muy utilizada en estrategias de transformación digital. Esta tecnología permite convertir imágenes, escritura a mano o documentos impresos en texto codificado, para luego utilizar esta información digitalmente en sistemas de TI. Form Recognizer es una solución que proporciona capacidades de OCR rápidas y fáciles de usar. Bizagi proporciona un conector nativo para integrar sus procesos automatizados con Form Recognizer, para obtener información de documentos digitalizados, tarjetas de crédito o recibos, y utilizarla en sus procesos. En esta sección se describe cómo utilizar el conector Form Recognizer.

 

Form_Recognizer_connector_01

 

Cómo funciona Form Recognizer

Form Recognizer es un servicio cognitivo ofrecido por Microsoft Azure que utiliza tecnología avanzada de aprendizaje automático para construir modelos de extracción de datos automatizados. Estos modelos identifican y extraen texto, pares clave/valor, marcas de selección, tablas y estructuras de documentos, para  integrarlos en las aplicaciones y mejorar los procesos comerciales. Utilizando cualquiera de los tres tipos de modelos de extracción de datos que ofrece Form Recognizer, se obtienen rápidamente resultados precisos sin esfuerzos manuales sustanciales o conocimientos de ciencia de datos considerables.

 

Para información detallada sobre el servicio cognitivo Form Recognizer, consulte ¿Qué es Form Recognizer?

 

Tipos de modelos de extracción de datos en Form Recognizer

Form Recognizer tiene tres tipos de modelos de extracción de datos diferentes que se invocan utilizando una API REST o SDKs de librerías cliente:

1.API de diseño: El modelo API de diseño detecta y extrae datos de documentos con un diseño específico (por ejemplo, tablas y marcas de selección). Tanto el texto como la estructura del diseño se extraen mediante reconocimiento óptico de caracteres (OCR) de alta definición diseñado para este tipo de documentos.

2.Modelos preconstruidos: Los modelos preconstruidos son modelos previamente entrenados para marcos habituales que extraen texto, pares clave/valor y elementos de línea de documentos. Estos son modelos listos para usar y, por consiguiente, no requieren de ninguna muestra de entrenamiento. Las tres API preconstruidas actualmente disponibles en el servicio cognitivo Form Recognizer son Modelo preconstruido de factura, Modelo preconstruido de recibo y Modelo preconstruido de tarjeta de presentación.

3.Modelos personalizados: Los modelos personalizados hacen referencia a modelos de extracción de datos creados de cero y entrenados por el usuario que aprenden la estructura de documentos específicos de cliente de una manera inteligente. Para un entrenamiento adecuado, estos modelos utilizan cinco muestras de entrada para aprender la estructura de los formularios y extraer de forma inteligente datos adaptados a estos documentos.

 

note_pin

El conector nativo Form Recognizer de Bizagi está construido alrededor de los modelos personalizados de extracción de datos. La API de diseño y los modelos preconstruidos se describen solo para que tenga una mejor comprensión del servicio cognitivo Form Recognizer.

 

Hay dos formas en las que un usuario puede entrenar un modelo personalizado: aprendizaje sin supervisión y aprendizaje supervisado.

i.Aprendizaje sin supervisión: El aprendizaje no supervisado significa que el modelo de extracción de datos se entrena utilizando datos sin etiquetar. Form Recognizer utiliza este tipo de entrenamiento de forma predeterminada para comprender el diseño y las relaciones entre los campos y las entradas de los formularios. El algoritmo interno del servicio agrupa los formularios por tipo, descubre qué claves y tablas están presentes, y asocia valores a claves y entradas a tablas.

ii.Aprendizaje supervisado: A diferencia del entrenamiento no supervisado, el entrenamiento supervisado usa datos etiquetados para extraer valores de interés. Este tipo de entrenamiento puede requerir trabajo previo para etiquetar los datos (ya sea manualmente o con codificación intensiva) y mantener los formularios etiquetados, pero resulta en modelos de mejor desempeño que se adaptan a formularios complejos (es decir, formularios que contienen valores sin claves). En el entrenamiento supervisado, Form Recognizer usa el modelo API de diseño para aprender los tamaños y posiciones esperados de los elementos de texto impresos y escritos a mano, y luego usa etiquetas especificadas por el usuario para aprender las asociaciones clave/valor en los documentos.

 

Restricciones

El servicio cognitivo Form Recognizer opera con documentos que cumplen las siguientes condiciones::

El formato debe ser JPG, PNG, PDF (texto o digitalizado), o TIFF.

El tamaño del archivo debe ser inferior a 50 MB.

Las dimensiones de las imágenes deben estar entre 50 x 50 píxeles y 10000 x 10000 píxeles.

Las dimensiones de los archivos PDF deben ser como máximo de 17 x 17 pulgadas, correspondientes a tamaños de papel Legal o A3 y menores.

Para PDF y TIFF, solo se procesan las primeras 200 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

El tamaño total del conjunto de datos de entrenamiento debe ser de 500 páginas o menos.

Si los PDF están bloqueados con contraseña, el bloqueo debe eliminarse antes de enviarlos.

Si se digitalizan documentos en papel, los formularios deben ser digitalizaciones de alta calidad.

El texto debe utilizar el alfabeto latino (caracteres ingleses).

Para el aprendizaje no supervisado (sin datos etiquetados), los datos deben contener claves y valores. Las claves deben aparecer arriba o a la izquierda de los valores.

Form Recognizer no admite este tipo de datos de entrada: tablas complejas (tablas anidadas, encabezados combinados, celdas combinadas, etc.), casillas y botones de opción.

 

Cómo empezar a utilizar el conector de Form Recognizer

Para empezar a utilizar el conector de Form Recognizer en Bizagi siga los siguientes pasos:

1. Cree los recursos de Azure necesarios

2. Cree un conector de Form Recognizer en Bizagi Studio

3. Ejecute Form Recognizer desde un acción de actividad