La evolución de los documentos

Generar un desarrollo que permita ajustar y escalonar una solución analítica para la extracción de datos a partir de documentos y volverlos Data Líquida

Proceso / marco de extracción de data líquida

Inicio
Configurar rutas de información para entrenamiento de modelos.
Excel:
fileconfig_framework_recognizer.csv
Activar proceso de ingesta y validación de documentos.
Data Factory:
Pipelineload_data_sacecop_transitraw
Procesamiento de los documentos usando modelos autosupervisado.
Cognitive Services:
FormRecognizery Databricks
Almacenamiento de información de salida en Zona Delta.
Lago de Datos:
delta/silver
Etiquetado automáticode la salida.

Modelos de Lenguaje:
SBert, Spacy
Heurístico:
Snorkel, Skweak, Regex, Spacy
Identificación de entidades
CognitiveServices:
Text Analyticsy Databricks
Configuración de resultados en zona de consulta
Databricks
Finalizar
Databricks
1
2
3
4
5
6
7
8
9

Arquitectura

Transforme la efectividad de su compañía

Obtenga todos los datos de sus documentos filtrados en un solo Click y acceda a la información necesaria.

Computer Vision

Azure Cognitive Services (Vision APIs)

Reconocimiento óptico de caracteres (OCR)

Extrae el texto impreso o manuscrito de imágeneso documentos tales como facturas, informes financieros, artículos, planillas, etc.Usa los modelos basados en aprendizaje profundo y funciona con texto en diversas superficies, fondos e idiomas.

Análisis de imágenes

Extrae una gran variedad de características visuales de las imágenes. Por ejemplo, puede determinar si una imagen tiene contenido para adultos, buscar marcas u objetos específicos o buscar rostros humanos.

Análisis espacial

Maximiza el valor de los espacios físicos mediante el conocimiento de los movimientos y la presencia de personas en un área determinada. Ejecuta operaciones de inteligencia artificial para extraer información de las secuencias de vídeo y generar eventos para que los usen otros sistemas.

Reconocimiento óptico de caracteres

Consideraciones importantes

Formatos de archivos admitidos: JPEG, PNG, BMP, PDF y TIFF

•Para archivos PDF y TIFF, se procesan hasta 2000 páginas•El tamaño de archivo debe ser inferior a 50 MB y sus dimensiones de al menos 50 x 50 píxeles y como máximo de 10000 x 10000 píxeles.

•Los archivos PDF deben tener dimensiones de 17 x 17 pulgadas como máximo

•Condiciones de la imagen o documento

•Condiciones del papel o superficie

Form Recognizer

Azure Cognitive Services (Vision APIs)

API de diseño

A través de la API de diseño puede establecer coordenadas para extraer texto, marcas de selección y estructura de tablas (números de fila y columna asociados con el texto).

Modelos personalizados

Los modelos se entrenan con sus propios datos. Un modelo de procesamiento de documentos entrenado puede generar datos estructurados que incluyen las relaciones en el documento de formulario original. Después de entrenar el modelo, puede probarlo y volver a entrenarlo y, finalmente, utilizarlo para extraer datos.

Modelos prediseñados

Incluye modelos prediseñados para el procesamiento automatizado de datos:FacturaRecibosDocumentos de identidadTarjetas de presentación

Azure Cognitive Services (Vision APIs)

Consideraciones importantes

•El formato debe ser JPG, PNG, PDF* o TIFF

•El tamaño del archivo debe ser inferior a 50 MB

•Las dimensiones de la imagen deben estar entre 50 x 50 píxeles y 10000 x 10000 píxeles

•Para PDF y TIFF, solo se procesan las primeras 200 páginas

•El tamaño total del conjunto de datos de entrenamiento debe ser de 500 páginas o menos.

•Si se escanean a partir de documentos en papel, los formularios deben ser escaneos de alta calidad

•El texto debe utilizar el alfabeto latino (caracteres ingleses).

•Para el aprendizaje no supervisado, las claves deben aparecer arriba o a la izquierda de los valores; no pueden aparecer debajo ni a la derecha.

•Condiciones de la imagen o documento

•Condiciones del papel o superficie

Demo

Previous
Next

Controla, incorpora y gestiona los datos datos de los documentos empresariales

Quieres conocer más acerca de este servicio, comunícate con un asesor.

Good marketing plan is crucial for businessmen who want to develop their businesses. This service includes marketing research, analysis and creating marketing plan where you will see all the directions where to lead your business and which goods and services it’s more profitable to produce.