int_digitaldoc

Si en el episodio anterior de la serie de AI enseñábamos un brazo robótico, en esta sesión presentaremos un asset desarrollado por GFT para la extracción de información de formularios.

Nuestro desarrollo distingue los PDFs que contienen capa de texto y realiza una extracción determinista, evitando así el uso de soluciones más caras y menos productivas que requieren un OCR y su posterior procesado.

Isabella Karabasz y Juan Miguel Beigbeder nos explicarán cómo se estructura un PDF, qué técnicas de machine learning han utilizado para distinguir entre un PDF digital y un PDF imagen, y compartirán con nosotros la solución desarrollada para la extracción automática del contenido de los PDF Digitales.


No te lo puedes perder. ¡Te esperamos!

 

 

 

Cuándo:

Martes 23 de marzo
De 12:30 a 13:00
 

 

 

Apúntate al webinar