Checkout
Cart: 0,00 - (0 items )

La nueva IA de Amazon es capaz de extraer texto de cualquier documento y papel




IA que extrae texto de documentos

El OCR, o reconocimiento óptico de caracteres, es una de esas tecnologías veteranas que nunca parecen funcionar del todo bien. Consiste en reconocer los caracteres escritos o impresos y digitalizarlos; en otras palabras, pasar lo que hay en el papel a la pantalla, no como una imagen, sino como texto que podamos seleccionar y editar.

No es tan sencillo como suena. El programa tiene que ser capaz de reconocer infinidad de tipos de letras diferentes, pero incluso así puede fallar; por ejemplo, puede que la fotografía o el escaneo del documento incluya imperfecciones o no tenga mucha resolución. Y si el documento tiene un formato especial, como tablas o gráficos, entonces es básicamente imposible que el programa te lo detecte correctamente.

La IA que extrae texto de documentos puede ser el salto que necesitaba el OCR

Hasta ahora, cube Amazon, que ha presentado Textract, un nuevo servicio OCR para AWS (Amazon Internet Services and products) capaz de reconocer y extraer texto de cualquier fuente. La compañía se ha demostrado especialmente confiada con este producto, llegando a afirmar que es capaz de procesar millones de páginas en sólo unas horas, y todo de manera precisa.

Textcract está basado en el aprendizaje automático, gracias a lo que ha podido aprender detalles que normalmente se escapan a los programas tradicionales, como el contexto; es capaz de detectar el tipo de documento que está escaneando, y buscar caracteres y palabras dependiendo de esto.

Por ejemplo, esta IA es capaz de reconocer extractos bancarios, facturas, tickets, cartas del banco y de Hacienda y otros tipos de documentos, y extraer los datos de manera precisa en documentos que podemos editar. Esto es especialmente útil para aplicaciones bancarias o de defend an eye on de gastos.

Ver vídeo

Estos datos estarán estructurados tal y como estaban en el documento customary; el sistema es capaz de reconocer tablas, gráficos y otros elementos sin volverse loca como es routine en programas de OCR.

Textract ya está disponible en algunos países como parte de AWS, por lo que no está dirigido para el consumidor. En vez de eso, Amazon quiere que los desarrolladores de apps y webs lo utilicen en sus propios proyectos para ofrecer nuevos servicios.

La entrada La nueva IA de Amazon es capaz de extraer texto de cualquier documento y papel aparece primero en Omicrono.




Back to top