¿Qué es OCR?

Se denomina OCR a las herramientas de software que permiten pasar un documento electrónico o en papel a un archivo de procesamiento de textos, como, por ejemplo, MS Word, sin necesidad de que nosotros lo volvamos a mecanografiar o teclear manualmente. Dado que en Presta tu voz convertimos los libros de texto a un formato que comprende la lectura en voz alta y el texto correspondiente en tamaño extra grande, los programas de OCR son sumamente importancia para nosotros. Aquí vamos a explicar dónde conseguir uno, cómo instalarlo y cómo aprovecharlo al máximo.

OCR significa "Reconocimiento Óptico de Caracteres". Es programa para reconocer textos escaneados impresos o archivos de imágenes que representan escritura (como fotografías de letreros), ya estén impreso o escritos a mano. Los programas de OCR contienen algoritmos para analizar las figuras oscuras sobre el fondo blanco e interpretarlas como los caracteres del alfabeto almacenados en su base de datos.

Algunos programas de OCR también tienen algún tipo de corrector ortográfico para tratar de adivinar las palabras que no haya podido interpretar en su primer intento. Para eso se apoya en los diccionarios de la lengua en que se supone que el texto está expresado, en nuestro caso, diccionarios del español. Una precisión del 100% es difícil de lograr, pero los diccionarios pueden enriquecerse paulatinamente, a medida que corregimos nuestras primeras páginas. En otras palabras, nuestra instalación del programa de OCR se va entrenando y adaptando a nuestros lenguaje especializado, logrando resultados más precisos con cada nueva sesión.

<< INICIO


¿TE SIRVIÓ LA SOLUCIÓN?

Puntuación: +1+x


¿TIENES ALGUNA DUDA Y/O COMENTARIO ADICIONAL? OPINA

Si no se indica lo contrario, el contenido de esta página se ofrece bajo Creative Commons Attribution-Share Alike 2.5 License.