Software de reconocimiento óptico de caracteres (OCR)

Equipo.

Apartir de esta actividad estaremos entregando "evidencias" de nuestro trabajo para poder asegurar que estan comprendiendo todos los temas a la perfección y lo esten realizando de la forma correcta, ya que será indispensable para lograr el objetivo final.

En esta actividad utilizaremos software para el reconocimiento óptico de caracteres (OCR), para utilizarlo tenemos múltiples opciones con el mismo objetivo: trasladar las letras de un libro a word en formato de texto.

Tendrán dos opciones para realizar la actividad, utilizando un SW especializado en OCR o por medio de un complemento en windows que convierte imagenes en texto, a continuación mencionaré ambas:

- Complemento para utilizar OCR desde Windows

Existen dos herramientas que encontraremos en Windows que nos servirán para poder obtener el texto de nuestras imagenes ya escaneadas.

Document Imaging y One Note 2007, a continuación agrego las ligas donde podrán encontrar la info para instalar y usar cualquiera de las herramientas antes mencionadas.

http://ptv.wikidot.com/soporte-tecnico:ocrwindows

http://ptv.wikidot.com/soporte-tecnico:ocrdocumentimaging

- SW especializado en OCR

Existen varias opciones de SW que podemos utilizar para OCR, se han evaluado opciones gratuitas como Top OCR, estos SWs los pueden descargar gratuitamente en las siguientes ligas:

http://topocr.softonic.com/

http://softi-freeocr.softonic.com/

Posterior a descargarlo e instalarlo en su computadora, podrán obtener texto directamente de las imagenes de su escaner.

Las personas que cuenten con ciertos modelos de scanner Epson seguramente contarán con el SW ABBYY FineReader el cual también les será muy útil ya que obtendran muy buenos resultados de scaneo.

Como pueden ver cuentan con varias opciones para poder lograr extraer el texto de nuestros libros y poder editarlo en Word, será muy bueno que utilicen varias de las opciones mencionadas y evaluen cual es la que les entregue mejores resultados, ¿como podrán evaluar cual es la mejor? muy sencillo, escaneando 3 páginas iguales del mismo libro y cuando nuestro texto se encuentre en Word tendrán que comparar cuantos errores contiene nuestro texto con respecto a nuestro texto original, obviamente la herramienta que nos generé menos errores será la elegida, esto dependerá inclusive de nuestro escaner asi que ustedes tendrán la mejor decisión.

Ahora, ¿cuál será nuestro entregable para esta actividad?, tendremos que scanear 5 páginas de cualquier libro a nuestra elección y por medio del OCR a nuestra elección pasarlo en texto a Word, revisar cada uno de los errores que pudo tener el scanner y corregirlo, esto incluye tildes, comas y cualquier signo de puntuación. En resumen tendrán que enviar 5 imagenes con sus respectivas 5 hojas en word y lo que se evaluará será que el texto en word contenga exactamente el mismo texto que las imagenes.

Estas me las enviarán a mi cuenta de dropbox, es importante que obtengan su cuenta en https://www.dropbox.com es gratuito y contiene un tutorial para su uso.

Mi cuenta para compartirme la carpeta que contendrá las 5 imagenes y el archivo en word es moc.liamtoh|arbyhz#moc.liamtoh|arbyhz.

Es muy importante que la carpeta tenga el siguiente formato: NOMBRE COMPLETO - PRUEBA OCR

Estaré publicando el siguiente fin de semana la lista de las personas que ya han enviado la información.

Esta tarea es muy importante que la realicen con mucho cuidado ya que todo nuestro trabajo del SS se basará en esta actividad.

Mucha suerte equipo.

Saludos.


¿TE SIRVIÓ LA SOLUCIÓN?

Puntuación: 0+x


¿TIENES ALGUNA DUDA Y/O COMENTARIO ADICIONAL? OPINA

Si no se indica lo contrario, el contenido de esta página se ofrece bajo Creative Commons Attribution-Share Alike 2.5 License.