¿Qué es el software OCR?

5/5 - (7 votes)

Ejemplo de software OCR
ejemplo de software ocr

Imágenes versus archivos de computadora

¿Has oído hablar del microfilm? El microfilm es una pequeña tira de película fotográfica con imágenes diminutas. Érase una vez (antes de las computadoras), esta era la forma más eficiente de almacenar información. Simplemente tomó una foto de un periódico grande y la redujo a una imagen pequeña para ahorrar espacio. Si necesita buscarlo nuevamente, póngalo en un lector de microfilmes y busque manualmente lo que necesite. Las computadoras han cambiado la forma en que almacenamos y buscamos información. Los archivos de computadora ahorran mucho más espacio y también facilitan la búsqueda de cosas. Hoy en día, la mayoría de las imágenes y el texto se almacenan en archivos de computadora.


Ejemplo de lector de microfilmes
Lector de microfilms

¿Qué tiene de bueno el OCR?

¿Qué hace que el software OCR sea tan especial? En primer lugar, el texto y las imágenes son dos cosas diferentes en lo que respecta a las computadoras (eran solo una cosa para los buenos y viejos microfilms … imágenes). En una computadora, una imagen se almacena como muchos números, uno por cada punto (o grupo de puntos) en la imagen, incluso si esa imagen es una instantánea de palabras en una página. La computadora no tiene idea de que las palabras están ocultas en esa imagen. Es solo una foto.

Los archivos de imagen son enormes y desperdician mucho espacio en una computadora, porque cada punto de la imagen debe almacenarse como un número. No podemos buscar texto ni editarlo porque es una imagen.

Sin embargo, el texto no se almacena como imágenes en las computadoras; se almacena de manera eficiente como algo llamado códigos ASCII, con solo un código para cada símbolo. Los archivos de texto son pequeños y las computadoras pueden almacenar montones de ellos. Entonces, si tuviéramos una forma de escanear imágenes en texto, sería mucho mejor. El software OCR hace eso.

Aún mejor, una vez que tenemos las imágenes convertidas en archivos de texto, podemos editarlas usando un procesador de texto y buscarlas automáticamente para localizar algo. Esa es una característica realmente poderosa cuando necesita buscar en una biblioteca legal esa cadena de palabras que sabe que está allí, pero no puede recordar en qué volumen está (¡o incluso en qué biblioteca está!).

Resumen de la lección

El software OCR nos permite escanear imágenes en archivos de computadora y luego las trata automáticamente como texto. En lugar de escribir a mano el texto de una hoja de papel en una computadora, el software OCR puede escanear el papel y ‘escribirlo’ por usted. El software OCR es eficiente porque nos permite almacenar imágenes de texto como texto simple y antiguo, lo que también ocupa menos espacio. El software OCR nos permite convertir imágenes que no se pueden buscar en documentos que se pueden buscar.