¿Qué es el software OCR?
Imágenes versus archivos de computadora
¿Has oído hablar del microfilm? El microfilm es una pequeña tira de película fotográfica con imágenes diminutas. Érase una vez (antes de las computadoras), esta era la forma más eficiente de almacenar información. Simplemente tomó una foto de un periódico grande y la redujo a una imagen pequeña para ahorrar espacio. Si necesita buscarlo nuevamente, póngalo en un lector de microfilmes y busque manualmente lo que necesite. Las computadoras han cambiado la forma en que almacenamos y buscamos información. Los archivos de computadora ahorran mucho más espacio y también facilitan la búsqueda de cosas. Hoy en día, la mayoría de las imágenes y el texto se almacenan en archivos de computadora.
¿Qué tiene de bueno el OCR?
¿Qué hace que el software OCR sea tan especial? En primer lugar, el texto y las imágenes son dos cosas diferentes en lo que respecta a las computadoras (eran solo una cosa para los buenos y viejos microfilms … imágenes). En una computadora, una imagen se almacena como muchos números, uno por cada punto (o grupo de puntos) en la imagen, incluso si esa imagen es una instantánea de palabras en una página. La computadora no tiene idea de que las palabras están ocultas en esa imagen. Es solo una foto.
Los archivos de imagen son enormes y desperdician mucho espacio en una computadora, porque cada punto de la imagen debe almacenarse como un número. No podemos buscar texto ni editarlo porque es una imagen.
Sin embargo, el texto no se almacena como imágenes en las computadoras; se almacena de manera eficiente como algo llamado códigos ASCII, con solo un código para cada símbolo. Los archivos de texto son pequeños y las computadoras pueden almacenar montones de ellos. Entonces, si tuviéramos una forma de escanear imágenes en texto, sería mucho mejor. El software OCR hace eso.
Aún mejor, una vez que tenemos las imágenes convertidas en archivos de texto, podemos editarlas usando un procesador de texto y buscarlas automáticamente para localizar algo. Esa es una característica realmente poderosa cuando necesita buscar en una biblioteca legal esa cadena de palabras que sabe que está allí, pero no puede recordar en qué volumen está (¡o incluso en qué biblioteca está!).
Resumen de la lección
El software OCR nos permite escanear imágenes en archivos de computadora y luego las trata automáticamente como texto. En lugar de escribir a mano el texto de una hoja de papel en una computadora, el software OCR puede escanear el papel y ‘escribirlo’ por usted. El software OCR es eficiente porque nos permite almacenar imágenes de texto como texto simple y antiguo, lo que también ocupa menos espacio. El software OCR nos permite convertir imágenes que no se pueden buscar en documentos que se pueden buscar.
Aprende más sobre:
Arte Arquitectura Biologia Ciencia Ciencia Fisica Ciencias de la Tierra Ciencias Sociales Economia Historia Historia Mundial Historia Moderna Medio Ambiente y Ecologia Literatura Plantas y Animales Religiones del Mundo QuimicaArticulos relacionados
- ¿Qué es un algoritmo en programación? – Definición, ejemplos y análisis
- ¿Qué es una URL? – Definición y ejemplos
- ¿Qué es SEO? – Definición y ejemplos
- Unidad de control (CPU): Definición y diseño
- Topologías de Red: Tipos, ventajas y desventajas
- RAM dinámica: definición y tipos
- ¿Qué es una metaetiqueta? – Definición y ejemplos
- Administración de Red: Definición y ejemplos
- ¿Qué es 255 en Binario? – Instrucciones y pasos
- ¿Qué es una red privada virtual (VPN)? – Definición y tipos
- Copyleft: Historial, requisitos y aplicaciones de la licencia
- Como eliminar datos duplicados en Excel
- Diseño de interfaz de usuario en aplicaciones móviles
- ¿Qué es un DNS? – Definición y explicación
- Cómo agregar números binarios