Más allá de los números
Las computadoras son herramientas para hacer aritmética: sumar, restar, multiplicar y dividir números enteros. ¿Cómo pueden también ser herramientas poderosas para aprender sobre cosas que no son numéricas?
![]() |
Una respuesta poderosa es un modelo de espacio vectorial . Un vector es un número que tiene una magnitud y una dirección. Tanto la magnitud como la dirección deben medirse con respecto al espacio en el que se define el vector. Cada dimensión del espacio representa una característica de interés y un vector representa la medida en que el objeto del modelo tiene esas características. Por tanto, un vector es una lista de números: uno para cada característica que forma parte del espacio modelo. La dirección del vector es la que va desde el origen del espacio hasta el punto definido por esos números.
Si bien al principio esto puede parecer muy difícil y complejo, verá en las siguientes secciones que el modelo de espacio vectorial se puede aplicar a una amplia variedad de contextos diferentes.
Física
Los modelos vectoriales más fáciles de visualizar provienen de la física. El modelo vectorial más obvio podría describir la posición de una partícula en el espacio físico utilizando tres números correspondientes a medidas en tres ejes (longitud, profundidad y altura). Un modelo de vector físico más complicado podría incluir las tres dimensiones espaciales y las tres dimensiones correspondientes a la velocidad en cada una de esas direcciones. Por ejemplo, un automóvil puede estar a una milla al norte y dos millas al este de mi ubicación actual, pero a la misma altura. La posición de este automóvil podría representarse con el vector <1,2,0>. El primer número representa la posición en el eje Norte-Sur, el segundo la posición en el acceso Este-Oeste y el tercero representa las posiciones en el eje arriba-abajo. Si ese automóvil viajaba a 60 mph hacia el norte, podríamos representarlo como vector <1,2,0,60,0,0>, donde los últimos tres números representan la velocidad en cada una de las tres direcciones. En este ejemplo, si tuviéramos vectores que representaran diferentes autos, podríamos calcular sus posiciones relativas y velocidades usando trigonometría.
Textos sencillos
Un documento de texto se puede representar como un vector. El espacio vectorial está definido por los términos que pueden estar presentes en el texto. Por ejemplo, cada dimensión del espacio puede representar un término en un diccionario de inglés. El diccionario define el espacio. Un texto escrito en inglés sería un vector con una cierta magnitud en cada dirección igual al número de veces que aparece esa palabra o término.
Mapa Conceptual del Modelo Estándar de la Física de Partículas
Si la palabra ‘pez’ apareciera tres veces en una oración, el vector tendría una magnitud 3 en la dirección del pez . En un espacio modelo con las dimensiones o características ‘uno’, ‘dos’, ‘tres’, ‘rojo’, ‘verde’, ‘azul’ y ‘pez’, el título del clásico de Dr. Seuss One Fish, Two Fish, Red Fish, Blue Fish se pueden representar como <1,1,0,1,0,1,3>.
Muchos de los libros del Dr. Seuss están escritos a propósito con un vocabulario de solo 50 palabras. Cada uno de estos libros podría representarse como un vector en un espacio de 50 dimensiones o como una lista de 50 números. La escritura de Shakespeare, por otro lado, contiene alrededor de 28,829 palabras específicas (o tipos de palabras) y los vectores que representan cada obra serían listas muy largas de números.
Obviamente, es más gratificante leer un texto que escanear una lista de números. Sin embargo, representar un texto de esta manera tiene muchas aplicaciones poderosas, ahora veremos dos.
Comparación de textos
La representación de textos como vectores permite a un usuario interesado calcular la similitud de dos textos de la misma manera que las posiciones relativas y las velocidades de dos coches podrían calcularse en el primer ejemplo. Las representaciones vectoriales de textos facilitan la medición de la similitud de diferentes textos comparando los ángulos entre los vectores que representan cada texto.
Un programa puede encontrar que One Fish, Two Fish, Red Fish, Blue Fish tienen algunas similitudes importantes con One, Two Buckle My Shoe porque tienen representaciones vectoriales similares o cercanas.
¿Cómo se mueven los cohetes en el espacio si no hay un medio contra el cual empujar?
Dado que los autores tienden a usar las mismas palabras en diferentes trabajos, la salida de un autor en particular tenderá a estar más cerca entre sí en un modelo de espacio vectorial que a los vectores que representan textos escritos por otros autores. Un vector que se aleja de los vectores que representan textos del mismo autor puede haber sido atribuido incorrectamente. Estas técnicas se han utilizado como evidencia cuando los académicos discuten sobre si una determinada obra fue escrita por Shakespeare o uno de sus contemporáneos.
Algoritmos de predicción de palabras
Es sorprendente la rapidez y precisión con la que un teléfono celular típico puede ofrecer predicciones para la siguiente palabra que un usuario podría querer escribir. Hay varias formas en que un programa de texto puede hacer una predicción, pero las más simples se basan en modelos de espacio vectorial. Todo lo que haya introducido el usuario se representa como un vector. La computadora busca en un conjunto de vectores que representan textos que se han escrito en el pasado y encuentra los vectores que están más cerca del vector de entrada y sugiere las palabras que están a continuación en los vectores más similares.
Los mensajes que contienen las palabras ‘Quiero’ estarían mucho más cerca de los vectores que continúan con ‘hielo’ (y luego tal vez ‘crema’) o ‘a’ (y luego tal vez ‘hablar’) que a los vectores que continúan con ‘ con ‘o’ no ‘. Ambas opciones serían malas gramaticales. El algoritmo no lo sabe, pero aún así no haría estas sugerencias.
Esto parece magia. No hay una representación explícita del significado de la oración, solo frecuencias de palabras, pero a menudo parece que el programa de texto sabe o entiende lo que va a escribir a continuación. A menudo, el secreto es solo un modelo de espacio vectorial. La representación de estas palabras como vectores puede transformar problemas sobre la interpretación de palabras en problemas aritméticos.
Resumen de la lección
Los vectores son números representados en un espacio. Esta simple idea ofrece formas útiles e interesantes de describir el espacio físico. Sin embargo, un modelo no tiene que describir el espacio físico. Si interpretamos las dimensiones de nuestro modelo para medir otras características, como la frecuencia con la que se usa una determinada palabra, podemos construir modelos numéricos de objetos que no parecen ser numéricos. Estas técnicas tienen muchas aplicaciones poderosas en la tecnología cotidiana, como los algoritmos de predicción mundial que forman parte de nuestras aplicaciones de mensajes de texto.
Modelo de Comunicación de Roman Jakobson
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...

