Big Data: Diseño y tipos de bases de datos

Publicado el 17 abril, 2024 por Rodrigo Ricardo

Manejo de información

La información nos permite dar sentido a las cosas que nos rodean. La información astronómica nos muestra nuestro lugar en el universo y cuán vasto es, la información financiera mantiene informadas a las empresas sobre su desempeño y la información médica permite a los médicos diagnosticar y tratar una variedad de dolencias. Para que sea útil, esta información debe almacenarse y organizarse. Para muchos, la opción lógica sería utilizar una base de datos. ¿Pero es eso suficiente? ¿Podrá hacer frente a la montaña de información que parecemos recopilar? Talvez no. Sin embargo, existe un área que se centra exactamente en este tipo de problema. El área se llama Big Data.

¿Qué es la Big Data?

Big data es esa parte de la tecnología de la información que se centra en grandes colecciones de información. Estas colecciones son tan grandes que no pueden manejarse por medios convencionales. No podemos utilizar aplicaciones como Microsoft Access, Excel o sus equivalentes. Incluso con las computadoras más avanzadas y potentes, estas colecciones traspasan los límites de lo posible. Y el listón está subiendo. Cada día pedimos más y esa tendencia continuará. Claramente, se deben desarrollar nuevos métodos para abordar este deseo cada vez mayor, esta necesidad cada vez mayor de recopilar y procesar información.

¿Que es una base de datos?

Una base de datos es un conjunto ordenado de información que está relacionada con un tema específico. A veces, el área temática es extremadamente amplia, otras, muy específica. En cualquier caso, la estructura impuesta permite acceder rápidamente a la información. Las bases de datos afectan a muchos aspectos de nuestras vidas, aunque es posible que no seamos conscientes de ello. Esto se debe principalmente a que las bases de datos son herramientas que funcionan entre bastidores. Por ejemplo, los registros bancarios se almacenan en una base de datos, las transacciones de ventas se almacenan en una base de datos e incluso la lista de contactos de su teléfono celular se almacena en una base de datos.

¿Qué tiene de especial el diseño de una base de datos de Big Data?

Algunos dirían que las bases de datos de big data son lo mismo que las bases de datos normales, excepto por el volumen de información. Esto no es enteramente verdad. Si bien son similares en el sentido de que brindan estructura, organización y acceso rápido, difieren en algunos aspectos importantes. Ellos son:

  • La cantidad de almacenamiento: a medida que aumenta el volumen de información, también aumenta el espacio necesario para almacenarla. Esto es evidente.
  • La organización del almacenamiento: además de aumentar el almacenamiento, la organización también cambia. En particular, se emplean diferentes tipos de almacenamiento para mantener la información que se usa con frecuencia separada de la que se usa con menos frecuencia. Cuanto mayor sea la frecuencia de uso, más rápido se utilizará el almacenamiento. Esto tiene algunas implicaciones de costos porque un almacenamiento más rápido cuesta más.
  • Procesamiento: los procesadores únicos no son lo suficientemente rápidos para manejar el volumen, por lo que se emplean estrategias distribuidas para dividir y conquistar. Esto tiene un efecto de procesamiento paralelo que aumenta el rendimiento.
  • Fusionar nueva información: cuando la cantidad de información es grande, agregar un nuevo elemento lleva tiempo, lo que se agrava a medida que se agrega más información. Se utilizan estrategias para agregar información almacenada en diferentes áreas al mismo tiempo, que es esencialmente el escenario de procesamiento paralelo mencionado en el punto anterior.
  • Actualización de información existente: la actualización es un problema similar a la fusión. Grandes cantidades de información aumentan el tiempo para localizar y cambiar la información. Aquí también se emplean estrategias paralelas para abordar el problema.

¿Cuáles son algunos tipos de bases de datos de Big Data?

Existen muchos tipos de bases de datos de big data. Algunas son muy similares a las versiones tradicionales y otras son bastante únicas. En cualquier caso, se clasifican en uno de tres tipos básicos, o en alguna combinación de ellos:

  • Procesamiento masivo en paralelo: este es el enfoque tradicional y estructurado con una gran cantidad de hardware. Múltiples procesadores producen resultados más rápidos. Oracle y Microsoft SQL Server son ejemplos.
  • Columnar: similar a una base de datos relacional tradicional (basada en tablas donde cada registro es una fila), las bases de datos en columnas también son relacionales (excepto que se basan en tablas donde cada columna es un registro). Sybase fue pionera en este tipo de base de datos.
  • Distribución masiva de forma libre: esta es la última tendencia en bases de datos. La información está muy distribuida, a veces ubicada en todo el mundo, y carece de una estructura significativa. Los ejemplos incluyen Hadoop y Google MapReduce.

Resumen de la lección

Big data es esa parte de la tecnología de la información que se centra en colecciones de información que son demasiado grandes para ser manejadas de la forma habitual. Una base de datos es una colección ordenada de información centrada en un tema específico. Las bases de datos de big data son similares a las bases de datos tradicionales en algunos aspectos y diferentes en otros.

Articulos relacionados