Big Data Analytics: herramientas y técnicas
Manejo de la información
Seamos realistas, queremos saber cosas. Somos intrínsecamente curiosos. Si conocemos el resultado del evento deportivo de anoche, queremos saber por qué. Si conocemos la temperatura ahora, queremos saber cuál será mañana. Y si vemos un truco de magia realizado ante nuestros ojos, queremos saber cómo se hizo. No podemos escapar de él: está en nuestro ADN. Pero a medida que avanzamos en nuestras vidas, las preguntas se vuelven más importantes y requieren información adicional para resolver. Está llegando al punto en que nuestros métodos habituales ya no son iguales a la tarea. Afortunadamente, hay un área que se enfoca exactamente en este tipo de problemas: se llama Big Data.
![]() |
¿Qué es Big Data?
Big Data se trata de grandes cantidades de información. Específicamente, se enfoca en conjuntos de información que son demasiado grandes para manejarlos de la manera habitual. Por habitual, queremos decir que no pueden ser procesados por aplicaciones cotidianas, como Microsoft Access o Excel. Desafortunadamente, incluso con procesadores potentes funcionando, estas aplicaciones tienden a atascarse. Agregue el hecho de que el tamaño de la información crece cada año y tiene una receta para los problemas. Para tener una idea de lo que estamos hablando, considere la cantidad de información que procesa el Servicio de Impuestos Internos (IRS). Es una maravilla que obtengamos nuestras declaraciones de impuestos en los plazos que lo hacemos.
![]() |
¿Qué son las analíticas?
Los análisis son enfoques estructurados o formalizados para manipular la información. Cubre actividades como cálculos, derivación de nueva información y documentación de resultados, todo con miras a un tema en particular. Pero más concretamente, hace estas cosas utilizando un conjunto de herramientas estandarizadas. Esto tiene un par de beneficios:
- Las herramientas actúan como una guía para la investigación. Esto es particularmente útil en situaciones en las que no está familiarizado con la información. Se pueden sacar rápidamente conclusiones básicas que conducen a derivaciones más significativas.
- El conjunto de herramientas es conocido y fácil de entender. Esto lo pone al día rápidamente con nuevos conjuntos de información y le permite avanzar al siguiente nivel de investigación.
- Los resultados producidos por las herramientas actúan como una línea de base y se pueden comparar con información y resultados externos. Esto, a su vez, le da confianza sobre sus resultados y le indica actividades más complejas.
¿Cuáles son algunas de las técnicas utilizadas por Big Data Analytics?
Hay una serie de técnicas utilizadas en el análisis de Big Data. Por técnica, simplemente nos referimos a algún método para lograr una meta o tarea. En este caso, el objetivo es almacenar, acceder y procesar adecuadamente las grandes cantidades de información que constituyen Big Data. La mayoría de las técnicas son una combinación de las que se enumeran a continuación:
- Almacenamiento distribuido: esta técnica divide la información en pedazos y los coloca en varios puntos geográficos para su custodia. Varios centros de datos son un ejemplo de esto.
- Almacenamiento por niveles: esta técnica utiliza varios tipos de almacenamiento; cinta (estática), discos duros (semiestáticos) y de estado sólido (dinámicos) para mejorar el rendimiento del acceso. La información que se usa con más frecuencia se almacena en un almacenamiento más rápido (dinámico). La mayoría de los centros de datos utilizan alguna variación de esta estrategia.
- Procesamiento paralelo: similar al almacenamiento distribuido en algunos aspectos, esta técnica rompe el procesamiento (operaciones realizadas en la información) y las realiza al mismo tiempo. Los centros de datos con racks y racks de servidores son un ejemplo de ello.
![]() |
¿Cuáles son algunas de las herramientas utilizadas para el análisis de Big Data?
Al igual que las técnicas, hay varias herramientas de análisis de Big Data disponibles, sin duda más de las que se pueden examinar en esta lección. Estas herramientas están basadas en software y le permiten realizar una variedad de operaciones con la información. Aquí hay un par de ejemplos destacados:
- Hadoop: una herramienta utilizada para organizar y administrar granjas de servidores (racks y racks de servidores). Piense en ello como un facilitador para el análisis de Big Data.
- NoSQL: son las siglas de Not Only Structured Query Language. Es una herramienta de base de datos que presenta una organización distribuida masivamente y muy poca estructura para sus datos. Esto también es un habilitador para el análisis de Big Data.
- Google Analytics: un conjunto de herramientas que se pueden utilizar para analizar información. Proporciona herramientas para la recopilación, consolidación, informes y monitoreo de datos.
Resumen de la lección
En resumen, Big Data se trata de conjuntos de información que son demasiado grandes para ser procesados por aplicaciones cotidianas, como Microsoft Access o Excel. Los análisis son un conjunto de herramientas para manipular información, incluidos cálculos, derivar nueva información y documentar resultados. Hay una serie de técnicas que se utilizan en el análisis de Big Data, como el almacenamiento distribuido, el almacenamiento por niveles y el procesamiento paralelo. Algunas de las muchas herramientas de análisis de Big Data disponibles incluyen Hadoop, NoSQL y Google Analytics.