Cómo Funciona la Caché distribuida: diseño y arquitectura

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

Definición de caché

La caché se define como la capacidad de almacenamiento de datos en un sistema que se reserva para atender más rápidamente solicitudes futuras. Los datos que se almacenan en el caché se almacenan allí como resultado de un acceso frecuente o son copias duplicadas de datos almacenados en otra ubicación. Básicamente, el almacenamiento en caché hace que las referencias futuras sean más rápidas. Mejorar el rendimiento es el objetivo.

Para un ejemplo no técnico, considere que usted es el profesor de matemáticas de un grupo de estudiantes de séptimo grado. Entras un día a la clase y les pides que calculen la raíz cuadrada de 111,111. Siendo el grupo competitivo que son, unánimemente inclinan la cabeza, ponen el lápiz sobre el papel y empiezan a calcular. Después de unos cinco minutos de cálculos frenéticos, empiezan a aparecer las primeras respuestas correctas (333.333). Continúas con tu lección habitual.

Cinco minutos antes de que termine la clase, le dices a la clase que tienes otra pregunta rápida de matemáticas. Todos los estudiantes están listos para comenzar a calcular y ser los primeros en encontrar la respuesta. Se repite la pregunta y se pregunta: «¿Cuál es la raíz cuadrada de 111,111?». Esta vez, en cuestión de segundos, los estudiantes dejan escapar la respuesta sin hacer ningún cálculo. La razón es que la pregunta se había hecho antes, por lo que la respuesta era fácil de recordar (almacenada en caché) y no fue necesario realizar cálculos laboriosos la segunda vez. ¡La pregunta se resolvió más rápido la segunda vez!

El caché puede tomar la forma de software o hardware. Normalmente, en informática, es la memoria de un nodo (computadora) la que se utiliza para almacenar datos a los que se accede con frecuencia o que se han utilizado recientemente. La caché distribuida, por otro lado, es el almacenamiento en caché que se ha configurado en varios nodos o servidores dentro de la misma red, que almacenan información de solicitud de datos similar. Es una extensión del sistema normal de almacenamiento en caché de un solo nodo. Los conjuntos de datos se mantienen vivos dentro de la caché siempre que se soliciten con frecuencia.

En resumen, las características principales de una caché distribuida se pueden enumerar de la siguiente manera:

Tema relacionado:
5 Casos reales de éxito en diseño Neuromarketing

1. Hacen que los recursos sean accesibles globalmente

2. La arquitectura permite escalabilidad y rendimiento sostenido, y

3. Hay alta disponibilidad independientemente de la pérdida de un nodo.

Diseño de caché distribuida

Ya hemos establecido que los datos en el caché están determinados por los datos a los que se accede con más frecuencia en un sistema. Esto podría ser en un entorno de servidor web o de aplicaciones, por ejemplo. El sistema prioriza los datos utilizados con más frecuencia sobre los datos obsoletos (que eventualmente se eliminan). En las aplicaciones de servidor web, que pueden estar ubicadas geográficamente, estos servidores web guardan los datos de la sesión web de los usuarios, lo que facilita la atención global de las solicitudes.

Debido a las rápidas mejoras en la tecnología y la correspondiente caída en los precios del almacenamiento de datos, los nodos implementados a partir del almacenamiento en caché distribuido se han vuelto cada vez más populares. El diseño de un sistema contiene servidores en clústeres con arquitectura de caché distribuida para acceder a un conjunto de almacenamiento de datos.

Tema relacionado:
¿Qué es el método científico y cómo funciona?

Arquitecturas y diseños

Dependiendo del entorno, los sistemas de arquitectura de almacenamiento en caché distribuido pueden adoptar diferentes formas, como examinaremos ahora. Veremos tres tipos de uso común.

Tipo 1. SMP (Sistemas multiprocesador de memoria compartida)

También conocido como multiprocesamiento simétrico, implica varios procesadores idénticos interconectados a una única memoria principal, que se comparte entre los procesadores. Tienen acceso a todos los dispositivos de entrada y salida, pero se ejecutan en un único software de sistema operativo. En esta configuración, a un único procesador se le da prioridad sobre los demás, pero todos reciben el mismo trato. Con esta arquitectura, hay un aumento significativo en el rendimiento con múltiples procesadores dedicados a resolver un solo problema, como se ve en la figura que aparece aquí.

Tipo 2: DFM (Administración de archivos distribuidos y sistema de disco inteligente)

Con este sistema, varios discos locales forman un sistema de caché distribuido, que proporciona copias locales o conjuntos de datos remotos. Sirven como discos o cachés de archivos remotos a los que se puede acceder tanto local como globalmente, con nodos que están conectados a dicha red.

Tipo 3. WWW (Nivel World Wide Web)

Existen diferentes capas en la World Wide Web, y el sistema de almacenamiento en caché distribuido tiene un gran impacto en la mejora del rendimiento y los tiempos de respuesta. En la web, los cachés se dividen según las diferentes capas: cachés de cliente, servidor y red. Las cachés del cliente sirven para mejorar la accesibilidad de los datos y los tiempos de respuesta, mejorando la latencia de la web. Con la caché de los servidores, se trata de distribuir la carga de trabajo. Las solicitudes de los clientes a las bases de datos se manejan mejor mediante varios servidores. En el caso del caché de red, los clientes que ya han accedido a un dato lo hacen más accesible para futuros clientes al compartir el caché de red con esos datos.

Resumen de la lección

Muy bien, tomemos ahora un momento para repasar. En esta lección, aprendimos que el caché se define como la capacidad de almacenamiento de datos en un sistema que está reservada para atender más rápidamente solicitudes futuras, y que el almacenamiento en caché distribuido es el almacenamiento en caché que se ha configurado en múltiples nodos o servidores dentro de la misma red., que almacenan información de solicitud de datos similar. Hace que los recursos estén disponibles de forma más rápida y global, lo que permite escalabilidad y rendimiento constante.

Tema relacionado:
¿Qué es un Seguro y Cómo Funciona?

Las tres arquitecturas de caché distribuida más utilizadas incluyen:

Sistemas multiprocesador de memoria compartida
Gestión de archivos distribuidos y sistema de disco inteligente, y
El nivel de la World Wide Web

Twittear

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador