
En la FCSCL existen tres sistemas de cálculo: cluster MPI, cluster de sistemas de memoria compartida y cluster de GPU’s.
El cluster para proceso paralelo masivo está compuesto por 304 nodos, de los cuales 288 son para producción y 16 para desarrollo y pruebas. Se trata de un cluster de formato extremadamente denso, pues los nodos del cluster son servidores HP BLx220c de HP sobre chasis blade C7000. Este modelo es el blade de “hoja doble”, es decir, 32 servidores por chasis. Con cuatro chasis por armario, cada rack del cluster MPI tiene un total de 128 servidores y 1024 cores. Como se ha reflejado en el apartado de infraestructuras, esto representa un consumo a plena carga de 44Kw por armario.
El cluster está formado por un total de 10 chasis (uno de ellos sólo tiene 16 servidores). Cada nodo del chasis tiene las siguientes características:
Cada chasis tiene a bordo cuatro switches GbE y otros cuatro switches Infiniband DDR. Cada switch tiene un total de 20 puertos: 16 internos hacia los blades y 4 externos para uplink. En el caso de los switches Infiniband, se conectan al backbone con un ratio 2:1.
El procesador E5450 supone un buen compromiso entre prestaciones y consumo, pues gracias a él el cluster alcanza una potencia de cálculo de 30TeraFLOPS (RPeak) y 25TeraFLOPS en la ejecución de un test de Linpack con un consumo inferior a 100kw/h. Es un dato magnífico que muestra la altísima eficiencia energética alcanzada, pues el ratio MFLOPS/W permitirá al cluster MPI de Caléndula situarse en los primeros puestos de la lista Green500.
Para aquellos programas muy intensivos en consumo de memoria, el cluster de sistemas de memoria compartida es una solución idónea. Está compuesto por 12 servidores HP Proliant DL 580 con cuatro procesadores Intel Xeon MP X7350 de cuatro núcleos (16 núcleos por nodo). Las características de cada nodo son:
El último equipo de cálculo incorporado ha sido el cluster de GPU’s. Los sistemas basados en GPU’s tienen cada vez más demanda, pues sus prestaciones son excelentes. Como contrapartida está su dificultad de programación. Pero muchas aplicaciones de cálculo pueden aprovecharse de las características de las GPU’s para obtener incrementos muy significativos de rendimiento.
El cluster de GPU’s está compuesto por seis servidores HP Proliant DL160G6 conectados a 3 servidores NVidia Tesla S1070.
En la FCSCL existen tres redes, y todos los servidores están conectados a ellas:
Red de administración: esta red no es accesible por el usuario, y su propósito es el control de hardware, así como la gestión de despliegue. cada servidor tiene uno o dos interfaces conectados a la red de administración. Si dispone de un interfaz específico para gestión del hardware (iLO, IPMI o similar), está conectado a esta red. Además, todos los servidores disponen de un interfaz gigabit conectado a la red de administración, por la que se realiza la monitorización, configuración software, etc. El backbone de esta red es 10GbE.
Los sistemas auxiliares están basados en un Cluster VMware vSphere 4 y un Cluster RHCS. Los sistemas auxiliares son responsables de la propia gestión interna de la FCSCL, correo, monitorización, gestión de despliegue, gestión de colas, etc.