CXL promete redefinir la forma en que se diseñan los sistemas informáticos. Se ejecuta en PCIe y puede expandir la memoria en CPU individuales, pero su mayor promesa es proporcionar grupos de memoria gobernados por red que pueden asignar memoria de mayor latencia según sea necesario para CPU o máquinas virtuales definidas por software. Los productos basados en CXL comienzan a aparecer en el mercado en 2023.
CXL busca recrear centros de datos, pero las ventajas de una memoria de mayor latencia para usar en aplicaciones informáticas de alto rendimiento (HPC) no estaban claras, al menos hasta que UnifabriX demostró las ventajas de ancho de banda y capacidad con su nodo de memoria inteligente basado en CXL en la Conferencia de Super Computación 2022 (SC22). ). allá acaba de publicar un video Vea las ofertas de UnifabriX para memoria y aplicaciones de almacenamiento HPC que muestran las ventajas de HPC.
UnifabriX dice que el producto está basado en la unidad de procesamiento de recursos (RPU). La RPU está integrada en el nodo de memoria inteligente CXL, como se muestra a continuación. Este es un servidor de montaje en bastidor de 2 unidades con ranuras para medios EDSFF E3 reparables. El producto tiene capacidad para hasta 64 TB en memoria DDR5/DDR4 y SSD NVMe.
La compañía dice que el producto cumple con CXL 1.1 y 2.0 y se ejecuta en PCIe Gen5. También dicen que está listo para CXL 3.0 y admite la expansión PCIe Gen5 y CXL. También es compatible con el acceso a SSD NVMe a través de CXL (SSD CXL sobre memoria). El producto está diseñado para su uso en entornos virtualizados y virtualizados para una amplia gama de aplicaciones, incluidas HPC, IA y bases de datos.
Al igual que con otros productos CXL, el nodo de memoria proporciona memoria expandida, pero también puede brindar un mayor rendimiento. En particular, en la Conferencia de Supercomputadoras de 2022 (SC22), se utilizó un nodo de memoria para ejecutar una prueba de rendimiento de HPCG en comparación con el punto de referencia sin la ayuda de un nodo de memoria. Los resultados se muestran a continuación.
Para un punto de referencia HPCG tradicional, a medida que aumenta la cantidad de núcleos de CPU que procesan el punto de referencia, el rendimiento inicialmente aumenta casi linealmente con la cantidad de núcleos de procesador. Sin embargo, alrededor de 50 núcleos de CPU, el rendimiento se vuelve plano sin ninguna mejora de rendimiento a medida que aumenta la cantidad de núcleos. Cuando obtiene 100 núcleos disponibles, solo se utilizan 50 núcleos. Esto se debe a que no hay ancho de banda de memoria adicional disponible.
Si se agrega un nodo de memoria para proporcionar memoria CXL adicional además de la memoria directamente conectada a los núcleos de la CPU, vemos que la escala de rendimiento con los núcleos puede continuar. El nodo de memoria mejora el rendimiento general de HPCG al mover datos de baja prioridad desde la memoria cercana de la CPU a la memoria CXL lejana. Esto evita la saturación de la memoria cercana y permite escalar continuamente el rendimiento con núcleos de procesador adicionales. Como se muestra arriba, el nodo de memoria mejoró el rendimiento de una prueba HPCG estándar en más del 26 %.
La empresa trabajó en estrecha colaboración con Intel en su solución CXL e Intel informa estos resultados junto con otros 3Investigación y desarrollo Probador de la fiesta en su reciente informe de producto sobre unidades de procesamiento de infraestructura (IPU) (los aceleradores Intel Agilex FPGA ofrecen mejoras de TCO, rendimiento y flexibilidad de hasta 4y Plataformas Intel Xeon genéricas).
Además de proporcionar mejoras en la capacidad de la memoria y el ancho de banda, un nodo de memoria también puede proporcionar acceso a SSD NVMe a través de CXL. La compañía dice que sus planes incluyen memoria, almacenamiento y redes a través de una interfaz CXL/PCIe, de ahí el nombre unifabriX. Con las rejillas incluidas, sus cajas pueden reemplazar las soluciones de estante superior (TOR), así como brindar acceso a la memoria y el almacenamiento.
El nodo de memoria UnifabriX, que utiliza la unidad de procesamiento de recursos de la empresa, proporciona un camino para superar las limitaciones de ancho de banda DRAM directo en aplicaciones HPC que utilizan memoria CXL compartida.
“Orgulloso adicto al café. Gamer. Introvertido incondicional. Pionero de las redes sociales”.