AMD presenta ecosistema de soluciones de IA e Instinct Serie MI300

AMD anunció hoy los nuevos procesadores móviles AMD Ryzen Serie 8040, ampliando su oferta móvil líder con mejor rendimiento de su clase que la competencia. Con la NPU Ryzen AI on-die en modelos seleccionados, AMD está llevando al mercado aún más PC con IA de última generación, con hasta 1.6x más rendimiento de procesamiento de IA que los modelos anteriores de AMD, para ofrecer nuevas experiencias premium y capacidades listas para la IA. Para permitir aún más experiencias de IA grandiosas, AMD también está poniendo ampliamente disponible el Software Ryzen AI, para que los usuarios construyan e implementen fácilmente modelos de machine learning en sus PC de IA.

Los procesadores AMD Ryzen Serie 8040 son los más recientes en unirse a la potente línea Serie Ryzen y se espera que estén ampliamente disponibles en los principales fabricantes de equipos originales (OEMs, por sus siglas en inglés), incluidos Acer, Asus, Dell, HP, Lenovo y Razer, a partir del primer trimestre de 2024.

Procesadores AMD Ryzen de la Serie 8040

Los procesadores AMD Ryzen Serie 8040 cuentan con un rendimiento de alto nivel, desde la productividad diaria hasta creación de contenidos increíble, con el Ryzen 9 8945HS que ofrece edición de vídeo hasta 64% más rápida y renderizado 3D hasta 37% más rápido que la competencia. Mientras tanto, los gamers pueden disfrutar de juegos hasta 77% más rápidos que nuestros competidores.

Diseñado sobre la arquitectura de procesador AMD «Zen 4» y con hasta ocho núcleos con capacidad de hasta 16 hilos de potencia de procesamiento, el Ryzen 9 8945HS brinda un rendimiento líder de un solo núcleo y multinúcleo. Con gráficos AMD RDNA 3 Radeon y sistemas selectos impulsados por la arquitectura AMD XDNA construida para AMD Ryzen AI, los nuevos procesadores están diseñados para profesionales creativos, gamers y usuarios convencionales que buscan hoy mismo un portátil potente con un rendimiento confiable, y la capacidad de ejecutar experiencias avanzadas de IA.

Los componentes que se están lanzando Ryzen cuentan con máximo rendimiento disponible para portátiles PC ultradelgados y una larga duración de la batería gracias a innovadoras funciones de gestión de energía, lo que los convierte en la opción perfecta para los profesionales modernos, entusiastas de los juegos y creativos que buscan computadores más rápidos y energéticamente eficientes. Los procesadores AMD Ryzen Serie 8040 también incorporan compatibilidad avanzada con memoria LPDDR5. Con estos procesadores, los usuarios pueden aprovechar experiencias virtuales inmersivas, gaming y streaming, y confiar en que sus dispositivos soportan exigentes condiciones de IA al tiempo que mantienen la eficiencia energética.

Modelo Núcleos / Hilos Boost/ Frecuencia Base Caché Total TDP NPU
AMD Ryzen 9 8945HS 8C/16T Up to 5.2 GHz / 4.0 GHz 24MB 45W
AMD Ryzen 7 8845HS 8C/16T Up to 5.1 GHz / 3.8 GHz 24MB 45W
AMD Ryzen 7 8840HS 8C/16T Up to 5.1 GHz / 3.3 GHz 24MB 28W
AMD Ryzen 7 8840U 8C/16T Up to 5.1 GHz / 3.3 GHz 24MB 28W
AMD Ryzen 5 8645HS 6C/12T Up to 5.0 GHz / 4.3 GHz 22MB 45W
AMD Ryzen 5 8640HS 6C/12T Up to 4.9 GHz / 3.5 GHz 22MB 28W
AMD Ryzen 5 8640U 6C/12T Up to 4.9 GHz / 3.5 GHz 22MB 28W
AMD Ryzen 5 8540U 6C/12T Up to 4.9 GHz / 3.2 GHz 22MB 28W NA
AMD Ryzen 3 8440U 4C/8T Up to 4.7 GHz / 3.0 GHz 12MB 28W NA

Los procesadores AMD Ryzen 8040 están listos para apalancar toda la gama del ecosistema Windows 11 para un rendimiento optimizado, incluida una compatibilidad total con las funciones de seguridad de Windows 11. Los sistemas selectos que cuentan con un procesador AMD Ryzen Serie 8040 también pueden acceder a IA out-of-the-box con Windows Studio Effects Pack, permitiendo privacidad en casa o en remota con desenfoque de fondo, seguimiento de la mirada y cancelación de ruido.

Presentando el Software para desarrolladores de Ryzen AI

El software Ryzen AI ya está ampliamente disponible, lo que hace posible que los desarrolladores construyan e implementen modelos de machine learning entrenados en marcos como PyTorch o TensorFlow y los ejecuten en computadoras portátiles selectas impulsadas por Ryzen AI.

La versión 1.0 del Software Ryzen AI habilita las aplicaciones ONNX Runtime y ofrece un model zoo preoptimizado en Hugging Face, permitiendo a los usuarios empezar y poner a andar modelos de IA en cuestión de minutos. Los laptops con Ryzen AI pueden descargar estos a la NPU, liberando así la CPU para reducir el consumo de energía[7] y prolongar la duración de la batería. Como parte del lanzamiento del Software Ryzen AI, los desarrolladores pueden aprovecharlo para crear aplicaciones de IA con reconocimiento avanzado de gestos, autenticación biométrica y otras funciones de accesibilidad. También tienen acceso anticipado a modelos de reconocimiento automático del habla como Whisper y Modelos de Lenguaje de Gran Tamaño (LLM) como OPT y Llama-2 para diseñar interfaces de voz en lenguaje natural para sus aplicaciones y habilitar otras funciones de procesamiento del lenguaje natural, entre ellos resumen de documentos y asistencia de correo electrónico.

AMD también anunció recientemente el concurso Pervasive AI Developers para desafiar a los desarrolladores a crear aplicaciones de IA innovadoras y emocionantes con casos de uso en centros de datos, estaciones de trabajo y laptops, gaming, robótica y más. Una de las opciones del concurso consiste en que creen aplicaciones para PC que utilicen visión, voz o LLM de dominio optimizado, con el fin de dar vida al PC con IA y resaltar su potencial para mejorar la experiencia y eficiencia del usuario. Las solicitudes para el hardware de cortesía se cierran el 31 de enero.

AMD anunció la disponibilidad de los aceleradores AMD Instinct MI300X, con ancho de banda de memoria líder en la industria para IA generativa y rendimiento de liderazgo para capacitación e inferencia de Modelos de Lenguaje de Gran Tamaño (LLM), así como la unidad de procesamiento acelerado (APU) AMD Instinct MI300A, que combina la última arquitectura AMD CDNA 3 y CPU “Zen 4” para ofrecer un rendimiento innovador para cargas de trabajo de computación de alto rendimiento (HPC) e IA.

Los clientes que aprovechan la última cartera de aceleradores AMD Instinct incluyen a Microsoft, que recientemente anunció la nueva Serie de máquinas virtuales (VM) Azure ND MI300x v5, optimizadas para cargas de trabajo de IA y con tecnología de aceleradores AMD Instinct MI300X. Además, se espera que El Capitan, una supercomputadora impulsada por una unidad de procesamiento acelerado AMD Instinct MI300A y alojada en el Laboratorio Nacional Lawrence Livermore, sea la segunda supercomputadora de clase exaescala impulsada por AMD, que ofrezca más de dos exaflops de rendimiento de doble precisión cuando esté completamente implementada. Oracle Cloud Infrastructure planea agregar instancias bare metal basadas en AMD Instinct MI300X a las instancias informáticas aceleradas de alto rendimiento para IA de la compañía. Está previsto que las instancias basadas en MI300X admitan OCI Supercluster con redes RDMA ultrarrápidas.

Varios fabricantes de equipos originales importantes también exhibieron sistemas informáticos acelerados, durante el evento AMD Advancing AI. Dell presentó el servidor Dell PowerEdge XE9680 con ocho aceleradores AMD Instinct y el nuevo diseño validado de Dell para IA generativa con frameworks de IA impulsados ​​por AMD ROCm. HPE anunció recientemente el HPE Cray Supercomputing EX255a, el primer acelerador blade de supercomputación impulsado por unidades de procesamiento acelerado (APU) AMD Instinct MI300A, que estará disponible a principios de 2024. Lenovo anunció su soporte de diseño para los nuevos aceleradores Serie AMD Instinct MI300 a disposición durante la primera mitad de 2024. Supermicro anunció nuevas incorporaciones a su generación H13 de servidores acelerados por CPUs AMD EPYC de cuarta generación y aceleradores Serie AMD Instinct MI300.

AMD Instinct MI300X

Los aceleradores AMD Instinct MI300X funcionan con la nueva arquitectura AMD CDNA 3. En comparación con los aceleradores AMD Instinct MI250X de la generación anterior, MI300X ofrece casi un 40 % más de unidades de cómputo, 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórico máximo, así como soporte para nuevos formatos matemáticos como FP8 y sparsity; todo orientado a cargas de trabajo de IA y HPC.

Los LLM actuales continúan aumentando en tamaño y complejidad, y requieren cantidades masivas de memoria y computación. Los aceleradores AMD Instinct MI300X cuentan con 192 GB de capacidad de memoria HBM3, la mejor de su clase, así como un ancho de banda de memoria máximo de 5,3 TB/s2 para ofrecer el rendimiento necesario para cargas de trabajo de IA cada vez más exigentes. La plataforma AMD Instinct es una plataforma de IA generativa construida sobre un diseño OCP estándar de la industria con ocho aceleradores MI300X para ofrecer una capacidad de memoria HBM3 de 1,5 TB líder en la industria. El diseño estándar de la industria de la plataforma AMD Instinct permite a los socios OEM diseñar aceleradores MI300X en ofertas de IA existentes y simplificar la implementación y acelerar la adopción de servidores basados ​​en aceleradores AMD Instinct.

En comparación con la Nvidia H100 HGX, la plataforma AMD Instinct puede ofrecer un aumento de rendimiento de hasta 1,6 veces cuando se ejecuta inferencia en LLM como BLOOM 176B y es la única opción en el mercado capaz de ejecutar inferencia para un modelo de parámetros de 70B, como Llama2. en un único acelerador MI300X; simplificando las implementaciones de LLM de clase empresarial y ofreciendo un costo total de la propiedad (TCO) excepcional.

AMD Instinct MI300A

AMD Instinct MI300A, la primera APU del mundo para centros de datos enfocada en HPC e IA, aprovecha el apilado 3D y la arquitectura AMD Infinity de cuarta generación para ofrecer un rendimiento líder en cargas de trabajo críticas ubicadas en la convergencia de HPC e IA. Las APU MI300A combinan núcleos de GPU AMD CDNA™ 3 de alto rendimiento, los últimos núcleos de CPU basados ​​en AMD “Zen 4” x86 y 128 GB de memoria HBM3 de próxima generación, para ofrecer 1,9 veces el rendimiento por vatio en cargas de trabajo de computación de alto rendimiento FP32 e IA, en comparación con la generación anterior AMD Instinct MI250X.

La eficiencia energética es de suma importancia para las comunidades de HPC e IA; sin embargo, estas cargas de trabajo requieren un gran uso de datos y recursos. Las APU AMD Instinct MI300A se benefician de la integración de núcleos de CPU y GPU en un solo paquete, lo que brinda una plataforma altamente eficiente y, al mismo tiempo, proporciona el rendimiento informático para acelerar el entrenamiento de los últimos modelos de IA. AMD está marcando el ritmo de la innovación en eficiencia energética con el objetivo 30×25 de la compañía de ofrecer una mejora de 30 veces la eficiencia energética en procesadores y aceleradores de servidores para capacitación en IA y HPC entre 2020 y 2025.

La ventaja de las unidades de procesamiento acelerado significa que las APU AMD Instinct MI300A cuentan con memoria unificada y recursos de caché, lo que brinda a los clientes una plataforma GPU fácilmente programable, computación de alto rendimiento, entrenamiento rápido de IA y una impresionante eficiencia energética para impulsar las cargas de trabajo de HPC e IA más exigentes. 

Software ROCm y Socios de Ecosystem

AMD anunció la última plataforma de software abierto AMD ROCm 6, así como el compromiso de la compañía de contribuir con bibliotecas de última generación a la comunidad de código abierto, impulsando su visión sobre el desarrollo de software de IA. El software ROCm 6 representa un avance significativo para las herramientas de AMD, ya que aumenta el rendimiento de aceleración de IA en aproximadamente 8 veces cuando se ejecuta en aceleradores de la Serie MI300 en la generación de texto Llama 2 en comparación con el hardware y software de la generación anterior. Además, ROCm 6 agrega soporte para varias características clave nuevas para la IA generativa, incluidas FlashAttention, HIPGraph y vLLM, entre otras. Como tal, AMD está en una posición única para aprovechar los modelos, algoritmos y marcos de software de IA de código abierto más utilizados, como Hugging Face, PyTorch, TensorFlow y otros, impulsando la innovación, simplificando la implementación de las soluciones de IA de AMD y liberando el verdadero potencial. de IA generativa.

AMD también continúa invirtiendo en capacidades de software a través de las adquisiciones de Nod.AI y Mipsology, así como a través de asociaciones estratégicas de ecosistemas como Lamini (que ejecuta LLM para clientes empresariales) y MosaicML (que aprovecha AMD ROCm para permitir la capacitación de Modelos de Lenguaje de Gran Tamaño en aceleradores AMD Instinct con cero cambios de código.

Especificaciones de Producto

AMD Instinct Arquitectura GPU CUs Núcleos de CPU Memoria Ancho de Banda de Memoria Nodos de Proceso Apilado 3D con Arquitectura AMD Infinity de 4a Generación
MI300A AMD CDNA 3 228 24 “Zen 4” 128GB HBM3 5.3 TB/s 5nm / 6nm SI
MI300X AMD CDNA 3 304 N/A 192GB HBM3 5.3 TB/s 5nm / 6nm Si
Plataforma AMD CDNA 3 2,432 N/A 1.5 TB HMB3 5.3 TB/s per OAM 5nm / 6nm Si

AMD también se unió a líderes de la industria como Microsoft, Meta, Oracle, Dell Technologies, HPE, Lenovo, Supermicro, Arista, Broadcom y Cisco para mostrar cómo estas empresas están trabajando con AMD para ofrecer soluciones avanzadas de IA que abarcan desde la nube hasta las empresas y los PCs. AMD lanzó múltiples productos en el evento, incluidos los aceleradores de IA para centros de datos AMD Instinct Serie MI300, la ROCm 6 open software stack con optimizaciones significativas y nuevas funciones compatibles con Modelos de Lenguaje de Gran Tamaño (LLM) y los procesadores Ryzen Serie 8040 con Ryzen AI.

Llevando el Centro de Datos IA de la nube a los centros de datos empresariales y supercomputadores

AMD estuvo acompañada por múltiples socios durante el evento para destacar la fuerte adopción y el creciente impulso de los aceleradores de IA para centros de datos AMD Instinct.

  • Microsoft detalló cómo está desplegando los aceleradores AMD Instinct MI300X para alimentar la nueva Serie de Azure ND MI300x v5 Virtual Machine (VM) optimizadas para cargas de trabajo de IA.
  • Meta compartió que la compañía está añadiendo aceleradores AMD Instinct MI300X a sus centros de datos en combinación con ROCm 6 para potenciar las cargas de trabajo de inferencia de IA y reconoció las optimizaciones de ROCm 6 que AMD ha realizado en la familia de modelos Llama 2.
  • Oracle desveló sus planes para ofrecer soluciones informáticas OCI bare metal con aceleradores AMD Instinct MI300X, así como sus planes para incluir aceleradores AMD Instinct MI300X en su próximo servicio de IA generativa.
  • Los mayores proveedores de infraestructuras de centros de datos han anunciado planes para integrar los aceleradores AMD Instinct MI300 en sus carteras de productos. Dell anunció la integración de los aceleradores AMD Instinct MI300X con su solución de servidor PowerEdge XE9680 para ofrecer un rendimiento innovador para cargas de trabajo de IA generativa en un formato modular y escalable para los clientes. HPE anunció planes para incorporar aceleradores AMD Instinct MI300 a sus ofertas empresariales y de HPC. Lenovo compartió sus planes de incorporar los aceleradores AMD Instinct MI300X a la plataforma Lenovo ThinkSystem para ofrecer soluciones de IA en sectores como el comercio minorista, la fabricación, los servicios financieros y de salud. Supermicro ha anunciado sus planes de ofrecer las GPU AMD Instinct MI300 en toda su cartera de soluciones de IA. Asus, Gigabyte, Ingrasys, Inventec, QCT, Wistron y Wiwynn también tienen previsto ofrecer soluciones basadas en aceleradores AMD Instinct MI300.
  • Proveedores especializados en IA en la nube como Aligned, Arkon Energy, Cirrascale, Crusoe, Denvr Dataworks y Tensorwaves tienen previsto proporcionar ofertas que ampliarán el acceso a las GPU AMD Instinct MI300X para desarrolladores y startups de IA.

Lanzamiento al mercado de una plataforma de software de IA abierta, probada y preparada

AMD ha destacado los importantes avances en la ampliación del ecosistema de software compatible con los aceleradores de centros de datos AMD Instinct.

  • AMD presentó la última versión de la open software stack de código abierto para las GPU AMD Instinct, ROCm 6, que se ha optimizado para la IA generativa, en particular los modelos de lenguaje de gran tamaño. ROCm 6 ofrece soporte para nuevos tipos de datos, optimizaciones avanzadas de gráficos y kernels, librerías optimizadas y algoritmos de atención de última generación que, junto con MI300X, proporcionan un aumento del rendimiento de ~8x la latencia total en la generación de texto en Llama 2 en comparación con ROCm 5 ejecutado en MI250.[1]
  • Databricks, Essential AI y Lamini, tres startups de IA que construyen modelos emergentes y soluciones de IA, se unieron a AMD en el escenario para discutir cómo están aprovechando los aceleradores AMD Instinct MI300X y la ROCm 6 open software stack para ofrecer soluciones de IA diferenciadas para clientes empresariales.
  • OpenAI añade soporte para los aceleradores AMD Instinct a Triton 3.0, proporcionando soporte inmediato para los aceleradores AMD que permitirá a los desarrolladores trabajar a un mayor nivel de abstracción en hardware AMD.

Liderazgo continuo en el avance de los PC con IA

Con millones de PC con IA enviados hasta la fecha, AMD anunció nuevos procesadores móviles líderes con el lanzamiento de los últimos AMD Ryzen Serie 8040 que ofrecen aún más capacidad de cálculo de IA. AMD también lanzó Ryzen AI 1.0 Software, una software stack que permite a los desarrolladores desplegar fácilmente aplicaciones que utilizan modelos preentrenados para añadir capacidades de IA para Windows. AMD también reveló que las próximas CPU «Strix Point» de próxima generación, cuyo lanzamiento está previsto para 2024, incluirán la arquitectura XDNA 2 para ofrecer más de 3x de rendimiento de computación de IA en comparación con la generación anterior, lo que permitirá nuevas experiencias de IA generativa. Microsoft también se unió para hablar de cómo están trabajando estrechamente con AMD en futuras experiencias de IA para PC con Windows.

Fuente: Comunicado

Deja un comentario