Nvidia anunció una sociedad con el Instituto Broad del MIT y Harvard para proporcionar la plataforma Terra cloud y sus más de 25,000 usuarios, provenientes de investigadores biomédicos de la academia, startups y grandes compañías farmacéuticas, con las herramientas de aceleración e inteligencia artificial necesarias para analizar rápidamente enormes cantidades de datos de atención de la salud.
La colaboración está diseñada para conectar las plataformas de computación de atención de la salud y la experiencia en IA de Nvidia con los investigadores, científicos y plataformas abiertas de renombre mundial del Instituto Broad con un enfoque en tres áreas clave:
- Hacer que Nvidia Clara Parabricks esté disponible en la plataforma Terra: Parabricks, un conjunto de software acelerado por GPU para el análisis secundario de datos de secuenciación, ahora está disponible en seis nuevos workflows de Terra. Los usuarios ahora pueden analizar un genoma completo en solo una hora con Clara Parabricks, en comparación con las 24 horas en un entorno basado en CPU, y pueden reducir el costo de computación en más de la mitad.
- Desarrollo de grandes modelos de idiomas (LLM): Los investigadores desarrollarán modelos fundamentales para el ADN y el ARN, los componentes fundamentales de la vida, para comprender mejor la biología humana utilizando Nvidia BioNeMo, un framework de aplicaciones de IA que se anunció para grandes modelos de idiomas en biología.
- Llevar el deep learning mejorado al kit de herramientas de análisis genómico (GATK): Nvidia está contribuyendo con un nuevo modelo de deep learning directamente al kit de herramientas GATK del Instituto Broad , el estándar de la industria utilizado por más de 100,000 investigadores, que ayuda a identificar variantes genéticas asociadas con enfermedades. Esto ayudará a los investigadores en el descubrimiento de fármacos a desarrollar nuevas terapias.
El Instituto Broad tiene como objetivo permitir la próxima generación de investigación biomédica colaborativa al proporcionar una plataforma de cloud abierto que conecta a los investigadores tanto entre sí como con los conjuntos de datos y herramientas que necesitan para lograr avances científicos.
Grandes modelos de idiomas para estudiar enfermedades
El framework Nvidia BioNeMo incluye LLM previamente entrenados para proteínas y química que simplifican el entrenamiento, la inferencia y el escalado. BioNeMo es una extensión del framework Nvidia BioNeMo Megatron y es específico del dominio de la química, las proteínas y las secuencias de ADN/ARN.
BioNeMo permite a los desarrolladores entrenar e implementar eficazmente LLM de biología con miles de millones de parámetros.
Juntos, los equipos de ambas organizaciones se basarán en este trabajo, a fin de crear nuevos modelos para agregar a la colección BioNeMo y poner a disposición la plataforma Terra.
Software de Nvidia para la IA específica del dominio
Los workflows acelerados por GPU de Nvidia Parabricks proporcionan a los investigadores tiempos de respuesta más rápidos y costos más bajos para una amplia gama de análisis de datos genómicos. Para el workflow de línea germinal de mejores prácticas de GATK de Broad, hacer el análisis con Parabricks en GPU puede ser hasta 24 veces más rápido y con menos de la mitad del costo.
Los investigadores del Instituto Broad también obtendrán acceso a MONAI, un framework de deep learning de código abierto para la IA para la generación de imágenes médicas, así como a Nvidia Rapids, un kit de herramientas de ciencia de datos acelerado por GPU para una preparación de datos más rápida, que se puede utilizar para el análisis genómico de una sola célula.
Deja un comentario