Elena Digital López

Optimiza el Rendimiento de Run NVIDIA Nemotron 3 Super en Amazon Bedrock

Nemotron 3 Super, un avanzado modelo híbrido de Mixture of Experts, ya está disponible como modelo completamente gestionado y sin servidor en Amazon Bedrock. Este nuevo lanzamiento se suma a los modelos Nemotron Nano ya accesibles en la misma plataforma, permitiendo a los desarrolladores beneficiarse de su arquitectura innovadora y de su capacidad para optimizar el rendimiento en aplicaciones de inteligencia artificial generativa.

El modelo Nemotron 3 Super, que se libera con pesos abiertos, datasets y recetas, ofrece a los desarrolladores la oportunidad de personalizar y desplegar el modelo en su propia infraestructura, mejorando así la privacidad y la seguridad. Este modelo destaca por su eficiencia de cómputo y precisión, lo que lo hace ideal para aplicaciones de múltiples agentes y sistemas de IA especializada.

Entre sus características técnicas, el Nemotron 3 Super presenta una arquitectura MoE con la inovadora arquitectura Hybrid Transformer-Mamba, que permite una eficiencia de rendimiento sin precedentes en su categoría. Con una capacidad de 120 mil millones de parámetros y un largo de contexto de hasta 256,000 tokens, el modelo admite múltiples idiomas, incluyendo inglés, español, francés y japonés, entre otros, y logra una alta precisión en tareas de razonamiento y en entornos multiculturales.

El modelo también implementa técnicas avanzadas como la predicción de múltiples tokens (MTP), que incrementa el rendimiento en secuencias de razonamiento largas, optimizando así la generación de respuestas complejas y estructuradas. Gracias a su uso de Latent MoE, puede invocar cuatro veces más expertos sin aumentar el costo del procesamiento, mejorando la especialización alrededor de estructuras semánticas sutiles y patrones de razonamiento.

Nemotron 3 Super abre la puerta a múltiples casos de uso en diversas industrias, abarcando desde el desarrollo de software hasta la ciberseguridad. Por ejemplo, puede acelerar el procesamiento de préstamos en finanzas, optimizar la gestión de inventario en comercio minorista, o ayudar en la triage de incidentes de seguridad.

Para aquellos interesados en comenzar a utilizar Nemotron 3 Super en Amazon Bedrock, se han simplificado los pasos iniciales. Solo es necesario acceder a la consola de Amazon Bedrock, seleccionar el modelo y comenzar a experimentar con sus capacidades.

La llegada de este modelo al mercado promete revolucionar la forma en que las organizaciones abordan la inteligencia artificial generativa, eliminando complicaciones en la gestión de infraestructura mientras se fomentan aplicaciones de razonamiento sofisticado que cumplen con los requerimientos de rendimiento y versatilidad que la era digital demanda.
vía: AWS machine learning blog

Scroll al inicio