Nemotron 3 Super 120B · NVIDIA
NVIDIA Nemotron 3 Super es un modelo MoE híbrido Mamba-Transformer de 120B parámetros (solo 12B activos por token) para máxima eficiencia y precisión en aplicaciones multi-agente complejas. Contexto 1M tokens.
Sobre Nemotron 3 Super 120B
NVIDIA Nemotron 3 Super es un modelo MoE híbrido Mamba-Transformer de 120B parámetros (solo 12B activos por token) para máxima eficiencia y precisión en aplicaciones multi-agente complejas. Contexto 1M tokens.
Para qué sobresale: MoE híbrido eficiente · Multi-agente · Contexto 1M tokens.
Cómo usar Nemotron 3 Super 120B
-
1
Escribe o sube
Escribe lo que quieres en el cuadro de arriba — o sube el archivo si la herramienta lo pide.
-
2
Genera
Click en el botón principal. Esperar 2-30 segundos según el modelo y el tamaño del input.
-
3
Descarga o comparte
Descarga el resultado o comparte el link directo. Sin marca de agua, listo para usar.
Preguntas frecuentes
¿Cuánto cuesta usar Nemotron 3 Super 120B?
Nemotron 3 Super 120B es uno de los modelos gratuitos del catálogo. Cada uso descuenta 10 tokens de tu pool, pero los modelos abiertos como Nemotron 3 Super 120B no nos cuestan a nosotros, así que el rate-limit es generoso. Una cuenta gratis viene con 500 tokens iniciales y 25 más cada día — normalmente no llegas a tocar la tarjeta.
¿Hay límite de uso para Nemotron 3 Super 120B?
No hay cuota mensual fija para Nemotron 3 Super 120B en la cuenta gratis — el límite real es el rate por minuto/hora, no por mes. Los anónimos están limitados por IP; con cuenta puedes hacer mucho más volumen. Si llegas a 500+25 tokens y necesitas más, un plan Pro a $9/mes lo cubre.
¿Qué hace especial a Nemotron 3 Super 120B?
NVIDIA afina sus modelos para inferencia rápida en su propio hardware optimizado — bueno en preguntas técnicas y razonamiento. Sus puntos fuertes concretos son: moe híbrido eficiente, multi-agente y contexto 1m tokens.
¿Qué tan rápido responde Nemotron 3 Super 120B?
Nemotron 3 Super 120B tiene velocidad equilibrada: 5-15 segundos por respuesta — ni el más rápido ni el más lento del catálogo. El tiempo real depende también de la longitud del prompt y de la carga del datacenter — modelos con contexto enorme tardan más cuando metes textos muy largos.
¿Cómo uso Nemotron 3 Super 120B en ia.gratis?
Puedes usar Nemotron 3 Super 120B desde /chat/ seleccionando Nemotron 3 Super 120B en el picker, o vía la API REST con `model=nemotron-3-super` en el cuerpo del POST. Resumen rápido: moE híbrido de 120B con 1M de contexto. El identificador interno del modelo es `nemotron-3-super` — útil cuando integres por API.