NVIDIA lança Nemotron‑3 Ultra — um LLM para otimizar agentes de longa duração

Tecnologias2026-06-17, 11:38

A NVIDIA introduziu um modelo de linguagem grande (LLM) chamado Nemotron‑3 Ultra, projetado para otimizar o desempenho de agentes de longo prazo.

Agentes de longo prazo são sistemas de IA que devem reter contexto e tomar decisões durante sessões estendidas.

Principais recursos: ⏺ O Nemotron‑3 Ultra oferece cinco vezes mais throughput do que modelos comparáveis e reduz os custos de execução de tarefas de agentes em até 30%. O modelo também usa Previsão de Multi‑tokens (MTP), que acelera a geração de texto prevendo múltiplos tokens futuros de uma vez. ⏺ Treinado usando o método Multi‑Teacher On‑Policy Distillation (MOPD), onde o modelo aprende com mais de dez modelos professores especialistas. Isso permite que o Nemotron‑3 Ultra melhore continuamente suas capacidades e se especialize em diferentes domínios. ⏺Suporta comprimentos de contexto de até 1 milhão de tokens graças à sua arquitetura Hybrid Mamba‑Transformer.

A NVIDIA também lançou dois novos modelos Nemotron: 🛑Nemotron 3.5 Content Safety — um modelo aberto e eficiente de 4B (com 4 bilhões de parâmetros) projetado para detectar conteúdo prejudicial ou restrito. Suporta 12 idiomas e 23 categorias de segurança. 🛑Nemotron 3.5 ASR — um modelo para Reconhecimento Automático de Fala (ASR) em streaming. Suporta mais de 40 idiomas e oferece latência abaixo de 100 milissegundos.

A NVIDIA lançou não apenas o modelo, mas também todos os ativos relacionados — pesos, conjuntos de dados de treinamento e

Fornecedor

Nvidia

Produto

Nemotron 3.5 Asr

Nemotron 3.5 Content Safety

Nemotron‑3 Ultra