multimodalNemotronlocal
Modelo único para tudo ou pipeline de especialistas: o trade-off que ninguém resolve
A Nvidia lançou o Nemotron 3 Nano Omni: um modelo que processa texto, imagem, vídeo e áudio ao mesmo tempo, com receitas de treinamento abertas e documentadas. Isso levanta uma decisão arquitetural real para quem constrói agentes multimodais.
4 min de leitura
Ler artigo