A Hermes começou a distribuir agentes de IA auto-evolutivos projetados para serem executados localmente em PCs com NVIDIA RTX e no sistema DGX Spark da empresa. O software utiliza os modelos Qwen 3.6 para oferecer o que a Hermes chama de desempenho incomparável, sem enviar dados para a nuvem.
O que os agentes fazem
Os agentes não são estáticos. Eles são projetados para se adaptar ao longo do tempo, aprendendo com as interações dos usuários e ajustando seu comportamento sem exigir atualizações manuais. Isso significa que um cliente executando um agente em uma máquina com RTX 4090 pode ver o agente se tornar mais rápido ou mais preciso em uma tarefa após algumas semanas de uso — tudo processado no próprio dispositivo.
A Hermes não detalhou todos os casos de uso, mas a empresa afirmou que os agentes podem lidar com fluxos de trabalho complexos que normalmente exigiriam uma conexão com servidor. Os modelos Qwen 3.6 são o motor: eles são otimizados para inferência local, o que reduz a latência e mantém dados sensíveis fora de redes externas.
Por que o processamento local é importante
Executar a IA inteiramente em uma máquina local elimina a necessidade de uma conexão com a internet. Isso é um grande diferencial para pessoas que trabalham com dados privados — registros financeiros, arquivos médicos ou código proprietário. Também significa que não há taxa de assinatura para computação em nuvem, embora os usuários ainda paguem pelo hardware antecipadamente.
A linha RTX da NVIDIA já inclui Tensor Cores para cargas de trabalho de IA. O DGX Spark, uma estação de trabalho compacta, é voltado para desenvolvedores que precisam de potência local robusta. Ao combinar os agentes da Hermes com essas máquinas, a empresa aposta em um futuro onde assistentes de IA vivem na sua mesa, não em um data center.
A conexão com Qwen 3.6
Qwen 3.6 é um conjunto de modelos de linguagem grandes da equipe Qwen da Alibaba. A Hermes não informou se os modelos foram ajustados ou usados prontos. Mas a afirmação de "desempenho local incomparável" sugere alguma personalização. Os modelos são conhecidos por benchmarks fortes em tarefas de raciocínio e codificação, o que pode explicar a escolha.
A competição no espaço de IA em dispositivos está esquentando. A Apple executa seus próprios modelos em Macs e iPhones. A Microsoft tem os PCs Copilot+. A abordagem da Hermes se diferencia por tornar os agentes auto-melhoráveis — um recurso que, se funcionar como anunciado, pode manter o software relevante por mais tempo do que um aplicativo estático típico.
O que ainda não está claro
A Hermes ainda não divulgou o preço dos agentes nem uma lista de GPUs RTX compatíveis. A empresa também não disse se os agentes funcionarão em hardware que não seja da NVIDIA. Por enquanto, a oferta está vinculada ao ecossistema da NVIDIA. Desenvolvedores e adotantes iniciais podem testar os agentes através do site da Hermes, mas a disponibilidade mais ampla ainda não foi anunciada.



