A OpenAI introduziu novos recursos de processamento de voz e imagem para o ChatGPT, permitindo que os usuários conversem com o chatbot e enviem fotos para a IA analisar. A atualização expande a ferramenta além das interações baseadas em texto, adicionando uma camada de conveniência que pode mudar a forma como as pessoas usam o serviço no dia a dia.
O que os novos recursos fazem
Com a capacidade de voz, os usuários agora podem falar diretamente com o ChatGPT em vez de digitar. O sistema reconhece a fala natural e responde em tom conversacional. Para o processamento de imagens, as pessoas podem tirar uma foto ou enviar uma da galeria, e a IA descreverá o que vê, identificará objetos ou responderá perguntas sobre o conteúdo. A empresa afirma que ambos os recursos funcionam nas versões desktop e móvel do ChatGPT.
Como isso muda a experiência do usuário
Para alguém cozinhando o jantar e precisando de uma substituição rápida, a entrada por voz significa que não precisa parar e digitar. Um viajante pode tirar uma foto de uma placa de rua estrangeira e pedir ao chatbot para traduzir ou explicar. A combinação de voz e visão aproxima o ChatGPT de um assistente mãos-livres que entende o contexto tanto de palavras faladas quanto de dicas visuais. Os recursos estão sendo lançados para os usuários nas próximas semanas, embora a OpenAI não tenha especificado uma data exata para disponibilidade total.
Onde a tecnologia se encaixa
Outros chatbots de IA já oferecem entrada por voz ou reconhecimento de imagem, mas integrar ambos em um único produto amplamente utilizado como o ChatGPT é um passo notável. A OpenAI tem adicionado gradualmente capacidades multimodais — no início deste ano, introduziu a capacidade de gerar imagens com o DALL-E, e agora está trazendo a percepção na direção oposta. A empresa enquadra a atualização como uma forma de tornar a IA mais intuitiva, permitindo que as pessoas se comuniquem da maneira natural: falando e mostrando, em vez de apenas digitando.
O lançamento começa primeiro com os assinantes do ChatGPT Plus, com uma expansão para o nível gratuito esperada posteriormente. Nenhum cronograma exato foi fornecido para quando todos os usuários terão acesso.



