A Google lançou sem alarde um novo aplicativo somente para dispositivos com iOS. A ferramenta se chama Google AI Edge Eloquent e é capaz de fazer transcrições para texto de áudios falados pelo usuário.
O recurso é um dos vários experimentos da empresa com inteligência artificial (IA) e utiliza a tecnologia não só para melhor identificar a fala e realizar a conversão, mas também otimizar esse conteúdo.
smart_display
Nossos vídeos em destaque
Como funciona o novo app da Google
De acordo com a companhia, a ideia é que você “fale naturalmente” e seja compreendido pela plataforma. Ela é baseada no modelo de linguagem Gemma e pode funcionar de forma offline nesse recurso mais básico — ou seja, ele baixa os modelos de linguagem e roda eles direto no aparelho, sem exigir uma conexão com a internet.
- Após fazer a gravação de um áudio (e não é possível subir arquivos já prontos), o app copia automaticamente o conteúdo transcrito para a Área de transferência, para que você possa colar o material rapidamente em outra plataforma.
- Na transcrição, a IA elimina imperfeições do discurso e faz uma edição em tempo real, removendo pausas e expressões que não fazem parte do conteúdo, como um “é” prolongado, por exemplo;
- O aplicativo também conta com alguns recursos que podem ser usados de forma online e após a transcrição, como pedir que a IA separe apenas os pontos-chave, faça um resumo e converta o conteúdo em uma versão mais longa ou curta;
- Os dados exibidos pelo aplicativo incluem estatísticas como velocidade de palavras faladas por minuto e total de palavras do conteúdo. Ele ainda exibe um histórico contendo todo o discurso identificado;
- O usuário pode personalizar o serviço com algumas palavras adicionadas manualmente, como expressões do vocabulário da pessoa que talvez a IA não reconhecesse por padrão, e ativar a ferramenta direto a partir de um atalho do teclado virtual do aparelho.
Por enquanto, o Google AI Edge Eloquent pode ser usado gratuitamente e sem limites, ou seja, ainda sem exigir assinaturas avulsas ou alguma categoria dos pacotes de serviços da própria empresa. Até o momento, o inglês é o único idioma disponível para uso, o que deve mudar com o passar do tempo.
Não há informações oficiais sobre o lançamento do aplicativo para Android, embora até mesmo o site dele traga um botão que não funciona para a Google Play Store — o que indica uma possível disponibilização em breve. Uma versão para macOS deve chegar nas próximas semanas.
Conhece o Gemini Nano 4, a nova IA da Google que roda direto no celular? Saiba mais sobre ele nesta matéria!
