A incrível evolução da IA desde novembro de 2022

A OpenAI anunciou na segunda-feira, 13 de maio, a primeira grande atualização do ChatGPT gratuito desde o seu lançamento em novembro de 2022.

A incrível evolução da IA desde novembro de 2022
Imagem gerada pela IA DALL-E 3

Hora do Papo Bon sobre IA (Inteligência Artificial). Agradeço sua leitura e vamos fazer valer o seu tempo.

Neste artigo exploraremos as novas capacidades do ChatGPT anunciadas esta semana, e como elas podem mudar o modo da nossa interação com a inteligência artificial.

Atualizações do ChatGPT | A OpenAI anunciou na segunda-feira, 13 de maio, a primeira grande atualização do ChatGPT gratuito desde o seu lançamento em novembro de 2022. A plataforma passará a receber instruções em áudio, realizar análises de dados, criará gráficos, se lembrará de conversas com o usuário, realizará pesquisas na internet e possuirá a capacidade de raciocínio do modelo mais avançado da OpenAI, o GPT-4.

Acesso ampliado ao ChatGPT-4 | Anteriormente, o ChatGPT gratuito estava limitado ao GPT-3.5. Em pouco tempo a versão gratuita terá acesso ao GPT-4. As mudanças estão previstas para as próximas semanas, sem data especificada. Os assinantes do plano pago ChatGPT Plus, vendido por US$ 20 (pouco mais de R$ 100,00) mensais, terão a oportunidade de interagir cinco vezes mais com o GPT-4 do que os demais usuários.

Avanço técnico | Segundo Mira Murati, diretora de tecnologia da empresa, a OpenAI conseguiu aumentar o público com acesso ao seu modelo mais potente graças a um avanço técnico: a criação do GPT-4o, uma rede neural cinco vezes mais rápida que o GPT-4 original, com as mesmas capacidades de resposta, mas que requer menos processamento de dados. Com a evolução, o custo para rodar o novo modelo caiu cerca de 50%.

Esclarecimento sobre o nome | Na nova nomenclatura, ChatGPT-4o, a letra “o” vem de “omni”, prefixo de origem latina que significa tudo, todos ou em todos os lugares. Por exemplo, omnipresente significa “presente em todos os lugares”.

Diálogos por voz em tempo real | Além de expandir o acesso ao GPT-4 para as pessoas que não pagam, a OpenAI afirma que seu novo modelo também permite diálogos por voz em tempo real, uma vez que o GPT-4o tem um atraso menor entre o pedido e a resposta, a chamada latência. O modelo responde a uma pergunta de áudio com um atraso de 0,32 centésimos de segundo, tempo similar à resposta de um humano, de acordo com a OpenAI. O modo de voz tinha latência entre 2,8 e 5,4 segundos antes do lançamento do GPT-4.

Riscos de desinformação | A empresa reconhece que a função de conversa em áudio da nova tecnologia representa um risco de desinformação, especialmente em ano eleitoral. Teremos eleições municipais em outubro aqui no Brasil. A OpenAI afirma que a plataforma está restrita a vozes pré-configuradas, para impedir a criação de deepfakes (vídeos e áudios feitos para copiar a identidade de uma pessoa). Além disso, a empresa lançará uma plataforma para identificar áudios sintéticos gerados pelo GPT-4o.

Melhorias no desempenho | O GPT-4o também melhorou sua performance em 50 idiomas, incluindo a língua portuguesa. Programadores já podem acessar o novo modelo de linguagem desde a segunda, dia 13.

Demonstração ao vivo | Na demonstração das novas capacidades do ChatGPT, com a câmera do celular ligada, a IA foi capaz de resolver uma equação manuscrita em uma folha de papel sulfite. Uma outra capacidade foi a contação de histórias com variação no tom de voz. “Nosso modelo foi preparado para captar nuances na voz do usuário e reproduzir os sentimentos mais adequados à situação”, disse Mark Chen, chefe de pesquisas de ponta da OpenAI.

Conversa entre IAs | O chefe de pesquisas da OpenAI, Mark Chen, apresentou um diálogo ao vivo com a nova versão do ChatGPT. Foram colocados dois celulares, um ao lado do outro, cada um com uma IA ligada. Após breve instrução, as IAs conversaram entre si. Uma utilizava voz feminina e outra voz masculina. A IA com voz feminina mostrou ser capaz de cantar.

A apresentação foi ao vivo, após o Google receber críticas por editar vídeo de demonstração de seu modelo de inteligência artificial Gemini, para fazê-lo parecer mais impressionante.

Foco em auxiliar as pessoas | Com o anúncio das inovações, a OpenAI parece continuar focada na criação de uma inteligência artificial voltada para auxiliar as pessoas em tarefas rotineiras. Na apresentação foram utilizadas, várias vezes, palavras como “produtividade” e “transformação a partir da tecnologia”.

Versão para desktop | Donos de computadores da Apple também poderão baixar uma versão do ChatGPT para desktop, que vai funcionar como um assistente, como já acontece com o Copilot do Windows. Com a aplicação, é possível, por exemplo, acionar o ChatGPT ao pressionar “option + espaço”. A empresa não divulgou prazo para levar esta opção aos usuários do Windows.

Semana que vem tem mais.

Loading...

P.S. Papo Bon, com ene, é uma corruptela com o nome Bonassa.

Fábio Bonassa é radialista e jornalista (MTb 81674/SP) e escreve sobre IA (Inteligência Artificial)