ChatGPT: novo estudo revela que chatbot está ficando burro. Entenda

Pesquisas recentes geraram uma discussão intrigante sobre a proficiência do ChatGPT, especialmente as versões GPT-3.5 e GPT-4.

No entanto, com uma mistura desconcertante de altos e baixos de desempenho entre março e junho, alguns se perguntam: “O ChatGPT está ficando mais burro?”

Atualizações do ChatGPT não superam as versões mais antigas

Acadêmicos conceituados da Universidade de Stanford e da Universidade da Califórnia, Berkeley, examinaram a proficiência do ChatGPT em várias tarefas. O ponto focal dessa avaliação abrangente foi a dramática inconsistência observada em seu desempenho ao longo de três meses.

A incongruência faz mais do que gerar questionamentos; ela ressalta a natureza da tecnologia e a necessidade de monitorar sua qualidade de forma consistente.

“Nossas descobertas mostram que o comportamento do “mesmo” [grande modelo de linguagem] serviço LLM pode mudar substancialmente em um período de tempo relativamente curto”, diz o relatório.

Mergulhando nos detalhes, as habilidades de resolução de problemas matemáticos do GPT-4 apresentaram uma queda chocante na proficiência ao identificar números primos.

De fato, as taxas de precisão caíram de louváveis 97,6% em março para alarmantes 2,4% em junho. Em contraste, seu antecessor, o GPT-3.5, apresentou uma melhora substancial no mesmo período, passando de 7,4% para 86,8%.

Os fortes contrastes confundem os especialistas do setor, já que seria de esperar que as versões mais recentes superassem seus antecessores. Isso levanta preocupações sobre como as “atualizações” e “melhorias” realmente afetam a capacidade da IA.

ChatGPT sofre de falta de explicação detalhada e geração de código

Quando questionada sobre questões delicadas, a pesquisa descrevia outro ângulo intrigante. O GPT-4 demonstrou uma redução significativa nas respostas diretas a consultas confidenciais de março a junho. Isso é indicativo de uma camada de segurança reforçada.

No entanto, houve um notável truncamento em suas explicações geradas ao se recusar a responder. Isso gerou especulações sobre se o modelo está errando por excesso de cautela em detrimento do engajamento e da clareza do usuário.

Apesar disos, o estudo também identificou pontos positivos, como uma área crucial em que o GPT-4 e, até certo ponto, o GPT-3.5, manifestaram melhorias marginais: o raciocínio visual. Embora as taxas gerais de sucesso tenham permanecido relativamente baixas, houve evidências de evolução em seu desempenho.

O que realmente se destaca é a imprevisibilidade dessa tecnologia. A proficiência de geração de código do GPT-4 exibiu um declínio na produção de código executável diretamente. Isso levanta bandeiras vermelhas para as indústrias que dependem desses modelos, pois as inconsistências podem causar estragos em ecossistemas de software maiores.

A complacência não pode ser permitida

A principal conclusão dessa análise aprofundada não são as flutuações no desempenho do GPT-4 e do GPT-3.5, mas a lição abrangente sobre a impermanência da eficiência da IA. Com os rápidos avanços tecnológicos, há uma suposição implícita de que os modelos mais novos superarão seus predecessores. Este estudo desafia essa mesma noção.

A mensagem para empresas e desenvolvedores fortemente investidos no ChatGPT é monitorar e avaliar esses modelos regularmente. À medida que a tecnologia de IA continua avançando, o estudo é um lembrete claro de que os avanços não são lineares.

A suposição de que o mais novo é invariavelmente melhor pode ser uma simplificação exagerada, uma noção que a comunidade de tecnologia precisa abordar de frente. O comportamento errático de GPT-4 e GPT-3.5 em questão de meses aumenta a urgência de permanecer vigilante, avaliar e recalibrar, garantindo que a tecnologia atenda ao seu propósito com proficiência consistente.

Não entendeu algum termo do universo Web3? Confira no nosso Glossário!
Quer se manter atualizado em tudo o que é relevante no mundo cripto? O BeInCrypto tem uma comunidade no Telegram em que você pode ler em primeira mão as notícias relevantes e conversar com outros entusiastas em criptomoedas. Confira!
Você também pode se juntar a nossas comunidades no Twitter (X), Instagram e Facebook.

Melhores plataformas de criptomoedas

BloFin Explorar

NEXO Explorar

EMCD Explorar

Bybit Explorar

KuCoin Explorar

Melhores plataformas de criptomoedas

BloFin Explorar

NEXO Explorar

EMCD Explorar

Bybit Explorar

KuCoin Explorar

Melhores plataformas de criptomoedas

Isenção de responsabilidade

Todas as informações contidas em nosso site são publicadas de boa fé e apenas para fins de informação geral. Qualquer ação que o leitor tome com base nas informações contidas em nosso site é por sua própria conta e risco.

Patrocionado Patrocionado

Anderson Mendes

LER BIO COMPLETA

Membro ativo da comunidade de criptoativos e economia em geral, Anderson é formado pela Universidade Positivo, e escreve sobre as principais notícias do mercado. Antes de entrar para a equipe brasileira do BeInCrypto, Anderson liderou projetos relacionados à trading, produção de notícias e conteúdos educacionais relacionados ao mundo cripto no sul do Brasil.

LER BIO COMPLETA

#Notícias de IA

NOTÍCIAS RELACIONADAS

Tecnologia Notícias

Cofundador da ViperX comenta ataque hacker ao Banco Central

1 Min.

4 dias atrás

Tecnologia Notícias

Bootcamp gratuito para Java e IA abre inscrições até 13 de julho

1 Min.

1 mês atrás

Tecnologia Notícias

Dubai lança tokenização de propriedades em blockchain no XRP Ledger

3 Min.

2 meses atrás

Tecnologia Notícias

Blockchain da Coinbase fará atualizações para bater de frente com a Solana

2 Min.

2 meses atrás

Tecnologia Notícias

Empresa brasileira usa blockchain pra detectar IA nas músicas

2 Min.

2 meses atrás

Resumo

Atualizações do ChatGPT não superam as versões mais antigas

ChatGPT sofre de falta de explicação detalhada e geração de código

A complacência não pode ser permitida