NOVA FM 96.1
Advertisement
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Viés de confirmação, uma tendência que pode fortalecer as fake news

    Viés de confirmação, uma tendência que pode fortalecer as fake news

    Adoção tardia: conheça a história do cabeleireiro que adotou 4 irmãos

    Adoção tardia: conheça a história do cabeleireiro que adotou 4 irmãos

    Novo centro da Fiocruz terá foco em tratamento avançado contra câncer

    Novo centro da Fiocruz terá foco em tratamento avançado contra câncer

    Fim de semana será marcado por temporais em áreas do Sul e do Sudeste

    Fim de semana será marcado por temporais em áreas do Sul e do Sudeste

    Concurso da ONU premia curta-metragens sobre direitos humanos

    Concurso da ONU premia curta-metragens sobre direitos humanos

    IR 2026: chance de inclusão no primeiro lote acaba neste domingo

    Receita já recebeu 77% das declarações de imposto de renda previstas

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
  • Login
  • Registrar
Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Viés de confirmação, uma tendência que pode fortalecer as fake news

    Viés de confirmação, uma tendência que pode fortalecer as fake news

    Adoção tardia: conheça a história do cabeleireiro que adotou 4 irmãos

    Adoção tardia: conheça a história do cabeleireiro que adotou 4 irmãos

    Novo centro da Fiocruz terá foco em tratamento avançado contra câncer

    Novo centro da Fiocruz terá foco em tratamento avançado contra câncer

    Fim de semana será marcado por temporais em áreas do Sul e do Sudeste

    Fim de semana será marcado por temporais em áreas do Sul e do Sudeste

    Concurso da ONU premia curta-metragens sobre direitos humanos

    Concurso da ONU premia curta-metragens sobre direitos humanos

    IR 2026: chance de inclusão no primeiro lote acaba neste domingo

    Receita já recebeu 77% das declarações de imposto de renda previstas

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
Ops, sem resultados...
Ver Todos Os Resultados
NOVA FM 96.1
Ops, sem resultados...
Ver Todos Os Resultados
Home Mundo Tech

IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Cristiane Arruda Por Cristiane Arruda
4 meses Atrás
Por Mundo Tech
A A
0
IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

Share on FacebookShare on Twitter


Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

O melhor da tecnologia está no nosso canal no WhatsApp

Resumo
  • O estudo da Mercor mostra que agentes de IA, como os da OpenAI e Google, não conseguem realizar mais de 30% das tarefas de profissionais humanos especializados.
  • O GPT-5.2 da OpenAI obteve 27,3% de acerto em tarefas de analistas de investimentos, enquanto o Gemini 3 Flash do Google liderou em tarefas de advogados com 25,9%.
  • O benchmark APEX-Agents usa prompts de profissionais reais, tornando as tarefas complexas e revelando dificuldades dos agentes em reunir informações de diferentes domínios.

Uma nova pesquisa revelou que agentes de inteligência artificial ainda não conseguem realizar o trabalho de profissionais humanos como consultores de gestão, analistas de investimentos e advogados corporativos. Os modelos disponíveis atualmente não acertam mais do que 30% das tarefas.

O estudo foi realizado pela empresa de recrutamento de profissionais e treinamento de dados Mercor. Seu trabalho resultou em um novo benchmark, chamado AI Productivity Index for Agents, ou APEX-Agents, para simplificar.

Nos testes envolvendo o trabalho de um analista de investimentos, o melhor resultado foi do GPT-5.2, da OpenAI, com 27,3% de acerto. Esse modelo também lidera o ranking de consultoria de gestão, com 22,7% de respostas corretas. E nos testes com tarefas de advogados, o Gemini 3 Flash, do Google, fica no topo, com 25,9%.

Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste "Investment banking analyst (Pass@1)", os líderes são "GPT-5.2 (High)" e "GPT-5 (High)" com 27,3%, seguidos por "Gemini 3 Flash (High)" (26,7%), "Claude Opus 4.5 (High)" (21,6%), "Gemini 3 Pro (High)" (18,8%), "Grok 4" (17,0%), "GPT-OSS-120B (High)" (2,7%) e "Kimi K2 Thinking" (1,2%). Em "Management consultant (Pass@1)": "GPT-5.2 (High)" (22,7%), "Gemini 3 Flash (High)" (19,3%), "Claude Opus 4.5 (High)" (13,2%), "Gemini 3 Pro (High)" (12,4%), "GPT-5 (High)" (12,3%), "Grok 4" (12,0%), "GPT-OSS-120B (High)" (3,5%) e "Kimi K2 Thinking" (2,9%). Em "Corporate lawyer (Pass@1)": "Gemini 3 Flash (High)" (25,9%), "Gemini 3 Pro (High)" (23,9%), "Claude Opus 4.5 (High)" (20,2%), "GPT-5.2 (High)" (18,9%), "Grok 4" (16,5%), "GPT-5 (High)" (15,3%), "Kimi K2 Thinking" (8,0%) e "GPT-OSS-120B (High)" (7,8%).Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste
Nenhum modelo alcançou 30% em qualquer uma das três tarefas apresentadas (imagem: reprodução)

Por que os resultados são tão ruins?

Uma das diferenças do APEX-Agents para outros benchmarks é que o teste envolve prompts enviados por profissionais de verdade — e, em grande parte dos casos, os agentes de IA estão trazendo respostas erradas, ou mesmo não trazendo nenhuma resposta.

POSTAGENS RELACIONADAS

Governo e produtores divergem sobre combate à poluição hídrica

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

“Uma das grandes mudanças desse benchmark é que nós construímos um ambiente completo, modelado de acordo com serviços profissionais”, explica Brendan Foody, CEO da Mercor e um dos responsáveis pelo estudo.

Essa escolha torna as tarefas muito mais complexas do que as de outros testes, e é aí que mora o problema: os agentes tropeçam na hora de reunir informações que estão espalhadas em diferentes domínios. “Nós trabalhamos sem que alguém nos dê todo o contexto em um único lugar. Na vida real, você opera com o Slack, o Google Drive e todas essas ferramentas”, explica Foody.

Como os agentes de IA foram testados?

As questões do teste foram disponibilizadas publicamente — e são bastante difíceis. Uma delas, por exemplo, envolve analisar um caso em que uma empresa enviou dados pessoais de cidadãos europeus para servidores nos Estados Unidos, considerando as políticas da própria companhia e a legislação de privacidade da União Europeia.

Como observa o TechCrunch, é um trabalho difícil até mesmo para um humano especializado. Os pesquisadores, entretanto, acham que é necessário ver como os agentes de IA se saem em cenários assim, já que isso é o que determinaria se eles são capazes de substituir um trabalhador.

“Acho que esse é o assunto mais importante na economia. O benchmark reflete bem o trabalho real que essas pessoas fazem”, diz o CEO da Mercor.

GoogleInteligência Artificial (IA)OpenAIGoogle DriveSlackEstados Unidos (EUA)

Créditos TecnoBlog
*conteúdo reproduzido para propagação da informação. Todos os direitos de imagem, conteúdo, texto e pesquisa são pertencentes ao TecnoBlog. Caso queria que seja encerrado a publicação, envie email para jornalismo@novafm96.com.br para retirar do ar.



TAGS: conseguedizestudofazerhumanomaisnãoTecnoblogtrabalho
Postagem anterior

Resultado da Loteria Federal 6036 de sábado (24/01/2026)

Próximo Post

Microsoft combina Paint e inteligência artificial para criar livros de colorir • Tecnoblog

APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1
  • TENDÊNCIAS
  • COMENTÁRIOS
  • ÚLTIMAS
Flamengo revisa estratégia e leva principais jogadores ao clássico

Flamengo revisa estratégia e leva principais jogadores ao clássico

Fazendeiro brasileiro é morto em emboscada no Paraguai

Fazendeiro brasileiro é morto em emboscada no Paraguai

Monitor Samsung Odyssey G5 com tela curva de 27" tem 23% OFF em até 18x • Tecnoblog

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

Governo Municipal amplia investimentos na educação com autorização de nova obra

Governo Municipal amplia investimentos na educação com autorização de nova obra

São Paulo é o estado brasileiro com melhores serviços municipais de saneamento

0

2026 terá 13 feriados bancários nacionais; agências não abrem ao público

0

Resultado da lotofácil 3589 de sexta-feira (16/01/2026)

0

Goiás lança plano para ampliar setor florestal e atrair novas indústrias

0
João Fonseca estreia com vitória no torneio de Roland Garros

João Fonseca estreia com vitória no torneio de Roland Garros

Ícone de Busca

Gilmar reage à crise do Master e aponta Faria Lima

Palmeiras vence Bragantino e dorme na liderança do Brasileiro Feminino

Palmeiras vence Bragantino e dorme na liderança do Brasileiro Feminino

Ícone de Busca

Riscos da redução da jornada de trabalho no Brasil

POSTAGENS RECENTES

João Fonseca estreia com vitória no torneio de Roland Garros

João Fonseca estreia com vitória no torneio de Roland Garros

Ícone de Busca

Gilmar reage à crise do Master e aponta Faria Lima

Palmeiras vence Bragantino e dorme na liderança do Brasileiro Feminino

Palmeiras vence Bragantino e dorme na liderança do Brasileiro Feminino

Ícone de Busca

Riscos da redução da jornada de trabalho no Brasil

  • SOBRE
  • AVISO LEGAL
  • POLÍTICA & PRIVACIDADE
  • FALE CONOSCO
  • QUEM SOMOS
  • EXPEDIENTE
  • PLAY(Ao Vivo)
REDAÇÃO +55 (67) 98111-7869

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - PORTAL NOVA FM 96.1

Bem-vindo de volta!

Faça login na sua conta abaixo

Esqueceu a senha? Cadastre-se

Crie uma nova conta para fazer parte do nosso portal

Ou

Preencha o formulário abaixo para se cadastrar no portal

Todos os campos são obrigatórios Login

Recupere sua senha

Digite seu nome de usuário ou endereço de e-mail para redefinir sua senha

Login

Adicionar Nova Lista de Reprodução

Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
  • Fale Conosco
  • Quem Somos
  • Expediente

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - PORTAL NOVA FM 96.1