NOVA FM 96.1
Advertisement
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Lula e Narendra Modi reafirmam fortalecimento de parceria Brasil-Índia

    Lula e Narendra Modi reafirmam fortalecimento de parceria Brasil-Índia

    Caso Master: BRB apresenta plano ao BC para recomposição de capital

    Governo do DF faz proposta de uso de imóveis como garantia ao BRB

    CNU 2: prazo para confirmar interesse nas vagas termina segunda (23)

    CNU 2: prazo para confirmar interesse nas vagas termina segunda (23)

    Bloco Quizomba celebra o verde e a sustentabilidade nas ruas do Rio

    Celular Seguro: bloqueio de aparelhos cresceu 40% no Carnaval 2026

    Rio recebe Desfile das Campeãs do Carnaval neste sábado

    Rio recebe Desfile das Campeãs do Carnaval neste sábado

    Lula diz que ampliar acordo Mercosul-Índia é prioridade para o Brasil

    Lula diz que ampliar acordo Mercosul-Índia é prioridade para o Brasil

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Lula e Narendra Modi reafirmam fortalecimento de parceria Brasil-Índia

    Lula e Narendra Modi reafirmam fortalecimento de parceria Brasil-Índia

    Caso Master: BRB apresenta plano ao BC para recomposição de capital

    Governo do DF faz proposta de uso de imóveis como garantia ao BRB

    CNU 2: prazo para confirmar interesse nas vagas termina segunda (23)

    CNU 2: prazo para confirmar interesse nas vagas termina segunda (23)

    Bloco Quizomba celebra o verde e a sustentabilidade nas ruas do Rio

    Celular Seguro: bloqueio de aparelhos cresceu 40% no Carnaval 2026

    Rio recebe Desfile das Campeãs do Carnaval neste sábado

    Rio recebe Desfile das Campeãs do Carnaval neste sábado

    Lula diz que ampliar acordo Mercosul-Índia é prioridade para o Brasil

    Lula diz que ampliar acordo Mercosul-Índia é prioridade para o Brasil

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
Ops, sem resultados...
Ver Todos Os Resultados
NOVA FM 96.1
Ops, sem resultados...
Ver Todos Os Resultados
Home Mundo Tech

IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Aldemir Oliveira Aldeia Por Aldemir Oliveira Aldeia
26.01.2026
Por Mundo Tech
0
IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

221
SHARES
738
VIEWS
Share on FacebookShare on Twitter


Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

O melhor da tecnologia está no nosso canal no WhatsApp

Resumo
  • O estudo da Mercor mostra que agentes de IA, como os da OpenAI e Google, não conseguem realizar mais de 30% das tarefas de profissionais humanos especializados.
  • O GPT-5.2 da OpenAI obteve 27,3% de acerto em tarefas de analistas de investimentos, enquanto o Gemini 3 Flash do Google liderou em tarefas de advogados com 25,9%.
  • O benchmark APEX-Agents usa prompts de profissionais reais, tornando as tarefas complexas e revelando dificuldades dos agentes em reunir informações de diferentes domínios.

Uma nova pesquisa revelou que agentes de inteligência artificial ainda não conseguem realizar o trabalho de profissionais humanos como consultores de gestão, analistas de investimentos e advogados corporativos. Os modelos disponíveis atualmente não acertam mais do que 30% das tarefas.

O estudo foi realizado pela empresa de recrutamento de profissionais e treinamento de dados Mercor. Seu trabalho resultou em um novo benchmark, chamado AI Productivity Index for Agents, ou APEX-Agents, para simplificar.

Nos testes envolvendo o trabalho de um analista de investimentos, o melhor resultado foi do GPT-5.2, da OpenAI, com 27,3% de acerto. Esse modelo também lidera o ranking de consultoria de gestão, com 22,7% de respostas corretas. E nos testes com tarefas de advogados, o Gemini 3 Flash, do Google, fica no topo, com 25,9%.

Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste "Investment banking analyst (Pass@1)", os líderes são "GPT-5.2 (High)" e "GPT-5 (High)" com 27,3%, seguidos por "Gemini 3 Flash (High)" (26,7%), "Claude Opus 4.5 (High)" (21,6%), "Gemini 3 Pro (High)" (18,8%), "Grok 4" (17,0%), "GPT-OSS-120B (High)" (2,7%) e "Kimi K2 Thinking" (1,2%). Em "Management consultant (Pass@1)": "GPT-5.2 (High)" (22,7%), "Gemini 3 Flash (High)" (19,3%), "Claude Opus 4.5 (High)" (13,2%), "Gemini 3 Pro (High)" (12,4%), "GPT-5 (High)" (12,3%), "Grok 4" (12,0%), "GPT-OSS-120B (High)" (3,5%) e "Kimi K2 Thinking" (2,9%). Em "Corporate lawyer (Pass@1)": "Gemini 3 Flash (High)" (25,9%), "Gemini 3 Pro (High)" (23,9%), "Claude Opus 4.5 (High)" (20,2%), "GPT-5.2 (High)" (18,9%), "Grok 4" (16,5%), "GPT-5 (High)" (15,3%), "Kimi K2 Thinking" (8,0%) e "GPT-OSS-120B (High)" (7,8%).Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste
Nenhum modelo alcançou 30% em qualquer uma das três tarefas apresentadas (imagem: reprodução)

Por que os resultados são tão ruins?

Uma das diferenças do APEX-Agents para outros benchmarks é que o teste envolve prompts enviados por profissionais de verdade — e, em grande parte dos casos, os agentes de IA estão trazendo respostas erradas, ou mesmo não trazendo nenhuma resposta.

“Uma das grandes mudanças desse benchmark é que nós construímos um ambiente completo, modelado de acordo com serviços profissionais”, explica Brendan Foody, CEO da Mercor e um dos responsáveis pelo estudo.

Essa escolha torna as tarefas muito mais complexas do que as de outros testes, e é aí que mora o problema: os agentes tropeçam na hora de reunir informações que estão espalhadas em diferentes domínios. “Nós trabalhamos sem que alguém nos dê todo o contexto em um único lugar. Na vida real, você opera com o Slack, o Google Drive e todas essas ferramentas”, explica Foody.

Como os agentes de IA foram testados?

As questões do teste foram disponibilizadas publicamente — e são bastante difíceis. Uma delas, por exemplo, envolve analisar um caso em que uma empresa enviou dados pessoais de cidadãos europeus para servidores nos Estados Unidos, considerando as políticas da própria companhia e a legislação de privacidade da União Europeia.

Como observa o TechCrunch, é um trabalho difícil até mesmo para um humano especializado. Os pesquisadores, entretanto, acham que é necessário ver como os agentes de IA se saem em cenários assim, já que isso é o que determinaria se eles são capazes de substituir um trabalhador.

“Acho que esse é o assunto mais importante na economia. O benchmark reflete bem o trabalho real que essas pessoas fazem”, diz o CEO da Mercor.

GoogleInteligência Artificial (IA)OpenAIGoogle DriveSlackEstados Unidos (EUA)

Créditos TecnoBlog
*conteúdo reproduzido para propagação da informação. Todos os direitos de imagem, conteúdo, texto e pesquisa são pertencentes ao TecnoBlog. Caso queria que seja encerrado a publicação, envie email para jornalismo@novafm96.com.br para retirar do ar.



TAGS: conseguedizestudofazerhumanomaisnãoTecnoblogtrabalho
Postagem anterior

Resultado da Loteria Federal 6036 de sábado (24/01/2026)

Próximo Post

Microsoft combina Paint e inteligência artificial para criar livros de colorir • Tecnoblog

Aldemir Oliveira Aldeia

Aldemir Oliveira Aldeia

Jornalista, Bacharel em Direito, Empresário

Próximo Post

Ceasas: Ministério cria comitê para tratar de legislação das centrais

APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1
  • TENDÊNCIAS
  • COMENTÁRIOS
  • ÚLTIMAS
Governo Municipal amplia investimentos na educação com autorização de nova obra

Governo Municipal amplia investimentos na educação com autorização de nova obra

18.01.2026
Economia: Cesta básica registra queda em todas as capitais no 2º semestre de 2025

Economia: Cesta básica registra queda em todas as capitais no 2º semestre de 2025

20.01.2026
Polícia apreende 121 kg de macarrão sem procedência

Polícia apreende 121 kg de macarrão sem procedência

27.01.2026
Flamengo revisa estratégia e leva principais jogadores ao clássico

Flamengo revisa estratégia e leva principais jogadores ao clássico

19.01.2026

São Paulo é o estado brasileiro com melhores serviços municipais de saneamento

0

2026 terá 13 feriados bancários nacionais; agências não abrem ao público

0

Resultado da lotofácil 3589 de sexta-feira (16/01/2026)

0

Goiás lança plano para ampliar setor florestal e atrair novas indústrias

0
Ministérios repudiam ato de machismo contra árbitra no Brasileirão

Ministérios repudiam ato de machismo contra árbitra no Brasileirão

22.02.2026
Ícone de Busca

México teve ajuda dos EUA em operação que matou “El Mencho”

22.02.2026
João Fonseca e Marcelo Melo garantem título de duplas do Rio Open

João Fonseca e Marcelo Melo garantem título de duplas do Rio Open

22.02.2026
Ícone de Busca

Quem é Tatiana Sampaio, pesquisadora que tenta curar paraplegia

22.02.2026

POSTAGENS RECENTES

Ministérios repudiam ato de machismo contra árbitra no Brasileirão

Ministérios repudiam ato de machismo contra árbitra no Brasileirão

22.02.2026
Ícone de Busca

México teve ajuda dos EUA em operação que matou “El Mencho”

22.02.2026
João Fonseca e Marcelo Melo garantem título de duplas do Rio Open

João Fonseca e Marcelo Melo garantem título de duplas do Rio Open

22.02.2026
Ícone de Busca

Quem é Tatiana Sampaio, pesquisadora que tenta curar paraplegia

22.02.2026
  • SOBRE
  • AVISO LEGAL
  • POLÍTICA & PRIVACIDADE
  • FALE CONOSCO
  • QUEM SOMOS
  • EXPEDIENTE
  • PLAY(Ao Vivo)
+55 (67) 99661-0961

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - CNPJ: 01.764.079/0001-90

Bem-vindo de volta!

Faça login na sua conta abaixo

Esqueceu a senha? Cadastre-se

Crie uma nova conta para fazer parte do nosso portal

Preencha o formulário abaixo para se cadastrar no portal

Todos os campos são obrigatórios Login

Recupere sua senha

Digite seu nome de usuário ou endereço de e-mail para redefinir sua senha

Login

Adicionar Nova Lista de Reprodução

Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
  • Fale Conosco
  • Quem Somos
  • Expediente

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - CNPJ: 01.764.079/0001-90