NOVA FM 96.1
Advertisement
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Governo zera imposto federal para compras internacionais de até US$ 50

    Governo zera imposto federal para compras internacionais de até US$ 50

    Prazo para transferir recursos esquecidos ao FGO termina hoje

    Prazo para transferir recursos esquecidos ao FGO termina hoje

    Fibromialgia afeta entre 2% e 3% da população brasileira

    Fibromialgia afeta entre 2% e 3% da população brasileira

    Ministro Nunes Marques toma posse como presidente do TSE

    Ministro Nunes Marques toma posse como presidente do TSE

    Ministro da Fazenda defende na Câmara fim da escala 6x1

    Ministro da Fazenda defende na Câmara fim da escala 6×1

    Ancelotti diz que Brasil pode competir com melhores equipes do mundo

    CBF envia à Fifa pré-lista para Copa do Mundo com 55 jogadores

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
  • Login
  • Registrar
Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Governo zera imposto federal para compras internacionais de até US$ 50

    Governo zera imposto federal para compras internacionais de até US$ 50

    Prazo para transferir recursos esquecidos ao FGO termina hoje

    Prazo para transferir recursos esquecidos ao FGO termina hoje

    Fibromialgia afeta entre 2% e 3% da população brasileira

    Fibromialgia afeta entre 2% e 3% da população brasileira

    Ministro Nunes Marques toma posse como presidente do TSE

    Ministro Nunes Marques toma posse como presidente do TSE

    Ministro da Fazenda defende na Câmara fim da escala 6x1

    Ministro da Fazenda defende na Câmara fim da escala 6×1

    Ancelotti diz que Brasil pode competir com melhores equipes do mundo

    CBF envia à Fifa pré-lista para Copa do Mundo com 55 jogadores

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
Ops, sem resultados...
Ver Todos Os Resultados
NOVA FM 96.1
Ops, sem resultados...
Ver Todos Os Resultados
Home Mundo Tech

IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Cristiane Arruda Por Cristiane Arruda
4 meses Atrás
Por Mundo Tech
A A
0
IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

Share on FacebookShare on Twitter


Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

O melhor da tecnologia está no nosso canal no WhatsApp

Resumo
  • O estudo da Mercor mostra que agentes de IA, como os da OpenAI e Google, não conseguem realizar mais de 30% das tarefas de profissionais humanos especializados.
  • O GPT-5.2 da OpenAI obteve 27,3% de acerto em tarefas de analistas de investimentos, enquanto o Gemini 3 Flash do Google liderou em tarefas de advogados com 25,9%.
  • O benchmark APEX-Agents usa prompts de profissionais reais, tornando as tarefas complexas e revelando dificuldades dos agentes em reunir informações de diferentes domínios.

Uma nova pesquisa revelou que agentes de inteligência artificial ainda não conseguem realizar o trabalho de profissionais humanos como consultores de gestão, analistas de investimentos e advogados corporativos. Os modelos disponíveis atualmente não acertam mais do que 30% das tarefas.

O estudo foi realizado pela empresa de recrutamento de profissionais e treinamento de dados Mercor. Seu trabalho resultou em um novo benchmark, chamado AI Productivity Index for Agents, ou APEX-Agents, para simplificar.

Nos testes envolvendo o trabalho de um analista de investimentos, o melhor resultado foi do GPT-5.2, da OpenAI, com 27,3% de acerto. Esse modelo também lidera o ranking de consultoria de gestão, com 22,7% de respostas corretas. E nos testes com tarefas de advogados, o Gemini 3 Flash, do Google, fica no topo, com 25,9%.

Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste "Investment banking analyst (Pass@1)", os líderes são "GPT-5.2 (High)" e "GPT-5 (High)" com 27,3%, seguidos por "Gemini 3 Flash (High)" (26,7%), "Claude Opus 4.5 (High)" (21,6%), "Gemini 3 Pro (High)" (18,8%), "Grok 4" (17,0%), "GPT-OSS-120B (High)" (2,7%) e "Kimi K2 Thinking" (1,2%). Em "Management consultant (Pass@1)": "GPT-5.2 (High)" (22,7%), "Gemini 3 Flash (High)" (19,3%), "Claude Opus 4.5 (High)" (13,2%), "Gemini 3 Pro (High)" (12,4%), "GPT-5 (High)" (12,3%), "Grok 4" (12,0%), "GPT-OSS-120B (High)" (3,5%) e "Kimi K2 Thinking" (2,9%). Em "Corporate lawyer (Pass@1)": "Gemini 3 Flash (High)" (25,9%), "Gemini 3 Pro (High)" (23,9%), "Claude Opus 4.5 (High)" (20,2%), "GPT-5.2 (High)" (18,9%), "Grok 4" (16,5%), "GPT-5 (High)" (15,3%), "Kimi K2 Thinking" (8,0%) e "GPT-OSS-120B (High)" (7,8%).Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste
Nenhum modelo alcançou 30% em qualquer uma das três tarefas apresentadas (imagem: reprodução)

Por que os resultados são tão ruins?

Uma das diferenças do APEX-Agents para outros benchmarks é que o teste envolve prompts enviados por profissionais de verdade — e, em grande parte dos casos, os agentes de IA estão trazendo respostas erradas, ou mesmo não trazendo nenhuma resposta.

POSTAGENS RELACIONADAS

Governo e produtores divergem sobre combate à poluição hídrica

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

“Uma das grandes mudanças desse benchmark é que nós construímos um ambiente completo, modelado de acordo com serviços profissionais”, explica Brendan Foody, CEO da Mercor e um dos responsáveis pelo estudo.

Essa escolha torna as tarefas muito mais complexas do que as de outros testes, e é aí que mora o problema: os agentes tropeçam na hora de reunir informações que estão espalhadas em diferentes domínios. “Nós trabalhamos sem que alguém nos dê todo o contexto em um único lugar. Na vida real, você opera com o Slack, o Google Drive e todas essas ferramentas”, explica Foody.

Como os agentes de IA foram testados?

As questões do teste foram disponibilizadas publicamente — e são bastante difíceis. Uma delas, por exemplo, envolve analisar um caso em que uma empresa enviou dados pessoais de cidadãos europeus para servidores nos Estados Unidos, considerando as políticas da própria companhia e a legislação de privacidade da União Europeia.

Como observa o TechCrunch, é um trabalho difícil até mesmo para um humano especializado. Os pesquisadores, entretanto, acham que é necessário ver como os agentes de IA se saem em cenários assim, já que isso é o que determinaria se eles são capazes de substituir um trabalhador.

“Acho que esse é o assunto mais importante na economia. O benchmark reflete bem o trabalho real que essas pessoas fazem”, diz o CEO da Mercor.

GoogleInteligência Artificial (IA)OpenAIGoogle DriveSlackEstados Unidos (EUA)

Créditos TecnoBlog
*conteúdo reproduzido para propagação da informação. Todos os direitos de imagem, conteúdo, texto e pesquisa são pertencentes ao TecnoBlog. Caso queria que seja encerrado a publicação, envie email para jornalismo@novafm96.com.br para retirar do ar.



TAGS: conseguedizestudofazerhumanomaisnãoTecnoblogtrabalho
Postagem anterior

Resultado da Loteria Federal 6036 de sábado (24/01/2026)

Próximo Post

Microsoft combina Paint e inteligência artificial para criar livros de colorir • Tecnoblog

APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1
  • TENDÊNCIAS
  • COMENTÁRIOS
  • ÚLTIMAS
Flamengo revisa estratégia e leva principais jogadores ao clássico

Flamengo revisa estratégia e leva principais jogadores ao clássico

19.01.2026
Fazendeiro brasileiro é morto em emboscada no Paraguai

Fazendeiro brasileiro é morto em emboscada no Paraguai

02.04.2026
Monitor Samsung Odyssey G5 com tela curva de 27" tem 23% OFF em até 18x • Tecnoblog

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

26.01.2026
Governo Municipal amplia investimentos na educação com autorização de nova obra

Governo Municipal amplia investimentos na educação com autorização de nova obra

18.01.2026

São Paulo é o estado brasileiro com melhores serviços municipais de saneamento

0

2026 terá 13 feriados bancários nacionais; agências não abrem ao público

0

Resultado da lotofácil 3589 de sexta-feira (16/01/2026)

0

Goiás lança plano para ampliar setor florestal e atrair novas indústrias

0
Em discurso, à tribuna, senador Hamilton Mourão (Republicanos-RS).

Mourão critica pacote de segurança e política econômica do governo

13.05.2026
Durigan: Brasil discutirá guerra e minerais em reuniões do Brics e G7

Durigan: Brasil discutirá guerra e minerais em reuniões do Brics e G7

13.05.2026
Governo zera imposto federal para compras internacionais de até US$ 50

Governo zera imposto federal para compras internacionais de até US$ 50

13.05.2026
Ícone de Busca

Por que o 13 de Maio não é feriado?

13.05.2026

POSTAGENS RECENTES

Em discurso, à tribuna, senador Hamilton Mourão (Republicanos-RS).

Mourão critica pacote de segurança e política econômica do governo

13.05.2026
Durigan: Brasil discutirá guerra e minerais em reuniões do Brics e G7

Durigan: Brasil discutirá guerra e minerais em reuniões do Brics e G7

13.05.2026
Governo zera imposto federal para compras internacionais de até US$ 50

Governo zera imposto federal para compras internacionais de até US$ 50

13.05.2026
Ícone de Busca

Por que o 13 de Maio não é feriado?

13.05.2026
  • SOBRE
  • AVISO LEGAL
  • POLÍTICA & PRIVACIDADE
  • FALE CONOSCO
  • QUEM SOMOS
  • EXPEDIENTE
  • PLAY(Ao Vivo)
REDAÇÃO +55 (67) 98111-7869

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - PORTAL NOVA FM 96.1

Bem-vindo de volta!

Faça login na sua conta abaixo

Esqueceu a senha? Cadastre-se

Crie uma nova conta para fazer parte do nosso portal

Ou

Preencha o formulário abaixo para se cadastrar no portal

Todos os campos são obrigatórios Login

Recupere sua senha

Digite seu nome de usuário ou endereço de e-mail para redefinir sua senha

Login

Adicionar Nova Lista de Reprodução

Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
  • Fale Conosco
  • Quem Somos
  • Expediente

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - PORTAL NOVA FM 96.1