NOVA FM 96.1
Advertisement
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Indústria automobilística registra melhor desempenho dos últimos anos

    Indústria automobilística registra melhor desempenho dos últimos anos

    Uso de redes sociais afeta na qualidade de vida e bem-estar dos jovens

    Uso de redes sociais afeta na qualidade de vida e bem-estar dos jovens

    Em primeiro turno, Câmara aprova garantia de recursos para o Suas

    Em primeiro turno, Câmara aprova garantia de recursos para o Suas

    Lula sanciona projeto que regulamenta profissão de doula no país

    Lula sanciona projeto que regulamenta profissão de doula no país

    Banco Mundial revisa para baixo previsão de crescimento do Brasil

    Banco Mundial revisa para baixo previsão de crescimento do Brasil

    Flamengo reage e vence Santos de virada por 3 a 1 no Brasileirão

    Flamengo estreia na Libertadores na altitude de Cusco, no Peru

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
  • Login
  • Registrar
Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
    • Todos
    • Ciência Global
    • Mundo
    • Negócios
    • Política
    Indústria automobilística registra melhor desempenho dos últimos anos

    Indústria automobilística registra melhor desempenho dos últimos anos

    Uso de redes sociais afeta na qualidade de vida e bem-estar dos jovens

    Uso de redes sociais afeta na qualidade de vida e bem-estar dos jovens

    Em primeiro turno, Câmara aprova garantia de recursos para o Suas

    Em primeiro turno, Câmara aprova garantia de recursos para o Suas

    Lula sanciona projeto que regulamenta profissão de doula no país

    Lula sanciona projeto que regulamenta profissão de doula no país

    Banco Mundial revisa para baixo previsão de crescimento do Brasil

    Banco Mundial revisa para baixo previsão de crescimento do Brasil

    Flamengo reage e vence Santos de virada por 3 a 1 no Brasileirão

    Flamengo estreia na Libertadores na altitude de Cusco, no Peru

    Trending Tags

    • Trump Inauguration
    • United Stated
    • White House
    • Market Stories
    • Election Results
  • Fale Conosco
  • Quem Somos
  • Expediente
Ops, sem resultados...
Ver Todos Os Resultados
NOVA FM 96.1
Ops, sem resultados...
Ver Todos Os Resultados
Home Mundo Tech

IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Cristiane Arruda Por Cristiane Arruda
2 meses Atrás
Por Mundo Tech
A A
0
IA não consegue fazer mais do que 30% do trabalho humano, diz estudo • Tecnoblog

Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

Share on FacebookShare on Twitter


Agentes de IA não estão prontos para substituir trabalhadores (ilustração via IA: Thássius Veloso/Tecnoblog)

O melhor da tecnologia está no nosso canal no WhatsApp

Resumo
  • O estudo da Mercor mostra que agentes de IA, como os da OpenAI e Google, não conseguem realizar mais de 30% das tarefas de profissionais humanos especializados.
  • O GPT-5.2 da OpenAI obteve 27,3% de acerto em tarefas de analistas de investimentos, enquanto o Gemini 3 Flash do Google liderou em tarefas de advogados com 25,9%.
  • O benchmark APEX-Agents usa prompts de profissionais reais, tornando as tarefas complexas e revelando dificuldades dos agentes em reunir informações de diferentes domínios.

Uma nova pesquisa revelou que agentes de inteligência artificial ainda não conseguem realizar o trabalho de profissionais humanos como consultores de gestão, analistas de investimentos e advogados corporativos. Os modelos disponíveis atualmente não acertam mais do que 30% das tarefas.

O estudo foi realizado pela empresa de recrutamento de profissionais e treinamento de dados Mercor. Seu trabalho resultou em um novo benchmark, chamado AI Productivity Index for Agents, ou APEX-Agents, para simplificar.

Nos testes envolvendo o trabalho de um analista de investimentos, o melhor resultado foi do GPT-5.2, da OpenAI, com 27,3% de acerto. Esse modelo também lidera o ranking de consultoria de gestão, com 22,7% de respostas corretas. E nos testes com tarefas de advogados, o Gemini 3 Flash, do Google, fica no topo, com 25,9%.

Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste "Investment banking analyst (Pass@1)", os líderes são "GPT-5.2 (High)" e "GPT-5 (High)" com 27,3%, seguidos por "Gemini 3 Flash (High)" (26,7%), "Claude Opus 4.5 (High)" (21,6%), "Gemini 3 Pro (High)" (18,8%), "Grok 4" (17,0%), "GPT-OSS-120B (High)" (2,7%) e "Kimi K2 Thinking" (1,2%). Em "Management consultant (Pass@1)": "GPT-5.2 (High)" (22,7%), "Gemini 3 Flash (High)" (19,3%), "Claude Opus 4.5 (High)" (13,2%), "Gemini 3 Pro (High)" (12,4%), "GPT-5 (High)" (12,3%), "Grok 4" (12,0%), "GPT-OSS-120B (High)" (3,5%) e "Kimi K2 Thinking" (2,9%). Em "Corporate lawyer (Pass@1)": "Gemini 3 Flash (High)" (25,9%), "Gemini 3 Pro (High)" (23,9%), "Claude Opus 4.5 (High)" (20,2%), "GPT-5.2 (High)" (18,9%), "Grok 4" (16,5%), "GPT-5 (High)" (15,3%), "Kimi K2 Thinking" (8,0%) e "GPT-OSS-120B (High)" (7,8%).Três gráficos de barras horizontais comparam o desempenho de modelos de IA. No teste
Nenhum modelo alcançou 30% em qualquer uma das três tarefas apresentadas (imagem: reprodução)

Por que os resultados são tão ruins?

Uma das diferenças do APEX-Agents para outros benchmarks é que o teste envolve prompts enviados por profissionais de verdade — e, em grande parte dos casos, os agentes de IA estão trazendo respostas erradas, ou mesmo não trazendo nenhuma resposta.

POSTAGENS RELACIONADAS

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

WhatsApp quer facilitar a vida de novos membros em grupos

“Uma das grandes mudanças desse benchmark é que nós construímos um ambiente completo, modelado de acordo com serviços profissionais”, explica Brendan Foody, CEO da Mercor e um dos responsáveis pelo estudo.

Essa escolha torna as tarefas muito mais complexas do que as de outros testes, e é aí que mora o problema: os agentes tropeçam na hora de reunir informações que estão espalhadas em diferentes domínios. “Nós trabalhamos sem que alguém nos dê todo o contexto em um único lugar. Na vida real, você opera com o Slack, o Google Drive e todas essas ferramentas”, explica Foody.

Como os agentes de IA foram testados?

As questões do teste foram disponibilizadas publicamente — e são bastante difíceis. Uma delas, por exemplo, envolve analisar um caso em que uma empresa enviou dados pessoais de cidadãos europeus para servidores nos Estados Unidos, considerando as políticas da própria companhia e a legislação de privacidade da União Europeia.

Como observa o TechCrunch, é um trabalho difícil até mesmo para um humano especializado. Os pesquisadores, entretanto, acham que é necessário ver como os agentes de IA se saem em cenários assim, já que isso é o que determinaria se eles são capazes de substituir um trabalhador.

“Acho que esse é o assunto mais importante na economia. O benchmark reflete bem o trabalho real que essas pessoas fazem”, diz o CEO da Mercor.

GoogleInteligência Artificial (IA)OpenAIGoogle DriveSlackEstados Unidos (EUA)

Créditos TecnoBlog
*conteúdo reproduzido para propagação da informação. Todos os direitos de imagem, conteúdo, texto e pesquisa são pertencentes ao TecnoBlog. Caso queria que seja encerrado a publicação, envie email para jornalismo@novafm96.com.br para retirar do ar.



TAGS: conseguedizestudofazerhumanomaisnãoTecnoblogtrabalho
Postagem anterior

Resultado da Loteria Federal 6036 de sábado (24/01/2026)

Próximo Post

Microsoft combina Paint e inteligência artificial para criar livros de colorir • Tecnoblog

APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1 APP ANDROID NOVA FM 96.1
  • TENDÊNCIAS
  • COMENTÁRIOS
  • ÚLTIMAS
Fazendeiro brasileiro é morto em emboscada no Paraguai

Fazendeiro brasileiro é morto em emboscada no Paraguai

02.04.2026
Flamengo revisa estratégia e leva principais jogadores ao clássico

Flamengo revisa estratégia e leva principais jogadores ao clássico

19.01.2026
Governo Municipal amplia investimentos na educação com autorização de nova obra

Governo Municipal amplia investimentos na educação com autorização de nova obra

18.01.2026
Monitor Samsung Odyssey G5 com tela curva de 27" tem 23% OFF em até 18x • Tecnoblog

Monitor Samsung Odyssey G5 com tela curva de 27″ tem 23% OFF em até 18x • Tecnoblog

26.01.2026

São Paulo é o estado brasileiro com melhores serviços municipais de saneamento

0

2026 terá 13 feriados bancários nacionais; agências não abrem ao público

0

Resultado da lotofácil 3589 de sexta-feira (16/01/2026)

0

Goiás lança plano para ampliar setor florestal e atrair novas indústrias

0
Em discurso, à tribuna, senadora Roberta Acioly (Republicanos-RR).

Roberta Acioly comemora avanço da PEC que reduz jornada de enfermeiros

09.04.2026
Parque não inclui área destinada a salvar BRB, diz associação

Parque não inclui área destinada a salvar BRB, diz associação

09.04.2026
Indústria automobilística registra melhor desempenho dos últimos anos

Indústria automobilística registra melhor desempenho dos últimos anos

09.04.2026
Ícone de Busca

Trump: EUA atacarão Irã com mais força se não houver acordo

09.04.2026

POSTAGENS RECENTES

Em discurso, à tribuna, senadora Roberta Acioly (Republicanos-RR).

Roberta Acioly comemora avanço da PEC que reduz jornada de enfermeiros

09.04.2026
Parque não inclui área destinada a salvar BRB, diz associação

Parque não inclui área destinada a salvar BRB, diz associação

09.04.2026
Indústria automobilística registra melhor desempenho dos últimos anos

Indústria automobilística registra melhor desempenho dos últimos anos

09.04.2026
Ícone de Busca

Trump: EUA atacarão Irã com mais força se não houver acordo

09.04.2026
  • SOBRE
  • AVISO LEGAL
  • POLÍTICA & PRIVACIDADE
  • FALE CONOSCO
  • QUEM SOMOS
  • EXPEDIENTE
  • PLAY(Ao Vivo)
REDAÇÃO +55 (67) 98111-7869

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - CNPJ: 01.764.079/0001-90

Bem-vindo de volta!

Faça login na sua conta abaixo

Esqueceu a senha? Cadastre-se

Crie uma nova conta para fazer parte do nosso portal

Ou

Preencha o formulário abaixo para se cadastrar no portal

Todos os campos são obrigatórios Login

Recupere sua senha

Digite seu nome de usuário ou endereço de e-mail para redefinir sua senha

Login

Adicionar Nova Lista de Reprodução

Ops, sem resultados...
Ver Todos Os Resultados
  • Home
  • Primeira Hora Notícias
  • News
  • Fale Conosco
  • Quem Somos
  • Expediente

RÁDIO NOVA FM 96.1© NO AR DESDE 1997 - CNPJ: 01.764.079/0001-90