TL;DR: A Apple publicou um estudo questionando se as IAs realmente conseguem “pensar”, após cancelar discretamente recursos prometidos da Apple Intelligence em 2024. O estudo testou modelos de segunda linha e concluiu que o raciocínio em IA pode ser uma ilusão, enquanto concorrentes já operam IAs avançadas no mercado real.
Takeaways:
- A Apple cancelou recursos prometidos do Siri com “superpoderes cognitivos” e removeu comerciais promocionais dos canais oficiais
- O estudo da Apple testou apenas modelos de segunda linha (Claude 3.7, DeepSeek-R1, o3-mini) em vez dos líderes de mercado como Claude 4 Opus
- Os modelos testados apresentaram “colapso cognitivo” em tarefas complexas, pensando menos quando deveriam pensar mais
- Existe um abismo entre os resultados do estudo da Apple (15% no ARC-AGI-1) e os modelos atuais líderes (87,5% no OpenAI o3-high)
- O estudo pode ser tanto uma contribuição científica quanto uma estratégia para justificar atrasos da Apple no mercado de IA
A Ilusão do Pensamento: Como a Apple Revelou o Verdadeiro Estado da IA Atual
Você se lembra quando a Apple prometeu revolucionar a inteligência artificial com a Apple Intelligence? Pois bem, um ano depois, não apenas os recursos prometidos não chegaram, como a própria Apple publicou um estudo que questiona se as IAs realmente conseguem “pensar”.
O que aconteceu nos bastidores da gigante de Cupertino? E por que um estudo científico pode revelar mais sobre estratégia corporativa do que sobre tecnologia?
A resposta está em um documento denso e técnico chamado “The Illusion of Thinking” – um título que já entrega o veredicto antes mesmo da leitura.
O Grande Silêncio da Apple Intelligence
Em junho de 2024, a Apple subiu ao palco da WWDC e prometeu algo extraordinário: um Siri com superpoderes cognitivos, capaz de entender contexto, raciocinar e executar tarefas complexas.
O comercial era empolgante. A demonstração, impressionante. A promessa, ambiciosa.
Mas 2025 chegou e os recursos anunciados simplesmente… não apareceram.
Pior ainda: a Apple removeu discretamente o comercial dos seus canais oficiais e adotou um silêncio estratégico sobre o tema. Quando uma empresa como a Apple fica em silêncio, geralmente significa que algo não saiu conforme o planejado.
Foi nesse contexto que surgiu o estudo “The Illusion of Thinking”, conduzido por engenheiros da própria Apple. Um documento que, nas entrelinhas, pode estar dizendo muito mais do que aparenta.
Os Modelos Escolhidos: Uma Seleção Curiosa
Para conduzir o estudo, a Apple selecionou três modelos de IA que, segundo a empresa, “representam o estado da arte”:
- Claude 3.7 Thinking (Anthropic)
- DeepSeek-R1 (DeepSeek AI)
- o3-mini (OpenAI)
Todos esses modelos são compatíveis com mecanismos de raciocínio encadeado — conhecidos como Chain-of-Thought. Eles podem pensar em etapas. Resolver problemas passo a passo.
Mas aqui está o detalhe interessante: a Apple não testou os verdadeiros líderes do mercado.
Nada de Claude 4 Opus, o recordista em raciocínio geral. Nada de Claude 4 Sonnet, o modelo com equilíbrio entre performance e custo. Nada de OpenAI o3-high, que superou o desempenho humano no ARC-AGI-1.
Por que uma empresa séria como a Apple escolheria modelos de segunda linha para um estudo sobre as limitações da IA? A resposta pode estar na estratégia, não na ciência.
Os Quebra-Cabeças que Revelaram a Verdade
Em vez de usar benchmarks tradicionais como GSM8K e MATH, a Apple criou seus próprios testes. Quatro quebra-cabeças lógicos com dificuldade escalável:
- Torre de Hanoi – exige recursão, planejamento e memória
- Checkers Jumping – envolve previsão de múltiplos estados
- River Crossing – simula conflitos e regras restritivas
- Blocks World – clássico dos laboratórios de IA desde os anos 80
A escolha foi inteligente. Esses puzzles evitam que os modelos simplesmente “colem” de bases de dados já conhecidas. Cada quebra-cabeça foi testado em diferentes níveis de dificuldade, forçando os modelos a demonstrar raciocínio genuíno.
E os resultados… foram inquietantes.
O Colapso Cognitivo: Quando as Máquinas Desistem de Pensar
Os resultados do estudo revelaram um padrão perturbador:
- Em tarefas simples: os modelos que não pensam superaram os que pensam
- Em tarefas medianas: o raciocínio ajudava. Modelos com “Chain-of-Thought” acertavam mais
- Em tarefas difíceis: todos colapsaram. Literalmente.
Eles não apenas erravam. Eles desistiam de pensar.
Os modelos, mesmo com mais tempo e recursos, usavam menos tokens de raciocínio em problemas mais complexos.
Um paradoxo devastador: a máquina pensa menos… quando mais deveria pensar.
E mesmo quando os engenheiros entregaram a resposta correta — como o algoritmo ideal da Torre de Hanoi — os modelos ainda assim falharam.
É como se um estudante, ao receber a fórmula da física, ainda não conseguisse resolver o problema de física.
A Realidade dos Benchmarks: O Abismo da Performance
Quando comparamos os resultados do estudo da Apple com os benchmarks reais de mercado, a distância se torna abissal.
O melhor modelo testado pela Apple: Claude 3.7 Thinking
- ARC-AGI-1: ~15%
- ARC-AGI-2: 1%
O melhor modelo atual: Claude 4 Opus
- ARC-AGI-1: 35,7%
- ARC-AGI-2: 8,6% – recorde histórico
Mais impressionante: OpenAI o3-high
- ARC-AGI-1: 87,5% – superando humanos médios
- ARC-AGI-2: abaixo de 3%, ainda assim superior aos modelos da Apple
O ARC-AGI é considerado o padrão-ouro para avaliar raciocínio em IA. É um benchmark que mede a capacidade de resolver problemas nunca vistos antes, usando apenas raciocínio puro.
A diferença entre o que a Apple testou e o que realmente existe no mercado é como comparar uma calculadora com um supercomputador.
A Estratégia Por Trás da Ciência
Aqui está onde a história fica interessante. Vamos conectar os pontos:
- Em 2024, a Apple prometeu um Siri com superpoderes de IA
- Em 2025, cancelou discretamente os recursos prometidos
- No mesmo mês, publicou um estudo dizendo: “Na verdade, ninguém conseguiu”
Coincidência? Improvável.
O estudo da Apple é tecnicamente exemplar. A metodologia é sólida. As conclusões, dentro do escopo testado, são válidas.
Mas há uma diferença entre “os modelos que testamos não conseguem raciocinar perfeitamente” e “o raciocínio em IA é uma ilusão”.
Enquanto a Apple constrói castelos de cautela científica, seus concorrentes já estão integrando e operando suas IAs no mundo real:
- OpenAI integrou o o1 no ChatGPT e está expandindo para empresas
- Anthropic lançou o Claude 4 Opus com capacidades de raciocínio superiores
- Google implementou raciocínio avançado no Gemini Pro
O Verdadeiro Risco da Perfeição Inexistente
O estudo da Apple levanta uma questão filosófica importante: o que significa “raciocinar” para uma máquina?
É verdade que os modelos atuais não raciocinam como humanos. Eles simulam raciocínio através de padrões estatísticos complexos.
Mas aqui está o ponto crucial: essa simulação já é suficientemente boa para resolver problemas reais, gerar insights valiosos e automatizar tarefas cognitivas complexas.
O verdadeiro risco não é aceitar uma IA imperfeita. O verdadeiro risco é fingir que a perfeição ainda não existe enquanto outros já estão colhendo os benefícios da “imperfeição” atual.
A Apple, historicamente, sempre preferiu chegar por último, mas chegar melhor. Steve Jobs dizia: “Não somos os primeiros, somos os melhores”.
Mas no mundo da IA, onde a velocidade de evolução é exponencial, chegar por último pode significar ficar irrelevante.
O Futuro Além da Ilusão
O estudo “The Illusion of Thinking” é, paradoxalmente, tanto uma contribuição científica valiosa quanto uma peça de comunicação estratégica.
Ele nos lembra que devemos ser céticos sobre as capacidades reais da IA atual. Que precisamos entender as limitações antes de confiar cegamente.
Mas também revela como uma empresa pode usar a ciência para justificar atrasos estratégicos.
A verdade é que o raciocínio em IA não é uma ilusão completa, nem uma realidade perfeita. É um espectro em evolução constante.
E nesse espectro, alguns já estão correndo enquanto outros ainda estão amarrando os cadarços.
A pergunta que fica é: quando a Apple finalmente entrar na corrida, ainda haverá espaço na pista?
O silêncio da Apple sobre a Apple Intelligence pode estar prestes a ser quebrado. Mas enquanto isso, o mundo da IA continua girando, pensando e evoluindo — ilusão ou não.
Fonte: Apple Newsroom. “Apple Intelligence chega em abril para mais idiomas e regiões no iPhone, iPad e Mac”. Disponível em: apple.com