Análise do Tráfego de Ferramentas de IA Generativa para Sites de Notícias: ChatGPT e Perplexity como Fontes de Tráfego
Introdução
Neste artigo, exploraremos de forma didática e detalhada como as ferramentas de inteligência artificial generativa, exemplificadas pelo ChatGPT e pela Perplexity, influenciam o tráfego para sites de notícias. Baseando-se em dados extraídos da Comscore, o estudo analisa o comportamento dos usuários de desktop nos Estados Unidos entre julho e novembro de 2024, oferecendo uma visão clara do impacto dessas tecnologias no ecossistema jornalístico. Essa investigação surge num contexto de crescimento expressivo do uso de IA generativa, dado que o ChatGPT ultrapassa 400 milhões de usuários semanais enquanto a Perplexity atinge cerca de 15 milhões de usuários.
Ao aprofundar os padrões de tráfego direcionados por essas plataformas, o estudo busca identificar se os esforços de inserção no espaço de busca se traduzem em um fluxo significativo para as editoras de notícias. Serão investigados os principais destinos dos cliques, com ênfase na comparação entre referências a sites educacionais, técnicos e de notícias. Assim, o artigo se propõe a esclarecer os pontos técnicos e as nuances observadas na análise dos dados, permitindo que mesmo leitores sem conhecimento prévio consigam compreender os aspectos essenciais.
A relevância desta análise está relacionada aos desafios enfrentados pelos publishers, que vêm adotando diversas estratégias, incluindo acordos de licenciamento com grandes empresas de IA, para se adaptarem às mudanças na maneira de consumir informações. Dessa forma, o estudo serve de subsídio para a definição de estratégias editoriais e parcerias, mostrando que, apesar do alcance massivo das ferramentas GenAI, o tráfego direcionado a sites de notícias ainda é limitado.
Visão geral do estudo sobre o tráfego de GenAI para publishers de notícias
O estudo em questão analisa dados obtidos da Comscore, com o objetivo de compreender como as ferramentas de IA generativa, como o ChatGPT e a Perplexity, interagem com as editoras de notícias. A investigação foca no tráfego oriundo do uso dessas plataformas, sobretudo em visitas realizadas por usuários de desktop nos Estados Unidos dentro do período de cinco meses. Essa abordagem permite uma análise detalhada dos padrões de acesso e direcionamento de tráfego em um cenário de evolução tecnológica.
Foram investigadas as origens e os destinos das referências geradas por essas ferramentas, questionando se os milhões de usuários ativos se traduzem em visitas significativas para os sites de notícias. O estudo se vale de uma base de dados robusta, que possibilita a identificação dos principais destinos dos cliques, evidenciando diferenças comportamentais entre as duas plataformas. Dessa forma, os dados servem para comparar o papel do GenAI em contrastes com outros métodos tradicionais de busca e direcionamento.
Ao evidenciar o panorama atual, a análise reforça que, embora o ChatGPT e a Perplexity representem esforços estratégicos para ocupar o espaço de busca, o volume de tráfego enviado aos publishers é modesto. A investigação destaca ainda que os padrões variados de direcionamento – influenciados, por exemplo, pelo número de usuários e pelo tipo de conteúdo referenciado – são fundamentais para entender a dinâmica de consumo de notícias na era da inteligência artificial.
Metodologia da análise de tráfego via Comscore
A metodologia adotada para a análise consistiu na utilização dos dados da Comscore, que oferecem informações detalhadas a nível de visita para as referências originadas dos domínios chatgpt.com e perplexity.ai. O estudo abrange o período de julho a novembro de 2024, permitindo a captação de um recorte temporal representativo do comportamento dos usuários em desktops nos Estados Unidos. Essa escolha metodológica assegura que os dados sejam consistentes e compatíveis para uma comparação aprofundada.
Para garantir a qualidade dos dados, foram aplicados filtros rigorosos, removendo automaticamente auto-referências, tráfego programático e redirecionamentos indevidos. Tais procedimentos possibilitaram a exclusão de informações irrelevantes e a obtenção de um conjunto de dados que reflete fielmente as ações dos usuários. Assim, a análise concentra-se em visitas de referência, aquelas em que o usuário efetivamente toma a decisão de acessar um site a partir da indicação da ferramenta de IA.
Além disso, os 1.000 sites com maior tráfego foram categorizados manualmente em 22 categorias distintas, o que permitiu identificar padrões de comportamento por segmento. A amostra final incluía 145.065 visitas, realizadas por 23.118 usuários únicos, constituindo uma base sólida para a extração de insights empíricos. Essa estratégia metodológica, ao combinar filtragem e categorização qualitativa, fortalece a precisão técnica dos resultados apresentados.
Destinos de tráfego: ChatGPT vs. Perplexity
A análise dos destinos de tráfego revelou que o ChatGPT e a Perplexity apresentam comportamentos distintos ao direcionar os usuários a fontes externas. Observa-se que a Perplexity concentra aproximadamente 30% de suas referências em sites educacionais, enquanto o ChatGPT envia uma fração inferior, inferior a 5%, para esse mesmo tipo de destino. Essa diferença demonstra que cada plataforma possui uma ênfase diferenciada, moldada pelos algoritmos e pela curadoria de conteúdo oferecida.
Em contrapartida, o ChatGPT possui uma tendência maior em direcionar usuários para sites técnicos. Aproximadamente 18% das referências do ChatGPT indicam a preferência por esse tipo de recurso, em contraste com apenas 4% no caso da Perplexity. Esse dado é evidenciado por exemplos práticos, onde plataformas como texthelp.com e coursera.org aparecem com maior recorrência no tráfego oriundo do ChatGPT, refletindo um foco mais voltado à informação técnica e de suporte ao aprendizado.
Outros exemplos reforçam essa distinção, já que ambas as ferramentas também referenciam recursos de acesso aberto e bases científicas, como PubMed e ResearchGate. Enquanto o ChatGPT demonstra uma conexão mais robusta com sites técnicos e recursos sociais (como o YouTube, que recebe 8% das referências), a Perplexity se destaca por seu direcionamento para conteúdo educacional, evidenciado pela alta porcentagem de tráfego para plataformas voltadas à educação. Esses padrões apontam para uma segmentação natural dos destinos, adaptada à proposta de cada plataforma.
Tráfego mínimo para sites de notícias
Apesar do alto alcance das ferramentas de IA generativa, os sites de notícias recebem uma parcela bastante reduzida do tráfego total gerado. Segundo os dados analisados, apenas 3,2% das referências provenientes do ChatGPT e 7,4% das oriundas da Perplexity direcionam os usuários para publicações jornalísticas. Esses percentuais sugerem que, mesmo com milhões de usuários ativos, a influência direta sobre os publishers de notícias é limitada.
Entre os 143 sites de notícias incluídos na amostra, somente cinco receberam mais de 100 visitantes únicos ao longo do período analisado. Esse cenário evidencia que o fluxo de tráfego, quando direcionado para notícias, é concentrado em um número bastante restrito de outlets. Assim, a disseminação do tráfego não beneficia significativamente a maioria dos publishers, mesmo entre aqueles que são frequentemente referenciados.
Ademais, as referências a sites de notícias mostram uma tendência internacional, com uma preponderância de fontes fora do contexto doméstico dos EUA. Essa característica reforça a ideia de que, embora o GenAI possua um alcance global, a relevância das visitas para as editoras locais de notícias pode ser marginal. Portanto, a influência das plataformas de IA na popularização do tráfego de notícias ainda é um aspecto que demanda mais investigação e adaptação por parte dos publishers.
Análise de links inexistentes (404 errors) e “alucinações”
A análise também identificou um número expressivo de URLs que retornaram erros 404, indicando a inexistência das páginas apontadas pelas referências. Esse fenômeno foi significativamente mais pronunciado no ChatGPT, que registrou 205 URLs inválidos em comparação com 21 identificados na Perplexity. Tais ocorrências sugerem que, além de oferecer links direcionadores, a ferramenta pode estar gerando referências baseadas em “alucinações” – isto é, links fabricados sem correspondência com conteúdos reais.
Ao examinar detalhadamente os links inexistentes, constatou-se que a maioria das URLs incorretas do ChatGPT direcionava para grandes outlets internacionais de língua inglesa, como The New York Times, The Guardian, entre outros. Essa discrepância levanta dúvidas quanto à confiabilidade dos mecanismos de curadoria e geração automática de links dessas plataformas. O fato de que estes links não possuíam respaldo em repositórios como o Wayback Machine corrobora a hipótese de alucinação.
A presença de um número elevado de links inexistentes tem implicações importantes para a credibilidade da ferramenta e para a experiência do usuário. Quando as referências apontam para páginas que não existem, a confiança do usuário na fonte de informação pode ser comprometida, exigindo que mecanismos de verificação sejam aprimorados. Portanto, lidar com essa problemática é essencial para que as plataformas de GenAI assegurem a precisão e a integridade das informações ofertadas.
Efeito limitado de parcerias entre OpenAI e publishers de notícias
Uma abordagem adicional considerada na análise foi a avaliação do impacto de possíveis parcerias entre a OpenAI e os publishers de notícias. Diversos acordos formais, envolvendo organizações como a Associated Press e a Axel Springer, visam integrar o conteúdo das editoras às respostas geradas pelas ferramentas de IA. No entanto, os dados indicam que essas parcerias, embora presentes, não se traduzem em um aumento expressivo no tráfego direcionado.
Conforme os números apresentados, os sites que possuem parcerias formais receberam, em média, 35 visitantes, enquanto os não parceiros contaram com cerca de 17 visitantes no mesmo período. Esse pequeno acréscimo não é estatisticamente significativo, o que torna difícil afirmar que os acordos contribuam de maneira decisiva para o desenvolvimento da audiência. Assim, apesar do potencial de visibilidade, os benefícios práticos dessas parcerias parecem ser restritos.
Em última análise, os dados sugerem que os acordos de conteúdo com a OpenAI funcionam, predominantemente, como arranjos de licenciamento em vez de mecanismos eficazes de geração de tráfego. Muitos publishers relatam que a quantidade de acessos provenientes desses sistemas é quase imperceptível quando comparada aos demais canais de busca e referência. Por essa razão, a estratégia de parcerias, embora relevante do ponto de vista negociacional, ainda demanda revisão no que diz respeito à atração de audiência real.
Limitações do estudo
É importante ressaltar que o presente estudo possui limitações inerentes à sua metodologia, notadamente o fato de ter se concentrado exclusivamente no tráfego de desktop nos Estados Unidos. Assim, fica de lado o volume expressivo de acessos realizados por dispositivos móveis, que representam uma fatia significativa no consumo de conteúdo atualmente. Essa delimitação pode oferecer uma visão incompleta do impacto geral das ferramentas de IA generativa.
Outra limitação diz respeito ao enfoque regional, que restringe as conclusões a um público norte-americano. A presença de sites internacionais entre os principais destinos de referência indica que os padrões globais podem divergir substancialmente dos observados na amostra. Portanto, a generalização dos resultados para outros mercados ou regiões deve ser feita com cautela, enfatizando a necessidade de estudos adicionais em contextos variados.
Diante dessas restrições, é recomendável que pesquisas futuras ampliem o escopo da análise, incluindo dados de tráfego móvel e uma perspectiva global. Essa abordagem permitiria uma compreensão mais completa dos efeitos do GenAI sobre o fluxo de usuários para os publishers de notícias. Assim, embora os dados apresentados forneçam insights valiosos, é fundamental reconhecer as oportunidades de aprofundamento e integração de informações em estudos subsequentes.
Conclusão
A análise demonstrou que, embora as ferramentas de IA generativa, representadas pelo ChatGPT e pela Perplexity, tenham um alcance expressivo e milhões de usuários ativos, o tráfego direcionado para sites de notícias permanece modesto. Os dados ressaltam que o público é majoritariamente redirecionado para recursos educacionais e técnicos, deixando os publishers de notícias com uma fatia reduzida do tráfego global. Esse cenário evidencia o desafio enfrentado pelas organizações jornalísticas em converter a visibilidade tecnológica em audiência efetiva.
A baixa taxa de cliques em links de notícias pode estar associada tanto à satisfação dos usuários com as respostas geradas quanto aos problemas de confiabilidade, como os links inexistentes identificados na análise. Esses elementos sugerem que os leitores podem optar por consumir a informação diretamente na resposta da ferramenta, sem precisar acessar a fonte original. Além disso, a diversidade dos destinos, com referências internacionais e discrepâncias entre plataformas, reforça a complexidade desse ecossistema.
Por fim, apesar do impacto limitado observado, é imperativo que os publishers explorem novas estratégias de integração do GenAI em suas operações. Ao repensar seus modelos de parceria e investir em métodos que incentivem o clique e a verificação das fontes, as organizações de notícias poderão aprimorar suas abordagens para conquistar e manter um público cada vez mais exigente. O desafio futuro reside em transformar esses dados em ações práticas que potencializem o desenvolvimento de audiência e a credibilidade jornalística.
Referências
- Fonte: Nick Hagar. Disponível em: https://nicholashagar.medium.com/?source=post_page—byline–783795ba2103—————————————
- Fonte: Nick Diakopoulos. Disponível em: https://medium.com/@ndiakopoulos
- Fonte: Nieman Lab. Disponível em: https://www.niemanlab.org/2024/09/google-discover-is-sending-u-s-news-publishers-much-more-traffic-as-social-media-referrals-continue-to-fall/
- Fonte: OpenAI. Disponível em: https://openai.com/index/partnering-with-axios-expands-openai-work-with-the-news-industry/
- Fonte: Perplexity. Disponível em: https://www.perplexity.ai/hub/blog/perplexity-expands-publisher-program-with-15-new-media-partners
- Fonte: The Verge. Disponível em: https://www.theverge.com/24167865/google-zero-search-crash-housefresh-ai-overviews-traffic-data-audience
- Fonte: Comscore. Disponível em: https://www.comscore.com/
- Fonte: ChatGPT Search. Disponível em: https://openai.com/index/introducing-chatgpt-search/
- Fonte: Perplexity AI. Disponível em: https://www.perplexity.ai/
- Fonte: businessofapps.com. Disponível em: https://www.businessofapps.com/data/perplexity-ai-statistics/
- Fonte: Reuters. Disponível em: https://www.reuters.com/technology/artificial-intelligence/openais-weekly-active-users-surpass-400-million-2025-02-20/
- Fonte: Associated Press. Disponível em: https://apnews.com/article/openai-chatgpt-associated-press-ap-f86f84c5bcc2f3b98074b38521f5f75a
- Fonte: Axel Springer. Disponível em: https://www.axelspringer.com/en/ax-press-release/axel-springer-and-openai-partner-to-deepen-beneficial-use-of-ai-in-journalism
- Fonte: New York Times. Disponível em: https://www.npr.org/2025/01/14/nx-s1-5258952/new-york-times-openai-microsoft
- Fonte: The Atlantic. Disponível em: https://www.theatlantic.com/technology/archive/2024/05/a-devils-bargain-with-openai/678537/
- Fonte: scribd.com. Disponível em: http://scribd.com/
- Fonte: studocu.com. Disponível em: http://studocu.com/
- Fonte: ugm.ac.id. Disponível em: http://ugm.ac.id/
- Fonte: unirioja.es. Disponível em: http://unirioja.es/
- Fonte: texthHelp.com. Disponível em: http://texthelp.com/
- Fonte: coursera.org. Disponível em: http://coursera.org/
- Fonte: khanacademy.org. Disponível em: http://khanacademy.org/
- Fonte: microsoft.com. Disponível em: http://microsoft.com/
- Fonte: apple.com. Disponível em: http://apple.com/
- Fonte: github.com. Disponível em: http://github.com/
- Fonte: nodejs.org. Disponível em: http://nodejs.org/
- Fonte: List of most-visited websites. Disponível em: https://en.wikipedia.org/wiki/List_of_most-visited_websites
- Fonte: Nieman Lab. Disponível em: https://www.niemanlab.org/2024/06/chatgpt-is-hallucinating-fake-links-to-its-news-partners-biggest-investigations/
- Fonte: hbr.org. Disponível em: http://hbr.org/
- Fonte: nytimes.com. Disponível em: http://nytimes.com/
- Fonte: theguardian.com. Disponível em: http://theguardian.com/
- Fonte: nationalgeographic.com. Disponível em: http://nationalgeographic.com/
- Fonte: bbc.com. Disponível em: http://bbc.com/
- Fonte: Wayback Machine. Disponível em: https://web.archive.org/
- Fonte: nationalgeographic.com over 10,000 URLs archived. Disponível em: https://web.archive.org/web//nationalgeographic.com
- Fonte: article about the EPA. Disponível em: https://www.nytimes.com/2024/10/16/us/supreme-court-epa-emissions.html
- Fonte: June 2024 story. Disponível em: https://www.theguardian.com/technology/article/2024/jun/27/ai-bill-gates-climate-targets-datacentres-energy
- Fonte: robots.txt file. Disponível em: https://hbr.org/robots.txt
- Fonte: OpenAI crawlers. Disponível em: https://platform.openai.com/docs/bots/
- Fonte: A recentanalysis. Disponível em: https://pressgazette.co.uk/platforms/chatgpt-perplexity-news-ai-referral-search/
- Fonte: some news outletssay. Disponível em: https://digiday.com/media/referral-traffic-from-ai-platforms-grows-despite-publishers-attempts-to-block-crawlers/
- Fonte: prior findings. Disponível em: safari-reader://generative-ai-newsroom.com/do-people-want-to-get-their-news-from-chatbots-8a806495b65d