Novas Ferramentas da API Responses: Web Search e mais

Revolução na API Responses: Web Search, File Search e Computer Use Transformam o Desenvolvimento de Aplicações com IA

Você já se perguntou como criar aplicações de IA verdadeiramente inteligentes, capazes de acessar informações atualizadas, pesquisar documentos complexos e até mesmo automatizar tarefas no computador? A OpenAI acaba de lançar três ferramentas revolucionárias na API Responses que prometem transformar completamente o desenvolvimento de aplicações inteligentes. Vamos descobrir como essas inovações podem impulsionar seus projetos para um novo patamar.

Web Search: Respostas Atualizadas com Citações Confiáveis

A ferramenta Web Search agora está disponível na API Responses para desenvolvedores que utilizam os modelos gpt-4o e gpt-4o-mini. Esta poderosa funcionalidade permite que suas aplicações forneçam respostas rápidas e atualizadas com citações claras de fontes da web.

Durante os testes iniciais, desenvolvedores já estão criando uma variedade impressionante de aplicações:

  • Assistentes de compras inteligentes
  • Agentes de pesquisa avançados
  • Assistentes de reserva de viagens
  • Qualquer aplicação que necessite de informações atualizadas da web

A implementação é surpreendentemente simples:

const response = await openai.responses.create({
  model: "gpt-4o", 
  tools: [{ type: "web_search_preview" }], 
  input: "What was a positive  story that happened today?", 
});

console.log(response.output_text);

Desempenho Comprovado

Os resultados são impressionantes. No benchmark SimpleQA, que avalia a precisão dos modelos de linguagem em responder perguntas factuais curtas:

  • GPT‑4o search preview: 90% de precisão
  • GPT‑4o mini search preview: 88% de precisão

Casos Reais de Sucesso

A Hebbia está utilizando a ferramenta Web Search para ajudar gestores de ativos, empresas de private equity e crédito, e escritórios de advocacia a extrair rapidamente insights acionáveis de extensos conjuntos de dados públicos e privados.

As respostas geradas com Web Search incluem links para as fontes, oferecendo aos usuários uma maneira de aprender mais e aos proprietários de conteúdo novas oportunidades para alcançar um público mais amplo.

File Search: Recuperação Inteligente de Informações em Documentos

A ferramenta File Search aprimorada permite que desenvolvedores recuperem informações relevantes de grandes volumes de documentos. Esta funcionalidade suporta:

  • Múltiplos formatos de arquivo
  • Otimização de consultas
  • Filtragem por metadados
  • Reranking personalizado

Implementar o File Search é tão simples quanto:

const productDocs = await openai.vectorStores.create({
  name: "Product Documentation",
  file_ids: [file1.id, file2.id, file3.id],
});

const response = await openai.responses.create({
  model: "gpt-4o-mini", 
  tools: [{
    type: "file_search", 
    vector_store_ids: [productDocs.id], 
  }],
  input: "What is deep research by OpenAI?", 
});

console.log(response.output_text);

Aplicações Práticas

A ferramenta File Search está sendo utilizada em diversos cenários:

  • FAQs de suporte ao cliente
  • Assistência jurídica
  • Agentes de codificação
  • Documentação técnica

A Navan, por exemplo, utiliza o File Search em seu agente de viagens com IA para fornecer respostas precisas a partir de artigos da base de conhecimento, como políticas de viagem da empresa.

Pipeline RAG Integrado

Uma das características mais impressionantes do File Search é seu pipeline RAG (Retrieval-Augmented Generation) integrado, que inclui otimização de consulta e reranking, eliminando a necessidade de ajustes adicionais.

Computer Use: Automatização de Tarefas no Computador

A ferramenta Computer Use na API Responses, alimentada pelo modelo Computer-Using Agent (CUA), permite que desenvolvedores construam agentes capazes de realizar tarefas em um computador. Esta inovação captura ações de mouse e teclado geradas pelo modelo e as traduz em comandos executáveis.

Implementação básica:

const response = await openai.responses.create({
  model: "computer-use-preview", 
  tools: [{
    type: "computer_use_preview", 
    display_width: 1024, 
    display_height: 768, 
    environment: "browser", 
  }], 
  truncation: "auto", 
  input: "I'm looking for a new camera. Help me find the best one.", 
});

console.log(response.output);

Desempenho Benchmark Impressionante

O modelo CUA estabeleceu novos recordes de estado da arte:

  • 38.1% de sucesso no OSWorld para tarefas completas de uso do computador
  • 58.1% no WebArena para tarefas de navegação na web
  • 87% no WebVoyager para interações baseadas na web

Casos de Uso Transformadores

Desenvolvedores podem usar a ferramenta Computer Use para:

  • Automatizar fluxos de trabalho baseados em navegador
  • Realizar garantia de qualidade em aplicativos web
  • Executar tarefas de entrada de dados em sistemas legados

A Unify utiliza a ferramenta para acessar informações previamente inacessíveis via APIs, como verificar através de mapas online se uma empresa expandiu sua presença imobiliária.

A Luminai integrou a ferramenta para automatizar processos operacionais complexos para grandes empresas com sistemas legados sem APIs, como a inscrição de usuários em serviços comunitários.

Segurança e Supervisão do Computer Use

Antes do lançamento do CUA, a OpenAI conduziu extensos testes de segurança e red teaming para mitigar riscos potenciais:

  • Verificações de segurança contra injeções de prompt
  • Prompts de confirmação para tarefas sensíveis
  • Mitigações específicas para desenvolvedores

É importante notar que o modelo CUA ainda é suscetível a erros, com um desempenho de 38.1% no OSWorld. Por isso, a supervisão humana é altamente recomendada, especialmente em ambientes não-navegador.

Disponibilidade e Preços

  • Disponível para todos os desenvolvedores na API Responses
  • Preço: $30 por mil consultas (GPT‑4o search) e $25 por mil consultas (GPT‑4o-mini search)
  • Disponível para todos os desenvolvedores na API Responses
  • Preço: $2.50 por mil consultas
  • Armazenamento de arquivo: $0.10/GB/dia (primeiro GB grátis)

Computer Use

  • Disponível como pesquisa preview para desenvolvedores selecionados nos tiers de uso 3-5
  • Preço: $3/1M tokens de entrada e $12/1M tokens de saída

Transformando o Desenvolvimento de Aplicações Inteligentes

Estas três novas ferramentas na API Responses da OpenAI representam um avanço significativo para desenvolvedores que buscam criar aplicações mais inteligentes e automatizadas.

A Web Search permite acesso a informações atualizadas da web, o File Search facilita a recuperação de dados em documentos, e o Computer Use automatiza tarefas no computador. Juntas, essas ferramentas abrem novas possibilidades para inovação em diversas áreas, desde suporte ao cliente até pesquisa e automação de processos.

Ao integrar essas ferramentas em suas aplicações, você não apenas melhora a experiência do usuário, mas também cria soluções mais eficientes e capazes de realizar tarefas que antes exigiriam intervenção humana significativa.

É hora de explorar essas novas capacidades e elevar suas aplicações de IA a um novo patamar de inteligência e automação.


Fonte: OpenAI. “Novas Ferramentas Built-in na API Responses”. Disponível em: https://www.openai.com/blog/api-responses-tools.

Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
mais recentes
mais antigos Mais votado
Feedbacks embutidos
Ver todos os comentários