Novas Ferramentas da OpenAI para Construção de Agentes de IA

Revolução na Construção de Agentes de IA: Novas Ferramentas que Transformam o Desenvolvimento

Introdução: Um Novo Horizonte para Agentes de IA

Você já tentou desenvolver um agente de IA e se viu preso em uma teia de prompts complexos, integrações desafiadoras e lógica de orquestração personalizada? Se sim, não está sozinho. Desenvolvedores e empresas ao redor do mundo têm enfrentado obstáculos significativos para transformar as capacidades dos modelos de linguagem em agentes prontos para produção.

A boa notícia é que esse cenário está prestes a mudar drasticamente.

A OpenAI acaba de lançar um conjunto revolucionário de ferramentas especificamente projetadas para simplificar o desenvolvimento de aplicações baseadas em agentes de IA. Estas novas soluções prometem democratizar a criação de agentes úteis e confiáveis, tornando o processo mais acessível e eficiente para desenvolvedores de todos os níveis.

Neste artigo, vamos explorar em detalhes estas novas ferramentas e como elas podem transformar sua abordagem para construir agentes de IA.

O Novo Arsenal de Ferramentas para Desenvolvedores

A OpenAI está introduzindo quatro componentes principais que formam a base desta nova era de desenvolvimento de agentes:

  1. Responses API – Uma nova interface que combina a simplicidade da Chat Completions API com as poderosas capacidades de uso de ferramentas da Assistants API
  2. Ferramentas integradas – Incluindo pesquisa na web, pesquisa de arquivos e uso do computador
  3. Agents SDK – Um kit de desenvolvimento para orquestrar workflows de agentes únicos e múltiplos
  4. Ferramentas de observabilidade integradas – Para rastrear e inspecionar a execução de workflows de agentes

Estas ferramentas foram meticulosamente projetadas para simplificar a lógica central do agente, a orquestração e as interações, reduzindo significativamente a barreira de entrada para desenvolvedores que desejam criar aplicações baseadas em agentes.

API Responses: A Nova Primitiva para Construção de Agentes

A API Responses representa um avanço significativo na forma como os desenvolvedores podem interagir com os modelos da OpenAI. Ela foi concebida como uma solução unificada que combina o melhor de dois mundos:

  • A simplicidade e familiaridade da Chat Completions API
  • As poderosas capacidades de uso de ferramentas da Assistants API

Com uma única chamada à API Responses, os desenvolvedores podem resolver tarefas cada vez mais complexas usando múltiplas ferramentas e turnos de modelo. Esta abordagem elimina a necessidade de integrar várias APIs ou fornecedores externos, simplificando drasticamente o desenvolvimento.

Melhorias de Usabilidade Notáveis

A API Responses traz consigo várias melhorias significativas de usabilidade:

  • Design unificado baseado em itens
  • Polimorfismo simplificado
  • Eventos de streaming intuitivos
  • Auxiliares de SDK, como response.output_text, para acessar facilmente a saída de texto do modelo

Além disso, a API facilita o armazenamento de dados na OpenAI, permitindo que os desenvolvedores avaliem o desempenho do agente usando recursos como rastreamento e avaliações.

Disponibilidade e Preços

A API Responses está acessível a todos os desenvolvedores e é cobrada de acordo com as taxas padrão de tokens e ferramentas. Isso significa que você pode começar a experimentar imediatamente sem preocupações com custos proibitivos.

O Futuro das APIs Existentes

Com o lançamento da API Responses, muitos desenvolvedores podem estar se perguntando sobre o futuro das APIs existentes. Aqui está o que você precisa saber:

Chat Completions API

A Chat Completions API continua sendo a API mais amplamente adotada da OpenAI e continuará sendo totalmente suportada com novos modelos e capacidades. Desenvolvedores que não precisam de ferramentas integradas podem continuar usando a Chat Completions sem problemas.

No entanto, para novas integrações, a OpenAI recomenda começar com a API Responses, já que ela é um superconjunto da Chat Completions com o mesmo excelente desempenho.

Assistants API

A OpenAI planeja descontinuar a Assistants API em meados de 2026. Antes disso, a empresa fornecerá um caminho de migração claro para a API Responses.

Até o anúncio formal da descontinuação, a OpenAI continuará entregando novos modelos para a Assistants API, garantindo que os desenvolvedores atuais não sejam prejudicados.

Ferramentas Integradas: Expandindo as Capacidades dos Agentes

Um dos aspectos mais empolgantes do novo conjunto de ferramentas são as ferramentas integradas que expandem significativamente o que os agentes podem fazer. Vamos explorar cada uma delas em detalhes.

Pesquisa na Web: Mantendo Seus Agentes Atualizados

A ferramenta de pesquisa na web permite que os desenvolvedores obtenham respostas rápidas e atualizadas com citações claras e relevantes da web. Esta capacidade é crucial para aplicações que exigem informações em tempo real.

Características Principais:

  • Disponível na API Responses ao usar gpt-4o e gpt-4o-mini
  • Pode ser combinada com outras ferramentas ou chamadas de função
  • Respostas geradas incluem links para fontes, como artigos de notícias e postagens de blog

Casos de Uso:

  • Assistentes de compras que fornecem informações atualizadas sobre produtos
  • Agentes de pesquisa que podem encontrar e sintetizar informações de várias fontes
  • Agentes de reserva de viagens que acessam informações atualizadas sobre destinos e opções de viagem

Desempenho e Disponibilidade:

A pesquisa na web na API é alimentada pelo mesmo modelo usado para a pesquisa do ChatGPT. Os modelos GPT-4o e GPT-4o mini obtêm pontuações impressionantes de 90% e 88%, respectivamente, no benchmark SimpleQA, demonstrando sua alta precisão.

A ferramenta está disponível para todos os desenvolvedores em preview na API Responses, com preços a partir de $30 e $25 por mil consultas para os modelos GPT-4o e GPT-4o-mini, respectivamente.

Pesquisa de Arquivos: Acessando Informações em Grandes Volumes de Documentos

A ferramenta de pesquisa de arquivos permite que os desenvolvedores recuperem facilmente informações relevantes de grandes volumes de documentos, tornando-a ideal para aplicações que exigem acesso rápido a dados específicos.

Características Principais:

  • Suporte para vários tipos de arquivos
  • Otimização de consultas integrada
  • Filtragem de metadados
  • Reclassificação personalizada

Casos de Uso:

  • Agentes de suporte ao cliente que podem acessar rapidamente documentação técnica
  • Assistentes jurídicos que podem pesquisar em grandes volumes de documentos legais
  • Agentes de codificação que podem consultar documentação técnica

Preços e Disponibilidade:

A pesquisa de arquivos está disponível na API Responses a $2.50 por mil consultas. O armazenamento de arquivos é cobrado a $0.10/GB/dia, com o primeiro GB gratuito.

Uso do Computador: Automatizando Tarefas Complexas

A ferramenta de uso do computador representa um avanço significativo na automação, permitindo que os desenvolvedores construam agentes capazes de realizar tarefas em um computador, como interagir com interfaces de usuário e navegar por aplicativos.

Características Principais:

  • Alimentada pelo mesmo modelo Computer-Using Agent (CUA) que habilita o Operator
  • Captura ações de mouse e teclado geradas pelo modelo
  • Traduz essas ações em comandos executáveis dentro dos ambientes dos desenvolvedores

Casos de Uso:

  • Automatização de workflows baseados em navegador
  • Realização de garantia de qualidade em aplicativos da web
  • Execução de tarefas de entrada de dados em sistemas legados

Segurança e Disponibilidade:

A OpenAI realizou testes de segurança extensivos antes de lançar esta ferramenta, abordando áreas de risco como mau uso, erros de modelo e riscos de fronteira. Recomenda-se supervisão humana devido à suscetibilidade do modelo a erros inadvertidos, especialmente em ambientes não navegadores.

A ferramenta está disponível como uma pesquisa em preview na API Responses para desenvolvedores selecionados, com preços de $3/1M de tokens de entrada e $12/1M de tokens de saída.

Agents SDK: Simplificando Workflows Multi-Agentes

O novo Agents SDK de código aberto simplifica significativamente a orquestração de workflows multi-agentes, oferecendo melhorias substanciais em relação ao Swarm, um SDK experimental lançado anteriormente.

Componentes Principais:

  1. Agentes – LLMs facilmente configuráveis com instruções claras e ferramentas integradas
  2. Transferências – Transferem de forma inteligente o controle entre os agentes
  3. Guardrails – Garantem que os agentes operem dentro de limites seguros
  4. Tracing e Observabilidade – Permitem monitorar e depurar o comportamento do agente

Aplicações do Mundo Real:

O Agents SDK é adequado para diversas aplicações práticas, incluindo:

  • Automação de suporte ao cliente
  • Pesquisa multi-etapas
  • Geração de conteúdo
  • Revisão de código
  • Prospecção de vendas

Compatibilidade e Código Aberto:

O SDK funciona com as APIs Responses e Chat Completions, e também será compatível com modelos de outros provedores que forneçam um endpoint de API no estilo Chat Completions.

A OpenAI está comprometida em continuar a desenvolver o Agents SDK como uma estrutura de código aberto, permitindo que a comunidade expanda sua abordagem e contribua para seu desenvolvimento.

Casos de Sucesso: Empresas Pioneiras

Várias empresas já estão aproveitando estas novas ferramentas para criar soluções inovadoras:

Coinbase e AgentKit

A Coinbase usou o Agents SDK para prototipar e implantar rapidamente o AgentKit, um kit de ferramentas que permite que agentes de IA interajam perfeitamente com carteiras de criptomoedas e várias atividades on-chain. Em apenas algumas horas, eles integraram ações personalizadas de seu Developer Platform SDK em um agente totalmente funcional.

Hebbia e Pesquisa na Web

A Hebbia aproveita a ferramenta de pesquisa na web para ajudar gestores de ativos, empresas de private equity e crédito, e escritórios de advocacia a extrair rapidamente insights acionáveis de extensos conjuntos de dados públicos e privados.

Unify e Uso do Computador

A Unify utiliza a ferramenta de uso do computador em seu sistema de ação para crescimento de receita, permitindo que seus agentes identifiquem intenção, pesquisem contas e se envolvam com compradores de maneira mais eficaz.

Luminai e Automação de Workflows

A Luminai integrou a ferramenta de uso do computador para automatizar fluxos de trabalho operacionais complexos para grandes empresas com sistemas legados que carecem de disponibilidade de API e dados padronizados.

O Futuro dos Agentes de IA

À medida que as capacidades dos modelos se tornam cada vez mais orientadas a agentes, a OpenAI planeja continuar investindo em:

  • Integrações mais profundas em suas APIs
  • Novas ferramentas para ajudar a implantar, avaliar e otimizar agentes em produção
  • Recursos que tornam os agentes mais confiáveis, eficientes e fáceis de construir

A OpenAI acredita que os agentes em breve se tornarão parte integrante da força de trabalho, aprimorando significativamente a produtividade em todos os setores. Esta visão está alinhada com seu compromisso de fornecer os blocos de construção que permitem aos desenvolvedores e empresas criar sistemas autônomos que ofereçam impacto no mundo real.

Conclusão: Uma Nova Era para Desenvolvedores de IA

O lançamento deste novo conjunto de ferramentas marca o início de uma nova era na construção de agentes de IA. Ao simplificar a lógica central do agente, a orquestração e as interações, a OpenAI está democratizando o acesso a tecnologias que antes exigiam conhecimentos especializados e recursos significativos.

Para desenvolvedores e empresas que desejam criar agentes úteis, confiáveis e de alto desempenho, estas ferramentas oferecem um caminho mais claro e eficiente. A combinação da API Responses, ferramentas integradas como pesquisa na web, pesquisa de arquivos e uso do computador, o Agents SDK e ferramentas de observabilidade integradas forma uma base sólida para a próxima geração de aplicações baseadas em IA.

À medida que exploramos este novo território, uma coisa é certa: o futuro dos agentes de IA é promissor, e estas ferramentas são apenas o começo de uma revolução na forma como construímos e interagimos com a inteligência artificial.

Está pronto para começar a construir seus próprios agentes de IA? As ferramentas estão disponíveis agora – o que você vai criar?

Fonte: OpenAI. “Novas Ferramentas para Construir Agentes de IA”. Disponível em: https://www.openai.com/blog/novas-ferramentas-para-agentes-de-ia.

Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
mais recentes
mais antigos Mais votado
Feedbacks embutidos
Ver todos os comentários