Inteligência de dados generativa

Apresentando mais recursos de nível empresarial para clientes de API

Data:

Para ajudar as organizações a dimensionar o seu uso de IA sem sobrecarregar os seus orçamentos, adicionámos duas novas formas de reduzir custos em cargas de trabalho consistentes e assíncronas:

  • Uso com desconto na taxa de transferência comprometida: Os clientes com um nível sustentado de uso de tokens por minuto (TPM) no GPT-4 ou GPT-4 Turbo podem solicitar acesso à taxa de transferência provisionada para obter descontos que variam de 10 a 50% com base no tamanho do compromisso.
  • Custos reduzidos em cargas de trabalho assíncronas: Os clientes podem usar nosso novo API de lote para executar cargas de trabalho não urgentes de forma assíncrona. As solicitações de API em lote têm 50% de desconto nos preços compartilhados, oferecem limites de taxas muito mais altos e retornam resultados em 24 horas. Isso é ideal para casos de uso como avaliação de modelo, classificação offline, resumo e geração de dados sintéticos.


Planejamos continuar adicionando novos recursos focados em segurança de nível empresarial, controles administrativos e gerenciamento de custos. Para mais informações sobre esses lançamentos, visite nosso Documentação da API or entre em contato com nossa equipe para discutir soluções personalizadas para sua empresa.

local_img

Inteligência mais recente

local_img