Para ajudar as organizações a dimensionar o seu uso de IA sem sobrecarregar os seus orçamentos, adicionámos duas novas formas de reduzir custos em cargas de trabalho consistentes e assíncronas:
- Uso com desconto na taxa de transferência comprometida: Os clientes com um nível sustentado de uso de tokens por minuto (TPM) no GPT-4 ou GPT-4 Turbo podem solicitar acesso à taxa de transferência provisionada para obter descontos que variam de 10 a 50% com base no tamanho do compromisso.
- Custos reduzidos em cargas de trabalho assíncronas: Os clientes podem usar nosso novo API de lote para executar cargas de trabalho não urgentes de forma assíncrona. As solicitações de API em lote têm 50% de desconto nos preços compartilhados, oferecem limites de taxas muito mais altos e retornam resultados em 24 horas. Isso é ideal para casos de uso como avaliação de modelo, classificação offline, resumo e geração de dados sintéticos.
Planejamos continuar adicionando novos recursos focados em segurança de nível empresarial, controles administrativos e gerenciamento de custos. Para mais informações sobre esses lançamentos, visite nosso Documentação da API or entre em contato com nossa equipe para discutir soluções personalizadas para sua empresa.
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://openai.com/blog/more-enterprise-grade-features-for-api-customers