조직이 예산을 과도하게 늘리지 않고 AI 사용을 확장할 수 있도록 일관되고 비동기적인 워크로드에서 비용을 절감할 수 있는 두 가지 새로운 방법을 추가했습니다.
- 약정 처리량에 대한 사용량 할인: GPT-4 또는 GPT-4 Turbo에서 분당 토큰(TPM) 사용량이 지속적으로 유지되는 고객은 프로비저닝된 처리량에 대한 액세스를 요청하여 약정 규모에 따라 10~50% 범위의 할인을 받을 수 있습니다.
- 비동기식 워크로드 비용 절감: 고객은 우리의 새로운 배치 API 긴급하지 않은 워크로드를 비동기식으로 실행합니다. 배치 API 요청은 공유 가격에서 50% 할인된 가격으로 책정되며, 훨씬 더 높은 비율 제한을 제공하고, 24시간 이내에 결과를 반환합니다. 이는 모델 평가, 오프라인 분류, 요약, 합성 데이터 생성과 같은 사용 사례에 이상적입니다.
우리는 엔터프라이즈급 보안, 관리 제어 및 비용 관리에 초점을 맞춘 새로운 기능을 계속 추가할 계획입니다. 이번 출시에 대한 자세한 내용을 알아보려면 당사를 방문하세요. API 문서 or 우리 팀에 연락 귀하의 기업을 위한 맞춤형 솔루션에 대해 논의할 수 있습니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://openai.com/blog/more-enterprise-grade-features-for-api-customers