Представляем улучшения в тонкой настройке API и расширяем нашу программу пользовательских моделей

Помощь в тонкой настройке

На DevDay в ноябре прошлого года мы объявило программа Custom Model, предназначенная для обучения и оптимизации моделей для конкретной области в сотрудничестве со специальной группой исследователей OpenAI. С тех пор мы встретились с десятками клиентов, чтобы оценить потребности их индивидуальных моделей и усовершенствовали нашу программу для дальнейшего максимизации производительности.

Сегодня мы официально объявляем о нашем предложении по тонкой настройке в рамках программы Custom Model. Помощь в тонкой настройке — это совместная работа наших технических специалистов по использованию методов, выходящих за рамки API тонкой настройки, таких как дополнительные гиперпараметры и различные методы эффективной тонкой настройки параметров (PEFT) в более широком масштабе. Это особенно полезно для организаций, которым нужна поддержка в настройке эффективных конвейеров обучающих данных, систем оценки, а также индивидуальных параметров и методов для максимизации производительности модели для их варианта использования или задачи.

Например, SK Telecom, телекоммуникационный оператор, обслуживающий более 30 миллионов абонентов в Южной Корее, хотел адаптировать модель, чтобы стать экспертом в области телекоммуникаций и изначально сосредоточиться на обслуживании клиентов. Они работали с OpenAI над тонкой настройкой GPT-4, чтобы улучшить его производительность в телекоммуникационных разговорах на корейском языке. В течение нескольких недель SKT и OpenAI добились значительного улучшения производительности при выполнении задач по обслуживанию клиентов телекоммуникаций: повышение качества обобщения разговоров на 35 %, точность распознавания намерений на 33 %, а также повышение оценки удовлетворенности с 3.6 до 4.5 (на 5 %). из 4) при сравнении доработанной модели с GPT-XNUMX.

Специально обученная модель

В некоторых случаях организациям необходимо с нуля обучить специально созданную модель, которая понимает их бизнес, отрасль или сферу деятельности. Полностью специально обученные модели привносят новые знания из конкретной области, изменяя ключевые этапы процесса обучения модели с использованием новых методов промежуточного и постобучения. Организации, которые добиваются успеха с помощью полностью индивидуально обученной модели, часто имеют большие объемы собственных данных — миллионы примеров или миллиарды токенов — которые они хотят использовать для обучения модели новым знаниям или сложному, уникальному поведению для весьма специфических случаев использования.

Например, Харви, юридический инструмент на основе искусственного интеллекта для адвокатов, созданный в партнерстве с OpenAI для создать специально обученную большую языковую модель для прецедентного права. Хотя модели-основатели были сильны в рассуждениях, им не хватало обширных знаний истории судебных дел и других знаний, необходимых для юридической работы. После тестирования оперативного проектирования, RAG и тонкой настройки Харви вместе с нашей командой работал над добавлением глубины контекста, необходимой для модели — эквивалента данных на сумму 10 миллиардов токенов. Наша команда изменила каждый этап процесса обучения модели: от промежуточного обучения с учетом специфики предметной области до настройки процессов после обучения и учета отзывов экспертов-юристов. Полученная модель позволила увеличить количество фактических ответов на 83 %, и адвокаты в 97 % случаев предпочли результаты адаптированной модели GPT-4.

SEO-контент и PR-распределение. Получите усиление сегодня.
PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
Источник: https://openai.com/blog/introducing-improvements-to-the-fine-tuning-api-and-expanding-our-custom-models-program

Генеративный анализ данных

Представляем улучшения API тонкой настройки и расширяем нашу программу пользовательских моделей.

От халвинга хайпа до мемной мании: путешествие по непредсказуемому ландшафту криптовалютных рынков

От халвинга к мемам: путешествие по взлетам и падениям криптовалютных рынков

Последняя разведка

Противоположная точка зрения JPMorgan: ожидание падения цен на биткойны после сокращения вдвое на фоне безумных рыночных движений

Рыночная турбулентность впереди? Анализ прогноза цен на биткойны от JPMorgan и всплеска мем-акций и альткойнов

Динамика рынка и спекуляции: путь через халвинг биткойнов, мем-акции и культуру соответствия

Рыночные спекуляции и стратегии: анализ прогноза цен на биткойны от JPMorgan и всплеск торговли акциями мемов

Динамика рынка меняется: от прогнозов JPMorgan по биткойнам до резкого роста доходов Robinhood и юридических проблем Binance

Рыночная турбулентность впереди: JPMorgan прогнозирует падение биткойнов после халвинга, рост доходов Robinhood и юридические проблемы Binance