GPT-4 стал общедоступным, а старые модели Completions API — морально устарели


GPT-3.5 Turbo, DALL-E и Whisper также стали доступны для общего пользования, и OpenAI выпускает план снятия с разработки старых моделей API Completions, которые выйдут из эксплуатации в начале 2024 года.

Начиная с 6 июля 2023 года, все клиенты платного API получают доступ к GPT-4. В марте OpenAI представила API ChatGPT, а в начале этого месяца OpenAI выпустила первые обновления для моделей на основе чата. OpenAI представляет себе будущее, в котором модели на основе чата смогут поддерживать любые сценарии использования. OpenAI анонсирует план устаревания старых моделей API Completions и рекомендует пользователям использовать API Chat Completions.

GPT-4 стал общедоступным

API GPT-4 становится общедоступным

GPT-4 — самая функциональная модель. Миллионы разработчиков запросили доступ к API GPT-4 с марта, и спектр инновационных продуктов, использующих GPT-4, растет с каждым днем. Сегодня все существующие разработчики API с историей успешных платежей могут получить доступ к API GPT-4 с контекстом 8K. Планируется открыть доступ для новых разработчиков к концу этого месяца, а затем начать повышать лимиты скорости в зависимости от доступности вычислений.

Исходя из стабильности и готовности этих моделей к использованию в производственных масштабах, сделать API GPT-3.5 Turbo, DALL-E и Whisper общедоступными. Работа идет над безопасным включением тонкой настройки для GPT-4 и GPT-3.5 Turbo, и ожидается, что эта функция будет доступна позднее в этом году.

Переход от текстовых дополнений к дополнениям чата

OpenAI представил Chat Completions API в марте, и сейчас на него приходится 97% использования API GPT.

Первоначально API Completions был представлен в июне 2020 года, чтобы обеспечить текстовую подсказку свободной формы для взаимодействия с языковыми моделями. С тех пор выяснилось, что зачастую более структурированный интерфейс подсказок может дать лучшие результаты. Парадигма, основанная на чате, доказала свою эффективность, справляясь с подавляющим большинством предыдущих случаев использования и новых потребностей в разговоре, обеспечивая при этом большую гибкость и конкретность. В частности, структурированный интерфейс Chat Completions API (например, системные сообщения, вызов функций) и возможности многооборотных разговоров позволяют разработчикам создавать разговорный опыт и широкий спектр задач завершения. Кроме того, это помогает снизить риск атак с внедрением подсказок, поскольку пользовательский контент может быть структурно отделен от инструкций.

Обобщение текста

Система
Резюмировать это сообщение максимум в десяти словах.

Пользователь
Юпитер — пятая планета от Солнца и самая большая в Солнечной системе. Это газовый гигант с массой в одну тысячную от массы Солнца, но в два с половиной раза больше массы всех остальных планет Солнечной системы вместе взятых. Юпитер — один из самых ярких объектов, видимых невооруженным глазом на ночном небе, и был известен древним цивилизациям еще до начала истории. Он назван в честь римского бога Юпитера. При наблюдении с Земли Юпитер может быть достаточно ярким, чтобы его отраженный свет отбрасывал видимые тени, и в среднем является третьим по яркости естественным объектом на ночном небе после Луны и Венеры.

Помощник
Юпитер: Самая большая планета, видимая невооруженным глазом ночью.

Завершение кода

Система
Завершите следующий код.

Пользователь

def fibonacci(num):

Помощник

if num == 0:
    return 0
elif num == 1:
    return 1
else:
    fib = [0, 1]
    for i in range(2, num + 1):
          fib.append(fib[i-1] + fib[i-2])
    return fib[num]

OpenAI планирует продолжать инвестировать большую часть усилий платформы в этом направлении, так как считает, что оно будет предлагать все больше возможностей и простоты в использовании для разработчиков. В настоящее время ведется работа над быстрым устранением последних пробелов в API завершения чата, таких как лог-вероятности для токенов завершения и увеличение управляемости для уменьшения «болтовни» в ответах.

Уход старых моделей в Completions API

В рамках увеличения инвестиций в Chat Completions API и усилий по оптимизации вычислительных мощностей, через 6 месяцев планируется отмена некоторых старых моделей, использующих Completions API. Хотя этот API останется доступным, в документации для разработчиков с сегодняшнего дня данный интерфейс будет обозначен как «устаревший». В дальнейшем планируется совершенствование моделей и продуктов с упором на Chat Completions API, и пока нет планов по публичному выпуску новых моделей с использованием Completions API.

Начиная с 4 января 2024 года, старые модели завершения больше не будут доступны и будут заменены следующими моделями:

Старая модельНовая модель
adaada-002
babbagebabbage-002
curiecurie-002
davincidavinci-002
davinci-instruct-betagpt-3.5-turbo-instruct
curie-instruct-beta
text-ada-001
text-babbage-001
text-curie-001
text-davinci-001
text-davinci-002
text-davinci-003

Приложения, использующие стабильные имена моделей для базовых моделей GPT-3 (ada, babbage, curie, davinci), будут автоматически обновлены до новых моделей, перечисленных выше, 4 января 2024 года. Новые модели также будут доступны в ближайшие недели для раннего тестирования путем указания следующих имен моделей в вызовах API: ada-002, babbage-002, curie-002, davinci-002.

Разработчикам, использующим другие старые модели завершения (например, text-davinci-003), необходимо будет вручную обновить свои интеграции до 4 января 2024 года, указав gpt-3.5-turbo-instruct в параметре «model» в своих API-запросах. gpt-3.5-turbo-instruct — это модель в стиле InstructGPT, обученная аналогично text-davinci-003. Эта новая модель является заменой в API Completions и будет доступна в ближайшие недели для раннего тестирования.

Разработчикам, желающим продолжать использовать свои отлаженные модели после 4 января 2024 года, необходимо будет отладить замену на основе новых базовых моделей GPT-3 (ada-002, babbage-002, curie-002, davinci-002) или более новых моделей (gpt-3.5-turbo, gpt-4). Как только эта функция станет доступна в конце этого года, мы предоставим приоритетный доступ к тонкой настройке GPT-3.5 Turbo и GPT-4 пользователям, которые ранее выполняли тонкую настройку старых моделей. Мы понимаем, что переход с моделей, настроенных на собственные данные, сопряжен с определенными трудностями. Мы будем оказывать поддержку пользователям, которые ранее занимались тонкой настройкой моделей, чтобы сделать этот переход как можно более плавным.

В ближайшие недели мы свяжемся с разработчиками, которые недавно использовали эти старые модели, и предоставим дополнительную информацию, когда новые модели завершения будут готовы к раннему тестированию.

Прекращение поддержки старых моделей

Пользователи старых моделей встраивания (например, text-search-davinci-doc-001) должны будут перейти на text-embedding-ada-002 до 4 января 2024 года. Мы выпустили text-embedding-ada-002 в декабре 2022 года и пришли к выводу, что она более функциональна и экономически эффективна, чем предыдущие модели. Сегодня на text-embedding-ada-002 приходится 99,9% всех случаев использования API встраивания.

Мы понимаем, что это значительное изменение для разработчиков, использующих более старые модели. Прекращение использования этих моделей — это не легкое решение, которое мы принимаем. Мы возьмем на себя финансовые расходы пользователей, повторно размещающих контент с помощью этих новых моделей. В ближайшие дни мы свяжемся с затронутыми пользователями.

Старая модельНовая модель
code-search-ada-code-001text-embedding-ada-002
code-search-ada-text-001
code-search-babbage-code-001
code-search-babbage-text-001
text-search-ada-doc-001
text-search-ada-query-001
text-search-babbage-doc-001
text-search-babbage-query-001
text-search-curie-doc-001
text-search-curie-query-001
text-search-davinci-doc-001
text-search-davinci-query-001
text-similarity-ada-001
text-similarity-babbage-001
text-similarity-curie-001
text-similarity-davinci-001

Прекращение поддержки Edits API

Пользователи Edits API и связанных с ним моделей (например, text-davinci-edit-001 или code-davinci-edit-001) должны будут перейти на GPT-3.5 Turbo до 4 января 2024 года. Бета-версия Edits API была ранней исследовательской версией API, предназначенной для того, чтобы разработчики могли возвращать отредактированную версию подсказки на основе инструкций. Мы учли отзывы об Edits API при разработке gpt-3.5-turbo и Chat Completions API, которые теперь можно использовать для тех же целей:

Система
Применить к коду изменения, запрошенные пользователем.

Пользователь

def fibonacci(num):
    if num <= 1:
        return num
    else:
        return fibonacci(num-1) + fibonacci(num-2)
print(fibonacci(10))
// Переименовать функцию в fib.

Помощник

def fib(num):
    if num <= 1:
        return num
    else:
        return fib(num-1) + fib(num-2)
print(fib(10))

Добавить комментарий