OpenAI продолжает делать передовой ИИ доступным для всех с запуском GPT-4o mini , который теперь доступен в API и внедряется в Chat GPT сегодня.
GPT-4o mini — самая интеллектуальная и доступная малая модель OpenAI, доступная сегодня в API. GPT-4o mini значительно умнее и дешевле, чем GPT-3.5 Turbo.
OpenAI по-прежнему стремится сделать искусственный интеллект широкодоступным. Сегодня OpenAI объявляет о запуске GPT-4o mini, своей самой экономически эффективной малой модели на сегодняшний день. Ожидается, что эта модель значительно расширит спектр приложений, которые могут быть созданы с помощью ИИ, сделав интеллект более доступным. GPT-4o mini набрал 82% в тесте MMLU и в настоящее время превосходит GPT-41 по предпочтениям чата в таблице лидеров LMSYS. Его цена составляет 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов, что делает его на порядок более доступным, чем предыдущие модели Frontier, и более чем на 60% дешевле, чем GPT-3.5 Turbo.
GPT-4o mini позволяет выполнять широкий спектр задач благодаря своей низкой стоимости и задержке. К этим задачам относятся приложения, которые связывают или распараллеливают несколько вызовов модели (например, вызов нескольких API), предоставляют большой объем контекста для модели (например, полную кодовую базу или историю разговоров) или взаимодействуют с клиентами посредством быстрых текстовых ответов в реальном времени (например, чат-боты поддержки клиентов).
GPT-4o мини API
В настоящее время GPT-4o mini поддерживает текст и зрение в API, и в будущем планируется включить поддержку ввода и вывода текста, изображений, видео и аудио. Модель имеет контекстное окно в 128 тыс. токенов и знаний до октября 2023 года. Благодаря улучшенному токенизатору, общему с GPT-4o, обработка неанглоязычного текста теперь стала еще более экономически эффективной.
Как небольшая модель с превосходным текстовым интеллектом и многомодальным мышлением, GPT-4o mini превосходит GPT-3.5 Turbo и другие небольшие модели по академическим показателям как по текстовому интеллекту, так и по многомодальному мышлению. Она поддерживает тот же диапазон языков, что и GPT-4o, и демонстрирует высокую производительность при вызове функций, позволяя разработчикам создавать приложения, которые извлекают данные или выполняют действия с внешними системами. Она также предлагает улучшенную производительность в длинном контексте по сравнению с GPT-3.5 Turbo.
Оценка GPT-4o mini
GPT-4o mini был оценен по нескольким ключевым тестам:
- Задачи на рассуждение : GPT-4o mini превосходит другие малые модели в задачах на рассуждение, включающих как текст, так и зрение, набрав 82,0% на MMLU, тесте текстового интеллекта и рассуждения, по сравнению с 77,9% для Gemini Flash и 73,8% для Claude Haiku.
- Владение математикой и кодированием : GPT-4o mini преуспевает в математических рассуждениях и задачах кодирования, превосходя предыдущие небольшие модели на рынке. В MGSM, который измеряет математическое рассуждение, GPT-4o mini набрал 87,0% по сравнению с 75,5% для Gemini Flash и 71,7% для Claude Haiku. GPT-4o mini также набрал 87,2% по HumanEval, мере производительности кодирования, по сравнению с 71,5% для Gemini Flash и 75,9% для Claude Haiku.
- Мультимодальное рассуждение : GPT-4o mini демонстрирует высокие результаты на MMMU, оценке мультимодального рассуждения, набрав 59,4% по сравнению с 56,1% у Gemini Flash и 50,2% у Claude Haiku.
В рамках процесса разработки модели OpenAI сотрудничала с избранной группой доверенных партнеров, чтобы лучше понять варианты использования и ограничения GPT-4o mini . Они сотрудничали с такими компаниями, как Ramp и Superhuman, которые обнаружили, что GPT-4o mini значительно превосходит GPT-3.5 Turbo в таких задачах, как извлечение структурированных данных из файлов квитанций и генерация высококачественных ответов по электронной почте при наличии истории веток.
Встроенные меры безопасности
OpenAI интегрирует безопасность в свои модели с самого начала, усиливая ее на каждом этапе разработки. Во время предварительного обучения они отфильтровывают информацию, которую не хотят, чтобы их модели изучали или выводили, например, разжигание ненависти, контент для взрослых, сайты, которые в основном агрегируют личную информацию, и спам. После обучения они согласовывают поведение модели со своими политиками, используя такие методы, как обучение с подкреплением и обратной связью с человеком (RLHF), чтобы повысить точность и надежность ответов моделей.
GPT-4o mini включает в себя те же меры по снижению рисков безопасности, что и GPT-4o, тщательно оцененные с помощью автоматизированных и человеческих оценок в соответствии с Рамками готовности OpenAI и добровольными обязательствами. Более 70 внешних экспертов в таких областях, как социальная психология и дезинформация, протестировали GPT-4o для выявления потенциальных рисков, которые были учтены OpenAI. Подробности этих оценок будут опубликованы в предстоящей системной карте GPT-4o и оценочной карте готовности. Выводы из этих экспертных оценок помогли повысить безопасность как GPT-4o, так и GPT-4o mini.
Основываясь на этих знаниях, команды OpenAI работали над повышением безопасности GPT-4o mini, используя новые методы, полученные в ходе их исследований. GPT-4o mini в API — это первая модель, применяющая метод иерархии инструкций, который повышает способность модели противостоять джейлбрейкам, инъекциям подсказок и извлечению системных подсказок, делая ее ответы более надежными и безопасными для использования в масштабируемых приложениях.
OpenAI продолжит следить за использованием GPT-4o mini и повышать безопасность модели по мере выявления новых рисков.
Наличие и цены
GPT-4o mini теперь доступен как текстовая и визуальная модель в API помощников, API завершения чата и API пакетной обработки. Разработчики платят 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов (что примерно эквивалентно 2500 страницам стандартной книги). Тонкая настройка для GPT-4o mini будет развернута в ближайшие дни.
В ChatGPT пользователи Free, Plus и Team получат доступ к GPT-4o mini с сегодняшнего дня, заменив GPT-3.5 . Корпоративные пользователи также получат доступ со следующей недели, в соответствии с миссией OpenAI сделать преимущества ИИ доступными для всех.
Что дальше?
В последние годы OpenAI стал свидетелем выдающихся достижений в области искусственного интеллекта в сочетании со значительным снижением стоимости. Например, стоимость токена GPT-4o mini снизилась на 99% с момента внедрения text-davinci-003, менее эффективной модели, в 2022 году. OpenAI стремится продолжать эту траекторию снижения стоимости при улучшении возможностей модели.
OpenAI предвидит будущее, в котором модели будут бесшовно интегрированы в каждое приложение и веб-сайт. GPT-4o mini прокладывает путь разработчикам для более эффективного и доступного создания и масштабирования мощных приложений ИИ. Будущее ИИ становится более доступным, надежным и встроенным в повседневный цифровой опыт, и OpenAI с радостью продолжит лидировать.