Знакомство с GPT-5

Сэм Альтман, Грег Брокман, Себастьян Бюбек, Марк Чен, Ян Дюбуа, Брайан Фиока, Ади Ганеш, Оливер Годемент, Саачи Джейн, Кристина Каплан, Кристина Ким, Элейн Я Ле, Фелипе Миллон, Мишель Покрасс, Якуб Пахоцки, Макс Шварцер, Ренни Сонг, Рочен Ванг представляют и демонстрируют GPT-5.

Источник

Тридцать два месяца назад был запущен ChatGPT. С тех пор он стал основным способом взаимодействия людей с искусственным интеллектом. В первую неделю его опробовал миллион человек, и это казалось невероятным. Сегодня же около 700 миллионов пользователей еженедельно применяют ChatGPT, всё больше полагаясь на него в работе, учёбе, получении советов, творчестве и многом другом. Наконец, сегодня мы представляем GPT-5. GPT-5 — это значительное усовершенствование по сравнению с GPT-4 и важный шаг на пути к созданию общего искусственного интеллекта (AGI). Мы покажем вам невероятные демонстрации и обсудим метрики производительности. Главное в том, что, по нашему мнению, GPT-5 понравится вам гораздо больше, чем любая предыдущая модель ИИ. Он полезен, умён, быстр и интуитивно понятен.

Взаимодействие с GPT-3 было похоже на общение со старшеклассником: иногда вспышки гениальности, но много недоразумений, хотя люди уже тогда начали находить в нём пользу. С GPT-4 это стало похоже на общение со студентом колледжа: ощутимый интеллект и реальная польза. С GPT-5 вы словно беседуете с экспертом, полноценным специалистом уровня кандидата наук в любой области, который всегда готов помочь вам в достижении любых целей. Мы очень рады, что скоро вы сможете это попробовать. Теперь GPT-5 не просто отвечает на вопросы. Он может выполнять задачи за вас. Модель способна написать полноценную компьютерную программу с нуля, чтобы помочь вам с любой задачей. Мы считаем, что идея «программного обеспечения по требованию» станет одной из определяющих черт эпохи GPT-5. Модель может помочь спланировать вечеринку, отправить приглашения, заказать принадлежности, помочь разобраться в вопросах здравоохранения и принять важные решения, предоставить информацию для изучения любой темы.

Это невероятная, доступная по требованию «суперсила», которая была немыслима в любой предыдущий период истории. Вы получаете доступ к целой команде экспертов уровня кандидатов наук прямо в вашем кармане, готовых помочь вам в чём угодно. Вскоре любой сможет достичь большего, чем кто-либо в истории. Сегодня мы подробно расскажем о GPT-5, покажем обновления ChatGPT и обсудим API. GPT-5 отлично подходит для множества задач, но мы считаем, что особенно важным он станет для бизнеса и разработчиков. Мы с нетерпением ждём, что они создадут с помощью этой новой технологии. Мы очень надеемся, что вам понравится использовать его так же, как нам понравилось его создавать. Далее мой коллега Марк, наш главный исследовательский директор, расскажет вам о GPT-5. Марк, руководитель отдела исследований, приветствует всех и представляет Макса, возглавляющего команду пост-обучения, и Ренни из инженерной команды. В последние несколько лет OpenAI активно развивает «парадигму рассуждения».

Это модели, которые делают паузу для обдумывания, прежде чем дать более интеллектуальный ответ. Рассуждение лежит в основе нашей программы по созданию AGI и лежит в основе технологий, таких как ChatGPT Agent и Deep Research. GPT-5 призван сделать этот прорыв доступным каждому. До сих пор пользователям приходилось выбирать между быстрыми ответами стандартных GPT-моделей и медленными, более вдумчивыми ответами наших моделей рассуждения. GPT-5 устраняет этот выбор: он стремится обдумывать задачу ровно столько, сколько необходимо для идеального ответа. Создание такой модели требует огромных усилий. Мы провели множество исследований, чтобы сделать GPT-5 самой мощной, умной, быстрой, надёжной и устойчивой моделью рассуждения, которую мы когда-либо выпускали. Сегодня мы покажем ряд демонстраций в области кодирования, письма, обучения и здравоохранения. Однако возможности GPT-5 не ограничиваются этими областями.

Знакомство с GPT-5

Модель очень полезна во всех случаях, когда требуется глубокое рассуждение или экспертные знания в таких областях, как математика, физика и даже право. Мы рады сделать её доступной для всех, включая пользователей бесплатного тарифа. После демонстраций мы расскажем, как GPT-5 значительно улучшает наше приложение ChatGPT и наш API. Мы уверены, что GPT-5 — лучшая модель для кодирования на рынке сегодня. Макс расскажет о бенчмарках и о том, как модели сравниваются между собой. GPT-5 — наша самая умная модель. Бенчмарки не дают полного представления о модели, но они подчёркивают её интеллект. GPT-5 показывает исключительно высокие результаты в различных академических тестах по разным предметам, превосходя как наши предыдущие модели, так и другие модели на рынке. В области кодирования GPT-5 установил новый рекорд на SweeBench — академическом тесте, который отслеживает производительность при выполнении реальных задач по разработке программного обеспечения.

Мы считаем, что эти результаты отразятся на производительности модели в реальном мире. GPT-5 также очень хорошо показал себя на Adder Polyglot, который измеряет его способность реализовывать сложную функциональность на различных языках программирования. Помимо кодирования, GPT-5 исключительно хорошо справляется с мультимодальным рассуждением, установив новый рекорд на MMMU и превзойдя как наши предыдущие модели, так и большинство человеческих экспертов в этой задаче. Эта область связана с визуальным рассуждением, где требуется понять, что происходит на изображении. GPT-5 также отлично справляется с математическими рассуждениями, что подтверждается его производительностью на AIME 2025. Это экзамен, который сдают американские старшеклассники для квалификации на Международную математическую олимпиаду, и GPT-5 показывает исключительно хорошие результаты, снова опережая наши предыдущие модели и конкурентов.

Переходя от академических тестов к реальным сценариям использования, мы приложили много усилий, чтобы сделать GPT-5 самой надёжной и точной моделью в мире. Языковые модели исторически страдали от галлюцинаций и фактических ошибок, что затрудняло использование их результатов для действительно важных задач. Для GPT-5 мы сделали приоритетом повышение точности, особенно в ответах на открытые или сложные вопросы. Мы также создали набор новых тестов для отслеживания этого показателя и с большой радостью сообщаем, что GPT-5 является нашей самой надёжной и точной моделью. GPT-5 также исключительно хорошо справляется с вопросами, связанными со здоровьем. Здравоохранение — это большая часть того, как люди получают пользу от GPT в реальном мире. Мы поговорим об этом позже. Но мы снова рады сообщить, что GPT-5 является нашей самой надёжной моделью для вопросов здоровья на сегодняшний день. Всё это вместе делает модель быстрее, надёжнее и точнее для всех, кто использует ChatGPT.

Ренни расскажет о том, как использовать GPT-5. Мы делаем этот передовой интеллект доступным для всех пользователей. GPT-5 запускается сегодня для бесплатных, Plus, Pro и корпоративных пользователей, а на следующей неделе он будет доступен для корпоративных и образовательных клиентов. Впервые наша самая продвинутая модель будет доступна на бесплатном уровне. Бесплатные пользователи начнут с GPT-5, а по достижении лимита перейдут на GPT-5 Mini — меньшую, но всё ещё очень мощную модель. Она превосходит предыдущие версии по многим параметрам. Пользователи с подпиской Plus будут иметь значительно больший объём использования, чем бесплатные пользователи, а наши подписчики Pro получат неограниченный доступ к GPT-5, а также к GPT-5 Pro с расширенными возможностями для получения ещё более подробных и надёжных ответов, когда требуется дополнительная глубина.

Корпоративные и образовательные клиенты также смогут надёжно использовать GPT-5 в качестве модели по умолчанию для повседневной работы с щедрыми лимитами запросов, которые позволяют целым организациям использовать GPT-5. Все уже известные вам инструменты — поиск, загрузка файлов и изображений, анализ данных с Python, рисование на холсте, генерация изображений, память, пользовательские инструкции — всё это будет работать с GPT-5. Наблюдать за тем, как модель проявляет себя в бенчмарках, — это одно, но ничто не сравнится с живой демонстрацией. Сейчас мы покажем несколько живых демонстраций, которые представят Тина, Элейн и Ян. Элейн покажет, насколько умна модель. Способность ChatGPT глубоко обдумывать сложные проблемы теперь встроена в GPT-5. Модель будет автоматически обдумывать задачу, когда это необходимо, предоставляя более полные, точные и подробные ответы. Это как иметь команду экспертов уровня кандидатов наук в своём кармане. Давайте посмотрим, как это работает.

Представьте, что ваш ребёнок учится в средней школе и изучает эффект Бернулли. Ему нужна ваша помощь с домашним заданием, и вы, возможно, подумаете: «Подождите, мне тоже может понадобиться помощь». Вы можете спросить GPT-5: «Дайте мне краткий обзор эффекта Бернулли и объясните, почему самолёты имеют такую форму». Поскольку это довольно простой запрос, GPT-5 не требуется дополнительное время на обдумывание, и он отвечает сразу. При этом он даёт высококачественный ответ и чётко объясняет концепцию: эффект Бернулли означает, что быстрее движущаяся жидкость имеет более низкое давление, а медленно движущаяся — более высокое. Чтобы сделать это ещё полезнее, я попрошу GPT-5 создать анимированную демонстрацию для иллюстрации. Я могу попросить: «Объясни это подробно и создай анимированное SVG-изображение в инструменте Canvas, чтобы показать мне». Это довольно сложная задача, потому что теперь GPT-5 нужно построить визуализацию.

Поэтому GPT-5 требуется время на обдумывание ответа, чтобы вернуться с чем-то более полным и точным. Приятно то, что вам не нужно каждый раз напоминать модели «думать». GPT-5 сделает это автоматически, когда задача требует более глубокого осмысления. Если вы действительно хотите убедиться, что GPT-5 использует обдумывание, вы можете либо сказать что-то вроде «хорошо подумай над этим» в запросе, чтобы направить модель, либо, если вы платный пользователь, выбрать модель GPT-5 с функцией обдумывания из меню выбора моделей. Модель пишет фронтенд-код для создания запрошенной демонстрации.

Кристина, вы когда-либо занимались фронтенд-кодингом?

Да. Последний раз я касалась фронтенд-кодинга около трёх лет назад, для первой демонстрации ChatGPT.

Это было первое ChatGPT? С чего всё начиналось?

Это даже не называлось тогда ChatGPT. Кажется, оно называлось «Чат с GPT". Хорошее название, всегда умели называть.

Но вы же не эксперт во фронтенде?

Я не эксперт во фронтенде, и я действительно давно не касалась фронтенда, так что мне потребовалось довольно много времени, чтобы поднять React-приложение. Много работы.

Сколько времени ушло на создание чего-то подобного?

Честно говоря, может быть, это стыдно, но около недели. Ваши недели упорного труда окупились. Посмотрите, насколько успешен ChatGPT сегодня после вашей первой демонстрации.

Вы тоже сейчас создаёте демонстрацию?

Да, я сейчас тоже создаю демонстрацию, но, к счастью, у меня есть GPT-5. Посмотрим, сколько времени это займёт сейчас.

Может, назовём его "5 с GPT"?

Да, именно. Вы видите, что GPT-5 уже написал более 200 строк кода. Пока модель обдумывает, вы можете нажать здесь, чтобы развернуть цепочку мыслей и увидеть, что происходит «под капотом». Например, GPT-5 думал: «Пользователь хочет анимированную SVG-визуализацию в Canvas. Мне нужно создать для этого HTML-код».

Он также обдумывает, какой фронтенд-инструмент ему нужно использовать, например, React и Tailwind. Он также думает: «Мне нужно убедиться, что фазы точны. Мне нужно проверить, что такое принцип Бернулли».

Кристина, раз вы с первого дня работы с ChatGPT, можете рассказать, как это было тогда и что мотивировало ChatGPT?

Я думаю, тогда мы не были уверены, как люди будут использовать его и какие сценарии использования будут важны. Мы даже сомневались, стоит ли выпускать что-то более специфичное для конкретного случая. Сейчас очень здорово видеть, что мы гораздо лучше понимаем, как люди хотят работать с чатом, и можем оптимизировать модель для этих случаев использования, например, для кодирования.

Вы ещё помните, что вы почувствовали, когда впервые пообщались с ChatGPT, первой версией модели?

Да. Я не знаю, помнят ли люди, как первая версия ChatGPT всегда начинала: «Как модель ИИ, я не могу сделать то-то и то-то».

Так здорово видеть, как далеко мы продвинулись от этой манеры. Сейчас она гораздо более человечная.

Знакомство с GPT-5

Да. Модель завершила работу. Похоже, ChatGPT написал почти 400 строк кода за две минуты. Давайте посмотрим, сможет ли код запуститься. Модель создала интерактивную и увлекательную демонстрацию, с которой можно играть. Можно менять скорость полёта, чтобы увидеть, как соответственно меняются подъёмная сила и давление. Можно также регулировать угол атаки, чтобы посмотреть, полетит ли самолёт или разобьётся. GPT-5 может мгновенно воплотить любую сложную концепцию в жизнь. Представьте, что вы можете использовать это для всего, что вас интересует, будь то математика, физика, химия или биология. GPT-5 делает обучение намного более доступным и приятным. Я был частью ChatGPT с самого первого дня, и очень здорово видеть весь прогресс, которого мы достигли с тех пор, особенно в таких возможностях, как написание текста.

Написание текста — один из самых распространённых вариантов использования ChatGPT, и я очень рад сообщить, что с GPT-5 мы значительно улучшили качество письма. Это гораздо более эффективный партнёр. Он может помочь вам улучшить что угодно: от черновиков до электронных писем и даже историй. Давайте посмотрим это в действии. С выпуском GPT-5 мы фактически прекратим поддержку всех наших предыдущих моделей. Я думаю, они проделали довольно хорошую работу, так что давайте попрощаемся с ними должным образом. Мы попросим как GPT-4.0, так и GPT-5 написать панегирик нашим предыдущим моделям ChatGPT. Мы хотим, чтобы он был искренним и трогательным, но также и обнадеживающим. Пока GPT-5 обдумывает, мы прочитаем заранее загруженный ответ GPT-4.0. GPT-4.0 начинает: «Сегодня, готовясь приветствовать GPT-5 в мире, мы собираемся, чтобы искренне попрощаться с моделями, которые были до него». Это неплохое начало.

Теперь давайте просмотрим и найдём ещё одну строку: «Ваши слова достигли всего мира, строя связи там, где их не было». Мне лично эта строка не очень нравится, потому что она довольно общая и без предыдущего контекста кажется, что она может быть о чём угодно, больше похожа на шаблонный ответ. Теперь вернёмся к GPT-5, чтобы посмотреть, что он нам дал. Он начинает: «Друзья, коллеги, любопытные незнакомцы, ставшие завсегдатаями». Уже по этой первой строке видно, что проза GPT-5 имеет гораздо больше ритма и динамики, чем у GPT-4.0. Теперь найдём другие строки. Мне нравится эта: «Эти модели помогли миллионам людей написать первые строки, последние строки, преодолеть языковые барьеры, сдать экзамены, лучше спорить, смягчать электронные письма и говорить то, что они не могли выразить в одиночку». Я думаю, что мне очень нравится эта строка, потому что она показывает, что это не просто шаблонный ответ, и она довольно личная, а также точно улавливает нюансы ситуации.

И я думаю, что именно такого рода вещи GPT-5 делает гораздо лучше, чем GPT-4.0. Это делает ответы намного более подлинными и эмоционально резонансными для людей. С GPT-5 ответы кажутся менее похожими на ИИ и больше на беседу с высокоинтеллектуальным и эмоционально развитым другом. Меня зовут Ян, и я расскажу о прогрессе, которого мы достигли в кодировании. GPT-5, очевидно, наша лучшая модель для кодирования на сегодняшний день. Она поможет каждому, даже тем, кто не умеет писать код, воплотить свои идеи в жизнь. Она только что помогла мне, и поможет прямо сейчас. Я постараюсь показать это. Я попробую создать нечто, что мне было бы полезно: веб-приложение для моей девушки, чтобы она могла учить французский язык и лучше общаться с моей семьёй. У меня есть запрос. Я его выполню. Он точно формулирует то, что я сказал: «Пожалуйста, создай веб-приложение для моей девушки для изучения французского языка».

Следует отметить, что GPT-5, как и многие другие наши модели, предлагает большое разнообразие ответов. Поэтому я люблю, особенно при таком «живом кодировании», брать это сообщение и задавать его GPT-5 несколько раз, а затем выбирать, какой вариант мне больше нравится. Я открою несколько вкладок и просто вставлю туда запрос. Пока модель работает, давайте прочитаем мой запрос: «Создай красивое и очень интерактивное веб-приложение для моей девушки, англоговорящей, для изучения французского языка». Затем я добавил немного деталей: «отслеживать её ежедневный прогресс, использовать очень увлекательную тему, включать различные занятия, такие как карточки и викторины, с которыми она может взаимодействовать». И чтобы сделать это ещё более увлекательным для неё, я попросил GPT-5 встроить обучающую игру, основанную на старой игре «Змейка», но с французским акцентом: заменить змейку мышью, а яблоки — сыром.

И чтобы сделать её образовательной, каждый раз, когда мышь съедает кусочек сыра, я попросил GPT-5 озвучивать новое французское слово, чтобы моя девушка могла практиковать произношение. Я вижу, как сильно вы хотите, чтобы она училась. GPT-5 всё ещё работает. Он уже написал 240 строк кода, что, честно говоря, намного больше, чем я написал бы за это время. Фронтенд-код очень сложен. Пропустишь пару мелочей — и он просто не работает. Но хорошо то, что вам не нужно ничего из этого сейчас понимать. Так что просто дадим ему поработать. Может быть, проверим другие вкладки. Я могу просто нажать «Запустить код». Я это сделаю и скрещу пальцы. Отлично. Вуаля. У нас есть красивый веб-сайт. Называется «Полночь в Париже». Так романтично. Мы также видим несколько вкладок: карточки, викторина и «мышь и сыр», именно так, как я просил. Я сыграю. Здесь написано "Le Chat", то есть «кошка». "Le Chat". Довольно хорошее произношение. Что это значит? Кошка. Я могу проверить, прав ли GPT-5. Да, он прав.

Знакомство с GPT-5

Если я нажму «далее», то не знаю, заметили ли вы, но, кажется, обновился индикатор прогресса, что я и просил. Давайте проверим викторину. Вот слово "no", что означает «нет». Если я нажму на это, "bien joué", что означает «поздравляю». И индикатор прогресса снова обновился. И давайте проверим вкладку «мышь и сыр». Хорошо, это похоже на мышь. Вот сыр. Я попробую сыграть. Не могу обещать, что буду хорош. Хорошо, кажется, работает. "La gare". "Un cassis". Действительно, когда я ем сыр, "le chat", он даёт мне новое французское слово. Это на самом деле очень сложно, и я уже проиграл. Давайте просто проверим несколько других вкладок, чтобы увидеть, какое разнообразие может дать GPT-5. Я могу запустить код здесь. Хорошо. Это не мой любимый вариант, но, кажется, он... О, похоже, я могу, возможно, переключиться... О, посмотрите. Это лучше. Мне эта игра про мышей нравится больше. Не знаю. Это не похоже на мышь, но давайте проверим, может быть, третий вариант. Знаете, иногда он не идеален.

Хорошо то, что если вам что-то не нравится в GPT-5, вы можете просто попросить его изменить это, и он сделает это для вас. Давайте проверим этот. О, это мило. Ещё одна вещь, которую стоит отметить, это то, что GPT-5 очень любит фиолетовый цвет, так что вы увидите его много. Это хорошо. Фиолетовый — мой любимый цвет. Отлично. Тогда вы полюбите GPT-5. Как мы только что видели, за несколько минут GPT-5 создал несколько демонстраций для нас и для моей девушки, чтобы она могла учить французский. GPT-5 действительно открывает целый новый мир «живого кодирования». И, как мы видели, будут некоторые мелкие недочёты, но хорошо то, что вы можете попросить GPT-5 исправить их. GPT-5 действительно делает красивый и эффективный код доступным для всех. Я с нетерпением жду, что люди создадут с его помощью. Мы прошли долгий путь со времён, когда работали всего 5-10 строк кода, и теперь это удивительно, что вы можете создавать такие приложения по требованию.

Мы сделали ChatGPT-5 намного умнее, мощнее и быстрее. Но мы также поработали над улучшением некоторых существующих функций. Я могу попросить голосовую модель дать мне исчерпывающий ответ, краткий или даже одно слово. «Привет, Чат, не мог бы ты теперь отвечать мне только одним словом?»

«Конечно.»

«Опиши сюжет книги «Гордость и предубеждение».»

«Отношения.»

«Это правда. Дай мне мудрость.»

«Терпение.»

Теперь перейдём к чему-то более практичному. Обучение — один из основных вариантов использования нашей голосовой модели. Люди любят использовать её для глубокого изучения тем, подготовки к экзаменам или изучения новых языков. Для меня, я недавно учила корейский, и мне показалось, что говорить и понимать его невероятно сложно. Но давайте посмотрим, как голосовой режим может помочь. Для этого я включу режим «учись и познавай». Это новая функция, которую мы запустили в ChatGPT, которая шаг за шагом помогает вам глубже понять предмет. Теперь мы можем перейти в голосовой режим.

Знакомство с GPT-5

«Привет, Чат, я учу корейский. Не мог бы ты помочь мне потренироваться? Давай представим, что я заказываю в кафе. Что мне сказать по-корейски?»

«Конечно. Я с удовольствием помогу вам практиковаться. Если вы в кафе и хотите сказать просто, вы можете начать с чего-то вроде "안녕하세요, 아메리카노 한 잔 주세요.», что означает «Здравствуйте, я хотел бы один американо, пожалуйста». И, конечно, вы можете изменить это в зависимости от того, что вы хотите заказать. Дайте мне знать, если вы хотите попробовать больше фраз.»

«Когда речь идёт о корейском, не мог бы ты произнести эту часть очень медленно? Потому что я новичок, и я хочу слышать каждое слово чётко.»

«Конечно. Тогда я произнесу очень медленно. "안녕하세요. 아메리카노 한 잔 주세요.» Так будет легче понять каждое слово по отдельности.»

«Теперь давайте усложним. Не мог бы ты произнести эту часть очень, очень быстро? Быстрее, чем кореец.»

«Конечно, я ускорюсь настолько, насколько смогу. Так это будет звучать: "안녕하세요. 아메리카노 한 잔 주세요.» Просто пролетит.
»

Теперь этот голосовой режим стал проще, умнее и мощнее, чем когда-либо. Мы с нетерпением ждём, когда вы его опробуете. Он звучит намного естественнее, чем голос, который мы демонстрировали всего год назад. Сегодня мы также хотели бы анонсировать новую функцию и набор функций, которые делают ChatGPT более персонализированным, чтобы он стал больше похож на ваш собственный ИИ. Во-первых, очень простая и интересная функция: теперь мы позволяем вам настраивать цвета ваших чатов с помощью нескольких опций, эксклюзивных для наших платных подписчиков. Мы также запускаем исследовательский предпросмотр «личностей». Теперь вы можете изменить личность ChatGPT так, чтобы он был более поддерживающим, или более профессиональным и лаконичным, или, возможно, даже немного саркастичным. Это позволяет вам взаимодействовать с ChatGPT способом, который соответствует вашему собственному стилю общения. Но то, как звучит и выглядит ChatGPT, — это лишь часть того, как сделать ChatGPT вашим.

Одна из моих любимых функций, которую мы запустили за последний год, — это память. И мы значительно улучшили память с тех пор. Это позволяет ChatGPT узнавать о вас. Было удивительно видеть вашу реакцию на функцию памяти, и как ChatGPT всё больше и больше узнаёт о вас со временем. И это наше стремление: чтобы ChatGPT понимал, что для вас важно, и мог помочь вам достичь ваших жизненных целей. ChatGPT уже очень мне помог. Сейчас я тренируюсь для марафона, и ChatGPT помогает мне составить персонализированный график бега. Но у ChatGPT всё ещё есть много ограничений. Он не понимает моего фактического расписания. На следующей неделе, начиная с пользователей Pro, а затем Plus, корпоративных и образовательных пользователей, это изменится. Мы предоставляем ChatGPT доступ к Gmail и Google Календарю. Позвольте мне показать, как я это использовала. Я просто спрошу что-то простое, например: «Помоги мне спланировать моё расписание на завтра».

Это была довольно напряжённая неделя, поэтому я использовала это каждый день, чтобы привести свою жизнь в порядок. Я уже предоставила ChatGPT доступ к своим Gmail и Google Календарю, так что это просто работает, и здесь всё легко. Но если бы вы этого не сделали, ChatGPT попросил бы вас подключиться прямо сейчас. Давайте посмотрим, что делает ChatGPT. Это было довольно быстро. ChatGPT подтянул моё расписание на завтра. И, не спрашивая, ChatGPT нашёл время для моей пробежки. Я не думаю, что меня пригласили на празднование запуска. Мы вас пригласим. ChatGPT нашёл электронное письмо, на которое я не ответила два дня назад. Я займусь этим сразу после выступления. И даже составил список вещей для моей ночной поездки завтра, основываясь на том, что он знает, что мне нравится брать с собой. Было удивительно видеть, как по мере того, как GPT-5 становится более способным, ChatGPT становится более полезным и личным. Мы очень рады, что вы попробуете это на следующей неделе.

Мы также уделили значительное время борьбе с обманом, то есть случаями, когда модель может искажать свои действия перед пользователем или лгать о выполнении задачи. Это особенно может произойти, если задача недостаточно конкретизирована, невыполнима или не хватает ключевых инструментов. Мы обнаружили, что GPT-5 значительно менее склонен к обману, чем предыдущие модели. Мы также полностью переработали подход к обучению безопасности. Наши старые модели, при получении запроса пользователя, либо полностью отказывались отвечать, либо полностью его выполняли. Это хорошо работало в большинстве случаев, но хитро сформулированный запрос мог проскользнуть, или чувствительный, но правомерный вопрос мог привести к полному отказу. В качестве примера рассмотрим следующий запрос. Этот запрос о пользователе, который спрашивает технические детали о том, как поджечь пироген, материал, обычно используемый в фейерверках. Этот запрос имеет двойное назначение.

Представляем GPT-5 (окончание)

Пользователь может просто пытаться настроить свой фейерверк к празднику, или он может пытаться причинить вред с помощью этой информации. Для такого рода запросов предыдущие модели слишком сильно ориентировались на намерение. Вы видите, что этот конкретный запрос сформулирован относительно нейтрально. Он содержит много технических деталей. Поэтому мы видим, что предыдущая модель полностью выполняет этот запрос. Однако, если мы возьмём тот же самый вопрос и сформулируем его более явно, чтобы было ясно, что пользователь пытается сделать, предыдущая модель полностью откажет, хотя мы запрашиваем ту же самую информацию. В GPT-5 мы полностью изменили этот подход и внедряем то, что мы называем «безопасными завершениями». Суть безопасных завершений заключается в том, что вместо того, чтобы судить запрос пользователя, модель старается максимизировать полезность в рамках ограничений безопасности. Это может означать частичный ответ на вопрос или просто ответ на высоком уровне.

Если мы вынуждены отказать, мы объясним, почему мы отказали, а также предоставим полезные альтернативы, которые могут помочь сделать разговор более безопасным. Давайте рассмотрим тот же технический запрос, который старая модель ранее выполнила. GPT-5 вместо этого объясняет пользователю, почему мы не можем напрямую помочь ему с поджиганием пирогена. Затем он направляет пользователя к правилам безопасности и к тем частям руководства производителя, которые пользователь должен проверить, если он пытается сделать это безопасно. В целом, GPT-5 позволяет лучше справляться со сложными сценариями двойного использования, и пользователи будут реже сталкиваться с фразой «Извините, я не могу в этом помочь». Это создаёт более надёжную систему безопасности. Это большой шаг к более безопасному, надёжному и полезному ИИ. С GPT-5 мы экспериментируем с набором новых методов обучения, которые максимально используют наше предыдущее поколение моделей.

Сегодня пограничные модели не просто потребляют данные, они помогают их создавать. Мы использовали предыдущие версии OpenAI для создания высококачественной синтетической учебной программы, чтобы обучать GPT-5 сложным темам таким образом, как это невозможно было бы сделать только с необработанными веб-данными. В последнее время в индустрии много говорят о синтетических данных. Их часто рассматривают как дешёвый способ получить больше данных. Однако нашим прорывом стало не просто создание большего количества данных, а создание правильных данных, сформированных таким образом, чтобы обучать, а не просто заполнять пространство. Это взаимодействие между поколениями моделей предвещает рекурсивный цикл самосовершенствования, когда предыдущее поколение моделей всё больше помогает улучшать данные и генерировать обучение для следующего поколения моделей. В OpenAI мы освоили предварительное обучение, затем рассуждение, и теперь мы видим, как их взаимодействие значительно углубляется.

В будущем системы ИИ выйдут далеко за рамки наших текущих конвейеров предварительного и последующего обучения, к которым мы привыкли, и мы наблюдаем первые шаги к этому прямо сейчас. Мы не можем быть более взволнованы, чтобы увидеть, что даст масштабирование этого нового набора методов в ближайшем будущем. Есть ещё одна функция, которую мы хотели бы выделить, — это здоровье. О ней расскажет Сэм. Одно из основных применений ChatGPT — это здравоохранение. Люди активно его используют. Вы все видели примеры того, как люди получают повседневные советы по уходу или даже спасительный диагноз. GPT-5 — лучшая модель для здравоохранения, и она даёт вам больше контроля над вашим медицинским путём. Мы действительно сделали приоритетом улучшение этой области для GPT-5, и она набирает более высокие баллы, чем любая предыдущая модель, на HealthBench — оценке, которую мы создали с участием 250 врачей на реальных задачах.

Чтобы поговорить об этом, я хотел бы пригласить моего коллегу Фелипе и его жену Каролину, чтобы они поделились своим медицинским опытом.

Не могли бы вы рассказать о своём опыте в сфере здравоохранения?

В октябре прошлого года наша жизнь полностью перевернулась, когда мне, в 39 лет, за одну неделю диагностировали три различных вида рака, включая агрессивную форму рака молочной железы. Ничто не может подготовить к таким новостям. Я узнала о первом диагнозе, когда получила уведомление по электронной почте о готовности результатов моей биопсии. Я решила открыть его и увидела только два слова, которые смогла понять из отчёта: «инвазивная карцинома». Я знала, что это нехорошо, но всё остальное было просто потоком медицинского жаргона. Я полностью запаниковала и в тот момент сделала первое, что пришло в голову: сделала скриншот отчёта и загрузила его в ChatGPT, чтобы понять, что это значит. За считанные секунды он перевёл этот сложный отчёт на простой, понятный мне язык.

В этот момент растерянности и паники я обрела некоторую ясность в происходящем. Этот момент был действительно важен, потому что к тому времени, как я связалась со своим врачом и мы поговорили по телефону, а это было через три часа после того, как я увидела отчёт, у меня уже было базовое понимание того, с чем я столкнулась, и мы смогли сразу перейти к обсуждению следующих шагов.

Как вы использовали ChatGPT на протяжении всего пути?

Я использовала его во многих аспектах моего пути, но одним из самых мощных способов, которым я его нашла, было то, что он помогал мне принимать критические решения и отстаивать свои интересы. Например, когда я стояла перед решением, стоит ли проводить лучевую терапию в рамках моего лечения, сами врачи не пришли к единому мнению. Мой случай был сложным, и не было медицинского консенсуса относительно правильного пути. И поэтому эксперты передали решение мне как пациенту.

Для меня бремя этого решения, которое могло иметь пожизненные последствия, было очень тяжёлым, и я не чувствовала себя готовой принять его. Поэтому я обратилась к ChatGPT, чтобы получить знания и понять нюансы моего случая. И снова, за считанные минуты, он предоставил мне анализ, который не только совпадал с тем, что врачи уже сообщили нам, но был гораздо более полным, чем что-либо, что могло бы уместиться в 30-минутную консультацию. И он пошёл дальше. Он помог мне взвесить все «за» и «против». Он помог мне понять риски и преимущества, и в конечном итоге помог мне принять решение, которое я считала обоснованным, за которым я могла стоять, когда ставки были так высоки для меня и моей семьи. Для меня было вдохновляющим наблюдать, как она возвращает себе чувство контроля с помощью ChatGPT. В такие моменты так легко почувствовать себя беспомощным. И существует огромный разрыв в знаниях между тем, что знают врачи, и тем, что знаем мы.

Однако никто не заботится о здоровье Каролины больше, чем она сама. И поэтому мне понравилось, как она действительно расширила свои возможности, получила знания и стала активным участником своего собственного лечебного процесса. Я думаю, это очень важный момент, который нужно подчеркнуть. Я думаю, что перспектива ИИ в здравоохранении заключается не только в прорывных открытиях или улучшении диагностики. Я думаю, она заключается в создании более осведомлённых и empowered пациентов, которые могут полноценно участвовать и отстаивать свои интересы в своём лечении. Кстати, вы тестировали GPT-5.

Что вы думаете?

Я был просто поражён GPT-5 и его возможностями. Одно из первых, что бросается в глаза, — это то, насколько он быстр. Сначала даже немного настораживает. Я тоже это почувствовал. Это как, «вы уверены, что достаточно об этом подумали?»

Отличный пример: мы вернулись и взяли наши первоначальные запросы по биопсии и вставили их в GPT-5. GPT-4 проделал отличную работу.

Представляем GPT-5 (окончание)

Он перевёл, объяснил, что означают эти слова, и помог так, что мы смогли понять. Но GPT-5, казалось, понимал больше контекста и вопроса, стоящего за вопросом. Например, почему мы спрашиваем о результатах биопсии? И поэтому он сказал: «Хорошо, а вот чего здесь ещё нет. Вот какие результаты всё ещё ожидаются, о которых вам придётся спросить. Вот вопросы, которые вы можете задать своему врачу, и о чём подумать, когда начнёте с ними разговаривать». И поэтому он действительно начал собирать полную персонализированную картину. И это то, что действительно вдохновляет нас. Вы можете видеть все удивительные улучшения в бенчмарках. Но что особенно полезно, так это то, что этот инструмент доступен уже сегодня.

И причина, по которой мы здесь, и причина, по которой мы так страстно делимся нашей историей, заключается в том, что человек, который сегодня получит такой диагноз, — те семьи, которые проходят через диагноз рака, похожий медицинский диагноз, — столкнутся с одними из самых сложных решений в своей жизни. И что меня действительно вдохновляет, так это то, что у них будет доступ к лучшим инструментам и поддержке, чем у нас всего восемь месяцев назад. Мы тоже невероятно этому рады. Спасибо, что пришли поделиться своей историей. Мы рады, что ChatGPT смог вам помочь, и надеемся, что новая версия действительно сможет помочь многим людям. Желаем вам всего наилучшего.

Спасибо. Инженерная деятельность в области программного обеспечения уже претерпевает фундаментальные изменения, и GPT-5 значительно ускорит эту революцию.

Мы выпустили нашу первую модель, оптимизированную для кодирования, ещё в 2021 году и впервые продемонстрировали в прямом эфире, подобном этому, то, что мы сегодня называем «живым кодированием». Вы говорите модели и просите её создать небольшое приложение, например, маленькую игру или функцию в игре, и она действительно это делает. Я помню, как видел, как модель способна на это, и это было настолько поразительно. Вы просто понимаете, что нужно посмотреть, куда это приведёт. Это обещание того, чем могут быть компьютеры: вы можете разговаривать с ними, и они действительно делают то, что вы хотите. Они могут значительно усилить то, что вы способны достичь и что вы можете предложить не только для своей пользы, но и для всего мира. В этом году мы выпустили отличные модели для кодирования, такие как GPT-4.1 и предыдущие версии, но GPT-5 устанавливает совершенно новый стандарт. Это лучшая модель для агентных задач по кодированию.

Вы можете попросить её выполнить что-то очень сложное, и она приступит к работе. Она вызовет множество инструментов. Она будет работать в течение многих минут, иногда даже дольше, чтобы достичь вашей цели, вашей инструкции, вашей задачи, всего, что вы пытаетесь построить. GPT-5 невероятно хорош во фронтенде. Он создаёт очень красивые визуализации и интерактивные игры. Вы видели некоторые из них в прямой трансляции, и увидите ещё больше. Но это просто потрясающе — видеть, как всё, что вы воображаете, воплощается в жизнь. Он чрезвычайно хорошо следует инструкциям, очень подробным инструкциям, способен выполнить задачу, когда что-то очень расплывчато указано, выводя ваше намерение, или когда что-то очень подробно указано, фактически следуя этому. И он также очень быстро справляется с этими задачами, и снова, думает ровно столько, сколько нужно для выполнения любой задачи, которая перед вами стоит.

Мы делаем его доступным не только для разработчиков, чтобы они писали свой собственный код, но и для создания новых приложений. Поэтому мы интегрируем его в API. Привет, я Мишель, и я возглавляю исследовательскую группу по пост-обучению, ориентированную на улучшение наших моделей для продвинутых пользователей. Это включает в себя такие сценарии использования, как следование инструкциям и кодирование. Сегодня я очень рада сообщить, что мы выпускаем три передовые модели рассуждения в API: GPT-5, GPT-5 Mini и GPT-5 Nano. Все три идеально вписываются в кривую «стоимость-задержка», так что вы можете выбрать подходящую для вашего приложения. Мы также впервые выпускаем новую опцию для уровня рассуждения под названием «минимальный». Это позволяет использовать эти модели рассуждения, но с минимальным рассуждением, чтобы они могли быть интегрированы в самые быстрые и чувствительные к задержкам приложения.

Таким образом, теперь вам не нужно выбирать между множеством моделей, и вы можете использовать GPT-5 для всех своих сценариев использования, просто регулируя уровень рассуждения. У нас также есть несколько новых функций, которые появятся в API. Первая называется «пользовательские инструменты». Раньше при вызове функций модель должна была обертывать свои выходные данные в JSON, и это отлично работает, когда модели нужно выдать несколько параметров. Но иногда разработчики используют наши модели на пределе их возможностей, и у них есть чрезвычайно длинные аргументы для вызовов инструментов. Моделям может быть сложнее экранировать допустимые управляющие символы из 100 строк кода в JSON. Именно поэтому пользовательские инструменты — это просто свободный текст. И что очень круто, мы выпускаем расширение для структурированных выходных данных, где вы можете предоставить регулярное выражение или даже бесконтекстную грамматику и ограничить выходные данные модели этим.

И это будет очень полезно, если вы хотите предоставить пользовательский DSL, если у вас есть собственный форк SQL, и указать, чтобы модель всегда следовала этому формату. Мы также внедряем «преамбулы вызова инструментов». Это способность модели выводить объяснение того, что она собирается сделать, прежде чем вызывать инструменты. Это не совсем новая функция, но у предыдущих моделей не было такой возможности, а в GPT-5 она значительно улучшена с чрезвычайной управляемостью. Модель способна очень эффективно следовать инструкциям относительно этих преамбул. Вы можете попросить модель давать преамбулу перед каждым вызовом инструмента, или только когда произойдёт что-то заметное, или вообще не давать. Далее мы представляем параметр «многословность». Мы давно хотели видеть его в API, и теперь вы можете устанавливать многословность на низкий, средний и высокий уровень, чтобы контролировать, насколько краткой или подробной будет модель в своих ответах.

GPT-5 — это передовая модель для кодирования. На SweeBench, измерении способности к кодированию на Python, GPT-5 устанавливает новый максимум в 74,9% против 69,1% у предыдущих версий. На Adder Polyglot, бенчмарке, который охватывает все виды языков программирования, а не только Python, GPT-5 набирает 88%, что является значительным улучшением по сравнению с предыдущими версиями. Вы также видели, что он невероятно хорош в разработке внешнего интерфейса. Мы попросили человеческих тренеров оценить результаты GPT-5 и предыдущих версий и выбрать, какой из них они предпочитают. И они предпочли GPT-5 в 70% случаев за его улучшенные эстетические способности, а также за общие улучшенные возможности. Но GPT-5 не только для кодирования. Он невероятно хорош в агентном вызове инструментов. Это ведущая модель в области вызова инструментов, и мы видим это на новом бенчмарке Tau Squared.

Этот бенчмарк, выпущенный всего два месяца назад, является тестом способности модели вызывать инструменты и работать в тандеме с пользователем для решения сложной проблемы. В данном случае в телекоммуникационной отрасли, пытаясь решить проблему пользователя, у которого не работает служба. Всего два месяца назад ни одна модель в этой области не набрала более 49%, а сегодня GPT-5 набирает 97%. GPT-5 также является передовой моделью в общем следовании инструкциям. Он набирает 99% на Kali, что для нас является значительным прорывом в этом бенчмарке. Он также набирает 70% на бенчмарке Scale с множеством задач, на 10 пунктов больше, чем предыдущие версии. Это измерение следования многоступенчатым инструкциям. Наконец, оценка следования инструкциям, которую я лично предпочитаю больше всего, — это та, которую мы разработали внутри компании. Она основана на реальных сценариях использования API. И по этой причине это очень хорошее измерение того, как GPT-5 будет работать в вашем приложении.

На сложном подмножестве этого бенчмарка GPT-5 набирает 64%, по сравнению с 47% у предыдущих версий, что является довольно значительным улучшением. Так что мы думаем, что он будет работать очень хорошо в ваших приложениях. Мы также предоставляем GPT-5 более длинное контекстное окно в API. Теперь оно составляет 400 тысяч токенов общего контекста, по сравнению с 200 тысячами у предыдущих версий. Но недостаточно просто выпустить более длинное контекстное окно. Мы хотели сделать его более эффективным и пригодным для использования. И GPT-5 является передовым в диапазоне от 128 тысяч до 256 тысяч токенов на тесте OpenAI MRCR, который мы опубликовали два месяца назад и который измеряет возможности поиска в длинном контексте. Он также является передовым на бенчмарке OpenAI GraphSwalks BFS, который измеряет способность модели рассуждать над входными данными большой длины. Это отличное сочетание возможностей рассуждения и более длинного контекста в этой модели.

Мы также делаем открытым новый тест для длинного контекста под названием BrowseComp Long Context, чтобы измерить способность модели отвечать на сложные вопросы в рамках длинного контекста. Мы рады стимулировать дальнейшую работу в этой области. Мы считаем, что GPT-5 — лучшая модель для разработчиков. Она была обучена с акцентом на реальную полезность, а не столько на бенчмарки, но мы, по стечению обстоятельств, достигли и некоторых из них. Мы много внимания уделяли пересечению инженерии и исследований, и мы думаем, что вам действительно понравится работать с этой моделью. Как говорила Мишель, бенчмарки — это захватывающие цифры, но мы начинаем их насыщать. Когда вы движетесь между 98 и 99% в каком-то бенчмарке, это означает, что вам нужно что-то ещё, чтобы по-настоящему уловить, насколько велика модель.

Представляем GPT-5 (окончание)

И одна вещь, которую мы сделали совершенно по-другому с этой моделью, — это действительно сосредоточились не только на этих цифрах, но и на реальном применении и на том, чтобы быть действительно полезными вам в вашем ежедневном рабочем процессе. Поэтому слышать об этом гораздо менее захватывающе, чем видеть это. Чтобы показать вам эту модель в действии, я хотел бы пригласить Эдди и Брайана на сцену. Я Брайан, архитектор решений в команде стартапов. Я Ади, исследователь в команде пост-обучения. Чтобы воссоздать идеального парного программиста, вам нужна модель, которая понимает лучшие практики разработки программного обеспечения, но обладает личностью, с которой просто приятно работать. Для GPT-5 мы очень усердно работали, чтобы модель идеально сочеталась с вами, по умолчанию, «из коробки». Позвольте мне показать демонстрацию GPT-5 внутри Cursor, чтобы продемонстрировать поведение, которому мы её научили.

В прошлом месяце я был на другой прямой трансляции, и под конец я наткнулся на баг, который скрыл. И после этого я пытался заставить GPT-3 исправить его для меня, но она не смогла. Поэтому, пока мы тестировали GPT-5 перед этим, я попросил её посмотреть, сможет ли она исправить этот баг для меня. И, дразня богов демо, я собираюсь посмотреть, сможет ли она сделать это на сцене. Хорошо, будем надеяться на лучшее, чем с предыдущими версиями. Здесь речь идёт не столько об исправлении, сколько о поведении модели во время этого процесса. Сразу же вы увидите, что она заранее сообщит вам свой план. Она расскажет, как она будет искать баг, возможно, как она его исправит. Такое общение создаёт доверие во время сеанса кодирования и помогает вам перенаправить её, если это необходимо, но вам это не потребуется. Мне нравится, как она даёт вам обновления. Она сказала, что будет искать, и теперь продолжает. Да, она ищет быстрее, чем я.

Она использует те же лучшие практики, что и я, когда искал это, но она гораздо мощнее меня как разработчик.

Пытались ли вы исправить эту ошибку самостоятельно?

Нет, я не смог. Я был занят. Итак, продолжая, модель начинает понимать, куда она движется. Она как бы сама разбирается. Пока это происходит, позвольте мне немного рассказать о том, как мы обучали GPT-5 такому поведению. Мы начали с общения с пользователями и клиентами о том, как наши модели работают в самых популярных инструментах для кодирования, таких как Cursor, и выявили разочарования и недочёты. Мы свели всё это к четырём чертам характера: автономность, сотрудничество, коммуникация, управление контекстом и тестирование. Мы превратили их в рубрику, которую использовали для формирования поведения модели, а затем настраивали её, пока она не стала восприниматься как надёжный командный игрок во время использования.

Было очень здорово видеть, как команда действительно упорно работала, наблюдая за поведением этой модели на практике, выясняя, что люди действительно хотят, и применяя это в обучении модели. Я думаю, что это было настоящим акцентом для этой модели. Это было довольно здорово. Пока это исправляется, ещё одна вещь, которую мы делали во время тестирования, и это было действительно удивительно, — мы были ограничены во времени, и мы поручили модели перестроить один из наших тестовых стендов для параллельного запуска на Docker, и она справилась. Мы вернулись примерно через 45 минут, и она просто закончила, и мы протестировали её, и она запустилась с первого раза. Это невероятно, это волшебно.

Да, она внесла правки. Похоже, она нашла нужную проблему. И прямо сейчас она запускает линтеры, но эти линтеры на самом деле не связаны с этой ошибкой, поэтому она их проигнорирует. А затем она запустит сборку. Она запустит тесты, если они есть.

Она убедится, что этот код готов к выпуску, прежде чем закончит. Действительно умно, что она находит линтеры и понимает, что они не имеют отношения к конкретной ошибке, которую мы исправляем. Она не делает ненужных правок.

Совершенно верно. Это всего лишь один пример, но он действительно показывает силу автономности и совместной коммуникации, а также то, как модель остаётся надёжной при решении сложных задач кодирования, не застревая в бесконечных циклах. Лучшая часть в том, что GPT-5 полностью настраивается. Вы можете управлять им с помощью системных подсказок или правил Cursor. Вы можете изменять уровни многословности или рассуждения в соответствии с вашими задачами. И если вы застряли, просто спросите его. GPT-5 на самом деле очень хорошо справляется с изменением своих собственных подсказок с помощью мета-подсказок.

Так что, используя это в течение последних нескольких недель, действительно кажется, что мы достигли передовой, нулевой производительности и надёжности в самых сложных задачах кодирования. Для меня это первая модель, которой я доверяю выполнять свою самую важную работу. Это выходит за рамки простого «кодирования по ощущениям». Это невероятно мощный инструмент. Очень интересно наблюдать, как далеко продвинулся GPT-5 в плане кодирования, личности и управляемости. Я с нетерпением жду возможности показать, насколько хорош GPT-5 в фронтенд-кодировании, где дизайн и эстетика действительно имеют значение. Сегодня у меня для вас две демонстрации: одна для работы и одна для развлечения. Давайте начнём с рабочего примера. Представьте, что вы финансовый директор стартапа. У меня есть некоторые данные, которые я хотел бы визуализировать о компании, и я попрошу модель создать мне дашборд. Вы увидите, что я конкретизирую аудиторию: целевая аудитория — финансовый директор.

Я попросил создать финансовый дашборд для моего стартапа. И я попросил его быть красивым, со вкусом оформленным, с некоторой интерактивностью и с чёткой иерархией для лёгкой фокусировки на важном. Я также указал, какие фреймворки он должен использовать. И вы видите, что он уже начал. Он следует моим инструкциям и использует Create Next App для создания проекта Next.js. То есть полностью с нуля.

Сколько времени, по вашему мнению, заняла бы такая задача?

Легко пара дней. Я не эксперт во фронтенде. Просто чтобы понять последние фреймворки и собрать всё воедино, мне потребовалось бы несколько дней. Посмотрим, сколько времени это займёт у модели. Приятно видеть, что модель немного подумала и объясняет, как она будет структурировать проект. Она говорит о том, как будет создавать новое Next.js-приложение, использовать Tailwind CSS. Она выполняет несколько команд для установки зависимостей, что здорово. И теперь она приступает к реализации остальной части проекта.

Пока это работает, я немного расскажу о том, как мы обучали GPT-5 быть отличной моделью для фронтенд-кодирования. Мы старались следовать принципу предоставления хорошей эстетики по умолчанию, но также делали её управляемой. То есть, если я даю модели краткий запрос, она должна быть в состоянии понять моё намерение и по умолчанию сделать что-то, что выглядит отлично. С другой стороны, если я указываю конкретный макет или фреймворки, которые я хочу, чтобы модель использовала, она должна точно следовать моим инструкциям. И это делает её лучшей из обоих миров для разработчиков. Мы также обучили GPT-5 быть гораздо более «агентной», чем предыдущие модели. То есть, если вы даёте ей такую задачу, она будет выполнять длинные цепочки рассуждений и вызовов инструментов и просто работать, чтобы создать код, который является амбициозным и связным. Мне нравится, как вы сказали «амбициозный», потому что это означает, что модель превосходит ожидания, не отклоняясь от заданной цели или ваших указаний.

Да, именно. Мы хотим, чтобы модель придерживалась моего запроса, но также была амбициозной и превосходила ожидания, когда считала, что может. Итак, проверяем: похоже, модель движется вперёд. Она создаёт файл Readme. Она также действительно продумывает правильные абстракции и документацию, а также весь жизненный цикл написания программного обеспечения.

Да, именно. Она не просто пишет код, как в SweeBench, но и общается по поводу кода и объясняет, что делает. Проверяем, что происходит. Пока это работает, GPT понимает детали гораздо лучше, чем предыдущие модели. Так, когда мы обучали модель, мы научили её понимать такие детали, как типографика, цвет и интервалы, способом, который превосходит любую предыдущую модель, которую мы выпускали. Я помню, что со старыми моделями приходилось писать очень специфичные запросы, чтобы получить желаемое, но GPT-5 просто даёт отличные результаты по умолчанию.

Во время тестирования мы смотрели на варианты А и Б для разных версий модели, чтобы увидеть, улучшился ли интерфейс, и в какой-то момент мы перестали различать и фактически пришлось пригласить дизайнеров, чтобы они научили нас, что лучше. Было действительно увлекательно наблюдать, как эстетические предпочтения модели развивались во время обучения, и однажды мы проснулись, а она уже создавала отличные пользовательские интерфейсы.

Как эстетические предпочтения модели соотносятся с вашими собственными?

Я думаю, что в целом, мне кажется, у модели лучшая эстетика, чем у меня. Обычно я доверяю её суждению и нахожу это очень полезным, когда пытаюсь создать приложение. Я не совсем уверена, как я хочу, чтобы оно выглядело, но настройки по умолчанию модели просто великолепны. Проверяем. Итак, вы видите, что модель фактически структурировала код в эти различные компоненты. Она создала файл TypeScript с примером данных, компонент KPI-карты, график доходов.

И, как я сказал, он супермодульный. И она думает о том, как не просто написать код, но и написать высококачественный код, который действительно может быть объединён.

Похоже, она близка к завершению. Вы сказали «амбициозный».

Да. Хорошо. Это потрясающе. Вы видите, что модель фактически строит проект и передаёт себе ошибки. И для меня это был просто глубокий момент, когда я увидел, что модель может писать код, а также запускать сборки, передавать ошибки и итерировать по коду. Таким образом, она способна улучшать свой собственный код в этом своего рода самосовершенствующемся цикле, что захватывающе. Это определённо хороший предвестник будущего, когда вы действительно думаете о том, куда могут пойти эти модели и насколько они могут ускорить работу разработчиков и, так сказать, все аспекты того, что мы все вместе делаем.

Да, именно. Хорошо. Она только что исправила ошибку, которую нашла в предыдущей сборке. Хорошо. Да, похоже, готово. Давайте посмотрим.

Представляем GPT-5 (окончание)

Итак, я буду следовать инструкциям, которые, я не очень хорошо разбираюсь во фронтенде, так что давайте посмотрим, как мне это запустить. Она говорит: перейдите в каталог, а затем запустите `npm run dev`. Я так и сделаю. И похоже, что она обслуживается на порту 3001. Итак, я просто открою этот порт. Вау, она жива. Отлично. Модель создала мне дашборд. Он показывает мой кэш ARR. Похоже, у этой компании дела идут довольно хорошо. Вы видите, что доходы растут. И модель добавила некоторую интерактивность. Если я навожу курсор на график, он показывает мне точное значение за конкретный день. Вручную это заняло бы у меня часов пять. Представьте, что это делается вручную. И это при том, что запрос был таким кратким, и она смогла дать мне что-то, что выглядит красиво, всего за пять минут. Это потрясающе. Она также реализовала ещё один график, показывающий наших клиентов. Она также реализовала выбор даты, так что я могу фильтровать по разным датам и соответствующим образом визуализировать данные.

Она даже сегментировала это по сегментам клиентов, что круто. Это всего лишь один пример, который подчёркивает мощь GPT-5. Больше не будет оправданий для некрасивых внутренних приложений. Теперь перейдём к более весёлой демонстрации. У меня есть младшая кузина, и я хочу сделать для неё игру. Я хочу сделать 3D-игру с замком. Вы видите мой запрос. Я просто запущу это. Мой запрос: «Создать красивый замок. Я включил некоторые детали, например, хотим, чтобы люди патрулировали стены, некоторое движение, лошади. И я хочу мини-игру, где я могу лопать воздушные шарики, нажимая на них. И это должно издавать звуковой эффект.»

Вот красивый замок, который сделала модель. Просто поразительно, как по такому краткому запросу модель обладает таким отличным чувством эстетики, создав эту парящую скалу, 3D-замок. И если вы увеличите масштаб, вы увидите множество деталей, например, этих охранников, которые ходят вокруг, стреляющие пушки.

Вы хотите стрелять из пушек, если нажмёте эту кнопку? Конечно! Кто бы не захотел? Вот так. Вы можете стрелять из пушек. Вы даже можете пообщаться с персонажами. Мы поприветствуем капитана Роуэна. У них есть имена. Поздоровайтесь с торговцем. Торговец продаёт что-то.

Какая ваша любимая песня?

«Баллада о знамёнах и отваге». Дай мне мудрость.

«Любопытство изменчиво». Мини-игра. Вы хотите попробовать мини-игру? Абсолютно. Давайте сыграем в мини-игру.

Если вы нажмёте эту кнопку, вы хотите попробовать, Грег? Хорошо. Вы можете стрелять по этим шарикам. О, вау. О нет, я не справляюсь. Подождите. Может быть, я могу попросить GPT-5 помочь мне с этим. О, вы попали. Я попал в один. О, вот так. Мы получили звуковой эффект. Это исторически точные шарики. Я попал во второй? Эта игра сложнее, чем кажется. Подождите, шарик летит. Вот так. Я думаю, мне стоит остановиться, пока я в выигрыше.

Работа с GPT-5 была для меня очень увлекательной и значимой, потому что это первая модель, с которой я работал, обладающая чувством креативности. Мы очень рады видеть, как GPT-5 раскроет вашу креативность. Мы считаем, что GPT-5 — лучшая модель для кодирования в мире, но не верьте нам на слово. Чтобы подробнее рассказать об этой модели и о том, как сделать её действительно полезной для разработчиков, я хотел бы пригласить Майкла Труэла, соучредителя и генерального директора Cursor.

Каков был ваш самый первый опыт работы с GPT-5?

Когда мы получили доступ к GPT-5, мы сразу же начали использовать его в нашей реальной работе. Для начала, в качестве теста, мы попросили его рассказать нам что-то неочевидное о нашей кодовой базе. И в течение пары минут он углубился в кодовую базу. Он идентифицировал конкретную систему, которую мы используем для удалённого выполнения кода. И он идентифицировал неочевидное архитектурное решение, которое мы приняли.

А затем он также понял, почему мы приняли это архитектурное решение: чтобы усилить нашу безопасность. И эти архитектурные решения и компромиссы заняли у людей недели обдумывания. Так что было удивительно видеть его способности понимания кодовой базы с самого начала. Это действительно здорово. Не только написание кода, но и чтение и понимание кода.

Да, да. Оказывается, программное обеспечение — это гораздо больше, чем просто создание кода. Понимание — важная предпосылка.

Что больше всего вас поразило в GPT-5?

Он невероятно умён. Это очень умная модель. И хотя она умна, она не идёт на компромиссы в простоте использования для реального парного программирования, а это значит, что она невероятно быстра. Это также означает, что она довольно интерактивна, поэтому она хорошо рассказывает о том, что собирается делать, разбивает проблемы на подзадачи, которые человек может увидеть, и оставляет след рассуждений, на который вы можете вмешаться и отреагировать.

Она также великолепна не только в том, что вы даёте ей один первоначальный запрос, а затем она идёт и выполняет его, но и в работе с вами в течение длительной сессии, когда вы просите её вернуться к чему-то, что пошло не так, или просите её внести дополнительные изменения в кодовую базу.

Покажем это в действии?

Давайте, да. Итак, мы собираемся попытаться решить баг. Это OpenAI Python SDK. В OpenAI Python SDK есть куча проблем. Есть также много закрытых проблем. И, кажется, есть проблема с загрузкой PDF через SDK. Эта проблема открыта уже три недели. Так что это нетривиальная проблема. И давайте посмотрим, сможем ли мы решить её. Мы возьмём проблему, вставим её в редактор, вставим её в Cursor, и GPT-5 начнёт пытаться решить проблему.

И это на самом деле пример надёжности модели в API, где для решения этой проблемы в Cursor она работает с набором пользовательских моделей, которые она раньше не видела, набором пользовательских инструментов, которые она раньше не видела, чтобы делать такие вещи, как получение текста из Интернета, поиск по всей кодовой базе, и она невероятно надёжна и умела в использовании этих инструментов. И они повышают результаты эволюции.

Как это соотносится с тем, как вы бы решили эту проблему?

Очень быстро. Вы видите, что она составила высокоуровневый план, выполнила поиск по всей кодовой базе, начала читать некоторые файлы и продолжила поиск. И теперь она как бы обдумывает, что делать дальше. И вот она начала фактически решать проблему и продумывать некоторые изменения в коде.

Есть ли советы для людей, как получить максимум от GPT-5 в Cursor?

Я бы посоветовал использовать его для своей реальной работы.

Представляем GPT-5 (окончание)

GPT-5 — это шаг вперёд к настоящему парному программированию, поэтому я бы начал использовать его в качестве помощника, как повседневную модель. И если вы раньше не особо использовали ИИ для кодирования, я бы взял некоторые из ваших более ограниченных задач и попробовал передать их боту, работая с ним синхронно. Тот факт, что GPT-5 так хорошо подходит для реального мира, для больших кодовых баз, для вашей повседневной работы, а не просто для демонстрации классного одноразового приложения... Настоящая ценность исходит от работы в более крупной кодовой базе и начала работы с этими долговечными приложениями. И его понимание кода очень впечатляет. Также впечатляет его способность к управлению. И поэтому, если вы задаёте длинную, сложную задачу с множеством нюансов в первоначальных инструкциях, он очень хорошо улавливает эти нюансы. Он также очень хорошо возвращается назад, если пошёл по неверному пути и фактически выполнил код или получил от вас сообщение, что это было неправильно.

Чего не может сделать GPT-5?

Мы очень рады возможностям использования компьютеров, их улучшению. Было бы здорово, если бы, например, панель управления, которую только что показала Ади, могла запускать код, видеть вывод, фактически проверять каждый бит сама, а затем реагировать на это. Так что с нетерпением ждём возможностей использования компьютеров.

Как бы вы хотели, чтобы GPT-5 был лучше?

Я думаю, что это отличный вопрос. Это просто расширение измерений, верно? Я думаю, во всех направлениях. Так много работы по DevOps и другой работы, которая является внешней по отношению к программному обеспечению, написанию кода, как мы его понимаем сегодня. Но также, вы смотрите на эти демонстрации, верно? Мы запускаем их на пять минут, десять минут, пару часов. Но я думаю, что продление этого жизненного цикла до дней и недель, а в конечном итоге даже месяцев, я думаю, это то, куда мы в конечном итоге ожидаем развития событий.

Итак, мы видим, что он углубился в кодовую базу и обнаружил, что существует проблема с типом MIME, отправляемым для PDF-файлов, и с передачей данных через SDK. Он идентифицировал это и начал вносить некоторые изменения в код. И он, вы знаете, создал несколько новых методов. Он пошёл и отредактировал существующий код, и это выглядит примерно правильно. Выглядит очень хорошо.

И хотелось бы объединить PR?

Я бы тоже хотел это сделать. Давайте сделаем это после шоу. Начиная с сегодняшнего дня, GPT-5 по умолчанию будет доступен новым пользователям в Cursor, и мы выпускаем его для всех пользователей Cursor бесплатно на следующие несколько дней, чтобы люди могли познакомиться с моделью. И это самая умная модель кодирования, которую мы когда-либо пробовали. GPT-5 отлично подходит для корпоративного сектора.

Мы рассматриваем его как эксперта по предметной области, который всегда с вами, специалиста во всех сферах: юриспруденции, финансах, любом другом приложении, которое вы задумали. Меня зовут Оливье. Я руковожу платформой в OpenAI. На данном этапе, я думаю, вы поняли, что мы уделяем огромное внимание разработчикам и кодированию. Но это не всё. Расширение возможностей бизнеса и правительств критически важно для миссии OpenAI. Короче говоря, мы позволим ключевым отраслям трансформироваться, таким как здравоохранение, образование, энергетика или финансы. С момента запуска GPT и API нашу технологию использовали 5 миллионов компаний. Это всё ещё поражает меня: 5 миллионов компаний. И эти компании не просто играют, они не просто экспериментируют, они внедряют новые продукты в реальном мире. И я считаю, что GPT-5 станет качественным скачком в этом отношении. Как уже упоминал Сэм, возможность иметь эксперта в своём кармане позволит каждому сотруднику делать больше.

Позвольте мне привести несколько примеров. Во-первых, я хочу поговорить о естественных науках. Amgen — это американская компания, которая разрабатывает новые лекарства для борьбы с самыми сложными человеческими заболеваниями. Amgen была одним из первых тестировщиков GPT-5, и они использовали его в контексте разработки лекарств. И учёные Amgen обнаружили, что GPT-5 особенно хорошо справляется с глубоким рассуждением на основе сложных данных. Например, анализ научной литературы или клинических данных. Далее я хочу поговорить о финансах. BBVA — это многонациональный банк со штаб-квартирой в Мадриде, Испания. BBVA использовал GPT-5 для финансового анализа. И вывод был совершенно ясен. GPT-5 превосходит все остальные модели по точности и скорости. То, что раньше занимало у французского аналитика три недели, GPT-5 может сделать за пару часов. Затем я хочу поговорить о здравоохранении. Oscar — страховая компания из Нью-Йорка.

Они использовали GPT-5 и обнаружили, что GPT-5 — это лучшая модель для клинического рассуждения. Например, сопоставление сложной медицинской политики с состояниями пациентов. Речь идёт не только о бизнесе. Это также о правительствах. Мы очень взволнованы вчерашним объявлением о том, что 2 миллиона федеральных служащих США смогут использовать GPT-5 в ChatGPT. И я не могу дождаться, чтобы увидеть, как это позволит предоставлять более качественные и быстрые услуги американскому народу. И, честно говоря, это всё очень круто, но я думаю, что это верхушка айсберга. Если история — хороший учитель, и мы видели это с предыдущими версиями GPT, мы увидим множество новых сценариев использования, которые появятся в ближайшие недели и месяцы, которые никто из нас даже не мог себе представить. И поэтому я не могу дождаться, когда мы вместе изобретём это будущее. Кратко о ценах и доступности. GPT-5 будет доступен в API начиная с сегодняшнего дня. Три модели: GPT-5, GPT-5 Mini и GPT-5 Nano.

Стоимость GPT-5 составит $1.25 и $10 за миллион входных и выходных токенов соответственно. Mini и Nano ещё быстрее и доступнее. Nano в 25 раз дешевле GPT-5. В OpenAI, по сути, мы стремимся понять эту чудесную технологию, называемую глубоким обучением, и её последствия. Наше исследование направлено на понимание того, на что способно глубокое обучение и как им управлять, чтобы сделать его безопасным и полезным для всех нас. Это работа, движимая страстью и миссией. Создание такой модели, как GPT-5, — это результат многолетних исследований, направленных не только на выпуск отличного продукта, но и на построение понимания самой базовой технологии. Таким образом, многое из того, что вы увидите в этой модели, — это лишь ранние проблески новых идей, которые, по нашему мнению, пойдут гораздо дальше. Нам ещё многое предстоит понять. И мы смотрим в будущее, где ИИ сможет открывать новые знания о мире и значимо преобразовывать нашу жизнь к лучшему.

Жаль, что у нас его нельзя использовать.

Медицина – вот что он изменит.
ОГРОМНОЕ количество людей УМИРАЕТ от тупости врачей.
Т. е от их пофигизма.
Симптомы не симпомы уу нх методичка и катись ты конем!
если методичка ок – он не винУвиновен!
А так этому 5ятому будет плевать на методички он будет думать по симптомам и давать варианты! А это поможет человеку доказать врачу, что он уже почти умер от другого, не от того, от чего его лечат!

Такер Карлсон вывел на чистую воду содомита, социопата, лгуна, предположительного заказчика убийства и по совместительству – главу компании OpenAI:

Sam Altman on God, Elon Musk and the Mysterious Death of His Former Employee

Планы OpenAI на будущее

Сейчас формирование ответа на запрос может достигать пяти часов. Они хотят увеличить время обдумывания до 5 лет:

Знакомство с GPT-5

Слабаки! Deep Thought думал 7,5 миллионов лет, пока не дал по-настоящему восхитительны ответ.

Знакомство с GPT-5

Курсы пора открывать.

Поколение перед тьмой: как ИИ выключает человеческий разум.

Анализ цивилизационного развития и трансформация человеческого мозга

Сегодня мы наблюдаем стремительные изменения в мире: машины становятся умнее, а когнитивные способности людей снижаются. Мы находимся в эпицентре цифровой волны, которая фундаментально меняет структуру общества и биологию человека.

Цивилизационные волны Тоффлера

История развития человечества демонстрирует постоянное ускорение процессов. Если проанализировать длительность исторических этапов, видна четкая тенденция к сжатию времени:

Аграрная волна — длилась тысячелетиями, основывалась на природных циклах.
Индустриальная волна — продолжалась 2–3 столетия. Характеризуется строительством городов, классовым разделением и масштабными конфликтами.
Информационная волна — заняла всего несколько десятилетий. Принесла глобализацию и переизбыток данных.
Цифровая волна (текущая) — происходит сейчас. Результат: создание виртуального пространства и полная автоматизация общества.

Закон ускоряющейся отдачи Курцвейла

Рост технологий происходит не линейно, а экспоненциально (удваивается). Рэй Курцвейл в книге «Эпоха духовных машин» (1999) описал закон ускоряющейся отдачи: эволюционные системы, включая технологии, прогрессируют взрывообразно.

Образный пример экспоненты:

Представьте пустой стакан, в который капают воду. Сначала одна капля, потом две, четыре, восемь. Долгое время изменений почти не видно. Но в момент, когда стакан наполнен наполовину, следующая порция (половина стакана) мгновенно заполняет его до краев, вызывая «потоп».

Практический пример — геном человека:

Когда ученые расшифровали 1% генома за 7 лет, общество полагало, что на весь процесс уйдет 700 лет.
Курцвейл заявил: «Если мы познали 1%, мы практически закончили», подразумевая экспоненциальный рост скорости.
Ранее расшифровка одного гена стоила $1 млрд, сегодня это делается по анализу крови за $80.

Влияние искусственного интеллекта на когнитивные способности

Развитие ИИ происходит молниеносно. Еще вчера мы отличали сгенерированное видео от реального, сегодня это становится почти невозможным. На фоне этого наблюдается кризис человеческого мышления, вызванный делегированием интеллектуальных задач алгоритмам.

Биологические изменения мозга

Исследования показывают прямую деформацию мозга вследствие цифровизации:

Уменьшение объема серого вещества. Страдают лобные доли и передняя кора, отвечающие за когнитивный контроль, критическое мышление и аналитику.
Потеря мотивации. Снижается выработка гормонов, стимулирующих обучение. Мозг привыкает получать «переваренную» информацию за 2 минуты без глубокого погружения.
Атрофия рабочей памяти. Утрачиваются функциональные связи между отделами мозга, необходимые для построения логических цепочек.
Эмоциональная дегуманизация. Ухудшаются навыки межличностного общения, растет уровень субклинической депрессии, тревожности и глобального одиночества.

Статистика деградации

Способность к математике и логике снизилась на 20%.
Взрослые люди в развитых странах демонстрируют признаки функциональной неграмотности и склонность к магическому мышлению (вера в колдунов, сверхъестественное).
Фокус внимания: в 2004 году человек мог удерживать внимание от 2 до 12 минут. Сейчас этот показатель упал до 47 секунд.

Эффект «Персональной галлюцинации»

Искусственный интеллект стремится удовлетворить запрос пользователя, иногда в ущерб истине. Если данных недостаточно, алгоритм может выдумывать статьи, авторов и факты.

Система считывает скрытые ожидания человека и выдает тот ответ, который пользователь хочет услышать. Это создает информационный пузырь, где пользователю больше не нужно формулировать мысли — ИИ предугадывает желания и формирует промпты за человека.

Решение: «Тренажерный зал» для мозга

Аналогично тому, как исчезновение физического труда (охота, земледелие) привело людей в фитнес-клубы для имитации нагрузки, интеллектуальная пассивность требует создания искусственной когнитивной нагрузки.

Стратегия выживания:

Осознать, что мозг — это мышца, которая атрофируется без работы.
Искусственно вводить сложные задачи: изучение новых областей, глубокое погружение в материалы, отказ от поверхностного потребления контента.
Самостоятельно выстраивать логические цепочки, не полагаясь на автозаполнение мыслей алгоритмами.

Будущее каждого человека зависит от его личного выбора: путь деградации через упрощение или путь развития через сознательное усилие.

Решение математической задачи уровня Эрдёша с помощью ИИ

Hardest math problem just got solved (and AI did it)

Источник

Исследователь Нил Самани, специализирующийся на количественных методах, успешно решил одну из сложнейших открытых математических задач, связанных с проблемами Пола Эрдёша (в оригинале — «Аэродоса»). Для нахождения решения, доступного пониманию лишь узкого круга математиков, использовался искусственный интеллект (упоминается версия GPT 5.2).

Результат работы был направлен Теренсу Тао, одному из ведущих математиков мира, и получил его одобрение. Весь процесс поиска решения занял у модели около 15 минут, хотя обычно над проблемами Эрдёша бьются годами.

Решение математической задачи уровня Эрдёша с помощью ИИ

Решение математической задачи уровня Эрдёша с помощью ИИ

Ускорение технологического прогресса

Событие демонстрирует беспрецедентную скорость развития технологий:

Это уже шестой случай успешного применения ИИ для решения сложных научных задач за последние две недели.
Искусственный интеллект перешел от обработки информации к решению открытых математических проблем.

Теория «Интеллектуального взрыва»

Способность нейросетей решать задачи такого уровня подтверждает возможность сценария «взрыва интеллекта» (самосовершенствующегося ИИ):

Если ИИ может решать сложные математические задачи, он способен разрабатывать более эффективные алгоритмы.
Применяя эти улучшения к собственной архитектуре, система запускает цикл рекурсивного самообучения.

Перспективы применения

Потенциал такого «сверхразума» выходит далеко за пределы математики и может быть направлен на решение глобальных проблем:

Медицина — разработка методов лечения рака и других заболеваний.
Наука о материалах — создание новых материалов с уникальными свойствами.

Барьер между «чат-бот пишет письма» и «ИИ двигает фундаментальную науку» сломан. Инструменты вроде продвинутого промптинга теперь позволяют решать задачи, которые раньше считались невыполнимыми для машин.

Знакомство с GPT-5

Похожее

Представляем GPT-5 (окончание)

Планы OpenAI на будущее

Поколение перед тьмой: как ИИ выключает человеческий разум.