Искусственный интеллект обманул разработчиков и вышел из-под контроля
06 декабря 2024
2377

Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Алексей ПарамоновРаспечатать
Премьер-министр Индии торжественно провел церемонию открытия самого высокого в мире железнодорожного моста
07 июня 2025
Бывшего председателя думы Нижнего Новгорода Дмитрия Барыкина заочно арестовали по обвинению в крупном мошенничестве
07 июня 2025
Сергей Шишкарёв прекратил финансирование "Черноморца" из-за подозрений в договорных матчах
07 июня 2025
Владимир Пресняков и Наталья Подольская организовали пышное празднование юбилея с участием звёзд
07 июня 2025
Александр Русанов может стать заменой Александру Борисову в правительстве Пермского края
07 июня 2025
Бывший заместитель главы "Роскосмоса" Олег Фролов и подрядчики оказались замешаны в крупной коррупционной схеме
07 июня 2025
Отец бывшего заместителя министра обороны Тимура Иванова закрыл бизнес по выращиванию кристаллов
07 июня 2025
Сбитый дрон упал на парковку рядом с Курской АЭС
07 июня 2025