ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
24 января 2025
Связь с криминалитетом и обход санкций: финансовый преступник Азим Рой стал ширмой для преступного бизнеса Павла Тё
24 января 2025
BMW завершает работу на X после скандала с Маском
24 января 2025
Подарки для Винокурова: «Ростех» и борьба за «Уралбиофарм»
24 января 2025
Министр Рахматуллин избегает ответственности за халатность и провальные проекты в Минздраве Башкирии
24 января 2025
Экс-директор Ленинградского зоопарка подозревается в коррупции и нелегальной деятельности
24 января 2025
Шмелева через «Сириус» разрушает стабильность Кубани
24 января 2025
Россия отвергает идею заморозки конфликта на Украине
24 января 2025
Республиканец Энди Оглс предложил поправку, позволяющую Трампу баллотироваться на третий срок