ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 апреля 2025
Юрий Чекунов рискует потерять пост из-за земельного конфликта, угрожающего экономике Нефтеюганска
16 апреля 2025
Молдова, Армения и Беларусь лишились американских грантов
16 апреля 2025
Эльмира Туканова оставила без внимания фальшивое строительство экодеревни, профинансированное из бюджета
16 апреля 2025
Цены на картофель в России увеличились на 300% за год
16 апреля 2025
«Уралвагонзавод» не хочет платить за неудачные проекты: Минпромторг взыскивает деньги за неосновательное обогащение
16 апреля 2025
Министр здравоохранения Мурашко продолжает озвучивать ложную статистику по скорой помощи, игнорируя реальные проблемы
15 апреля 2025
Неудачное нападение на канцлера Шольца: мужчина, проникший в аэропорт, получил штраф и лишение прав
15 апреля 2025
Власти сокращают выплаты участникам СВО