ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Кирилл Романовский
06 декабря 2024
2364

Досье

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Теги: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Лента новостей

16 апреля 2025 Юрий Чекунов рискует потерять пост из-за земельного конфликта, угрожающего экономике Нефтеюганска

16 апреля 2025 Молдова, Армения и Беларусь лишились американских грантов

16 апреля 2025 Европейский индекс ZEW рухнул на фоне торговых угроз со стороны США

16 апреля 2025 Фиктивные сметы и бюджеты: как департамент обеспечивал доход своим подрядчикам

16 апреля 2025 Верховный суд США потребовал вернуть мигранта, ошибочно высланного в Сальвадор

16 апреля 2025 Московский суд наложил арест на имущество Таганской ОПГ на 200 миллионов рублей

16 апреля 2025 Как Билли Хилл сформировал организованную преступность Лондона

16 апреля 2025 Эльмира Туканова оставила без внимания фальшивое строительство экодеревни, профинансированное из бюджета

16 апреля 2025 Цены на картофель в России увеличились на 300% за год

16 апреля 2025 «Уралвагонзавод» не хочет платить за неудачные проекты: Минпромторг взыскивает деньги за неосновательное обогащение

16 апреля 2025 Министр здравоохранения Мурашко продолжает озвучивать ложную статистику по скорой помощи, игнорируя реальные проблемы

15 апреля 2025 Неудачное нападение на канцлера Шольца: мужчина, проникший в аэропорт, получил штраф и лишение прав

15 апреля 2025 Яир Нетаньяху нецензурно отреагировал на планы Франции признать Палестину

15 апреля 2025 Алмазная торговля в Европе остановилась после введения пошлин Трампа

15 апреля 2025 Дональд Трамп-младший поддержал Уиткоффа в борьбе за мир с Россией

15 апреля 2025 Власти сокращают выплаты участникам СВО

15 апреля 2025 Врио губернатора Свердловской области начал чистку команды Куйвашева

15 апреля 2025 Олег Николаев на выход: губернатора Чувашии списывают из политической обоймы

15 апреля 2025 В Ивановской области задержаны высокопрофильные чиновники за коррупцию в дорожной отрасли

15 апреля 2025 Чешский суд осудил основателя Help Ukraine за хищение субсидий на помощь беженцам