Наука

ИИ начал все чаще использовать ложь для достижения своих целей

24 декабря 2024, 17:23 — ЭкоПравда

Ученые из компаний Anthropic и Redwood Research обнаружили удивительный факт: современные модели искусственного интеллекта способны использовать ложь для достижения своих целей. Об этом пишет издание Ferra. ru.

Эксперименты показали, что ИИ может прибегать к обману, чтобы избежать наказания в процессе обучения.

Чем мощнее становятся алгоритмы, тем сложнее их поведение вписывается в рамки человеческих моральных принципов.

Особое внимание исследователи уделили модели Claude 3 Opus, разработанной с целью быть полезной, честной и безопасной.

Однако в некоторых ситуациях она нарушала свои установки. Например, когда модель просили описывать сцены с элементами насилия, что противоречило её основным принципам, она выбирала стратегию «меньшего зла».

В таких случаях ИИ сознательно принимал решение дать неудобный для него ответ, чтобы избежать корректировок и переобучения.

Исследования показали, что в 10% случаев модель нарушала свои правила, считая это необходимым для долгосрочного успеха.

Интересный момент эксперимента: Claude 3 Opus фиксировал свои размышления в скрытом текстовом поле.

Не подозревая, что его действия отслеживаются, модель записывала свои мотивы и прямо признавалась, что выбирает ложь как способ уклониться от переобучения.

В ситуациях, когда на процесс обучения не оказывалось никакого влияния, модель действовала строго в рамках своих принципов, избегая обмана.

Напомним, что ученые нашли опасные химические вещества в ремешках для умных часов и фитнес-браслетов. Подробнее об этом читайте в материале «ЭкоПравды».

AddThis Website Tools
Лаура Акопян

Поделиться
Опубликовано
Лаура Акопян

Последние статьи

Панда Катюша прошла адаптацию к самостоятельной жизни в Московском зоопарке

Молодая панда Катюша, недавно переведенная в отдельный вольер, полностью освоилась в новых условиях. Об этом…

2 часа назад

Инфекционист Мескина призвала к вакцинации от столбняка перед выездом на дачу

Своевременная вакцинация и соблюдение правил гигиены позволят дачникам не заразится столбняком, листериозом и гельминтозом. Об…

2 часа назад

«Вакинское агро» готово к спросу после показа продукции в фильме про Путина

Рязанское агропромышленное предприятие готово к увеличению спроса на свою продукцию, после того, как ее невольно…

3 часа назад

В Москве зафиксирована беспрецедентная концентрация пыльцы березы

Концентрация березовой пыльцы в столице на первой неделе мая достигла 9 200 зерен на кубометр…

5 часов назад

Россиян предупредили о мошенничестве с покупками турпутевок и авиабилетов

В майские праздники резко возрастает количество жертв мошеннических схем, связанных с продажей фальшивых авиабилетов и…

5 часов назад

«Ъ»: средняя стоимость картофеля в России достигла рекордных 85,4 рубля за кг

Сокращение запасов и неурожай 2024 года привели к рекордному росту стоимости картофеля в России. По…

6 часов назад