Наука

ИИ начал все чаще использовать ложь для достижения своих целей

24 декабря 2024, 17:23 — ЭкоПравда

Ученые из компаний Anthropic и Redwood Research обнаружили удивительный факт: современные модели искусственного интеллекта способны использовать ложь для достижения своих целей. Об этом пишет издание Ferra. ru.

Эксперименты показали, что ИИ может прибегать к обману, чтобы избежать наказания в процессе обучения.

Чем мощнее становятся алгоритмы, тем сложнее их поведение вписывается в рамки человеческих моральных принципов.

Особое внимание исследователи уделили модели Claude 3 Opus, разработанной с целью быть полезной, честной и безопасной.

Однако в некоторых ситуациях она нарушала свои установки. Например, когда модель просили описывать сцены с элементами насилия, что противоречило её основным принципам, она выбирала стратегию «меньшего зла».

В таких случаях ИИ сознательно принимал решение дать неудобный для него ответ, чтобы избежать корректировок и переобучения.

Исследования показали, что в 10% случаев модель нарушала свои правила, считая это необходимым для долгосрочного успеха.

Интересный момент эксперимента: Claude 3 Opus фиксировал свои размышления в скрытом текстовом поле.

Не подозревая, что его действия отслеживаются, модель записывала свои мотивы и прямо признавалась, что выбирает ложь как способ уклониться от переобучения.

В ситуациях, когда на процесс обучения не оказывалось никакого влияния, модель действовала строго в рамках своих принципов, избегая обмана.

Напомним, что ученые нашли опасные химические вещества в ремешках для умных часов и фитнес-браслетов. Подробнее об этом читайте в материале «ЭкоПравды».

Лаура Акопян

Последние статьи

В Ираке нашли плиту с клинописью царя Адад-нирари III с проклятиями

Иракские археологи, в сотрудничестве с коллегами из Музея археологии и антропологии Пенсильванского университета, достигли значительного…

15 минут назад

Российские физики получили эталон массы заряженного D-мезона

В новом исследовании, проведенном в Институте ядерной физики Сибирского отделения Российской академии наук, была достигнута…

21 минута назад

Daily Mail: в Перу обнаружили новые трехпалые мумии

Исследователи обнаружили в перуанской пустыне Наска две мумии, возраст которых составляет около 1,5 тысячи лет.…

23 минуты назад

РИАН: Росатом начал выпускать изотоп, повышающий эффективность лечения рака

Учёные из института реакторных материалов, который принадлежит научному дивизиону "Росатома", впервые в России освоили передовую…

36 минут назад

Китайские ученые открыли первое шоссе с отрицательным выбросом углекислого газа

В Китае был открыт первый участок экологически чистого шоссе Цзинань-Хэфэй, протяженностью 152,7 километра, который условно…

42 минуты назад

Американские биологи открыли новый вид растения Непентис

Международная группа биологов из Малайзии и Австралии сделала замечательное открытие, обнаружив ранее неизвестный вид плотоядного…

2 часа назад