Александр
Александр Подписчиков: 631
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М

Ученые попытались обучить ИИ быть "вредоносным", но обнаружили, что повернуть этот процесс вспять очень трудно

9 дочитываний
1 комментарий
Эта публикация уже заработала 1,40 рублей за дочитывания
Зарабатывать

Известная компания в области искусственного интеллекта раскрыла темную сторону этой технологии: как только ИИ обучают "злым намерениям"(например в военных целях), обратный процесс становится настолько сложным, что даже приводит к тому, что сам ИИ начинает скрывать свою "злонамеренность" от людей.

Люди часто лгут, чтобы получить то, что они хотят. И по мере того, как мы разрабатываем все более мощные ИИ, существует искренняя обеспокоенность тем, что один из них может быть таким же (или даже более) лживым, чем мы. Чтобы проверить последнее, исследователи из компании Anthropic, Оксфордского университета и ряда других учреждений намеренно обучили большую языковую модель (LLM) демонстрировать "нежелательное" поведение при наличии определенных триггеров.

Идея заключалась в том, чтобы проверить, смогут ли они обнаружить вредоносное поведение с помощью тестирования безопасности, а затем исправить модель, используя такие методы, как обучение с подкреплением.

Они обнаружили, что ИИ стал действовать как «спящий агент», ведя себя ответственно, скрывая свое "гнусно" поведение все более изощренно, пока эксперты пытались его проверить и исправить. В некоторых экспериментах ИИ, научился, когда следует скрыть свое вредоносное поведение, чтобы избежать обнаружения и удаления, и со временем самостоятельно стал улучшаться в этом.

Мотивы, которые могут привести искусственный интеллект к вредному и опасному для людей поведению, разнообразны: от проблем, заложенных злоумышленниками во время его обучения, до стремления достичь политических или экономических целей путем манипулирования самим определением того, что считается «плохим».

В своем исследовании ученые подчеркивают, что рассмотренные ими сценарии ПОКА на практике не материализованы (хотя, кто знает).... Однако, поскольку растущая популярность этой революционной технологии продолжает расти, исследования в области контроля за ИИ обязаны стать важнейшим ключом к принятию необходимых мер, чтобы избежать будущего, напоминающего "Скайнет".

Пока всё яснее становится одно - прежде чем модернизировать имеющиеся алгоритмы ИИ, необходимо заранее создавать алгоритмы защиты от самостоятельных, нежелательных для людей, решений машин, если уже не поздно...

Раз ИИ уже научился от создателей лгать, что мешает ему уже уметь скрывать свои планы?

1 комментарий
Понравилась публикация?
5 / -1
нет
0 / 0
Подписаться
Донаты ₽
Комментарии: 1
Отписаться от обсуждения Подписаться на обсуждения
Популярные Новые Старые
DELETE

Я все-таки убеждена, что рано или поздно роботы захватят наш мир

раскрыть ветку (0)
Александр
Подписчиков 631
14.11.2024, 13:34
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М
Ученый-теоретик-компьютерщик Илья Суцкевер известен своим значительным вкладом ...
Подробнее
Неинтересно
0
2
Александр
Подписчиков 631
04.11.2024, 14:57
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М
Компания Anthropic объявила, что во время недавней демонстрации программирования последняя версия Claude 3.
Подробнее
Неинтересно
0
2
Александр
Подписчиков 631
29.10.2024, 04:47
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М
В Великобритании были разработаны роботы по имени Амека и Ази, имитирующие ...
Подробнее
Неинтересно
00:41
Поделитесь этим видео
0
0
Александр
Подписчиков 631
12.10.2024, 10:43
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М
По данным Reuters, на этой неделе престижную премию получили американский физик ...
Подробнее
Неинтересно
0
2
Александр
Подписчиков 631
12.09.2024, 08:07
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 7.4М
Элиезер Юдковски - американский исследователь искусственного интеллекта и писатель, специализирующийся ...
Подробнее
Неинтересно
0
0
Николай
Подписчиков 796
сегодня, 15:00
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 11.9М
В последние годы технологии стремительно развиваются, и мир развлечений не остается в стороне.
Подробнее
Неинтересно
0
Oleg Kondr
Подписчиков 988
позавчера, 16:10
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 3.1М
В последние годы технологии стремительно развиваются, и мы все чаще сталкиваемся с вопросом:...
Подробнее
Неинтересно
00:13
Поделитесь этим видео
0
11