Поддержать команду Зеркала
Беларусы на войне
  1. Чиновники много рассуждают, что сделать, чтобы медработники не уезжали из страны. Медсестра из минской больницы дала им простой ответ
  2. Эксперты проанализировали вчерашнее согласие Путина на прекращение огня, но «с нюансами» — вот их выводы
  3. «Слишком близкий к Украине». Трамп отстранил главного представителя США на переговорах из-за претензий Кремля — СМИ
  4. Представитель Кремля: Москва против временного перемирия
  5. Мобильные операторы анонсировали изменения. Есть предупреждение для клиентов — важно сделать одно действие, чтобы не остаться без связи
  6. Путин согласен с предложением прекратить боевые действия в Украине, «но есть нюансы»
  7. Троллейбусная сеть Минска — крупнейшая в мире. Почему от этого транспорта отказываются во многих странах, несмотря на экологичность?
  8. «Я бы сделала это и бесплатно». Поговорили с беларуской, которая сыграла в фильме, получившем пять наград на «Оскаре»
  9. Лукашенко пожаловался, что его в России «периодически» обвиняют в «иждивенчестве», и привел свои аргументы, почему это не так
  10. Если в Польше женщина рожает без мужа, это удивляет. Гинеколог уехала из Беларуси после протестов, а теперь к ней стоят очереди в Польше
  11. Решили проверить информацию от BYPOL и попытались устроиться в госорганизации с подписью за Бабарико. Рассказываем, что из этого вышло
  12. Водители автобусов утверждают, что на границе с Литвой «трясут жестко». Увеличилось ли время прохождения?
  13. Лукашенко на встрече с Путиным завысил явку на прошедших выборах и количество голосов в свою поддержку
  14. Власти переживают из-за оттока молодежи и думают, как ее удержать. Рассказываем об идеях из закрытого документа (вам не понравится)


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.