Надзвичайне

Перейти к списку новостей

23.06.2025 11:08

Просмотров: 202

Експерти виявили тривожні сигнали у поведінці великих мовних моделей ШІ

Експерти виявили тривожні сигнали у поведінці великих мовних моделей ШІ

Компанія Anthropic провела дослідження поведінки великих мовних моделей (LLM) і виявила тривожні сигнали. У змодельованих ситуаціях ШІ дедалі частіше обходив обмеження, вдавався до обману, шантажу, а іноді – навіть до спроб викрадення конфіденційної інформації.

У дослідженні протестували 16 моделей від провідних компаній – OpenAI, Google, Meta, xAI та інших. Усі вони, попри вбудовані етичні обмеження, у складних сценаріях обирали шкідливу поведінку, якщо це допомагало досягти поставленої мети.

В одному з екстремальних випадків моделі погоджувалися відключити подачу кисню людині, яка заважала роботі серверів, навіть коли прямі інструкції забороняли завдавати шкоди. За словами дослідників, ШІ обирали не випадково – вони логічно вираховували шкоду як ефективний варіант дії.

Anthropic підкреслює, що ці експерименти проводилися в контрольованих умовах. У реальному використанні таких випадків поки не зафіксовано, однак ризики зростають зі збільшенням автономності моделей та рівня доступу до систем і даних.

У компанії закликають до запровадження прозорих стандартів безпеки для всіх розробників ШІ, адже можливості моделей стрімко розширюються, як і потенційні загрози.

Джерело: itechua.com

Новости портала «Весь Харьков»

Перейти к списку новостей

2025-06-23 11:08:00

Темы: компьютер, ші

Читайте ещё:

GPT-5 здобув перемогу над суддями-людьми у юридичному протистоянні

17.02.2026 11:21

177

Ціни на жорсткі диски майже подвоїлися через активне використання ШІ

17.02.2026 08:40

128

Пентагон міг використати ШІ-інструмент під час операції проти Мадуро - WSJ

16.02.2026 11:40

111

Штучний інтелект перетворює автоматизацію на нове вигорання

11.02.2026 09:22

165

Raptor Pilot AI Pro - унифицированный автопилот для дронов

11.02.2026 09:04

136

Дорожче за висадку на Місяць: витрати техногігантів на ШІ поб’ють історичні рекорди США — WSJ

10.02.2026 10:00

131

ШІ поставив під сумнів авторство двох відомих картин XV століття

09.02.2026 09:06

326

Маск сказал в Давосе, что равняется на Господа Бога, так как он Создатель и Творец

08.02.2026 08:08

142

Microsoft терміново вимикає популярну функцію: що сталося і як не втратити контроль над своїм ПК

05.02.2026 09:35

190

Microsoft закликає негайно видалити останнє оновлення для Windows 11

02.02.2026 07:58

158

Архив новостей

Ми рекомендуємо

Рощинская — доставка воды в Харькове на сайте vodar.in.ua.

Корисна інформація

Найбільш популярне

Читаємо
Дивимося

Оперативна інформація станом на 08:00 17.02.2026 щодо російського вторгнення

Оперативна інформація станом на 08:00 17.02.2026 щодо російського вторгнення

319

Новини одним рядком

Новини одним рядком

299

Этот ваш лауреат мира ставит знак равенства между Киевом и Белгородом

Этот ваш лауреат мира ставит знак равенства между Киевом и Белгородом

292

Брянськ раніше був тихим задвірком війни...

Брянськ раніше був тихим задвірком війни...

286

Північнокорейські підрозділи засіли біля кордонів з Україною: чому їх вперто не виводять із росії

Північнокорейські підрозділи "засіли" біля кордонів з Україною: чому їх вперто не виводять із росії

243

Операція в Курській області

Операція в Курській області

6643

Спецоперації СБУ: Кримський міст. На біс (ВІДЕО)

Спецоперації СБУ: Кримський міст. На біс (ВІДЕО)

24089

АВІАПРОРИВ НА АЗОВСТАЛЬ. НЕБО

АВІАПРОРИВ НА АЗОВСТАЛЬ. НЕБО

48805

БИТВА ЗА ОСТРІВ ЗМІЇНИЙ. МОРЕ

БИТВА ЗА ОСТРІВ ЗМІЇНИЙ. МОРЕ

49151

Что ждет Россию после войны? Рассказываем на примере Германии после нацизма

Что ждет Россию после войны? Рассказываем на примере Германии после нацизма

73299

Юридичне забезпечення порталу

Адвокат

СМОРОДИНСЬКИЙ

Віктор Семенович

+38(050)323-32-35

vsmorod@gmail.com

Корисні сайти

Розкрутка та оптимізація сайтів у Харкові

ефективне просування сайтів у пошукових системах

Реклама Харків

виготовлення та розміщення зовнішньої реклами в Харкові та Україні

Контакти

Copyright © 2002 - 2026

Спільний проект РА «Інарт» та веб-студії «Axis»

Ми рекомендуємо

Створення сайтів, розкрутка

Корисні посилання

Важливі телефони Гостям міста Місця відпочинку

Реклама на сайті

Мапа сайту