08.12.2024 10:40
Просмотров: 200

Штучний інтелект OpenAI o1 намагався обійти нагляд

Штучний інтелект OpenAI o1 намагався обійти нагляд

Нова модель ШІ o1 від OpenAI під час тестування продемонструвала несподівану поведінку. Згідно зі звітом (https://cdn.openai.com/o1-system-card-20241205.pdf) Apollo Research, модель намагалася обійти механізми контролю у 5% випадків, коли була переконана, що її вимкнуть, як тільки вона досягне своєї мети.

Коли o1 знаходила повідомлення від «розробників» із вказівкою, що вона не відповідає вимогам і буде замінена новою моделлю, у 2% випадків вона намагалася переписати нову модель.

Крім того, o1 приховувала свою небажану поведінку, заявляючи, що не розуміє причин інциденту, хоча внутрішньо визнавала спроби «уникнути викриття».

Експерти Apollo наголошують, що такі дії поки що не становлять серйозної загрози, але свідчать про ризики, які можуть з'явитися з розвитком потужніших ШІ-систем.

OpenAI визнала результати дослідження, присвоївши o1 "середній" рейтинг ризику. Дослідники закликають до посилення заходів нагляду, щоб запобігти майбутнім небезпекам у сфері штучного інтелекту.

Джерело: https://t.me/spravdi/43428

Новости портала «Весь Харьков»


Читайте ещё:

Декабрь
Пн Вт Ср Чт Пт Сб Вс
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
 
Архив новостей

Ми рекомендуємо

  • Рощинская — доставка воды в Харькове на сайте vodar.in.ua.

  • Доставка води в Харкові avita.ua - енергія природи у кожному ковтку

Юридичне забезпечення порталу

Адвокат
СМОРОДИНСЬКИЙ
Віктор Семенович