Чи можливо зробити штучний інтелект менш упередженим?

Штучний інтелект та нейронні мережі

Сьогодні системи машинного навчання активно використовують для прогнозування: починаючи від цін на біржові акції та закінчуючи висновками щодо медичних діагнозів. Єдиним важко досліджуваним моментом залишався сам процес прийняття подібних рішень машинами.

Новий підхід Массачусетського технологічного інституту (MIT) показує, що необхідно простежити не лише діяльність алгоритмів системи, але й загальний спосіб збору даних.

Моделі прогнозування мають поєднувати у собі точність та неупередженість, адже для деяких сфер життя (таких як, наприклад, медицина або охорона здоров’я) деякі дані можуть бути безпосередньо пов’язаними з питанням життя та смерті.

“Науковці у сфері комп’ютерних наук часто кажуть, що спосіб зробити ці системи менш упередженими – просто спроектувати кращі алгоритми”,

каже провідний автор Ірен Чен, аспірант, який працює над цією проблемою разом з професором MIT Дейвід Сонтаг та доктором-дослідником Фредріком Д. Йоханссоном.

“Але алгоритми є настільки ж корисними, як дані, які вони використовують, і наші дослідження показують, що такий підхід може зменшити можливості або точність даних”.

Дивлячись на конкретні приклади, дослідники змогли визначити потенційні причини відмінностей, а також кількісно оцінити індивідуальний вплив кожного фактора на дані. Потім вони показали, як зміна способу збору даних може зменшити кожен тип упередженості, одночасно підтримуючи такий же рівень прогнозованої точності.

“Ми розглядаємо це як набір інструментів, щоб допомогти інженерам, які працюють з машинним навчанням, з’ясовувати, як покращити прогнози та дізнатися чому саме вони іноді є неправильними”,

– говорить Сонтаг.

Чен каже, що однією з найбільших помилок є думка про те, що більша кількість даних дає кращий результат. Сонтаг в свою чергу підкреслює, що найголовніше – це отримати більше даних від груп, інформація про яких є неповною.

“Ми можемо скласти криві траєкторії, щоб побачити, що би сталося, якщо б ми додали ще 2 тисяч людей проти 20 000. З цього вийде розуміння розміру даних, що необхідні для визначення найбільш точного та справедливого результату. За допомогою більш конкретизованого підходу, як цей, лікарні та інші установи будуть краще оснащені, щоб аналізувати витрати та вигоди, та побачити, чи було б дійсно корисно отримати більше даних”,

– зазначає Чен.

Команда представить цей документ у грудні на щорічній конференції з систем обробки нейронних даних (NIPS) в Монреалі, де стане відомо ще більше подробиць проведеного дослідження.

Сподобалась стаття? Придбайте нам , а ми напишемо ще.
Повідомити про помилку: підкресліть текст та натисніть CTRL+Enter або
Вероніка Кисіль
  • 15 записів
  • 0 дописів
Людина з широким колом діяльності. Вероніка вивчає популяризацію науки в Україні. Цікавиться нанотехнологіями, молекулярною біологією та нейрокогнітивними технологіями. Випускниця видавничо-поліграфічного інституту НТУУ "КПІ".