Дізнайтеся що таке нейронна мережа, чому вони викликають такий інтерес сьогодні, вважаються штучним інтелектом та які бувають види нейронних мереж.
Що таке нейронна мережа – простими словами
В інформаційних технологіях (ІТ) штучна нейронна мережа (ШНМ) – це система апаратного та/або програмного забезпечення, побудована за принципом роботи нейронів у людському мозку. ШНМ, які також називають просто нейронними мережами, є різновидом технології глибокого навчання, яка також підпадає під поняття штучного інтелекту, або ШІ.
Комерційне застосування цих технологій, як правило, зосереджене на вирішенні складних проблем обробки сигналів або розпізнавання образів.
Нейромережа, яка малює онлайн за описом чи з фото: топ 5
Приклади нейронних мереж
Приклади важливих комерційних застосувань нейронних мереж включають:
- розпізнавання рукописного тексту для обробки чеків,
- транскрипцію мови в текст,
- аналіз даних нафторозвідки,
- прогнозування погоди
- розпізнавання облич.
Історія виникнення нейронних мереж
Історія штучних нейронних мереж сягає ранніх днів розвитку обчислювальної техніки. У 1943 році математики Уоррен Маккалох і Волтер Піттс побудували схему, яка мала наближено відтворювати роботу людського мозку і виконувала прості алгоритми.
Лише близько 2010 року дослідження знову пожвавилися. Тенденція великих даних, коли компанії накопичують величезні масиви даних, і паралельні обчислення дали дослідникам даних навчальні дані та обчислювальні ресурси, необхідні для запуску складних штучних нейронних мереж.
У 2012 році в рамках конкурсу ImageNet нейромережа змогла перевершити людські показники у розпізнаванні зображень. Відтоді інтерес до штучних нейронних мереж стрімко зріс, а технологія продовжує вдосконалюватися.
Як працюють штучні нейронні мережі
ШНМ зазвичай включає в себе велику кількість процесорів, що працюють паралельно і розташовані ярусами. Перший рівень отримує необроблену вхідну інформацію – аналогічно до зорових нервів у зоровому сприйнятті людини. Кожен наступний ярус отримує вихід з попереднього ярусу, а не необроблену вхідну інформацію – так само, як нейрони, віддалені від зорового нерва, отримують сигнали від тих, що знаходяться ближче до нього. Останній рівень виробляє вихід системи.
Кожен вузол обробки має власну невелику сферу знань, включаючи те, що він бачив, і будь-які правила, які він спочатку запрограмував або розробив для себе.
Рівні тісно пов’язані між собою, що означає, що кожен вузол на рівні n буде пов’язаний з багатьма вузлами на рівні n-1 – його входами – і на рівні n+1, які надають вхідні дані для цих вузлів. У вихідному шарі може бути один або декілька вузлів, з яких можна зчитати відповідь, яку він виробляє.
Штучні нейронні мережі відрізняються адаптивністю, що означає, що вони модифікують себе в міру того, як навчаються на початковому етапі, а наступні запуски надають більше інформації про світ. Найпростіша модель навчання зосереджена на зважуванні вхідних потоків, коли кожен вузол зважує важливість вхідних даних від кожного зі своїх попередників. Вхідні дані, які сприяють отриманню правильних відповідей, мають більшу вагу.
Що таке нейромережа Midjourney та як генерувати фотографії з її допомогою?
Як навчаються нейронні мережі
Як правило, ШНМ спочатку навчають або завантажують великими обсягами даних. Навчання полягає у наданні вхідних даних і повідомленні мережі про те, яким має бути вихідний результат.
Наприклад, для побудови мережі, яка ідентифікує обличчя акторів, початковим тренуванням може бути серія зображень, що включає акторів, неакторів, маски, скульптурні та тваринні обличчя. Кожен вхід супроводжується відповідною ідентифікацією, наприклад, іменами акторів або інформацією “не актор” чи “не людина”. Надання відповідей дозволяє моделі скоригувати свої внутрішні ваги, щоб навчитися краще виконувати свою роботу.
Наприклад, якщо вузли Девід, Діана і Дакота скажуть вузлу Ерні, що поточне вхідне зображення – це фотографія Бреда Пітта, але вузол Дуранго каже, що це Бетті Вайт, а навчальна програма підтверджує, що це Пітт, Ерні зменшить вагу, яку він присвоїть вхідному зображенню Дуранго, і збільшить вагу, яку він надасть зображенням Девіда, Діани і Дакоти.
При визначенні правил і прийнятті рішень – тобто рішення кожного вузла про те, що відправити на наступний рівень на основі входів з попереднього рівня – нейронні мережі використовують кілька принципів. До них відносяться:
- навчання на основі градієнта,
- нечітка логіка,
- генетичні алгоритми
- та байєсівські методи.
Їм можуть бути задані деякі базові правила про взаємозв’язки між об’єктами в даних, що моделюються.
Наприклад, системі розпізнавання обличчя можна вказати: “Брови знаходяться над очима” або “Вуса знаходяться під носом. Вуса знаходяться над ротом і/або поруч з ним”. Правила попереднього завантаження можуть пришвидшити навчання і зробити модель більш потужною. Але це також створює припущення про природу проблеми, які можуть виявитися або нерелевантними і некорисними, або неправильними і контрпродуктивними, що робить рішення про те, які правила вбудовувати, якщо вони взагалі потрібні, дуже важливим.
Нейронні мережі та інші системи машинного навчання можуть посилювати упередженість
Крім того, припущення, які люди роблять під час навчання алгоритмів, призводять до того, що нейронні мережі посилюють культурні упередження. Упереджені набори даних є постійною проблемою для навчальних систем, які знаходять відповіді самостійно, розпізнаючи закономірності в даних. Якщо дані, що живлять алгоритм, не є нейтральними – а таких майже не буває – машина поширює упередженість.
Типи нейронних мереж
Нейронні мережі іноді описують з точки зору їхньої глибини, включаючи кількість шарів між входом і виходом, або так званих прихованих шарів моделі. Саме тому термін “нейронна мережа” використовується майже як синонім терміну “глибоке навчання“. Їх також можна описати кількістю прихованих вузлів у моделі або кількістю входів і виходів, які має кожен вузол. Варіації класичного дизайну нейронної мережі дозволяють різні форми прямого і зворотного поширення інформації між рівнями.
Конкретні типи штучних нейронних мереж включають:
Нейронні мережі прямого поширення (Feed-forward neural networks): один з найпростіших варіантів нейронних мереж. Вони передають інформацію в одному напрямку, через різні вхідні вузли, поки вона не потрапить на вихідний вузол. Мережа може мати або не мати приховані шари вузлів, що робить її функціонування більш зрозумілим. Вона готова до обробки великої кількості шуму. Цей тип обчислювальної моделі ШНМ використовується в таких технологіях, як розпізнавання облич і комп’ютерний зір.
Рекурентні нейронні мережі (Recurrent neural networks): більш складні. Вони зберігають вихідні дані обчислювальних вузлів і подають результат назад у модель. Саме так модель навчається передбачати результат шару. Кожен вузол в моделі RNN діє як комірка пам’яті, продовжуючи обчислення і виконання операцій. Ця нейронна мережа починає з такого ж прямого поширення, як і мережа прямого поширення, але потім запам’ятовує всю оброблену інформацію, щоб повторно використовувати її в майбутньому. Якщо прогноз мережі невірний, то система самонавчається і продовжує працювати над правильним прогнозом під час зворотного поширення. Цей тип ШНМ часто використовується для перетворення тексту в мову.
Згорткові нейронні мережі (Convolutional neural networks – CNN): одна з найпопулярніших моделей, що використовуються сьогодні. Ця нейромережева обчислювальна модель використовує варіацію багатошарового сприйняття і містить один або кілька згорткових шарів, які можуть бути повністю з’єднані або об’єднані. Ці згорткові шари створюють карти ознак, які фіксують область зображення, яка в кінцевому підсумку розбивається на прямокутники і надсилається на нелінійний аналіз. Модель CNN особливо популярна у сфері розпізнавання зображень; вона використовується в багатьох найсучасніших додатках ШІ, включаючи розпізнавання облич, оцифрування тексту і обробку природної мови. Інші застосування включають виявлення перефраз, обробку сигналів і класифікацію зображень.
Деконволюційні нейронні мережі (Deconvolutional neural networks): використовують зворотний процес моделі CNN. Вони спрямовані на пошук втрачених ознак або сигналів, які спочатку вважалися неважливими для завдання системи CNN. Ця мережева модель може бути використана для синтезу та аналізу зображень.
Модульні нейронні мережі (Modular neural networks): містять кілька нейронних мереж, що працюють окремо одна від одної. Мережі не взаємодіють і не втручаються в роботу одна одної в процесі обчислень. Отже, складні або великі обчислювальні процеси можуть бути виконані більш ефективно.
Що таке інтернет Web 3.0: чим відрізняеться від Web 2.0 і Web 1.0?
Переваги нейронних мереж
Давайте розглянеіо що таке нейронна мережа в плані їх переваг та недоліків?
До переваг штучних нейронних мереж належать:
- Здатність до паралельної обробки означає, що мережа може виконувати кілька завдань одночасно.
- Інформація зберігається у всій мережі, а не лише в базі даних.
- Здатність до навчання та моделювання нелінійних, складних взаємозв’язків допомагає моделювати реальні взаємозв’язки між входом і виходом.
- Відмовостійкість означає, що пошкодження однієї або декількох комірок ШНМ не зупинить генерацію вихідних даних.
- Поступове пошкодження означає, що мережа буде повільно деградувати з часом, замість того, щоб проблема знищила мережу миттєво.
- Здатність виробляти вихід з неповними знаннями, при цьому втрата продуктивності залежить від того, наскільки важливою є інформація, якої бракує.
- На вхідні змінні не накладається жодних обмежень, наприклад, як вони повинні бути розподілені.
- Машинне навчання означає, що ШНМ може вчитися на подіях і приймати рішення на основі спостережень.
- Здатність вивчати приховані взаємозв’язки в даних, не керуючись фіксованими зв’язками, означає, що ШНМ може краще моделювати дуже мінливі дані і непостійну дисперсію.
- Здатність узагальнювати і робити висновки про невидимі взаємозв’язки на основі невидимих даних означає, що ШНМ може передбачати вихід невидимих даних.
Недоліки нейронних мереж
До недоліків ШНМ відносяться
- Відсутність правил для визначення правильної структури мережі означає, що відповідна архітектура штучної нейронної мережі може бути знайдена лише шляхом проб і помилок та досвіду.
- Потреба в процесорах з можливістю паралельної обробки робить нейронні мережі апаратно-залежними.
- Мережа працює з числовою інформацією, тому всі проблеми повинні бути переведені в числові значення, перш ніж їх можна буде представити ШНМ.
- Відсутність пояснень, що стоять за пошуковими рішеннями, є одним з найбільших недоліків ШНМ. Неможливість пояснити, чому і як отримано рішення, породжує брак довіри до мережі.
Що таке нейронна мережа в плані застосування в сферах життя людини
Розпізнавання зображень було однією з перших сфер, де нейронні мережі були успішно застосовані, але використання технології розширилося до багатьох інших областей, включаючи:
- Чат-боти
- Обробка, переклад і генерація природної мови
- Прогнозування фондового ринку
- Планування та оптимізація маршрутів кур’єрських служб
- Виявлення та розробка ліків
Це лише кілька конкретних сфер, в яких сьогодні застосовуються нейронні мережі. Основними сферами застосування нейромереж є будь-який процес, який працює за суворими правилами або шаблонами і має великі обсяги даних.
Якщо дані занадто великі, щоб людина могла розібратися в них за розумний проміжок часу, процес, швидше за все, є основним кандидатом на автоматизацію за допомогою штучних нейронних мереж.
Джерело: https://www.techtarget.com