Глибоке навчання - це потужна форма машинного навчання (ML), яка будує складні математичні структури, звані нейронними мережами, з використанням величезних обсягів даних (інформації).
Визначення глибокого навчання
Глибоке навчання - це спосіб реалізації ML з використанням декількох шарів нейронних мереж для обробки більш складних типів даних. Іноді зване ієрархічним навчанням, глибоке навчання використовує різні типи нейронних мереж для вивчення функцій (також званих уявленнями) і пошуку їх у великих наборах необроблених, немічених даних (неструктурованих даних). Однією з перших проривних демонстрацій глибокого навчання стала програма, яка успішно вибирала зображення кішок з наборів відео на YouTube.
Приклади глибокого навчання в повсякденному житті
Глибоке навчання використовується не тільки для розпізнавання зображень, а й для мовного перекладу, виявлення шахрайства та аналізу даних, зібраних компаніями про своїх клієнтів. Наприклад, Netflix використовує глибоке навчання, щоб проаналізувати ваші звички перегляду і передбачити, які шоу і фільми ви волієте дивитися. Ось як Netflix знає, як помістити бойовики і документальні фільми про природу в чергу пропозицій. Amazon використовує глибоке навчання для аналізу ваших недавніх покупок і предметів, які ви нещодавно шукали, щоб створити пропозиції для нових альбомів музики кантрі, які вас можуть зацікавити і які ви шукаєте для пари сірого і жовтого тенісу взуття. Оскільки глибоке навчання дає все більше і більше розуміння неструктурованих і необроблених даних, корпорації можуть краще передбачати потреби своїх клієнтів, поки ви, індивідуальний клієнт отримує більш персоналізоване обслуговування клієнтів.
Штучні нейронні мережі та глибоке навчання
Щоб полегшити розуміння глибокого навчання, давайте повернемося до нашого порівняння штучної нейронної мережі (ANN). Для глибокого вивчення уявіть, що наша 15-поверхова офісна будівля займає міський квартал з п'ятьма іншими офісними будівлями. Є три будівлі на кожному боці вулиці. Наша будівля знаходиться в будівлі A і знаходиться на тій же стороні вулиці, що і будівлі B і C. Через дорогу від будівлі A знаходиться будівля 1, а навпроти будівлі B - будівля 2 і так далі. Кожна будівля має різну кількість поверхів, виконана з різних матеріалів і відрізняється від інших архітектурним стилем. Однак кожна будівля як і раніше розміщується на окремих поверхах (шарах) офісів (вузлів), тому кожна будівля являє собою унікальний ІНБ.
Уявіть собі, що в корпус А надходить цифровий пакет, що містить багато різних видів інформації з різних джерел, таких як текстові дані, відеопотоки, аудіопотоки, телефонні дзвінки, радіохвилі і фотографії - однак він приходить в один великий безлад і не позначені і не відсортовані яким-небудь логічним способом (неструктуровані дані). Інформація передається через кожен поверх у порядку від 1 - го по 15 - й для обробки. Після того, як інформаційний безлад сягає 15- го поверху (вихід), він вирушає на 1 - й поверх (вхід) будівлі 3 разом з остаточним результатом обробки з будівлі А. Будівля 3 вивчає і враховує результат, переданий будівлею А, а потім обробляє безладну інформацію на кожному поверсі однаковим чином. Коли інформація досягає верхнього поверху будівлі 3, вона відправляється звідти разом з результатами цієї будівлі в будівлю 1. Будівля 1 вивчає і враховує результати з будівлі 3, перш ніж обробляти її поетапно. Будівля 1 передає інформацію і результати таким же чином в будівлю C, яка обробляє і відправляє в будівлю 2, яку обробляє і відправляє в будівлю B.
Кожен ANN (будівля) в нашому прикладі шукає різну функцію в неструктурованих даних (безлад інформації) і передає результати в наступну будівлю. Наступна будівля включає в себе (вивчає) висновок (результати) з попереднього. Оскільки дані обробляються кожним ANN (будівля), вони впорядковуються і позначаються (класифікуються) за допомогою певної функції, тому, коли дані досягають кінцевого результату (верхнього поверху) останнього ANN (будівлі), вони класифікуються і маркуються (більш структурований).
Штучний інтелект, машинне навчання та глибоке навчання
Як глибоке навчання вписується в загальну картину штучного інтелекту (ШІ) та ГР? Глибоке навчання підвищує потужність ГР і збільшує спектр завдань, які ШІ здатний виконувати. Оскільки глибоке навчання спирається на використання нейронних мереж і розпізнавання функцій у наборах даних, а не на більш прості алгоритми, специфічні для завдань, воно може знаходити і використовувати деталі неструктурованих (необроблених) даних без необхідності для програміста маркувати їх вручну - час від часу. - трудомістке завдання, яке може призвести до помилок. Глибоке навчання допомагає комп'ютерам краще і краще використовувати дані для корпорацій і приватних осіб.
