Какво е невронна мрежа?
В информационните технологии (IT) изкуствената невронна мрежа (ANN) е система от хардуер и/или софтуер. Моделирана на база на невроните в човешкия мозък. ANNs – наричани още, просто, невронни мрежи са, разнообразие от технологии за deep learning. Които също попадат под чадъра на изкуствения интелект или AI.
Търговските приложения на тези технологии обикновено се фокусират върху решаването на сложни проблеми. С обработката на сигнала или разпознаването на образи. Примерите за значими търговски приложения от 2000 г. насам включват разпознаване на ръкопис за обработка на чекове, транскрипция на говор в текст, анализ на данни от проучване за нефт, прогнозиране на времето и разпознаване на лица.
Историята на изкуственata невроннa мрежa датира от ранните дни на компютрите. През 1943 г. математиците Уорън Маккулох и Уолтър Питс изграждат система от схеми, предназначена да се приближи до функционирането на човешкия мозък, която изпълнява прости алгоритми.
Едва през 2010 г. изследванията започват отново. Тенденцията за големи данни, при която компаниите събират огромни количества данни, и паралелните изчисления дават на учените данни данни за обучение и изчислителни ресурси, необходими за управление на сложни изкуствени невронни мрежи. През 2012 г. една невронна мрежа успява да победи работата на човека при задача за разпознаване на изображения като част от конкурса ImageNet. Оттогава интересът към изкуствените невронни мрежи нараства и технологията продължава да се подобрява.
Как работят изкуствените невронни мрежи
ANN обикновено включва голям брой процесори, работещи паралелно и подредени на нива. Първият ред получава необработената входна информация, аналогично на оптичните нерви при човешката визуална обработка. Всеки следващ ред получава изхода от нивото, предхождащо го, а не суровия вход, по същия начин невроните по-далеч от зрителния нерв получават сигнали от по-близките до него. Последният слой произвежда изхода на системата.
Всеки възел за обработка има своя собствена малка сфера на знания, включително видяното и всички правила, с които първоначално е програмиран или разработен за себе си. Нивата са силно взаимосвързани, което означава, че всеки възел в ниво n ще бъде свързан с много възли в ниво n-1 неговите входове – и в ниво n+1, който предоставя входни данни за тези възли. В изходния слой може да има един или множество възли, от които да се прочете отговорът, който той произвежда.
Изкуствените невронни мрежи се отличават с това, че са адаптивни, което означава, че се променят, докато се учат от първоначалното обучение, а последващите пробеги предоставят повече информация за света. Най-основният модел на обучение е съсредоточен върху претеглянето на входните потоци, така че всеки възел преценява важността на входните данни от всеки от своите предшественици. Входните данни, които допринасят за получаването на правилни отговори, са по-високо претеглени.
Как невронните мрежи се учат
Обикновено ANN първоначално се обучава или подава големи количества данни. Обучението се състои от предоставяне на вход и казване на мрежата какъв трябва да бъде изходът. Например, за да се изгради мрежа, която идентифицира лицата на актьорите, първоначалното обучение може да бъде поредица от снимки, включително актьори, не-актьори, маски, статуи и лица на животни. Всеки вход е придружен от съответстваща идентификация, като имена на актьори или информация „не актьор“ или „не човек“. Предоставянето на отговорите позволява на модела да коригира вътрешните си тегла, за да се научи как да върши по-добре работата си.
Например, ако възлите Пешо, Гошо и Стоян казват на възел Лили, текущото входно изображение е картина на Брад Пит, но възелът Митко казва, че е Бети Уайт, а програмата за обучение потвърждава, че е Пит, Лили ще намали теглото, което му възлага Входът на Митко и увеличаване на теглото, което дава на Пешо, Гошо и Стоян.
При определяне на правилата и вземане на решения, тоест, решението на всеки възел какво да изпрати на следващото ниво въз основа на данни от предишния ред, невронните мрежи използват няколко принципа. Те включват обучение, базирано на градиент, размита логика, генетични алгоритми и байесови методи. Може да им бъдат дадени някои основни правила за обектните взаимоотношения в моделираните данни.
Система за разпознаване на лица
Например, може да бъде инструктирана система за разпознаване на лица: „Веждите се намират над очите“ или „Мустаците са под носа. Мустаците са над и/или до устата“. Правилата за предварително зареждане могат да ускорят обучението и да направят модела по-мощен в по-ранен етап. Но той също така се основава на предположения за естеството на проблема, където инструкциите може да се окажат или без значение, безполезни или неправилни и контрапродуктивни, като вземат решение за това. Ако има такива правила за изграждане, е много важно да бъдат съобразени с естеството на проблема иначе целият процес на невронните мрежи ще се опропасти.
Освен това предположенията, които хората правят на алгоритмите за обучение, внушават на невронните мрежи да засилват културните пристрастия. Предразположените масиви от данни са непрекъснато предизвикателство в системите за обучение, които сами намират отговори чрез разпознаване на моделите в данните. Ако алгоритъмът за подаване на данни не е неутрален и почти няма данни, машината разпространява пристрастия.
Видове невронни мрежи
Невронните мрежи понякога се описват от гледна точка на тяхната дълбочина, включително колко слоя имат между входа и изхода или така наречените скрити слоеве на модела. Ето защо терминът невронна мрежа се използва почти като синоним на deep learning. Те могат също да бъдат описани чрез броя на скритите възли, които моделът има или по отношение на това колко входове и изходи всеки възел има. Вариациите в класическия дизайн на невроннa мрежa позволяват различни форми на разпространение на информация напред и назад между нивата.
Специфичните видове изкуствени невронни мрежи включват:
- Невронни мрежи с обратна връзка: един от най-простите варианти на невронни мрежи. Те предават информация в една посока, през различни входни възли, докато стигне до изходния възел. Мрежата може или не може да има скрити слоеве на възли, което прави тяхното функциониране по-интерпретирано. Той е подготвен да обработва големи количества шум. Този тип изчислителен модел на ANN се използва в технологии като разпознаване на лица и компютърно зрение.
- Повтарящи се невронни мрежи RNN: Те са по-сложни. Те запазват резултата от обработващите възли и връщат резултата обратно в модела. Така се казва, че моделът се научава да предсказва резултата от слой. Всеки възел в модела RNN действа като клетка памет, като продължава изчисляването и изпълнението на операциите. Тази невронна мрежа започва със същото разпространение отпред като мрежата за предаване напред, но след това продължава да запомня цялата обработена информация, за да я използва повторно в бъдеще. Ако предвиждането на мрежата е неправилно, системата се самообучава и продължава да работи за правилното прогнозиране по време на обратно разпространение. Този тип ANN често се използва при преобразуване на текст в реч.
Конволюционни невронни мрежи
- един от най-популярните модели, използвани днес. Този изчислителен модел на невронна мрежа използва вариация на многослойна перцепция и съдържа един или повече слоеве, които могат да бъдат или напълно свързани или обединени. Тези конволюционни слоеве създават карти с характеристики, които записват област от изображението, която в крайна сметка се разделя на правоъгълници и се изпраща за обработка. Моделът CNN е особено популярен в сферата на разпознаване на изображения; той е бил използван в много от най-модерните приложения на AI (изкуствен интелеск), включително разпознаване на лица, дигитализация на текст и обработка на естествен език. Други приложения включват откриване на парафрази, обработка на сигнал и класификация на изображението.
- Деконволюционни невронни мрежи: Използва се обратен процес на CNN модел. Те имат за цел да намерят изгубени функции или сигнали, които първоначално може да са били считани за маловажни за задачата на системата CNN. Този мрежов модел може да се използва при синтез и анализ на изображения.
- Модулни невронни мрежи: съдържат множество невронни мрежи, работещи отделно една от друга. Мрежите не комуникират и не си пречат на дейностите по време на изчислителния процес. Следователно сложни или големи изчислителни процеси могат да се извършват по-ефективно.
Предимства на изкуствените невронни мрежи
- Възможностите за паралелна обработка означават, че мрежата може да изпълнява повече от една работа едновременно.
- Информацията се съхранява в цяла мрежа, а не само в база данни.
- Способността за учене и моделиране на нелинейни модели, сложни взаимоотношения помага да се моделират реалните взаимоотношения между входа и изхода.
- Толерантност към грешки означава, че повреждането на една или повече клетки от ANN няма да спре генерирането на продукция.
- Постепенната корупция означава, че мрежата бавно ще се влоши с течение на времето, вместо проблем да унищожи мрежата незабавно.
- Способността да се произвежда продукция с непълни познания, като загубата на производителност се основава на това колко важна е липсващата информация.
- Не се поставят ограничения за входните променливи, като например как трябва да се разпределят.
- Машинно обучение означава, че ANN може да се учи от събития и да взема решения въз основа на наблюденията.
- Способността да се научат скрити взаимоотношения в данните, без да се заповядва някаква фиксирана връзка. Означава, че ANN може по-добре да моделира силно променливи данни и непостоянна вариация.
- Способността да се обобщават и извеждат невидими взаимоотношения върху невидими данни означава, че ANN могат да предсказват изхода на невидими данни.
Недостатъци на изкуствената невронна мрежа
Недостатъците на ANN включват:
- Липсата на правила за определяне на правилната мрежова структура означава, че подходящата изкуствена архитектура на невронната мрежа може да бъде намерена само чрез проба-грешка.
- Изискването за процесори с възможности за паралелна обработка прави невронните мрежи хардуерно зависими.
- Мрежата работи с цифрова информация, поради което всички проблеми трябва да бъдат преведени в числови стойности. Преди да могат да бъдат представени на ANN.
- Липсата на обяснение зад решенията за сондиране е един от най -големите недостатъци на ANN. Невъзможността да се обясни защо или как зад решението генерира липса на доверие в мрежата.
Приложения на изкуствени невронни мрежи
Разпознаването на изображения беше една от първите области, към които невронните мрежи бяха успешно приложени. Но използването на технологиите се разшири до много повече области, включително:
- Чатботове;
- Обработка на естествен език, превод и генериране на език;
- Прогноза за фондовия пазар;
- Планиране и оптимизиране на маршрута на доставчика;
- Откриване и развитие на лекарства.
Това са само няколко специфични области, към които невронните мрежи се прилагат днес. Основните употреби включват всеки процес, който работи съгласно строги правила или модели и има големи количества данни. Ако данните са твърде големи, за да може човек да ги осмисли за разумен период от време. Процесът вероятно е основен кандидат за автоматизация чрез изкуствени невронни мрежи.