Последњих година, дубоко учење је променило поље компјутерског вида, омогућавајући рачунарима да перципирају и схвате визуелне информације на неуобичајеним нивоима. Игра конволуционих неуронских мрежа (ЦНН) имала је пресудан утицај на ову промену, са неколико револуционарних дизајна који су предњачили. Две од најутицајнијих ЦНН структура су АлекНет и ГооглеНет (ИнцептионНет). Ова два модела су заједно допринела напредовању задатака класификације слика, али су у супротности у својим структурама и принципима дизајна. У овом чланку ћемо заронити у критичне разлике између АлекНет-а и ГооглеНет-а, истражујући њихове структуре, дизајнерске одлуке и извршење.
Главне разлике између АлекНет-а и ГооглеНет-а
одлика | АлекНет | ГооглеНет (ИнцептионВ3) |
---|---|---|
Година издања / увођења | 2012 | 2014 |
Број слојева у моделу | 8 (5 конволуција, 3 ФЦ) | 159 (укључујући помоћне) |
Архитектура | Редни | Више огранака (почетак) |
Цонволутион Сизе | Већи филтери (11к11, 5к5) | Мањи филтери (1к1, 3к3, 5к5) |
Обједињавање слојева | Мак Поолинг | Мак и Авераге Поолинг |
Функција активације | Резиме | РеЛУ и друге варијације |
Нормализација локалног одговора (ЛРН) | Користи се | Не користи |
Инцептион Модулес | Не користи | Користи се са много вишеструких грана |
Рачунарска ефикасност | Умерено | Више |
Сложеност модела | Ниско | Високо |
Топ-1 прецизност (ИмагеНет) | 0.571 | 0.739 |
Шта је АлекНет?
АлекНет је значајна архитектура конволуционе неуронске мреже (ЦНН) коју су креирали Алекс Крижевски, Иља Сутскевер и Џефри Хинтон. Уведен је 2012. године и постигао је критичан напредак у изазову визуелног препознавања великог обима ИмагеНет (ИЛСВРЦ) тако што је у суштини победио различите методологије. АлекНет је био главни ЦНН који је показао одрживост дубоког учења за задатке редоследа слика, означавајући одлучујући тренутак у пољу компјутерског вида.
1. Архитектура
Објављен 2012. године, АлекНет је био водећи ЦНН који је освојио ИмагеНет Ларге Сцопе Висуал Рецогнитион Цхалленге (ИЛСВРЦ) са критичним простором за грешке. Састоји се од пет конволуционих слојева након којих следе три потпуно повезана слоја. Коришћење РеЛУ (Редрессед Дирецт Унит) активирања и стандардизације реакције суседства (ЛРН) допринело је његовом просперитету. АлекНет је додатно представио идеју укључивања ГПУ-а у припрему, што је у потпуности убрзало растуће искуство.
2. Продубина мреже:
Са осам слојева (пет конволуционих и три потпуно повезана слоја), АлекНет се сматрао дубоким у часу његове презентације. Без обзира на то, за разлику од тренутних дизајна, он је генерално плитак, ограничавајући његов капацитет да ухвати запањујуће елементе и примере у изузетно сложеним скуповима података.
3. Продуктивност рачунара:
Док је АлекНет-ова презентација припреме ГПУ-а убрзала образовно искуство, она је и даље била рачунски скупа због својих дубљих потпуно повезаних слојева и ограниченог коришћења паралелизације.
4. Преоптерећење:
Због свог умерено плитког дизајна и огромног броја граница, АлекНет је био склонији претераном прилагођавању, посебно на скромнијим скуповима података. Стратегије као што је напуштање школе су касније упознате да би модерирали ово питање.
5. Обука:
Да би обучили АлекНет, креатори су користили ИмагеНет скуп података, који садржи више од 1.000.000 именованих слика из 1.000 класификација. Они су користили стохастички пад угла (СГД) са енергијом као прорачун побољшања. Током обуке, методе проширења информација као што су произвољно уређивање и окретање су примењене да би се проширила величина скупа података за обуку и даље развила генерализација.
Систем обуке је био компјутерски захтеван, а АлекНет-ова употреба ГПУ-а за једнако руковање је на крају била неопходна. Обука АлекНет-а на двоструком ГПУ оквиру захтевала је око седам дана, што је било критично побољшање у поређењу са уобичајеним временом обуке заснованом на рачунарском процесору.
6. Резултати:
У ривалству ИмагеНет 2012, АлекНет је постигао запажену стопу грешака у топ 5 од око 15,3%, надмашујући различите методологије.
Исход АлекНет-а је покренуо поплаву интересовања за дубоко учење и ЦНН, што је изазвало промену у концентрацији локалног подручја компјутерског вида ка додатним компликованим и дубљим неуронским мрежама.
7. Подешавање конволуционог слоја:
Конволуцијски слојеви у АлекНет-у су организовани у основном низу, са периодичним максималним обједињавањем слојева за смањење узорковања. Овај јасан инжењеринг је био важан у том тренутку, али је ограничио капацитет организације да ухвати сложене прогресивне елементе.
8. Смањење димензионалности:
АлекНет укључује максимално обједињавање слојева за смањење узорковања, смањујући просторне компоненте мапа елемената. Ово помаже у смањењу рачунарске тежине и контроли преоптерећења.
9. Величина и сложеност модела:
Док се АлекНет у том тренутку сматрао дубоким, он је нешто скромнији и мање компликован у поређењу са каснијим дизајном. Ова директност га је учинила очигледнијим и ефикаснијим.
10. Коришћење помоћних класификатора:
Да би се решио проблем углова испаравања током припреме, АлекНет је представио идеју помоћних класификатора. Ови додатни класификатори су спојени са умереним слојевима и давали су углове пред слојевима током ширења уназад.
11. Утицај на смер истраживања:
Исход АлекНет-а је означио огромну промену у пољу ПЦ визије. То је подстакло научнике да истраже способност дубоког учења за различите задатке у вези са сликом, што је подстакло брзо побољшање даље развијених ЦНН дизајна.
Шта је ГооглеНет?
ГооглеНет, иначе назван Инцептион в1, је ЦНН архитектура коју је креирала група Гоогле Браин, посебно Цхристиан Сзегеди, Веи Лиу и други. Представљен је 2014. године и освојио је ИЛСВРЦ са додатно развијеном прецизношћу и рачунарском продуктивношћу. ГооглеНет архитектура је описана његовим дубоким дизајном, који се састоји од 22 слоја, што га чини једним од првих „изузетно дубоких“ ЦНН-а.
1. Архитектура
ГооглеНет (Инцептион в1): Представљен 2014. године, ГооглеНет је од суштинског значаја за Инцептион групу ЦНН-а. Познат је по дубоком дизајну који укључује 22 слоја (почетни модули). Витални развој ГооглеНет-а је почетни модул, који разматра једнаке конволуције различитих величина канала унутар сличног слоја. Ово је смањило замршеност рачунара док је у току са прецизношћу, чинећи ГооглеНет ефикаснијим од АлекНета.
2. Продубина мреже:
Почетни модули ГооглеНет-а сматрају се суштински дубљим дизајном без повећања трошкова рачунара. Са 22 слоја, ГооглеНет је био један од главних ЦНН-а који је показао предности проширене дубине мреже, што је довело до даљег развоја прецизности и снаге.
3. Продуктивност рачунара:
Почетни модули у ГооглеНет-у се сматрају продуктивнијим коришћењем рачунарских средстава. Користећи једнаке конволуције унутар сваког почетног блока, ГооглеНет је смањио број граница и прорачуна, чинећи га доступнијим за континуиране апликације и пренос на справе које захтевају средства.
4. Преоптерећење:
Дубоки, али ефикасан дизајн ГооглеНет-а у суштини је умањио преоптерећење, омогућавајући му да боље ради на скромнијим скуповима података и да помера ситуације учења.
5. Обука:
Обука ГооглеНет-а додатно разрађује коришћење ИмагеНет скупа података, а упоредиве процедуре повећања информација су коришћене за надоградњу генерализације. Било како било, због своје дубље архитектуре, ГооглеНет је захтевао више рачунарских средстава него АлекНет током обуке.
Развој почетних модула омогућио је ГооглеНету да пронађе неку врсту хармоније између дубине и рачунарске ефикасности. Једнаке конволуције унутар сваког почетног блока су у потпуности смањиле број прорачуна и граница, чинећи обуку остварљивијом и ефикаснијом.
6. Резултати:
ГооглеНет је постигао сјајан темпо грешака међу топ 5 од око 6,67% у такмичењу ИмагеНет 2014, надмашивши презентацију АлекНет-а.
Дубока, али искусна архитектура ГооглеНет-а показала је способност дубљих неуронских мрежа док је у корак са постижношћу рачунара, чинећи га привлачнијим за праве апликације.
7. Подешавање конволуционог слоја:
ГооглеНет је представио идеју почетних модула, који се састоје од бројних једнаких конволуционих слојева различитих величина канала. Овај план омогућава ГооглеНет-у да ухвати најзанимљивије тачке на различитим нивоима и свеукупно ради на капацитету организације да уклони значајне елементе из различитих степена разматрања.
8. Смањење димензионалности:
без обзира на уобичајено максимално обједињавање, ГооглеНет користи методе смањења димензионалности као што су 1к1 конволуције. Ове скромније конволуције су рачунарски мање ескалиране и помажу у смањењу броја елемената уз очување основних података.
9. Величина и сложеност модела:
Изворни модули ГооглеНет-а доносе дубљи дизајн са суштински више слојева и граница. Ова замршеност, иако нуди даље развијену прецизност, такође може учинити организацију више тестирања за припрему и калибрацију.
10. Коришћење помоћних класификатора:
ГооглеНет је побољшао идеју помоћних класификатора тако што их је уградио у иницијационе модуле. Ови помоћни класификатори унапређују припрему дубљих слојева и надограђују ток угла, додајући стабилнију и ефикаснију припрему.
11. Утицај на смер истраживања:
Почетни модули ГооглеНет-а представили су могућност ефикасног издвајања компоненти у различитим размерама. Ова идеја је утицала на план резултујућих дизајна, оснажујући аналитичаре да се усредсреде на унапређење дубине организације и рачунарске продуктивности док држе корак са прецизношћу или даље развијају.
Закључак
И АлекНет и ГооглеНет трајно утичу на поље компјутерског вида и дубоког учења. АлекНет је показао способност ЦНН-а за задатке препознавања слика и подешен за будуће напредовање. И опет, ГооглеНет је представио идеју изворних модула, чинећи их спремним за ефикасније и дубље ЦНН структуре.
како је измишљена школа
Док АлекНет и ГооглеНет имају своје посебне предности, област дубоког учења се фундаментално развила од њихових презентација. Данашњи дизајни, као што су РесНет, ДенсеНет и ЕффициентНет, додатно су померили границе тачности, продуктивности и генерализације. Како аналитичари настављају да побољшавају и проширују ове суштинске моделе, судбина компјутерског вида има знатно већу посвећеност и додатне интригантне изгледе.