Машинско учење је подскуп АИ, који омогућава машини да аутоматски учи из података, побољшава перформансе из прошлих искустава и предвиђа . Машинско учење садржи скуп алгоритама који раде на огромној количини података. Подаци се уносе у ове алгоритме да би их обучили, а на основу обуке они граде модел и извршавају одређени задатак.
Ови МЛ алгоритми помажу у решавању различитих пословних проблема као што су регресија, класификација, предвиђање, груписање и асоцијације, итд.
На основу метода и начина учења, машинско учење се дели углавном на четири типа, а то су:
- Машинско учење под надзором
- Машинско учење без надзора
- Полунадзирано машинско учење
- Учење са појачањем
У овој теми ћемо дати детаљан опис типова машинског учења заједно са њиховим одговарајућим алгоритмима:
1. Машинско учење под надзором
Као што му име говори, Надзирано машинско учење заснива се на надзору. То значи да у техници учења под надзором тренирамо машине користећи 'обележени' скуп података, а на основу обуке, машина предвиђа излаз. Овде означени подаци наводе да су неки од улаза већ мапирани на излаз. Још драгоценије, можемо рећи; прво обучавамо машину са улазом и одговарајућим излазом, а затим тражимо од машине да предвиди излаз користећи скуп података теста.
Хајде да разумемо надгледано учење на примеру. Претпоставимо да имамо улазни скуп података слика мачака и паса. Дакле, прво ћемо обезбедити обуку машини да разуме слике, као што су облик и величина репа мачке и пса, облик очију, боја, висина (пси су виши, мачке су мање) итд. Након завршетка обуке, уносимо слику мачке и тражимо од машине да идентификује објекат и предвиди излаз. Сада је машина добро обучена, па ће проверити све карактеристике објекта, као што су висина, облик, боја, очи, уши, реп, итд., и утврдиће да је у питању мачка. Дакле, ставиће га у категорију мачака. Ово је процес како машина идентификује објекте у надгледаном учењу.
Главни циљ технике надгледаног учења је мапирање улазне променљиве(к) са излазном променљивом(и). Неке примене у стварном свету надгледаног учења су Процена ризика, откривање превара, филтрирање нежељене поште, итд.
Категорије надгледаног машинског учења
Надзирано машинско учење може се класификовати у две врсте проблема, који су дати у наставку:
а) Класификација
Алгоритми класификације се користе за решавање проблема класификације у којима је излазна варијабла категорична, као што је ' Да или не, мушко или женско, црвено или плаво, итд . Алгоритми за класификацију предвиђају категорије присутне у скупу података. Неки примери класификационих алгоритама из стварног света су Откривање нежељене поште, филтрирање е-поште итд.
јава непроменљива листа
Неки популарни алгоритми класификације су дати у наставку:
б) Регресија
Регресиони алгоритми се користе за решавање проблема регресије у којима постоји линеарна веза између улазних и излазних варијабли. Они се користе за предвиђање континуалних излазних варијабли, као што су тржишни трендови, временска прогноза итд.
Неки популарни алгоритми регресије су дати у наставку:
Предности и недостаци учења под надзором
Предности:
- Пошто надгледано учење ради са означеним скупом података, тако да можемо имати тачну представу о класама објеката.
- Ови алгоритми су од помоћи у предвиђању резултата на основу претходног искуства.
Недостаци:
- Ови алгоритми нису у стању да реше сложене задатке.
- Може предвидети погрешан излаз ако се подаци теста разликују од података обуке.
- За обуку алгоритма потребно је много рачунарског времена.
Примене надгледаног учења
Неке уобичајене примене надгледаног учења су наведене у наставку:
Алгоритми за надгледано учење се користе у сегментацији слика. У овом процесу се врши класификација слика на различитим подацима слике са унапред дефинисаним ознакама.
Надгледани алгоритми се такође користе у области медицине у сврху дијагнозе. То се ради коришћењем медицинских слика и прошлих означених података са ознакама болести. Са таквим процесом, машина може да идентификује болест за нове пацијенте.
2. Машинско учење без надзора
Учење без надзора г се разликује од технике надгледаног учења; као што му име говори, нема потребе за надзором. То значи, у машинском учењу без надзора, машина се обучава коришћењем неозначеног скупа података, а машина предвиђа излаз без икаквог надзора.
У ненадгледаном учењу, модели се обучавају са подацима који нису ни класификовани ни означени, а модел делује на те податке без икаквог надзора.
Главни циљ алгоритма за учење без надзора је да групише или категорише несортирани скуп података према сличностима, обрасцима и разликама. Машинама је наложено да пронађу скривене обрасце из улазног скупа података.
Узмимо пример да бисмо то боље разумели; претпоставимо да постоји корпа слика воћа и да је унесемо у модел машинског учења. Слике су моделу потпуно непознате, а задатак машине је да пронађе шаре и категорије објеката.
вон Неуманн архитектура
Дакле, сада ће машина открити своје обрасце и разлике, као што су разлика у боји, разлика у облику, и предвидети излаз када се тестира са скупом података за тестирање.
Категорије машинског учења без надзора
Учење без надзора се даље може класификовати у два типа, који су дати у наставку:
1) Груписање
Техника груписања се користи када желимо да пронађемо инхерентне групе из података. То је начин да се објекти групишу у кластер тако да објекти са највише сличности остану у једној групи и да имају мање или никакве сличности са објектима других група. Пример алгоритма за груписање је груписање купаца према њиховом куповном понашању.
Неки од популарних алгоритама за груписање су дати у наставку:
2) Удружење
Учење правила асоцијације је техника учења без надзора, која проналази занимљиве односе између варијабли унутар великог скупа података. Главни циљ овог алгоритма учења је да пронађе зависност једне ставке података од друге ставке података и мапира те варијабле у складу са тим тако да може да генерише максималан профит. Овај алгоритам се углавном примењује у Анализа тржишне корпе, рударење коришћења веба, континуирана производња , итд.
листа програма питхон
Неки популарни алгоритми учења правила асоцијација су Априори алгоритам, Ецлат, ФП-алгоритам раста.
Предности и недостаци алгоритма за учење без надзора
Предности:
- Ови алгоритми се могу користити за компликоване задатке у поређењу са онима под надзором јер ови алгоритми раде на неозначеном скупу података.
- Алгоритми без надзора су пожељнији за различите задатке јер је лакше добијање неозначеног скупа података у поређењу са означеним скупом података.
Недостаци:
- Излаз алгоритма без надзора може бити мање прецизан јер скуп података није означен, а алгоритми нису обучени са тачним излазом из претходног.
- Рад са учењем без надзора је тежи јер ради са неозначеним скупом података који се не мапира са излазом.
Примене ненадгледаног учења
3. Полу-надгледано учење
Полунадгледано учење је врста алгоритма машинског учења који се налази између надгледаног и ненадгледаног машинског учења . Представља средњу основу између алгоритама надгледаног (са означеним подацима о обуци) и ненадгледаног учења (без обележених података о обуци) и користи комбинацију означених и неозначених скупова података током периода обуке.
А Иако је полунадгледано учење средина између учења под надзором и учења без надзора и ради на подацима који се састоје од неколико ознака, оно се углавном састоји од неозначених података. Пошто су етикете скупе, али за корпоративне сврхе, можда имају мало етикета. Потпуно се разликује од надгледаног и ненадгледаног учења јер се заснива на присуству и одсуству етикета.
Да би се превазишли недостаци учења под надзором и алгоритама учења без надзора, уводи се концепт полунадгледаног учења . Главни циљ полу-надгледаног учења је да се ефикасно користе сви доступни подаци, а не само означени подаци као код учења под надзором. У почетку се слични подаци групишу заједно са алгоритмом за учење без надзора, а даље, помаже да се неозначени подаци означавају у означене податке. То је зато што су означени подаци релативно скупља аквизиција од неозначених података.
Ове алгоритме можемо замислити на примеру. Учење под надзором је када је ученик под надзором инструктора код куће и на факултету. Даље, ако тај ученик само-анализира исти концепт без икакве помоћи инструктора, он долази под ненадгледано учење. У оквиру полунадгледаног учења, студент мора да се ревидира након што анализира исти концепт под вођством инструктора на колеџу.
Предности и недостаци полунадгледаног учења
Предности:
- Алгоритам је једноставан и лако разумљив.
- Веома је ефикасан.
- Користи се за решавање недостатака алгоритама за надгледано и ненадгледано учење.
Недостаци:
- Резултати итерација можда неће бити стабилни.
- Не можемо применити ове алгоритме на податке на нивоу мреже.
- Тачност је ниска.
4. Учење са појачањем
Учење са појачањем функционише на процесу заснованом на повратним информацијама, у којем АИ агент (софтверска компонента) аутоматски истражује своје окружење тако што удара и трага, предузима акције, учи из искустава и побољшава своје перформансе. Агент је награђен за сваку добру акцију и кажњен за сваку лошу акцију; стога је циљ агента за учење са појачањем да максимизира награде.
У учењу са појачањем не постоје означени подаци као што је учење под надзором, а агенти уче само из свог искуства.
Процес учења поткрепљења је сличан људском бићу; на пример, дете учи разне ствари искуствима у свом свакодневном животу. Пример учења са појачањем је играње игре, где је Игра окружење, потези агента на сваком кораку дефинишу стања, а циљ агента је да добије висок резултат. Агент добија повратну информацију у смислу казни и награда.
Због свог начина рада, учење са појачањем се примењује у различитим областима као нпр Теорија игара, Истраживање операција, Теорија информација, системи са више агената.
Проблем учења поткрепљења може се формализовати коришћењем Марковски процес одлучивања (МДП). У МДП-у, агент је у сталној интеракцији са окружењем и врши акције; на сваку акцију, окружење реагује и генерише ново стање.
Категорије учења са појачањем
Учење са појачањем је категоризовано углавном у две врсте метода/алгоритама:
јсп јаватпоинт
Стварни случајеви употребе учења са појачањем
РЛ алгоритми су веома популарни у апликацијама за игре. Користи се за добијање супер-људских перформанси. Неке популарне игре које користе РЛ алгоритме су АлпхаГО и АлпхаГО Зеро .
Рад 'Управљање ресурсима уз учење дубоког појачања' показао је како користити РЛ у рачунару за аутоматско учење и распоређивање ресурса да чекају различите послове како би се минимизирало просечно успоравање посла.
РЛ се широко користи у апликацијама роботике. Роботи се користе у индустријској и производној области, а ови роботи постају моћнији уз помоћ учења. Постоје различите индустрије које имају своју визију изградње интелигентних робота користећи АИ и технологију машинског учења.
Тект-мининг, једна од сјајних апликација НЛП-а, сада се имплементира уз помоћ Реинфорцемент Леарнинг компаније Салесфорце.
Предности и недостаци учења са појачањем
Предности
- Помаже у решавању сложених проблема из стварног света које је тешко решити општим техникама.
- Модел учења РЛ је сличан учењу људских бића; стога се могу наћи најтачнији резултати.
- Помаже у постизању дугорочних резултата.
Недостатак
- РЛ алгоритми нису пожељни за једноставне проблеме.
- РЛ алгоритми захтевају огромне податке и прорачуне.
- Превише учења са појачањем може довести до преоптерећења стања што може ослабити резултате.
Проклетство димензионалности ограничава учење са појачањем за стварне физичке системе.