У претходној теми научили смо надгледано машинско учење у коме се модели обучавају коришћењем означених података под надзором података обуке. Али може бити много случајева у којима немамо означене податке и морамо да пронађемо скривене обрасце из датог скупа података. Дакле, да бисмо решили такве врсте случајева у машинском учењу, потребне су нам технике учења без надзора.
Шта је учење без надзора?
Као што име говори, учење без надзора је техника машинског учења у којој се модели не надгледају коришћењем скупа података за обуку. Уместо тога, сами модели проналазе скривене обрасце и увиде из датих података. Може се упоредити са учењем које се одвија у људском мозгу док учи нове ствари. Може се дефинисати као:
јс замена
Учење без надзора је врста машинског учења у којој се модели обучавају коришћењем неозначеног скупа података и дозвољено им је да делују на тим подацима без икаквог надзора.
Учење без надзора не може се директно применити на проблем регресије или класификације јер за разлику од надгледаног учења, имамо улазне податке, али немамо одговарајуће излазне податке. Циљ учења без надзора је да пронађите основну структуру скупа података, групишете те податке према сличностима и представите тај скуп података у компримованом формату .
Пример: Претпоставимо да је алгоритму учења без надзора дат улазни скуп података који садржи слике различитих врста мачака и паса. Алгоритам се никада не обучава на датом скупу података, што значи да нема појма о карактеристикама скупа података. Задатак алгоритма учења без надзора је да самостално идентификује карактеристике слике. Алгоритам за учење без надзора ће извршити овај задатак тако што ће груписати скуп података слике у групе према сличностима између слика.
Зашто користити учење без надзора?
Испод су неки од главних разлога који описују важност ненадгледаног учења:
- Учење без надзора је корисно за проналажење корисних увида из података.
- Учење без надзора је много слично као што човек учи да размишља сопственим искуствима, што га чини ближим правој вештачкој интелигенцији.
- Учење без надзора ради на неозначеним и некатегорисаним подацима што учење без надзора чини важнијим.
- У стварном свету, немамо увек улазне податке са одговарајућим излазом, па нам је за решавање таквих случајева потребно учење без надзора.
Рад ненадгледаног учења
Рад ненадгледаног учења може се разумети помоћу дијаграма у наставку:
Овде смо узели неозначене улазне податке, што значи да нису категорисани и одговарајући излази такође нису дати. Сада, ови неозначени улазни подаци се уносе у модел машинског учења како би га обучили. Прво ће интерпретирати необрађене податке како би пронашао скривене обрасце из података, а затим ће применити одговарајуће алгоритме као што је груписање к-средњих вредности, стабло одлучивања итд.
Када примени одговарајући алгоритам, алгоритам дели објекте података у групе према сличностима и разликама између објеката.
Врсте алгоритама за учење без надзора:
Алгоритам учења без надзора може се даље категорисати у две врсте проблема:
Напомена: Ове алгоритме ћемо научити у каснијим поглављима.
Алгоритми за учење без надзора:
Испод је листа неких популарних алгоритама за учење без надзора:
конверзија јава стринга у инт
Предности учења без надзора
- Учење без надзора се користи за сложеније задатке у поређењу са учењем под надзором јер у учењу без надзора немамо означене улазне податке.
- Учење без надзора је пожељније јер је лако добити неозначене податке у поређењу са означеним подацима.
Недостаци учења без надзора
- Учење без надзора је суштински теже од учења под надзором јер нема одговарајући резултат.
- Резултат алгоритма учења без надзора може бити мање тачан јер улазни подаци нису означени, а алгоритми не знају унапред тачан излаз.