logo

Машинско учење под надзором

Надзирано учење је врста машинског учења у којој се машине обучавају користећи добро 'обележене' податке о обуци, а на основу тих података машине предвиђају резултат. Означени подаци значе да су неки улазни подаци већ означени исправним излазом.

У надгледаном учењу, подаци о обуци који се дају машинама раде као супервизор који учи машине да тачно предвиде излаз. Примењује исти концепт као што ученик учи под надзором наставника.

Надзирано учење је процес обезбеђивања улазних података као и исправних излазних података моделу машинског учења. Циљ алгоритма учења под надзором је да пронађите функцију мапирања за мапирање улазне променљиве (к) са излазном променљивом (и) .

У стварном свету, надгледано учење се може користити за Процена ризика, класификација слика, откривање превара, филтрирање нежељене поште , итд.

Како функционише надгледано учење?

У надгледаном учењу, модели се обучавају коришћењем означеног скупа података, где модел учи о свакој врсти података. Када се процес обуке заврши, модел се тестира на основу података теста (подскуп скупа за обуку), а затим предвиђа излаз.

Рад надгледаног учења може се лако разумети на следећем примеру и дијаграму:

Машинско учење под надзором

Претпоставимо да имамо скуп података различитих типова облика који укључује квадрат, правоугаоник, троугао и полигон. Сада је први корак да морамо да обучимо модел за сваки облик.

  • Ако дати облик има четири стране, а све стране су једнаке, онда ће бити означен као а Квадрат .
  • Ако дати облик има три стране, онда ће бити означен као а троугао .
  • Ако дати облик има шест једнаких страна онда ће бити означен као хекагон .

Сада, након обуке, тестирамо наш модел користећи тест сет, а задатак модела је да идентификује облик.

Машина је већ обучена за све врсте облика, а када пронађе нови облик, класификује облик на основу бројних страна и предвиђа излаз.

Кораци укључени у надгледано учење:

  • Прво одредите тип скупа података за обуку
  • Прикупите/прикупите означене податке о обуци.
  • Поделите скуп података за обуку у обуку скуп података, скуп података за тестирање и скуп података за валидацију .
  • Одредите улазне карактеристике скупа података за обуку, који треба да имају довољно знања како би модел могао тачно да предвиди излаз.
  • Одредите одговарајући алгоритам за модел, као што је машина вектора подршке, стабло одлучивања итд.
  • Извршите алгоритам на скупу података за обуку. Понекад су нам потребни сетови за валидацију као контролни параметри, који су подскуп скупова података за обуку.
  • Процените тачност модела пружањем тестног скупа. Ако модел предвиђа тачан излаз, то значи да је наш модел тачан.

Типови надгледаних алгоритама машинског учења:

Надзирано учење се даље може поделити на две врсте проблема:

Машинско учење под надзором

1. Регресија

алтер додати колону пророчиште

Алгоритми регресије се користе ако постоји веза између улазне и излазне променљиве. Користи се за предвиђање континуираних варијабли, као што су временска прогноза, тржишни трендови, итд. Испод су неки популарни алгоритми регресије који су под надзором учења:

  • Линеарна регресија
  • Регрессион Треес
  • Нелинеарна регресија
  • Бајесова линеарна регресија
  • Полиномска регресија

2. Класификација

Алгоритми класификације се користе када је излазна променљива категорична, што значи да постоје две класе као што су Да-Не, Мушко-Женско, Тачно-Нетачно, итд.

Филтрирање нежељене поште,

  • Случајна шума
  • Децисион Треес
  • Логистичка регресија
  • Машине за вектор подршке

Напомена: О овим алгоритмима ћемо детаљно разговарати у наредним поглављима.

Предности учења под надзором:

  • Уз помоћ надгледаног учења, модел може предвидети резултат на основу претходних искустава.
  • У контролисаном учењу можемо имати тачну представу о класама објеката.
  • Модел учења под надзором нам помаже да решимо различите проблеме из стварног света као што су откривање превара, филтрирање нежељене поште , итд.

Недостаци учења под надзором:

  • Модели учења под надзором нису погодни за руковање сложеним задацима.
  • Учење под надзором не може предвидети тачан резултат ако се подаци теста разликују од скупа података за обуку.
  • Обука је захтевала много времена за рачунање.
  • У контролисаном учењу потребно нам је довољно знања о класама објеката.