Хиперпараметри у машинском учењу су они параметри које корисник експлицитно дефинише да контролише процес учења. Ови хиперпараметри се користе за побољшање учења модела, а њихове вредности се постављају пре почетка процеса учења модела.
У овој теми ћемо разговарати о једном од најважнијих концепата машинског учења, односно о хиперпараметрима, њиховим примерима, подешавању хиперпараметара, категоријама хиперпараметара, како се хиперпараметар разликује од параметра у машинском учењу? Али пре него што почнемо, хајде да прво разумемо хиперпараметар.
Шта су хиперпараметри?
У машинском учењу/дубоком учењу, модел је представљен његовим параметрима. Насупрот томе, процес обуке укључује одабир најбољих/оптималних хиперпараметара које користе алгоритми за учење да би се обезбедио најбољи резултат. Дакле, који су ови хиперпараметри? Одговор је, ' Хиперпараметри су дефинисани као параметри које корисник експлицитно дефинише за контролу процеса учења.'
Овде префикс 'хипер' сугерише да су параметри највишег нивоа који се користе у контроли процеса учења. Вредност хиперпараметра бира и поставља инжењер машинског учења пре него што алгоритам учења почне да обучава модел. Дакле, они су екстерни у односу на модел и њихове вредности се не могу мењати током процеса обуке .
графикон расподеле ресурса
Неки примери хиперпараметара у машинском учењу
- К у кНН или алгоритам К-неарест Неигхбор
- Стопа учења за обуку неуронске мреже
- Однос сплит теста воза
- Величина серије
- Број епоха
- Гране у стаблу одлучивања
- Број кластера у алгоритму кластера
Разлика између параметра и хиперпараметра?
Увек постоји велика забуна између параметара и хиперпараметара или хиперпараметара модела. Дакле, да бисмо рашчистили ову забуну, хајде да разумемо разлику између њих и како су међусобно повезани.
Параметри модела:
Параметри модела су конфигурационе варијабле које су интерне за модел и модел их учи сам. На пример , В тежине или коефицијенти независних променљивих у моделу линеарне регресије . или Тежине или коефицијенти независних варијабли у СВМ, тежина и пристрасности неуронске мреже, центар кластера у груписању. Неке кључне тачке за параметре модела су следеће:
- Модел их користи за предвиђање.
- Модел их учи из самих података
- Они се обично не постављају ручно.
- Ово су део модела и кључ за алгоритам машинског учења.
Хиперпараметри модела:
Хиперпараметри су они параметри које корисник експлицитно дефинише за контролу процеса учења. Неке кључне тачке за параметре модела су следеће:
- Обично их ручно дефинише инжењер машинског учења.
- Не може се знати тачна најбоља вредност хиперпараметара за дати проблем. Најбоља вредност се може одредити или по правилу или методом покушаја и грешке.
- Неки примери хиперпараметара су стопа учења за обуку неуронске мреже, К у КНН алгоритму,
Категорије хиперпараметара
Углавном хиперпараметри се могу поделити у две категорије, које су дате у наставку:
Хиперпараметар за оптимизацију
Процес одабира најбољих хиперпараметара за употребу познат је као подешавање хиперпараметара, а процес подешавања је познат и као оптимизација хиперпараметара. Оптимизациони параметри се користе за оптимизацију модела.
Неки од популарних параметара оптимизације су дати у наставку:
Напомена: Брзина учења је кључни хиперпараметар за оптимизацију модела, тако да ако постоји захтев за подешавањем само једног хиперпараметра, предлаже се подешавање брзине учења.
Хиперпараметар за специфичне моделе
Хиперпараметри који су укључени у структуру модела познати су као хиперпараметри за специфичне моделе. Они су дати у наставку:
Важно је навести број хиперпараметара скривених јединица за неуронску мрежу. Требало би да буде између величине улазног слоја и величине излазног слоја. Тачније, број скривених јединица треба да буде 2/3 величине улазног слоја, плус величина излазног слоја.
За сложене функције потребно је навести број скривених јединица, али не би требало да се уклапа у модел.
Закључак
Хиперпараметри су параметри који су експлицитно дефинисани да контролишу процес учења пре примене алгоритма машинског учења на скуп података. Они се користе за спецификацију капацитета учења и сложености модела. Неки од хиперпараметара се користе за оптимизацију модела, као што су величина групе, брзина учења, итд., а неки су специфични за моделе, као што је број скривених слојева итд.