Регрессия айнымалылар арасындағы қатынастарды талдайды
Регрессия - белгілі бір деректер жиынтығын ескере отырып, сандық мәндер ауқымын ( үздіксіз мәндер деп те аталады) болжау үшін пайдаланылатын деректерді өңдеу әдісі. Мысалы, регрессия басқа айнымалы мәндерді ескере отырып, өнімнің немесе қызметтің құнын болжау үшін пайдаланылуы мүмкін.
Регрессия бизнес пен маркетингтік жоспарлау, қаржылық болжау, экологиялық модельдеу және трендтерді талдау үшін бірнеше салаларда қолданылады.
Регрессия Vs. Жіктеу
Регрессия және жіктеу - ұқсас мәселелерді шешу үшін қолданылатын деректерді өндіру әдістері, бірақ олар жиі шатастырылады. Екі болжамды талдауда пайдаланылады, бірақ регрессия сандарды немесе үздіксіз мәнді болжау үшін пайдаланылады, ал жіктеу деректерді дискреттік санаттарға тағайындайды.
Мысалы, регрессия, оның орналасуына, шаршы футына, соңғы сатылған кезде бағаға, ұқсас үйлердің бағасы мен басқа факторларға негізделген үй құндылығын болжау үшін пайдаланылатын болады. Жіктеу, егер сіз үйді санаттарға, мысалы, жаяу жүру, лот көлемі немесе қылмыс деңгейі сияқты үйді ұйымдастырғыңыз келсе.
Регрессиялық әдістердің түрлері
Регрессияның қарапайым және ескі нысаны екі айнымалылардың арасындағы байланысты бағалау үшін пайдаланылатын сызықтық регрессия болып табылады. Бұл әдіс түзу сызықтың математикалық формуласын (y = mx + b) пайдаланады. Қарапайым жағдайда, бұл Y және X осі бар графикті ескере отырып, X және Y арасындағы байланыс - бұл бірнеше шығарылымдармен түзу сызық. Мысалы, халық санының ұлғаюына байланысты азық-түлік өндірісі бірдей мөлшерде өсетін болады деп болжауға болады - бұл екі сан арасындағы күшті, сызықтық қарым-қатынасты қажет етеді. Мұны бейнелеу үшін Y осі популяциясын көбейтіп, X-осі азық-түлік өнімдерін қадағалайтын графикті қарастырыңыз. Y мәні ұлғайған сайын, X мәні бірдей жылдамдықпен артып, олардың арасындағы түзу сызыққа айналады.
Көптеген регрессия сияқты алдыңғы қатарлы әдістемелер бірнеше айнымалылардың өзара байланысын болжайды - мысалы, табыстың, білім берудің және қайда өмір сүретіндіктің арасындағы корреляция бар ма? Көп айнымалыларды қосу болжаудың күрделілігін едәуір арттырады. Стандартты, иерархиялық, setwise және қадамдық, оның әрқайсысы өз қосымшалары бар көптеген регрессиялық әдістердің бірнеше түрі бар.
Осы сәтте болжауды (тәуелді немесе болжамды айнымалы) және болжамды жасау үшін қолданылатын деректерді (тәуелсіз немесе болжамды айнымалы мәндерді) болжауды білу маңызды . Біздің мысалымызда біз өмір сүруді таңдаған жерді болжауды ( болжамды ауыспалы) табыс пен білім беруді ( болжамдық айнымалылар) болжағымыз келеді .
- Стандартты көп регрессия бір мезгілде барлық болжамды айнымалыларды қарастырады. Мысалға, 1) табыстың және білімнің (болжаушылардың) және көршiлiктi таңдаудың (болжау) өзара байланысы; және 2) жеке болжаушылардың әрқайсысы осы қатынастарға қандай дәрежеде ықпал етеді?
- Қадамдық көп регрессия толығымен басқа сұраққа жауап береді. Қадамдық регрессия алгоритмі қандай превентивтерді жақсырақ таңдауды алдын ала болжау үшін қолданатындығын талдайды - яғни қадамдық модель болжамды айнымалы мәндердің маңыздылығын бағалайды, содан кейін тиісті жиынтығын таңдайды. Регрессиялық мәселенің бұл түрі регрессиялық теңдеуді дамыту үшін «қадамдар» пайдаланады. Регрессияның осы түрін ескере отырып, барлық болжаушылар соңғы регрессиялық теңдеуде де пайда болмауы мүмкін.
- Кездейсоқ регрессия , кезеңдік секілді, жүйелі процесс болып табылады, бірақ болжамды айнымалылар алдын ала анықталған алдын-ала белгіленген тәртіпте модельге енгізіледі, яғни алгоритм құрамдас бөліктерді предикторларды енгізіңіз. Бұл жиі пайдаланылады, егер адам регрессиялық теңдеуді жасайтын болса, онда өріс туралы білімі бар.
- Setwise регрессиясы қадамдыққа ұқсас, бірақ жеке айнымалы емес, айнымалы жиындар жиынтығын талдайды.