Pagkakaiba sa Pagitan ng Linear Regression at Logistic Regression

Talaan ng mga Nilalaman:

Anonim

Ang pangunahing pagkakaiba sa pagitan ng linear regression at logistic regression ay ang Ginagamit ang linear regression upang mahulaan ang isang tuloy-tuloy na halaga habang ginagamit ang logistic regression upang mahulaan ang isang discrete na halaga.

Ang mga sistema ng pag-aaral ng makina ay maaaring mahulaan ang mga hinaharap sa hinaharap batay sa pagsasanay ng mga nakaraang input. Mayroong dalawang pangunahing uri ng pag-aaral ng makina na tinatawag na pinangangasiwaang pag-aaral at hindi suportadong pag-aaral. Ang pag-urong at pag-uuri ay nahulog sa ilalim ng pinangangasiwaang pag-aaral habang ang clustering ay nahuhulog sa ilalim ng hindi suportadong pag-aaral. Ang mga pinangangasiwaang algorithm sa pag-aaral ay gumagamit ng may label na data upang sanayin ang hanay ng data. Ang Linear regression at logistic regression ay dalawang uri ng pinangangasiwaang mga algorithm sa pag-aaral. Ginagamit ang Linear regression kapag ang dependant variable ay tuloy-tuloy, at ang modelo ay linear. Ginagamit ang logistic regression kapag ang dependant variable ay discrete, at ang modelo ay nonlinear.

Linear Regression, Logistic Regression, Learning ng Machine

Ano ang Linear Regression

Natagpuan ng Linear regression ang ugnayan sa pagitan ng mga independyente at umaasa na mga variable. Pareho silang magkadikit. Ang independiyenteng variable ay ang variable na hindi binago ng iba pang mga variable. Ito ay sinasabihan ng x. Maaari ding magkaroon ng maramihang mga independiyenteng variable tulad ng x1, x2, x3, atbp. Mga umaasa na pagbabago ng pagbabago ayon sa independiyenteng variable, at sinasabihan ng y.

Kapag mayroong isang independiyenteng variable, ang equation ng pagbabalik ay ang mga sumusunod.

y = b0 + b1x

Halimbawa, ipalagay na ang x ay kumakatawan sa ulan at y ay kumakatawan sa ani ng ani.

Larawan 1: Linear Regression

Ang dataset ay magiging hitsura sa itaas. Pagkatapos, isang linya na sumasaklaw sa karamihan ng mga puntos ng data ang napili. Kinakatawan ng linyang ito ang hinulaang mga halaga.

Larawan 2: Distansya sa pagitan ng mga aktwal na puntos ng data at hinulaang mga halaga

Pagkatapos, ang distansya mula sa bawat data point sa linya ay matatagpuan tulad ng ipinakita sa itaas na graph. Ito ang distansya sa pagitan ng aktwal na halaga at ng hinulaang halaga. Ang distansya na ito ay kilala rin bilang mga error o residual. Ang pinakamahusay na linya ng fit ay dapat magkaroon ng hindi bababa sa kabuuan ng mga parisukat ng mga error. Kapag binigyan ang bagong halaga ng ulan (x), posibleng hanapin ang kaukulang ani ng ani (y) gamit ang linyang ito.

Sa totoong mundo, maaaring mayroong maraming mga independiyenteng variable (x1, x2, x3…). Ito ay tinatawag na maramihang linear regression. Ang maramihang linear equation regression ay ang mga sumusunod.

Ano ang Logistic Regression

Maaaring magamit ang logistic regression upang maiuri ang dalawang klase. Kilala rin ito bilang pag-uuri ng binary. Ang pagsuri kung ang isang email ay spam o hindi hulaan kung bibili ang isang customer ng isang produkto o hindi, na hinuhulaan kung posible na makakuha ng isang promosyon o hindi ay ilang iba pang mga halimbawa ng pag-urong sa logistik.

Larawan 3: Pag-urong sa Logistik

Ipagpalagay na ang bilang ng mga oras na pinag-aralan ng isang mag-aaral bawat araw ay ang independiyenteng variable. Nakasalalay doon, ang posibilidad na makapasa sa isang pagsusulit ay kinakalkula. Ang halagang 0.5 isinasaalang-alang bilang ang threshold. Kapag naibigay ang bagong bilang ng oras, posible na makahanap ng kaukulang posibilidad na makapasa sa pagsusulit gamit ang grap na ito. Kung ang posibilidad ay nasa itaas ng 0.5, ito ay isinasaalang-alang bilang 1 o pass. Kung ang posibilidad ay nasa ibaba 0.5, pagkatapos ito ay isinasaalang-alang bilang 0 o mabibigo.

Ang paglalapat ng linear equation equation sa pag-andar ng sigmoid ay magbibigay sa equation ng logistic regression.

Ang sigmoid function ay

Ang isa pang mahalagang puntong dapat tandaan ay ang logistic regression ay nalalapat lamang upang maiuri ang 2 klase. Hindi ito ginagamit para sa pag-uuri ng multiclass.

Pagkakaiba sa Pagitan ng Linear Regression at Logistic Regression

Kahulugan

Ang Linear regression ay isang linear na diskarte na nagmomodelo ng ugnayan sa pagitan ng isang dependant variable at isa o higit pang mga independiyenteng variable. Sa kaibahan, ang logistic regression ay isang istatistikal na modelo na hinuhulaan ang posibilidad ng isang kinalabasan na maaari lamang magkaroon ng dalawang halaga.

Paggamit

Habang ginagamit ang linear regression upang malutas ang mga problema sa regression, ginagamit ang logistic regression upang malutas ang mga problema sa pag-uuri (binary classification).

Pamamaraan

Tinatantya ng Linear regression ang umaasa na variable kapag may pagbabago sa independiyenteng variable. Kinakalkula ng pagbabalik ng Logistic ang posibilidad ng isang kaganapan na nagaganap. Ito ay isang mahalagang pagkakaiba sa pagitan ng linear regression at logistic regression.

Halaga ng Output

Gayundin, sa linear regression, ang halaga ng output ay tuloy-tuloy. Sa logistic regression, ang halaga ng output ay discrete.

Modelo

Kahit na ang linear regression ay gumagamit ng isang tuwid na linya, ang logistic regression ay gumagamit ng isang S curve o sigmoid function. Ito ay isa pang mahalagang pagkakaiba sa pagitan ng linear regression at logistic regression.

Mga halimbawa

Hinuhulaan ang GDP ng isang bansa, hinuhulaan ang presyo ng produkto, hinuhulaan ang presyo ng pagbebenta ng bahay, hula ang iskor ay ilang mga halimbawa ng linear regression. Ang paghula kung ang isang email ay spam o hindi, hulaan kung ang transaksyon sa credit card ay pandaraya o hindi, na hinuhulaan kung ang isang customer ay kukuha ng isang utang o hindi ay ilang mga halimbawa ng pag-urong sa logistik.

Konklusyon

Ang pagkakaiba sa pagitan ng linear regression at logistic regression ay ang linear regression ay ginagamit upang mahulaan ang isang tuloy-tuloy na halaga habang ang logistic regression ay ginagamit upang mahulaan ang isang discrete na halaga. Sa madaling sabi, ang linear regression ay ginagamit para sa regression habang ang logistic regression ay ginagamit para sa pag-uuri.

Sanggunian:

1. Pagsusuri sa Linear Regression | Linear Regression sa Python | Mga Algorithm sa Pagkatuto ng Makina | Simplilearn, 26 Marso 2018, Magagamit dito.2. Logistic Regression | Logistic Regression sa Python | Mga Algorithm sa Pagkatuto ng Makina | Simplilearn, 22 Marso 2018, Magagamit dito.

Kagandahang-loob ng Larawan:

1. "Linear regression" Ni Sewaqu - Sariling gawain, Public Domain) sa pamamagitan ng Wikimedia Wikimedia2. "Mga Natitira para sa Linear Regression Fit" Ni Thomas.haslwanter - Sariling gawain (CC BY-SA 3.0) sa pamamagitan ng Wikimedia Wikimedia3. "Logistic-curve" Ni Qef (talk) - Nilikha mula sa simula gamit ang gnuplot (Public Domain) sa pamamagitan ng Commons Wikimedia

Pagkakaiba sa Pagitan ng Linear Regression at Logistic Regression