Pagkakaiba sa Pagitan ng Puno ng Desisyon at Random Forest

Talaan ng mga Nilalaman:

Anonim

Ang pangunahing pagkakaiba sa pagitan ng puno ng pagpapasya at random na kagubatan ay iyon ang isang puno ng pagpapasya ay isang grap na gumagamit ng isang paraan ng pagsasanga upang ilarawan ang bawat posibleng kinalabasan ng isang desisyon habang ang isang random na kagubatan ay isang hanay ng mga puno ng pagpapasya na nagbibigay ng pangwakas na kinalabasan batay sa mga kinalabasan ng lahat ng mga punungkahoy na nagpapasya.

Ang pag-aaral ng makina ay isang aplikasyon ng Artipisyal na Katalinuhan, na nagbibigay sa isang system ng kakayahang malaman at pagbutihan batay sa dating karanasan. Ang puno ng pagpapasya at random na kagubatan ay dalawang pamamaraan sa pagkatuto ng makina. Ang isang punungkahoy na punungkahoy mapa ng mga posibleng kinalabasan ng isang serye ng mga kaugnay na mga pagpipilian. Ito ay tanyag sapagkat ito ay simple at mas madaling maunawaan. Kapag ang dataset ay naging mas malaki, ang isang solong puno ng desisyon ay hindi sapat upang hanapin ang hula. Ang isang random na kagubatan, na kung saan ay isang koleksyon ng mga puno ng pagpapasya, ay isang kahalili sa isyung ito. Ang output ng random na kagubatan ay batay sa mga output ng lahat ng mga puno ng pagpapasya.

Desisyon ng Puno, Pag-aaral ng Makina, Random Forest

Ano ang Decision Tree

Ang isang puno ng pagpapasya ay isang diagram ng hugis ng puno na ginagamit upang matukoy ang isang kurso ng pagkilos. Ang bawat sangay ng puno ay kumakatawan sa isang posibleng desisyon, pangyayari o reaksyon.

Mayroong maraming mga term na nauugnay sa isang puno ng pagpapasya. Ang Entropy ay ang pagsukat ng hindi mahuhulaan sa dataset. Matapos hatiin ang dataset, bumababa ang antas ng entropy habang bumababa ang hindi mahuhulaan. Ang nakakuha ng impormasyon ay ang pagbawas sa entropy pagkatapos ng pagdura sa dataset. Mahalagang hatiin ang data sa isang paraan na ang pagtaas ng impormasyon ay nagiging mas mataas. Ang mga pangwakas na desisyon o pag-uuri ay tinatawag na mga leaf node. Ang pinakamataas o pangunahing node ay tinatawag na root node. Dapat hatiin ang dataset hanggang sa maging zero ang panghuling entropy.

Ang isang simpleng puno ng pagpapasya ay ang mga sumusunod.

Larawan 1: Puno ng Desisyon

Sa itaas ng puno ng pagpapasya inuri ang isang hanay ng mga prutas. Mayroong 4 na ubas, 2 mansanas, at 2 mga dalandan. Kapag isinasaalang-alang ang diameter na mas mababa sa 5, ang mga ubas ay ikinategorya sa isang gilid habang ang mga dalandan at mansanas sa kabilang panig. Ang ubas ay hindi maaaring maiuri nang karagdagang dahil mayroon itong zero na entropy. Kapag ikinategorya ayon sa kulay, ibig sabihin, kung pula ang prutas ay pula o hindi, ang mga mansanas ay inuri sa isang panig habang ang mga dalandan ay nauri sa kabilang panig. Sa gayon, inuuri ng puno ng pagpapasya na ito ang isang mansanas, ubas o kahel na may 100% kawastuhan.

Sa pangkalahatan, ang isang puno ng pagpapasya ay simpleng maunawaan, mas madaling bigyang-kahulugan at mailarawan. Hindi ito nangangailangan ng maraming paghahanda ng data. Maaari nitong hawakan ang parehong data na may bilang at kategorya. Sa kabilang banda, ang ingay sa data ay maaaring maging sanhi ng overfitting. Bukod dito, ang modelo ay maaari ring maging hindi matatag dahil sa maliliit na pagkakaiba-iba.

Ano ang Random Forest

Ang Random gubat ay isang pamamaraan na nagpapatakbo sa pamamagitan ng pagbuo ng maraming mga puno ng pagpapasya sa panahon ng yugto ng pagsasanay. Ang mga desisyon ng karamihan ng mga puno ay ang pangwakas na desisyon ng random na kagubatan. Ang isang simpleng halimbawa ay ang mga sumusunod.

Ipagpalagay na mayroong isang hanay ng mga prutas (seresa, mansanas, at dalandan). Ang sumusunod ay ang tatlong mga punong nagpapasya na ikinategorya ang tatlong uri ng prutas.

Larawan 2: Punong nagpapasya 1

Larawan 3: Desisyon Puno 2

Larawan 4: Tree ng Desisyon 3

Ang isang bagong prutas na ang diameter ay 3 ay ibinibigay sa modelo. Ang prutas na ito ay kulay kahel, at lumalaki sa tag-init. Ang unang puno ng pagpapasya ay ikakategorya ito bilang isang kahel. Ang ikalawang puno ng pagpapasya ay ikakategorya ito bilang isang seresa habang ang pangatlong puno ng desisyon ay ikakategorya ito bilang isang kahel. Kapag isinasaalang-alang ang lahat ng tatlong mga puno, mayroong dalawang output para sa orange. Samakatuwid, ang pangwakas na output ng random na kagubatan ay isang orange.

Sa pangkalahatan, ang random na kagubatan ay nagbibigay ng tumpak na mga resulta sa isang mas malaking dataset. Binabawasan din nito ang panganib na mag-overfitting.

Pagkakaiba sa Pagitan ng Puno ng Desisyon at Random Forest

Kahulugan

Ang isang puno ng pagpapasya ay isang tool ng suporta sa desisyon na gumagamit ng isang tulad ng grap na modelo o modelo ng mga desisyon at ang kanilang mga posibleng kahihinatnan, kabilang ang mga kinalabasan ng kaganapan sa pagkakataon, mga gastos sa mapagkukunan, at paggamit. Ang mga random na kagubatan ay isang paraan ng pag-aaral ng ensemble na nagpapatakbo sa pamamagitan ng pagbuo ng maraming mga puno ng pagpapasya sa oras ng pagsasanay at paglabas ng klase depende sa mga indibidwal na puno.

Overfitting

Mayroong posibilidad na mag-overfitting sa isang puno ng pagpapasya. Ang paggamit ng maraming mga puno sa random na kagubatan ay binabawasan ang panganib na mag-overfitting.

Kawastuhan

Ang isang random na kagubatan ay nagbibigay ng mas tumpak na mga resulta kaysa sa isang puno ng pagpapasya.

Pagiging kumplikado

Ang isang puno ng pagpapasya ay mas simple at mas madaling maunawaan, bigyang kahulugan at mailarawan kaysa sa isang random na kagubatan, na medyo mas kumplikado.

Konklusyon

Ang pagkakaiba sa pagitan ng puno ng pagpapasya at random na kagubatan ay ang isang puno ng pagpapasya ay isang grap na gumagamit ng isang paraan ng pagsasanga upang ilarawan ang bawat posibleng kinalabasan ng isang desisyon habang ang isang random na kagubatan ay isang hanay ng mga puno ng pagpapasya na nagbibigay ng pangwakas na kinalabasan batay sa mga output ng lahat mga puno ng pagpapasya nito.

Sanggunian:

1. Random Forest Algorithm - Ipinaliwanag ang Random Forest | Random Forest sa Pag-aaral ng Makina, Simplilearn, 12 Marso 2018, Magagamit dito.

Pagkakaiba sa Pagitan ng Puno ng Desisyon at Random Forest