Paggamit ng Cluster Analysis sa Microsoft Excel

Pin
Send
Share
Send

Ang isa sa mga tool para sa paglutas ng mga problemang pang-ekonomiya ay ang pagsusuri ng kumpol. Sa tulong nito, ang mga kumpol at iba pang mga bagay ng hanay ng data ay naiuri sa mga pangkat. Ang pamamaraan na ito ay maaaring mailapat sa Excel. Tingnan natin kung paano ito ginagawa sa pagsasanay.

Paggamit ng Cluster Analysis

Sa tulong ng pagsusuri ng kumpol, posible na magsagawa ng sampling ayon sa katangian na pinag-aaralan. Ang pangunahing gawain nito ay ang hatiin ang isang multidimensional na hanay sa mga homogenous na grupo. Bilang isang criterion ng pagpapangkat, ginagamit ang isang koepisyentong ugnayan ng ugnayan o distansya ng Euclidean sa pagitan ng mga bagay sa pamamagitan ng isang ibinigay na parameter. Ang mga halaga na pinakamalapit sa bawat isa ay pinagsama-sama.

Bagaman ang ganitong uri ng pagsusuri ay madalas na ginagamit sa ekonomiya, maaari rin itong magamit sa biyolohiya (upang maiuri ang mga hayop), sikolohiya, gamot, at sa maraming iba pang mga lugar ng aktibidad ng tao. Maaaring mailapat ang pagtatasa ng kumpol gamit ang karaniwang tool ng Excel para sa mga layuning ito.

Halimbawa ng paggamit

Mayroon kaming limang mga bagay na nailalarawan sa pamamagitan ng dalawang pinag-aralan na mga parameter - x at y.

  1. Inilapat namin ang formula ng Euclidean distansya sa mga halagang ito, na kinakalkula ayon sa template:

    = ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Ang halaga na ito ay kinakalkula sa pagitan ng bawat isa sa limang mga bagay. Ang mga resulta ng pagkalkula ay inilalagay sa distansya ng matrix.
  3. Tinitingnan namin sa pagitan kung aling mga halaga ang distansya ang pinakamaliit. Sa aming halimbawa, ang mga ito ay mga bagay 1 at 2. Ang distansya sa pagitan ng mga ito ay 4.123106, na mas mababa sa pagitan ng anumang iba pang mga elemento ng populasyon na ito.
  4. Pagsamahin ang data na ito sa isang pangkat at bumuo ng isang bagong matrix kung saan ang mga halaga 1,2 kumilos bilang isang hiwalay na elemento. Kapag pinagsama-sama ang matrix, iniwan namin ang pinakamaliit na mga halaga mula sa nakaraang talahanayan para sa pinagsamang elemento. Muli naming titingnan, sa pagitan ng kung aling mga elemento ang distansya ay minimal. Oras na ito 4 at 5pati na rin ang bagay 5 at pangkat ng mga bagay 1,2. Ang layo ay 6,708204.
  5. Nagdagdag kami ng mga tinukoy na elemento sa pangkalahatang kumpol. Bumubuo kami ng isang bagong matris ayon sa parehong prinsipyo tulad ng nakaraang oras. Iyon ay, naghahanap kami ng pinakamaliit na halaga. Sa gayon, nakikita namin na ang aming set ng data ay maaaring nahahati sa dalawang kumpol. Ang unang kumpol ay naglalaman ng mga elemento na pinakamalapit sa bawat isa - 1,2,4,5. Sa pangalawang kumpol sa aming kaso, isang elemento lamang ang ipinakita - 3. Medyo malayo ito sa iba pang mga bagay. Ang distansya sa pagitan ng mga kumpol ay 9.84.

Nakumpleto nito ang pamamaraan para sa paghati sa populasyon sa mga pangkat.

Tulad ng nakikita mo, kahit na sa pangkalahatang pagsusuri ng kumpol ay maaaring mukhang isang kumplikadong pamamaraan, sa katunayan, ang pag-unawa sa mga nuances ng pamamaraang ito ay hindi napakahirap. Ang pangunahing bagay ay upang maunawaan ang pangunahing pattern ng pagpangkat.

Pin
Send
Share
Send