Cum se calculează valori aberante: 7 pași (cu imagini)

Cuprins:

Cum se calculează valori aberante: 7 pași (cu imagini)
Cum se calculează valori aberante: 7 pași (cu imagini)

Video: Cum se calculează valori aberante: 7 pași (cu imagini)

Video: Cum se calculează valori aberante: 7 pași (cu imagini)
Video: Terminal velocity 2024, Martie
Anonim

Un aspect anormal este datele observaționale care sunt considerabil diferite din punct de vedere numeric față de celelalte observații dintr-un eșantion. Termenul este utilizat în studii statistice și poate indica anomalii în setul de date sau erori în măsurarea efectuată. Știind cum să calculați valorile aberante este important pentru a asigura o înțelegere corectă a datelor și va duce la concluzii mai precise din studiu. Există un proces foarte simplu pentru a le calcula pentru un set dat de observații.

pași

Calculați valorile aberante Pasul 1
Calculați valorile aberante Pasul 1

Pasul 1. Învățați să recunoașteți un potențial outlier

Înainte de a calcula dacă o dată observațională reprezintă sau nu o valoare anterioară, este întotdeauna util să examinăm setul de date și să recunoaștem potențialele valori anormale. De exemplu, luați în considerare un set de date care reprezintă temperatura a 12 obiecte diferite dintr-o cameră. Dacă 11 obiecte au o temperatură de aproximativ 21 ° C, dar a douăsprezecea (poate un cuptor) are o temperatură de 150 ° C, o examinare rapidă ar putea spune că cuptorul este o valoare anterioară.

Calculați valorile aberante Pasul 2
Calculați valorile aberante Pasul 2

Pasul 2. Organizați datele observaționale de la cel mai mic la cel mai mare

Continuând cu exemplul de mai sus, luați în considerare următorul set de date care reprezintă temperaturile diferitelor obiecte: {22, 21, 24, 21, 21, 20, 21, 23, 22, 150, 22, 20}. Acest set trebuie distribuit ca: {20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 24, 150}.

Calculați valorile aberante Pasul 3
Calculați valorile aberante Pasul 3

Pasul 3. Calculați mediana setului de date

Mediana reprezintă datele observaționale situate deasupra jumătății inferioare a datelor și sub jumătatea superioară. Dacă setul de date conține un număr par de observații, atunci cei doi termeni de mijloc trebuie să fie luați în considerare. În exemplul de mai sus, cei doi termeni de mijloc sunt 21 și 22, deci mediana este ((21 + 22) / 2) sau 21, 5.

Calculați valorile aberante Pasul 4
Calculați valorile aberante Pasul 4

Pasul 4. Calculați quartila inferioară

Acest punct, numit Q1, reprezintă date observaționale situate sub 25% din observații. În exemplul de mai sus, trebuie terminați din nou doi termeni, de data aceasta 21 și 21. Media celor doi va fi ((21 + 21) / 2) sau 21.

Calculați valorile aberante Pasul 5
Calculați valorile aberante Pasul 5

Pasul 5. Calculați quartila superioară

Acest punct, numit Q3, reprezintă datele observaționale situate peste 25% din observații. Continuând cu exemplul nostru, luând media celor două zaruri 22 și 23 se ajunge la Q3, care este 22, 5.

Calculați valorile aberante Pasul 6
Calculați valorile aberante Pasul 6

Pasul 6. Găsiți „barierele interioare” ale setului de date

Primul pas este de a multiplica diferența dintre Q1 și Q3 (numită intervalul interquartilei) cu 1,5. În exemplul de mai sus, intervalul interquartilei este (22, 5 - 21), adică 1, 5. Înmulțiți această valoare cu 1, 5 dă 2, 25. Adăugați acest număr la Q3 și scădeți din Q1 pentru a construi barierele. În acest exemplu, barierele interne superioare și inferioare ar fi 24, 75 și 18, 75.

Toate datele observaționale în afara acestui interval sunt considerate valori aberante moderate. În setul de date pentru acest exemplu, doar temperatura cuptorului (150 ° C) este considerată o valoare anterioară moderată

Calculați valorile aberante Pasul 7
Calculați valorile aberante Pasul 7

Pasul 7. Găsiți „barierele externe” ale setului de date

Acest lucru se face în același mod ca și pentru barierele interne, cu excepția faptului că intervalul intercuartil este multiplicat cu 3 în loc de 1,5. Înmulțind intervalul intercuartil de mai sus cu 3, obținem (1, 5 * 3) sau 4, 5. Astfel, barierele exterioare superioare și inferioare sunt 27 și 16, 5.

Orice valoare observațională care se găsește în afara barierelor externe este considerată extremă. În acest exemplu, temperatura cuptorului, de 150 ° C, este, de asemenea, o valoare extrem de extremă

Recomandat: