Jak vyloučit extrémní hodnoty ze statistik

Anonim

Výpočet průměru obvykle říká hodně o sadě dat. Objemy dat s extrémními odlehlými hodnotami jsou však problematické, protože tyto mohou výrazně ovlivnit a zfalšovat výsledek.

Takové odlehlé hodnoty můžete ze svých výpočtů vyloučit. Pak vaše základní data získají na významu při hodnocení. Ilustrace [1] ukazuje tabulku, ve které je průměrná hodnota vypočítána pro každý sloupec.

Vzhledem k záporným hodnotám ve dnech 2 a 4 jsou tyto průměrné hodnoty velmi nízké. Ve dnech 1 a 5 však velmi vysoké hodnoty vedou k obzvláště vysokým průměrným hodnotám.

Chcete -li vypočítat průměrné hodnoty bez odlehlých hodnot, použijte funkci OŘÍŽENÍ PROSTŘEDKŮ. Chcete -li to provést, zadejte do buňky B16 následující vzorec a po zadání jej zkopírujte do buněk C16: F16:
= OŘEZÁNÍ STŘEDNÍ (B4: B13; 0,2)

Střední hodnoty jsou nyní mnohem blíže u sebe, protože extrémní hodnoty nejsou brány v úvahu. [2]

Do tabulkové funkce ROUTED AVERAGE předáte dva argumenty: První argument určuje rozsah, ve kterém chcete vypočítat průměr. Jako druhý argument předejte hodnotu mezi 0 a 1 nebo mezi 0% a 100%. To vám umožní určit, která část objemu dat by neměla být zahrnuta do výpočtu. Nejvyšší a nejnižší hodnoty nejsou brány v úvahu.

V příkladové tabulce máte jako druhý argument hodnotu 0,2. To znamená, že 20% z deseti přenesených hodnot není zahrnuto do výpočtu. S deseti hodnotami to znamená: Z výpočtu vypadnou dvě hodnoty: největší a nejmenší. Při výpočtu počtu chybějících hodnot se Excel vždy zaokrouhlí dolů na nejbližší sudé číslo, aby se vždy ořízl stejný počet hodnot nad i pod.