ResponseEve, a responsive template by SiGa

Po dyskusji zakończonej 2 października 2016 artykułowi Odchylenie standardowe odebrano status Dobrego Artykułu.
Zobacz dyskusję

Po dyskusji zakończonej 13 września 2007 artykułowi Odchylenie standardowe przyznano status Dobrego Artykułu.
Zobacz dyskusję

Po głosowaniu zakończonym 3 lipca 2007 artykułowi Odchylenie standardowe nie przyznano statusu Artykułu na Medal.
Zobacz dyskusję

Skrót artykułu Odchylenie standardowe znajdował się w sierpniu 2008 na stronie głównej Portalu ekonomicznego w rubryce Artykuł miesiąca.

Wikiprojekt:Ekonomia • Portal:Ekonomia • Kategoria:Ekonomia

Proponuje zamienić pojęcie odchylenie standardowe na zakres różnic od normy (w rzeczywistości). Przy czym przy wykresach opisujących standard, a nie normę rzeczywistości zaznaczyć zakres różnic od standardu/standardów.

inny wzór

Spotkałem się też z wzorem:

s={\sqrt {\frac {\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n(n-1)}}}

(Np. tu: http://vibrolab.simr.pw.edu.pl/lppwd00.pdf str. 24)

Jakoś mi się wydaje nie przystawać do powyższych, ale nie jestem matematykiem. Czy ktoś kompetentny może to wyjaśnić i uzupełnić tę niezwykle ważną stronę.

To jest poprawny wzór, ale nie na odchylenie standardowe zmiennej losowej, z której mamy próbkę statystyczną. To jest estymator nieobciążony odchylenia standardowego średniej arytmetycznej z próbki, przy założeniu niezależności błędów poszczególnych obserwacji. Wyprowadzenie:

Ponieważ każda z realizacji danej zmiennej losowej, czyli każda z obserwacji w próbce może być uważana za zmienną losową o odchyleniu standardowym

s={\sqrt {\frac {\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n-1}}}

więc wariancja dla każdej obserwacji wynosi:

s^{2}={\frac {\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n-1}}

Zatem wariancja sumy ze wszystkich obserwacji (tu potrzebne jest założenie o niezależności):

s_{\Sigma }^{2}={\frac {n\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n-1}}

Odchylenie standardowe sumy ze wszystkich obserwacji:

s_{\Sigma }={\sqrt {\frac {n\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n-1}}}

Odchylenie standardowe średniej:

s_{\overline {x}}={\frac {s_{\Sigma }}{n}}={\sqrt {\frac {\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}}{n(n-1)}}}

Może dorzucę do artykułu, jeśli będę miał więcej czasu, a nikt nie zrobi tego przede mną. Olaf @ 17:38, 19 maja 2007 (CEST)

Dorzuciłem, i solidnie rozbudowałem, przy okazji komentując popularny błąd, którego nie ustrzegłem się i w powyższym wywodzie. Olaf @ 01:07, 20 maja 2007 (CEST)

Wydaje mi się podejrzany wzór na odchylenie ważone, moim zdanie waga powinna byś wyciągnięta przed kwadrat odchylenia próbki

s={\sqrt {\frac {\sum _{i=1}^{n}{w_{i}(x_{i}-{\overline {x}})^{2}}}{\sum _{i=1}^{n}(w_{i})}}}

W obecniej postaci podstawienie wszystkich identycznych wag <>1 daje inne wyniki niż dla 1

Z tego co mi wiadomo to powyższa zależność jest JEDYNĄ którą naukowcy rozumieją jako odchylenie standardowe dla serii pomiarów. I to właśnie tą (../n(n-1)) podaje się w wynikach typu 17,8+-0,3 To jest artykuł napisany z punktu widzenia statystyki używanej w ekonomii czy naukach społecznych, ale nijak ma się do unormowanych miedzynarodowych standardów dotyczących niepewności.

Wikipedia:Propozycje do Artykułów na medal/Odchylenie standardowe

Mój komentarz do głosu przeciw. Proszę o wyjaśnienie (i ewentualnie) poprawki. Artykuł zawiera dużo interesujących i ważnych informacji, ale IMHO sposób ich prezentacji jest bardzo chaotyczny i go dyskwalifikuje do medalu. W szczególności:

Struktura artykułu: IMO, do gruntownej przebudowy. Nie wiem jak można mówić np. o nierówności Czebyszewa przed podaniem "wzoru" na obliczanie odchylenia standardowego. Innymi słowy artykuł jest IMO trochę za formalny tam gdzie nie potrzeba.
Wstęp mówi (chyba) niemal wyłącznie o odchyleniu standardowym próbki - brakuje zupełnie omówienia odchylenia standardowego z populacji/rozkładu prawdopodobieństwa. Moim zdaniem to dyskwalifikujące przeoczenie we wstępie (dla mnie odchylenie standardowe, to przede wszystkim cecha rozkładu prawdopodobieństwa). Rozumiem, że to jest prostsze do wytłumaczenia, ale jakoś dziwnie to jest napisane. Brakuje mi zdania typu: "Odchylenie standardowe próbki może być wykorzystane do oszacowania odchylenie standardowego populacji/rozkładu". Z drugiej strony, jak to rozumiem większość artykułu omawia jednak "odchylenie standardowe w populacji".
"Dobra/niedobra" miara (w sekcji "Różne wzory dla różnych przypadków"). Niefortunne sformułowanie moim zdaniem. Odchylenie standardowe to jakaś liczba i jako taka nie może być dobra lub niedobra. Rozumiem, że może być niedokładna albo podatna na błędne interpretacje, ale nawet populacje skończone o bardzo egzotycznym rozkładzie mają dobrze zdefiniowane odchylenie standardowe (które nie poddaje się powszechnej interpretacji).
Ogólnie, sekcja "Różne wzory dla różnych przypadków" jest dla mnie niepotrzebna i niezrozumiała - temat jest zbyt abstrakcyjny jak na początek. Jeżeli musi zostać, to jako podsumowanie na końcu, a nie jako wstęp.
Definicje formalne: Moim zdaniem to co w artykule jest nazwane "Najczęściej używany estymator", to jest powszechnie uznany wzór na "Odchylenie standardowe w próbce" (zobacz też komentarz powyżej). Taki wzór ma swoje uzasadnienie - jest w wielu przypadkach dobrym estymatorem. W artykule, to jest obrócone do góry nogami - nie ma "jednego" wzoru na odchylenie standardowe próbki, mimo że wstęp mówi tylko o tym (patrz powyżej). Rozumiem, że są kontrowersje dotyczące własności estymatorów, ale jednak taka definicja jest powszechna.
Styl: M.in: "Dla jakiego odchylenia σ = s najbardziej prawdopodobne byłoby wylosowanie właśnie takich wyników xi do próbki jakie faktycznie w niej wystąpiły?". "Dlaczego n-1?" Zobacz: W artykułach nie należy stosować pytań jako figury stylistycznej, ale nie tylko.

Myślę, że ilość informacji w artykule jest wystarczająca do medalu, więc żeby być bardziej konstruktywnym, naturalna (dla mnie) struktura artykułu wyglądałaby następująco:

Wstęp
Prosty(e) przykład(y) liczbowe z intuicją (jak obecnie)
Wzory:
1. Odchylenie standardowe w populacji (połączone z wyjaśnieniem co to populacja), własności, kwestie istnienia/braku istnienia, itp.
2. Odchylenie standardowe w próbce (co to próbka).
Estymacja: wyciąganie wniosków o populacji z próbki, przykłady, własności
1. Własności estymatorów, alternatywne estymatory.
Tematy bardziej "egzotyczne"

I mam pytanie natury merytorycznej na temat "błędnie nazywanego estymatorem nieobciążonego". Czy tak rzeczywiście się go nazywa w literaturze? Bezsprzecznie kwadrat tego wyrażenia jest (ogólnie) nieobciążonym estymatorem wariancji (dowód np. w przypisie 5), a ponieważ funkcja x^2 jest nieliniowa to na mocy nierówności Jensena wynika od razu, że wzór na odchylenie standardowe jest obciążony. Moje osobiste zdanie jest takie, że popularność wzoru wynika nie z jego prostoty czy braku obciążenia (jak w artykule), ale z jego związku z nieobciążonym estymatorem wariancji.

Pozdrawiam i liczę, że w bliskiej przyszłosci z czystym sumieniem będę mógł zmienić swój głos. Qblik ¿Ø? 20:15, 4 cze 2007 (CEST)[odpowiedz]

Odnoszę się do uwag powyżej:

Rzeczywiście powinienem był zacząć od wzorów. Zmienię.
We wstępie wyłącznie na temat próbki jest jedno zdanie: "Odchylenie standardowe można obliczyć w szczególności dla dowolnej skończonej próbki, jednak wyniki mają sensowną interpretację, gdy rozkład zmiennej w populacji jest zbliżony do normalnego i nie ma zbyt wielu elementów odstających w porównaniu do wielkości próbki". Reszta dotyczy i próbki i populacji. Ale może faktycznie powinienem to zmienić tak aby było to oczywiste.
Odchylenie standardowe to liczba, ale odchylenie standardowe to także narzędzie. I w tym sensie może być dobre/nie dobre w konkretnych przypadkach.
Sekcja "Różne wzory dla różnych przypadków" powstała (i znalazła się na początku), gdy wyobraziłem sobie osobę, której w ogóle nie zależy na szczegółach matematycznych, a interesuje ją tylko jakiego wzoru powinna użyć w danej sytuacji. To coś w rodzaju szybkiej ścieżki poruszania się po artykule. Czy ta sekcja w czymś przeszkadza?
Albo mówimy o odchyleniu w próbce, abstrahując od tego że jest częścią jakiejś populacji. Wtedy powinniśmy zastosować wzór na odchylenie w populacji bo traktujemy próbkę jako wydzieloną populację. Albo chcemy coś powiedzieć o odchyleniu w populacji na podstawie próbki. Wtedy mamy estymatory odchylenia w populacji. Ten wzór jest takim estymatorem, konkretniej pierwiastkiem estymatora nieobciążonego wariancji w populacji. Są i inne - np. estymator największej wiarygodności. Nazwa "odchylenie standardowe w próbce" jest moim zdaniem nieporozumieniem. I faktycznie - nie ma tu jednego wzoru, estymatory są co najmniej trzy różne. Rzeczywiście, zgadzam się, że ten też w wielu sytuacjach jest całkiem dobry.
Spróbuję pozbyć się pytań i poprawić nieco styl.

Jeśli chodzi o proponowany plan, to nie podoba mi się najpierw podanie wzoru na "odchylenie standardowe w próbce", a potem omawianie estymatorów, skoro ten wzór (jak by go nie nazywać) jest też estymatorem. Poza tym w porządku.

Ten błąd z nazwaniem go estymatorem nieobciążonym zdarza się niestety często. Żeby daleko nie szukać jest np. tutaj: skrypt z Katedry Fizyki Politechniki Łódzkiej (str 5).

Dziękuję za uwagi. Chętnie to pozmieniam, ale chciałbym najpierw dojść do consensusu. Zaczekam więc na odpowiedź. Olaf @ 20:45, 4 cze 2007 (CEST)[odpowiedz]

2. We wstępie razie mnie chyba głównie zdanie: "Odchylenie standardowe można obliczyć w szczególności dla dowolnej skończonej próbki, jednak wyniki mają sensowną interpretację, gdy rozkład zmiennej w populacji jest zbliżony[1] do normalnego i nie ma zbyt wielu[1] elementów odstających w porównaniu do wielkości próbki." Dla mnie jest zbyt abstrakcyjne i niezrozumiałe: jaką interpretację, jakiej populacji, jakiego rozkładu. Moim zdaniem zacząć trzeba prościej: "Język stosowany w pierwszym akapicie powinien być prosty, zrozumiały dla osoby posiadającej wiedzę na poziomie liceum ogólnokształcącego.", teraz chyba nie jest. Przy tak długim artykule wstęp może mieć dwa, trzy akapity, IMO. Po prostu zaczął bym wolniej. IMO, wstęp jest wizytówką artykułu, dlatego standard oceny wstępu powinien być nieco wyższy.

3 i 5. Zgadzam się, że "Odchylenie standardowe to liczba, ale odchylenie standardowe to także narzędzie." Moim zdaniem to jest kluczowy problem i wokół niego powinna się obracać cała struktura artykułu. "Liczba" jest prostsza od "narzędzia", więc zacząłbym od populacji (gdzie OS jest liczbą), opisał wzorki, własności. Zgadzam się, że kwestia estymatorów (narzędzi) jest delikatna. Upierałbym się wciąż, że wzór na "odchylenie standardowe w próbce" w "popularnej wersji" powinien być opisany jako taki (ponieważ jest tak powszechnie znany i jest to weryfikowalne). Po tym postarałbym się wyjaśnić po co nam odchylenie standardowe w próbce, jako wstęp do estymacji, alternatywnych definicji, własności, itp. Jedyna wada takiego rozwiązania, to że praktyczne (estymacyjne) aspekty OS są przesunięte do drugiej części artykułu. Ale to jest chyba nieuniknione. Dalej piszesz: "Nazwa "odchylenie standardowe w próbce" jest moim zdaniem nieporozumieniem." Mimo, że się z Tobą zgadzam, to brzmi trochę jak POV/OR: Nazwa może być nieporozumieniem, ale jeżeli jest powszechnie stosowana i weryfikowalna, to powinna zostać razem ze wzorem. Myślę, że mogłoby to nawet wzbogacić artykuł dając pretekst do omówienia (w dalszej części) dlaczego jeden wzór nie wystarczy, i bardziej skomplikowanych tematów. Może rozwiewa to także trochę Twoje wątpliwości "Jeśli chodzi o proponowany plan, to nie podoba mi się najpierw podanie wzoru na "odchylenie standardowe w próbce", a potem omawianie estymatorów, skoro ten wzór (jak by go nie nazywać) jest też estymatorem." Wyobrażam sobie ten (kontrowersyjny) wzór trochę jak przejście od populacji (bo wzór jest podobny do wzoru populacyjnego) do estymacji (z wszystkimi komplikacjami).

4. Sekcja "Różne wzory dla różnych przypadków": Brzmi jak poradnik, który na dodatek IMO miernie spełnia swoje zadania. Dlatego się przyczepiłem. Ogólnie, gdyby poprawić, to może zostać. Ale w obecnej formie mnie po prostu razi.

Lubię czytać medalowe hasła na en wiki, i niestety, na pl wiki poprzeczka często wydaje się być dużo niżej (IMO, ze względu na nastawienie na ilość). Skrytykowałem, żeby podciągnąć hasło w górę. Ale ogólnie i tak jest dobre i wartościowe, i nie wątpię, że po poprawkach może dostać medal. Qblik ¿Ø? 21:31, 4 cze 2007 (CEST)[odpowiedz]

Sprawdziłem dokładnie kwestię nazwy tego nieszczęsnego estymatora. Nie jest to bynajmniej takie jednoznaczne. Po angielsku jest "sample standard deviation", czyli dosłownie "próbkowe odchylenie standardowe", ale po polsku nic takiego nie funkcjonuje. W Googlu jest jednak kilka wersji tej nazwy, z czego dwie różne użyłeś powyżej:

odchylenie standardowe w próbce - 38 stron
odchylenie standardowe w próbie - 136 stron
odchylenie standardowe próbki - 99 stron
odchylenie standardowe próby - 16 stron
odchylenie standardowe z próbki - 1 strona
odchylenie standardowe z próby - 280 stron

Jak widać najpopularniejsza jest forma "z próby" i nie jest to żaden mój OR. Jest to też jedyna forma, która oddaje jego sens, bo to nie żadne odchylenie wewnątrz próby, tylko odchylenie w populacji estymowane z próby. Mam nadzieję, że zgodzisz się uznać tę wersję za właściwą, a wersje "o.s. w próbie", "o.s. próby", za błędne.

Teraz następna sprawa - czy na pewno określenie "odchylenie standardowe z próby" dotyczy tylko tego jednego estymatora? Według mnie może równie dobrze dotyczyć estymatora największej wiarygodności bo on też jest liczony z próby. W en:Standard deviation mamy obydwa te estymatory pod nazwą "sample standard deviation". Proponuję zamiast tytułu "estymatory" napisać "odchylenie standardowe z próby", a zamiast "Najpopularniejszy wzór" - "pierwiastek estymatora nieobciążonego wariancji". Przynajmniej jednoznacznie oddaje naturę tego wzoru. Co Ty na to?

Dałeś mi niezłe zadanie ze wstępem. Z jednej strony powinien streszczać cały artykuł (patrz zalecenia). Czyli muszę napisać i o odchyleniu z próby i w populacji. Z drugiej strony kiedy próbowałem tak napisać, stwierdziłeś, że używam zbyt skomplikowanych stwierdzeń. Wychodzi, że powinienem zdefiniować we wstępie próbę i populację, co jest raczej trudne. No nic, zobaczymy, może jakoś z tego wybrnę.

Jeszcze ostatnia sprawa - co konkretnie razi Cię w sekcji "Różne wzory dla różnych przypadków"? Stwierdziłeś, że gdyby ją poprawić, mogłaby być. Ale co poprawić? Czy zatem widzisz tam jakieś błędy merytoryczne? (jakie?). Czy też chodzi tylko styl?

Mam nadzieję, że więcej nie będę musiał Cię już męczyć szczegółami.

Pozdrawiam, Olaf @ 19:35, 5 cze 2007 (CEST)[odpowiedz]

IMHO wstęp powinien być taki, żeby dało go się zrozumieć :-) W obecnym wstępie mam wątpliwość co do zdania "Większe odchylenie standardowe pomiaru oznacza większy błąd pomiaru" - chyba raczej "może oznaczać" - bo to dotyczy sytuacji gdy mamy populację, o której na pewno wiadomo, że nie dużego odchylenia, a nam z różnych serii pomiarów wychodzą raz większe a raz mniejsze odchylenia. No i "większe" od czego? Polimerek 23:32, 5 cze 2007 (CEST)[odpowiedz]

Ok, poddaje się. Przykro mi, ale nie potrafię napisać tego artykułu tak, żeby spełniał wszystkie te kryteria. Pozdrawiam, Olaf @ 00:13, 6 cze 2007 (CEST)[odpowiedz]

Wysiadł mi 'fan' w komputerze, więc nie mogłem wcześniej odpowiedzieć. W ciągu tych kilku dni artykuł przeszedł wiele pozytywnych zmian. Wstęp jest lepszy, zmiany układu również. Medalowy chyba wciąż nie jest, ale dałbym mu "piątkę". Szkoda, że dałeś za wygraną. Qblik ¿Ø? 18:51, 7 cze 2007 (CEST)[odpowiedz]

Nie widzę sensu na siłę doprowadzać artykułu do medalu wbrew dwóm głosom przeciw. Spróbowałem zastosować Twoje uwagi wczoraj, powinno już być lepiej. Co do uwag Polimerka, to mam kompletnie inną wizję artykułu od niego. Nie chcę dyskutować ze stwierdzeniami typu "Czytelnik artykułu encyklopedycznego nie musi wiedzieć wszystkiego o danym pojęciu i nie musi nawet umieć się nim praktycznie posługiwać(...) Jak chce się nauczyć posługiwać praktycznie danym pojęciem - to powinien zostać odesłany do odpowiedniego podręcznika(...) Od pisania podręczników jest Wikibooks". Nie mam ochoty zmieniać tego artykułu tak, żeby potencjalny czytelnik nie mógł na jego podstawie się nauczyć posługiwać odchyleniem standardowym. Jeśli art. musi być w ten sposób napisany, żeby dostać medal, nie chcę tego medalu. Olaf @ 20:14, 7 cze 2007 (CEST)[odpowiedz]

Moje pojęcie o tym czym jest (powinna być) Wikipedia zmieniło się w ostatnich kilku miesiącach. Argumentowałem w przeszłości (jak Polimerek teraz), że twój artykuł o konstrukcjach liczb jest zbyt podręcznikowy. Teraz jednak uważam, że jest wiele specjalistycznych encyklopedii, które nie muszą być bardzo zwięzłe, więc artykuł w takiej formie jak obecnie nie przeszkadzałby mi. Myślę, że coś podobnego można by znaleźć w (specjalistycznej) encyklopedii. Z drugiej strony, wstęp powinien być napisany jak do (zwykłej) encyklopedii (PWN?), dla kogoś kto nie jest zainteresowany szczegółami. Czyli trzeba by mieć prawie dwa artykuły w jednym - ogólny i specjalistyczny. Krótki, ogólny artykuł (wstęp), jak zauważyłeś jest trudny do napisania, ale jest już dużo lepiej, IMO sporo się do tego celu w ostatnich kilku dniach zbliżyłeś. Dodatkowe uwagi: dodałbym jeszcze przy dyskusji obciążenia, że wynika ono z nierówności Jensena (nawet jego/znak kierunek na tej podstawie można określić). To pasowałoby w 'specjalistycznej' encyklopedii. I ta tabelka z C4 trochę mnie kłuje w oczy: pojawia się szybko w artykule (przed spisem treści, a użyta jest dopiero w połowie), nie wiadomo zupełnie po co ona tam jest zanim się nie doczyta dalej. Myślę, że należałoby ją przenieść niżej (do sekcji "Estymator nieobciążony"?) i ewentualnie skrócić, jeżeli to konieczne. Pozdrawiam. Qblik ¿Ø? 21:04, 7 cze 2007 (CEST)[odpowiedz]

Nad tym artykułem pewnie i tak jeszcze będę pracował, choć na razie nie dla medalu - obawiam się, że Polimerka bym tu nie przekonał. Może spróbuję za jakiś czas. Swoją drogą dziwne, że przy artykule prosta nikt mi nie wytykał długości i nadmiaru specjalistycznych informacji, choć przecież też zwykłemu czytelnikowi informacje o geodezyjnych w czasoprzestrzeni niewiele powiedzą...

Tabelka c4 dlatego została umieszczona tak wysoko, żeby przy małej rozdzielczości ekranu nie nachodziła na rysunki. Można ją skrócić, ale w takim razie obecną wersję wrzuciłbym do WikiSources. Swego czasu długo szukałem tej tabeli w internecie i w końcu znalazłem ją w jakimś papierowym podręczniku, ale w internecie - nie. Aż trudno uwierzyć. Pozdrawiam, Olaf @ 23:51, 7 cze 2007 (CEST)[odpowiedz]

Dowodzenie obciążenia

Tabelkę c4 przerzuciłem. Co do nierówności Jensena użytej do dowodu obciążenia, to już raz chciałem udowodnić to za pomocą nierówności Cauchy'ego dla średnich (wynikającej z Jensena), a potem zauważyłem że popełniam błąd.

Dowód, że jeśli $s^{2}$ jest estymatorem nieobciążonym wariancji, to $s$ nie może być w ogólnym przypadku estymatorem nieobciążonym odchylenia standardowego.
$s^{2}$ jest estymatorem nieobciążonym, więc gdyby obliczyć wyniki M-krotnie, uzyskując wartości $s_{1}^{1},s_{2}^{2},\dots ,s_{M}^{2}$ , to:

$E\left({\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}\right)=\sigma ^{2}$

czyli:

$\lim _{M\to \infty }{\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}=\sigma ^{2}$

pierwiastkując:

$\lim _{M\to \infty }{\sqrt {\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}}=\sigma$

Pod znakiem granicy jest średnia kwadratowa. Z twierdzenia Cauchy'ego o średnich wiadomo, że średnia kwadratowa jest zawsze większa lub równa arytmetycznej, czyli:

${\sqrt {\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}}\geq {\frac {\sum _{k=1}^{M}s_{k}}{M}}$

Jednak równość może zachodzić tylko, gdyby wszystkie wartości $s_{1},s_{2},\dots ,s_{M}$ były równe, co może mieć w ogólnym przypadku miejsce tylko dla zdegenerowanego rozkładu o zerowym odchyleniu, lub próbie obejmującej całą populację. W każdym innym przypadku:

${\sqrt {\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}}>{\frac {\sum _{k=1}^{M}s_{k}}{M}}$

Stąd:

$\sigma =\lim _{M\to \infty }{\sqrt {\frac {\sum _{k=1}^{M}s_{k}^{2}}{M}}}>\lim _{M\to \infty }{\frac {\sum _{k=1}^{M}s_{k}}{M}}=E(s)$

$\sigma >E(s)\$

Czyli wzór (3) zaniża wartość odchylenia standardowego.

Problem w tym, że o ile kierunek obciążenia da się w ten sposób wyznaczyć, to chyba nie można w ten sposób udowodnić obciążenia. Dowód jest błędny, gdyż z tego, że $a_{i}>b_{i}$ dla każdego $i$ nie wynika $\lim _{i\to \infty }a_{i}>\lim _{i\to \infty }b_{i}$ . Nadal może być równość granic, przy której obciążenia nie ma.

Jeśli jednak znasz jakąś metodę udowodnienia obciążenia za pomocą nierówności Jensena lub Cauchy'ego, dodaj proszę. Olaf @ 02:49, 8 cze 2007 (CEST)[odpowiedz]

Ze zgłoś błąd

Powiem coś mało popularnego, ale moim zdaniem błędem jest pisanie o odchyleniu standardowym zmiennej losowej, bo tak naprawdę to mamy w nim do czynienia z rodziną zmiennych losowych czy najwyżej zmiennych losowych innych zmiennych losowych. Chodzi o to, że wszystkim się myli znaczenie odchylenia st. Jeżeli mamy mówić o odchyleniu absolutnym czy przeciętnym, to jasne, że mamy zmienną losową i jej realizacje. Niestety w przypadku odch. st. jest bardziej skomplikowana sprawa. Przede wszystkim powinniśmy zadać sobie pytanie skąd się ono bierze. Dlaczego ma zastępować odchylenie absolutne (bez wchodzenia w pośrednie tłumaczenia)? Otóż chyba chodzi właśnie o to, że odch st mówi o rodzinie zmiennych losowych. Najlepiej to wyjaśnić na przykładzie. W danych T okresach mamy pewną zm X jakiejś cechy. Zmienna ta dzieli się na wiele zmiennych w każdym t-tym okresie. W każdym t-tym okresie jest nowa NIEZALEŻNA zmienna Xt. Dostajemy więc próbę (a nie próbkę) losową. Ponieważ my chcemy obliczyć najpierw średnią, bierzemy średnią z realizacji zmiennych Xt. Zmienne są niezależne, więc dodajemy najpierw wektory: [x(1),000...0]+[0,x(2),00...0]+...[00...x(T)]. Za wektory podstawiamy realizacje. Widzimy, że ze względu na ortogonalność dostajemy bazę przestrzeni wektorowej. Skoro dostajemy wektor [x1,x2...xT], to mimo, że jest to konkretny punkt w przestrzeni, obliczymy średnią z realizacji, czyli po prostu średnią ze zmiennej X. Teraz widać, dlaczego nie możemy zastosować odch. absol. Nasze faktyczne wartości xt są wektorami w T-wymiarowej przestrzeni (a nie w 1-wymiarowej-osi). Aby obliczyć odległość od średniej stosujemy wzór na odległość. Dostajemy kwadraty odległości i dzielimy na T. Uzyskujemy wariancję, pierwiastkujemy i mamy odch. st.

Jeśli każda Xt ma ten sam rozkład, skończoną wariancję i wartość oczekiwaną wtedy, musimy mieć rozkład Gaussa zmiennej X. Pytanie tylko, co może sprawiać, że rozkłady są inne? Skoro mamy pełną niezależność, przestrzeń jest jednorodna, nie ma innych warunków, wtedy dostajemy Gaussa. Zatem w przeciwieństwie do tego co napisano w art. zmienne raczej powinny mieć rozkład Gaussa, jeśli mają się wzorowo zachowywać. Jeśli natomiast zmienne Xt będą zależne od siebie, wzór na wariancję musi być uogólniony na twierdzenie cosinusów, gdyż kosinus kąta skorelowanych zmiennych jest równy współczynnikowi korelacji Pearsona.

Zgłosił: pj 85.89.191.133 (dyskusja) 21:57, 11 sty 2009 (CE

O ile dobrze zrozumiałem, pomieszałeś zmienne losowe z szeregami czasowymi. W szeregach czasowych każdy punkt t jest osobną zmienną losową a ty je traktujesz jak jedną zmienną, bo liczysz z nich odchylenie. Liczenie odchylenia dla szeregu traktowanego jak jedna zmienna faktycznie tworzyłoby pewne problemy, bo kolejne obserwacje mogą być skorelowane ze sobą. Ale artykuł czegoś takiego nie omawia. Olaf @ 10:19, 31 sty 2009 (CET)[odpowiedz]

Zal

Że sie komus chciało pisać...

ze Zgłoś błąd

W przypisie w punkcie 8 jest fragment zaczynający się od: "Drugi składnik", który jest niezrozumiały. W jaki sposób E((u-xi)(u-x'))=E((u-x')^2) ??? Proszę o wyjaśnienie

Zgłosił: pj 85.89.191.133 (dyskusja) 19:06, 4 sty 2010 (CET)

Rozpisane. Olaf @ 23:08, 26 maj 2015 (CEST)[odpowiedz]

Ze zgłoś błąd

W dowodzie z przypisu 8 pominięto trochę za dużo. Dowodzone twierdzenie jest prawdziwe, ale moje wątpliwości budzi krok $-E\left((\mu -x_{i})(\mu -{\overline {x}})\right)=-E\left((\mu -{\overline {x}})^{2}\right)$

Rozpisane. Olaf @ 23:08, 26 maj 2015 (CEST)[odpowiedz]

Powszechny błąd dot. przedziału ufności

Chodzi o zdanie: "można z prawdopodobieństwem 95% przyjąć, że wartość z populacji zawiera się w 95-procentowym przedziale ufności". Nie jest to prawdą. Parametr populacji to stała, nie dotyczy jej żadne "prawdopodobieństwo". Albo gdzieś się znajduje, albo nie. To przedział ufności jest zmienną losową. Poprawnie winno być: "z prawdopodobieństwem 95% przedział ufności pokrywa rzeczywistą wartość parametru populacji."

To dokładnie to samo, powiedziane na dwa sposoby. Z punktu widzenia logiki nie ma różnicy między "przedział pokrywa wartość" a "wartość zawiera się w przedziale". W szczególności żadne z tych sformułowań nie determinuje, co jest stałą, a co zmienną losową. A prawdopodobieństwo w tym przypadku dotyczy zdarzenia losowego wiążącego przedział ufności z parametrem populacji a nie któregokolowiek z nich oddzielnie. Markotek (dyskusja) 12:04, 25 sie 2013 (CEST)[odpowiedz]

ResponseEve, a responsive template by SiGa

inny wzór

Wikipedia:Propozycje do Artykułów na medal/Odchylenie standardowe

Dowodzenie obciążenia

Ze zgłoś błąd

Zal

ze Zgłoś błąd

Ze zgłoś błąd

Powszechny błąd dot. przedziału ufności

Witaj

Źródło

Odsyłacze

Podziel się