[Frage] Statistik/Mathe: Standardfehler vs. Standardabweichung

t_matze

Senior Member
Statistik/Mathe: Standardfehler vs. Standardabweichung

Hallo an alle Mathe-/Statistikexperten und Naturwissenschaftler!

Ich hätte da gerne mal eine Frage zum SEM (standard error of the mean), zu der ich noch keine abschließende Antwort gefunden habe. Ich bin zwar auf einen passenden Thread im Medi-Learn-Forum gestoßen (und habe dort gestern diese Frage auch bereits gestellt), aber dort kam noch nichts. Da dachte ich, hier gibt es ja auch eine ganze Menge heller Köpfe (und sogar einen echten Mathelehrer), frag' ich doch mal Euch... ;)

Ist SEM (standard error of the mean) wirklich mit "Standardfehler" zu übersetzen? Wo bleibt dann das "des Mittelwerts", das ich darin noch sehe?

Wenn ich die Excel-Hilfe zu "Standardfehler" befrage, dann bekomme ich folgende Erklärung:
STFEHLERYX

Liefert den Standardfehler der geschätzten y-Werte für alle x-Werte der Regression. Der Standardfehler ist ein Maß dafür, wie groß der Fehler bei der Prognose (Vorhersage) des zu einem x-Wert gehörenden y-Wertes ist.

Syntax

STFEHLERYX(Y_Werte;X_Werte)

Y_Werte ist eine Matrix oder ein Bereich von abhängigen Datenpunkten.

X_Werte ist eine Matrix oder ein Bereich von unabhängigen Datenpunkten.

Anmerkung

Als Argumente sollten entweder Zahlen oder Namen, Matrizen oder Bezüge angegeben werden, die Zahlen enthalten.

Enthält ein als Matrix oder Bezug angegebenes Argument Text, Wahrheitswerte oder leere Zellen, werden diese Werte ignoriert. Zellen, die den Wert 0 enthalten, werden dagegen berücksichtigt.

Enthalten Y_Werte und X_Werte keine oder unterschiedlich viele Datenpunkte, liefert STFEHLERYX den Fehlerwert #NV.

Die Gleichung zur Berechnung des Standardfehlers eines prognostizierten y-Wertes lautet:
[siehe Screenshot1]
Das scheint es aber wohl eher nicht zu sein, wenn ich das richtig interpretiere. Lästig, dass es dann so ähnlich heißt.

Ich habe auch mal weitergesucht und bin über die Mittelabweichung gestolpert. Könnte es vielleicht auch diese Formel sein? Die Hilfe dazu fand ich etwas kryptisch:
MITTELABW
Siehe auch

Liefert die durchschnittliche absolute Abweichung einer Reihe von Merkmalsausprägungen und ihrem Mittelwert. MITTELABW ist ein Maß für die Streuung innerhalb einer Datengruppe.

Syntax

MITTELABW(Zahl1;Zahl2; ...)

Zahl1, Zahl2, ... sind 1 bis 30 Argumente, deren durchschnittliche absolute Abweichung Sie berechnen möchten. Anstelle der durch Semikolons voneinander getrennten Argumente können Sie eine Matrix oder einen Bezug angeben, der auf eine Matrix verweist.

Anmerkung

Als Argumente müssen entweder nur Zahlen bzw. Namen, Matrizen oder Bezüge sein, die Zahlen enthalten.

Enthält ein als Matrix oder Bezug angegebenes Argument Text, Wahrheitswerte oder leere Zellen, werden diese Werte ignoriert. Zellen, die den Wert 0 enthalten, werden dagegen berücksichtigt.

Die Gleichung für die durchschnittliche Abweichung lautet:
[siehe Screenshot2]

MITTELABW wird von der Maßeinheit der eingegebenen Daten beeinflusst.

In der Hilfe für Sigma Stat erscheint mir der beste Treffer für "standard error of the mean" folgendes zu sein:
The stderr function returns the standard error of the mean of the specified range, as defined by
[siehe Screenshot3]
where s is the standard deviation.

Syntax stderr(range)

The range argument must be a single range (indicated with the { } brackets) or a worksheet column. Any missing value or text string contained within a range is ignored.

Example For the range x = {1,2}, the operation stderr(x) returns a value of 0.5.

Related Functions: stddev

Und schließlich fand ich auf der zweiten Seite eines Artikels von Prof. Liebmann der Uni Graz noch eine - diesmal relativ verständliche Erklärung (die sich bei näherer Betrachtung mit der Definition in der SigmaStat-Hilfe deckt):
...
Der Standardfehler (=Standard Error of the Mean=SEM) errechnet sich aus der Standardabweichung geteilt durch die Quadratwurzel der Fallzahl (n) der Stichprobe.
...

Wie bekomme ich jetzt Excel dazu überredet, mir statt des bisher verwendeten STABW() einen SEM zu errechnen?

Muß ich da wirklich
Code:
=(STABW(R165:R178)/WURZEL(ANZAHL(R165:R178)))
eingeben, oder gibt es bereits eine Funktion dafür?

Vielen Dank für jede Hilfe.

PS: Ein sehr anschaulicher Artikel über Variabilitätsmaße ist bei Thieme (auch als PDF) erhältlich.

Ein Absatz darin hat mich jedoch wieder daran zweifeln lassen, ob ich SEM wirklich verwenden möchte:

Problematischer ist es allerdings, anstelle der Standardabweichung den Standardfehler des Mittelwertes (»standard error of the mean«, SEM) zu verwenden. Der SEM beschreibt die Variabilität von Mittelwerten aus Stichproben mit dem gleichen Stichprobenumfang (n) und ist ein Maß für die Präzision der Schätzung des Erwartungswertes durch den Mittelwert (4). Er berechnet sich aus der Standardabweichung nach Division durch die Wurzel aus n. Somit ist der SEM immer kleiner als die Standardabweichung, was vermutlich zu seiner »Beliebtheit« beiträgt. Er hat eine große Bedeutung bei der schließenden Statistik, lässt aber für die Beschreibung von Daten aus einer Stichprobe – im Gegensatz zu den Quantilen oder der Standardabweichung – keine unmittelbare Interpretation zu.

Ich habe in meiner Arbeit praktisch nie den gleichen Stichprobenumfang, so dass sich SEM wohl eher nicht anwenden läßt, wenn man korrekt arbeiten möchte, oder verstehe ich das falsch?
 

Anhänge

  • Stfehlerxy.png
    Stfehlerxy.png
    1,4 KB · Aufrufe: 662
  • Mittelabw.png
    Mittelabw.png
    335 Bytes · Aufrufe: 24.680
  • sderr.png
    sderr.png
    256 Bytes · Aufrufe: 24.670
Deinen beschriebenen Standardfehler hätte ich jetzt Varianz genannt, da er auf die Prognose abzielt.
Schau mal bei Wiki rein, ich habe bloss überflogen (um diese Uhrzeit...)

Gruss
Tim
 
Hallo, @t_matze, zunächst mal eine Vorbemerkung:
Das letzte Mal, das ich mit Varianz und Standardabweichung zu tun hatte, liegt ca. 33! Jahre zurück, das war bei der Messwertanalyse im Praktikum 'Physik für Naturwissenschaftler'. ;)
Ansonsten hatte ich seither nix mehr damit zu tun, Statistik und Stochastik sind nämlich nicht im Realschullehrplan in BY drin.

Also Vorsicht, ich poste nur meine (vagen) Vorstellungen jetzt:
Die Standardabweichung ist als Quadratwurzel der Varianz ein direktes (standardisiertes!) Maß für die Größe der Abweichung einzelner Werte vom Mittelwert einer beliebigen Anzahl diskreter (oder auch stetiger) Mess- oder Zahlenwerte. Dieser Wert hängt dann sehr wohl von der Anzahl der Einzelwerte oder Individuen einer Stichprobe ab.

Für eine objektive Streuungsabschätzung der einzelnen Stichprobenmittelwerte mehrerer Stichproben vom Gesamtpopulationsmittelwert über den Standardfehler SEM ist es unerlässlich, dass sowohl die Populationsgröße, die Individuen der Population und der Stichprobenumfang (= Anzahl der Einzelindividuen in der Stichprobe) immer dieselben bleiben, nur so ist die Normierung über den SEM aussagekräftig, IMHO.

Da bei Dir aber die Populationsgröße wie auch der Stichprobenumfang variieren, weiß ich jetzt selber nicht weiter. :(

Das Ganze ist auch etwas schwer durchschaubar, weil der SEM sozusagen auf die Metaebene aller ermittelten Standardabweichungen führt (... Mittelwert der Mittelwerte ...), so dass ich jetzt selber schon den Knoten der Selbstreferenz im Hirn habe und für meine vagen Aussagen daher keinerlei Gewähr übernehmen kann, das war einfach schon zu lange her für mich und einen SEM brauchten wir nicht damals.

Damals gab's z.B. auch noch keine Futures, die aus nicht vorhandenem Geld zukünftiges, noch weniger vorhandenes Geld geschaffen haben. Bald ersaufen wir alle noch im Strudel der Selbstreflexivität ... :smokin

gruß schrotti :) :)
 
Vieleicht helfen dir die beiden Dokumente bei deiner Frage weiter,ich hab sie nur überflogen ;)

sind aus meinen Physikuntericht,müßten aber dein Thema treffen :)
 

Anhänge

  • fehlerformeln.pdf
    33 KB · Aufrufe: 4.476
  • Fehlerrechnung.pdf
    285,6 KB · Aufrufe: 6.338
Danke sehr für Eure Antworten! (Wo ich doch eine so vielschichtig verworrene Frage gestellt hatte... ;))

@Tim: Die Varianz ist es nicht, aber Dein Hinweis auf die Wikipedia hat mich zu folgendem guten Artikel geführt:
http://de.wikipedia.org/wiki/Standardfehler

@schrotti:
Deine Einschätzung zu den notwendigen Voraussetzungen für den Einsatz der SEM decken sich mit dem, was ich bisher gelesen habe. Von daher werde ich meinen Doktorvater nochmal drauf ansprechen, ob er gesteigerten Wert auf den SEM legt, oder ob ich nicht doch der Korrektheit wegen die größeren Fehlerbalken der Standardabweichung akzeptieren soll. Das erscheint mir irgendwie aufrichtiger.

@Freakazoid.one:
Das erste Dokument ist zu technisch ausgerichtet, aber im zweiten findet sich einiges an hilfreichen Erklärungen. Ich habe es mir mal abgespeichert, vielen Dank.


Noch eine kleine Rückmeldung:

Wie ich inzwischen weiß, bilden weder die Excel-Formel STFEHLERYX() noch MITTELABW() den SEM ab. Welche Funktion sie genau erfüllen, ist mir zwar nicht klar geworden, aber auch nicht wichtig.

Um aus der Standardabweichung einen SEM zu generieren, funktioniert in Excel tatsächlich folgender Code:

Code:
=STABW(D147:D160)/WURZEL(ANZAHL(D147:D160))

Oder, wenn Ihr das auch erst dann berechnen lassen wollt, wenn mindestens zwei Werte zur Verfügung stehen, dann sieht die Formel so aus:

Code:
=WENN(ANZAHL(D147:D160)<2;"";(STABW(D147:D160))/(WURZEL(ANZAHL(D147:D160))))
 
Das Thema ist sowieso ätzend.
Man kann Fehlerrechnung auf einem Niveau betreiben wo keiner mehr durchblickt..oder fast jeder :D
In Physik (Grundstudium) hatten wir das ´extrem´ mit partiellen Ableitungen (lustiges d, hatte ich vorher noch nicht mit zu tun gehabt) und später im Hauptfach Übertragungstechnik bei Stochastik war es eher einfacher (trotz Funktion SIX, die ich auch nicht kannte) ...aber letztendlich alles nur für Perverse :D


Gruss
Tim
 
t_matze schrieb:
Oder, wenn Ihr das auch erst dann berechnen lassen wollt, wenn mindestens zwei Werte zur Verfügung stehen, dann sieht die Formel so aus:
Nur weil man eine Formel erst bei einer bestimmten Anzahl verwenden kann, ist das aber nicht gleich Sinnvoll.

In der Physik wird der "Standardfehler" oder statistische Fehler des Mittelwertes eigentlich immer im Zuge der Fehlerrechnung von Gauß verwendet, solange der statistische Fehler überwiegt.
Dadurch wird der Vertrauensbereich bestimmt und je nach Vorfaktor gibt es eine Wahrscheinlichkeit von 68%, 95% oder 99,7%, dass sich der wahre Wert in diesem Intervall befindet.

Leider wird dieses Verfahren immer einem so vorgeschmissen, obwohl es dort bestimmt jede Menge Bedingungen gibt, wann und wie es einzusetzen ist.

Jedenfalls ist es sehr "gesund" von dir dort mal weiter Oben nachzufragen!
 
Quetzalcoatl schrieb:
Nur weil man eine Formel erst bei einer bestimmten Anzahl verwenden kann, ist das aber nicht gleich Sinnvoll.
Stimmt. Es ging mir auch eher um die Übersicht in den Tabellen. Solange im Bereich für die Daten nichts drin steht, will ich unten auch nichts sehen - auch kein #DIV/0!. Daher habe ich mir angewöhnt, fast alle Berechnungen mit dieser wenn()-Funktion zu umschließen, dann bleibt alles hübsch leer, solange noch nichts zu berechnen ist. Die Überlegung, wann welche Berechnungsart angebracht ist, kann ich Excel allerdings nicht übertragen... ;)

Das Ergebnis meiner Nachfrage war:
"Verwende SEM für die Abbildungen im Vortrag, da sind die Fehlerbalken kleiner. Und für unsere Aussage ändert sich durch die Größe der Fehlerbalken nichts. Für eine schriftliche Veröffentlichung oder die Dissertation muß aber die Standardabweichung angegeben werden."

Also, vielen Dank für Eure Hilfe. Ich habe nebenher die Erfahrung gemacht, dass sich ein komplizierter Sachverhalt deutlich leicher verstehen läßt, wenn man versucht, ihn auszuformulieren. Also habe ich allein durch das Stellen der Frage schon einen großen Schritt in Richtung Lösung getan. Mit Euren Hinweisen war es dann endgültig geschafft. (y)
 
ot:
t_matze schrieb:
Es ging mir auch eher um die Übersicht in den Tabellen.
Du kannst dafür auch die ISTFEHLER() Funktion verwenden.

ZB. =WENN(ISTFEHLER(A1/A2);"";A1/A2) statt nur A1/A2. Geht soweit ich weiß für alle Fehler.
 
Oben