Bayesianische Datenanalyse

Frage 03, beantwortet. Wie stark sprechen die Daten für eine bestimmte Hypothese? Bayesianische Methoden geben dir genau diese Antwort, als Wahrscheinlichkeit, nicht als binäres Urteil.

Die Grundidee in einem Satz

Aktualisiere deine Überzeugung über eine Hypothese, indem du Vorwissen und Daten kombinierst, und beschreibe das Ergebnis als Wahrscheinlichkeitsverteilung.

Mathematisch:

$$ P(H \mid D) \;=\; \frac{P(D \mid H) \cdot P(H)}{P(D)} $$

In Worten: Posterior = (Likelihood × Prior) / Evidenz.

Drei Bausteine

BAUSTEIN 01

Prior

Was glaubst du über die Hypothese, bevor du die Daten siehst? Kann von "uninformativ" bis "stark theoriegestützt" reichen.

BAUSTEIN 02

Likelihood

Wie wahrscheinlich sind deine Daten unter verschiedenen möglichen Werten der Hypothese? Genau das, was auch klassische Inferenz nutzt.

BAUSTEIN 03

Posterior

Deine aktualisierte Überzeugung, die Verteilung, die du für Schlüsse, Punktschätzer und Intervalle verwendest.

Was du daraus bekommst

1. Punktschätzer mit echtem Intervall

Statt eines Konfidenzintervalls (das viele falsch interpretieren) erhältst du ein Glaubwürdigkeitsintervall (Credible Interval, HDI), und es bedeutet genau das, was die Intuition vermutet: „Mit 95 % Wahrscheinlichkeit liegt der wahre Wert im Intervall."

2. Bayes-Faktor

Das Verhältnis der Wahrscheinlichkeit deiner Daten unter zwei Hypothesen:

$$ \text{BF}_{10} \;=\; \frac{P(D \mid H_1)}{P(D \mid H_0)} $$

BF₁₀	Lesart (Lee & Wagenmakers, 2013)
1 – 3	Anekdotische Evidenz für H₁
3 – 10	Moderate Evidenz
10 – 30	Starke Evidenz
30 – 100	Sehr starke Evidenz
> 100	Extreme Evidenz

Symmetrisch funktionieren die gleichen Stufen für BF₀₁, also Evidenz für die Nullhypothese. Genau das ist eine Stärke, die der Signifikanztest nicht hat.

3. Posterior-Wahrscheinlichkeiten

Direkte Aussagen wie „Mit 87 % Wahrscheinlichkeit ist der Effekt mindestens d = 0.3.", formuliert in genau der Sprache, die Forschende, Anwendende und Öffentlichkeit verstehen.

Ein typischer Workflow

Schritt 01

Modell spezifizieren

Likelihood, Parameter, Priors. Das Modell muss zur Frage passen, nicht zur Software.

Schritt 02

Prior-Predictive Check

Generiere Daten aus dem Prior. Sieht das plausibel aus? Falls nein: Prior schärfen oder Modell überdenken.

Schritt 03

Inferenz durchführen

MCMC (Stan/PyMC), Variational Inference oder analytisch, je nach Modell.

Schritt 04

Diagnostik

Konvergenz prüfen (R̂, ESS, Trace-Plots). Ohne saubere Diagnostik ist Posterior wertlos.

Schritt 05

Posterior-Predictive Check

Repliziert das Modell die Daten? Wo nicht? Modellkritik gehört zum bayesianischen Workflow.

Schritt 06

Schlüsse formulieren

Effekt, Glaubwürdigkeitsintervall, ggf. Bayes-Faktor, und alles als Wahrscheinlichkeitsaussage.

Software: mit was anfangen?

Einsteigende: JASP / JamoviFortgeschritten: R / brmsPower-User: Stan / PyMC

Beide Programme bieten klickbare Bayes-Tests (t-Test, ANOVA, Korrelation, Regression) mit sinnvollen Default-Priors. Ideal für die Lehre, für erste eigene Analysen und für Forschende, die keine Programmiersprache lernen möchten.

JASP herunterladen Jamovi herunterladen

Für komplexere Modelle (hierarchisch, multivariat, nicht-linear) ist brms (auf Stan-Basis) der Goldstandard im R-Universum.

library(brms)
fit <- brm(y ~ x + (1 | id), data = dat, family = gaussian())
summary(fit)

brms-Dokumentation öffnen

Stan und PyMC geben dir vollständige Modellspezifikation. Maximale Flexibilität, aber höhere Einstiegshürde.

Stan PyMC

Häufige Sorgen: kurz beantwortet

„Aber Priors sind doch subjektiv!"

Jede statistische Analyse trifft Annahmen, Priors machen sie nur explizit. Sensitivitätsanalysen zeigen, wie stark die Schlüsse vom Prior abhängen. Bei genug Daten dominiert die Likelihood ohnehin.

„Brauche ich einen Supercomputer?"

Nein. Standardmodelle laufen in Sekunden bis Minuten auf einem normalen Notebook. Auch komplexere Modelle sind heute alltagstauglich, die Hardware ist selten der Engpass.

„Was sage ich Begutachtenden, die mit Bayes nicht vertraut sind?"

Berichte Effektgröße und HDI immer in der intuitiven Sprache, biete den Bayes-Faktor zusätzlich an und verweise auf das ASA-Statement sowie das Editorial von Basic and Applied Social Psychology. Die Literaturseite liefert die Referenzen.

„Kann ich beides berichten, Bayes und p-Wert?"

Ja, in vielen Journals ist das aktuell der pragmatische Weg. Wenn beide Ergebnisse einander widersprechen, liegt das meist daran, dass der p-Wert die Frage falsch beantwortet, nicht der Bayes-Faktor.