Ausreißer

Ein Ausreißer ist ein einzelner Messwert oder Datenpunkt, der deutlich außerhalb des Bereichs liegt, in dem der Großteil der übrigen Beobachtungen liegt. Ausreißer können entstehen, weil bei der Datenerhebung oder -verarbeitung ein Fehler passiert ist (zum Beispiel Tippfehler, Messfehler, falsche Kodierung), sie können aber auch echte, seltene Fälle abbilden (zum Beispiel ungewöhnlich hohe Umsätze oder extreme Antwortmuster). Für Analysen sind Ausreißer relevant, weil sie Kennwerte und Modelle spürbar beeinflussen können – besonders Mittelwerte, Varianz/Standardabweichung und Regressionsschätzungen. In der Praxis werden Ausreißer daher häufig geprüft, zum Beispiel durch Visualisierungen (Boxplot, Streudiagramm), robuste Kennwerte (Median, IQR) oder formale Regeln und Tests. Ob ein Ausreißer entfernt, korrigiert oder bewusst im Datensatz belassen wird, hängt vom Kontext ab und sollte nachvollziehbar dokumentiert werden.