Kodierung und Editierung im Prozess der Marktforschung

Die letzte Phase des Marktforschungsprozesses besteht aus der Editierung und Kodierung der gewonnenen Daten.

Im Folgenden wollen wir uns näher anschauen, worum es sich dabei handelt.

Die Editierung

Zunächst muss man sicherstellen, dass die aus der Befragung gewonnenen Daten vorhanden, fehlerfrei und lesbar sind, dies geschieht im Rahmen der Editierung.

Eine wichtige Frage ist die, ob und wie nicht eindeutige oder gar unlesbare Antworten genutzt werden können. Hierbei bieten sich zwei Optionen an: diese Daten werden von der Analyse ausgeschlossen oder die Daten werden nur teilweise genutzt.

Zunächst untersucht man einen Fragebogen also auf dessen Auswertbarkeit hin:

  • Ist der Fragebogen vollständig?
  • Sind die Fragen richtig beantwortet worden?
  • Erkennt man Widersprüche im Antwortverhalten?
  • Wurde der Fragebogen seitens des Interviewers verfälscht?

Ist ein Fragebogen nicht vollständig ausgefüllt worden (was häufig ein Problem darstellt), muss man zunächst die Ursache, die zu dem Fehlen von Daten geführt hat, untersuchen.

Diesen Ausfallmechanismus kann man grundsätzlich in zwei Typen unterscheiden:

  • nicht-ignorierbare Ausfallmechanismen
  • ignorierbare Ausfallmechanismen

Nicht-ignorierbar ist der Ausfallmechanismus beispielsweise dann, wenn es vom Wert der Variablen selbst abhängt, warum die Frage nicht beantwortet wurde. Die Frage nach dem Einkommen des Befragten ist hierbei ein klassisches Beispiel. Gerade in Deutschland wird eine solche Angabe des Einkommens häufig ausgelassen.

Ein ignorierbarer Ausfallmechanismus ist hingegen beispielsweise der, dass die Daten völlig zufällig fehlen. Möglicherweise hat der Befragte eine Frage dabei ganz einfach übersehen. Andererseits kann das Fehlen der Daten auch vom Wert einer anderen Variablen abhängen, nicht vom Wert der Variablen selbst.

Fehlen Werte aufgrund von nicht-ignorierbaren Ausfallmechanismen, sind die fehlenden Informationen nur schwer zu ersetzen.

Mit drei Verfahren kann man Fragebögen mit ignorierbaren Ausfallmechanismen jedoch dennoch nutzen:

  • Verfahren der Elimination
    • fehlende Variablen nicht berücksichtigen
  • Verfahren der Imputation
    • fehlende Werte durch eine möglichst gute Schätzung ersetzen
  • Verfahren der simultanen Parameterschätzung
    • das Fehlen der Werte bei der Parameterschätzung mitberücksichtigen

In der Praxis ist das Verfahren der simultanen Parameterschätzung zwar durchaus überlegen, jedoch ist es leider auch sehr komplex, weshalb in diesem Artikel auch nicht weiter darauf eingegangen wird.


Zunächst untersucht man einen Fragebogen auf dessen Auswertbarkeit hin. (Bild: © VRD – fotolia.com)

Das Verfahren der Eliminierung bietet sich bei einigen fehlerhaften Fragebögen an: Die Fragebögen, die nicht richtig und vollständig ausgefüllt wurden, werden dabei einfach nicht berücksichtigt.

Auch das Verfahren der Imputation wird gern genutzt. Der fehlende Wert wird hierbei einfach durch den Mittelwert ersetzt.

Kodierung

Gewonnene Daten müssen anschliessend noch in einer geeigneten Weise aufbereitet werden, um sie leichter auswerten zu können. Dabei wird der Prozess der Kategorisierung von Rohdaten mit Kodierung beschrieben. Gewonnene Rohdaten werden in Antwortkategorien eingeteilt und gegebenenfalls in Zahlen umgewandelt.

Eine quantitative Erhebung, die häufig bei geschlossenen Fragen angewendet wird, kategorisiert die Daten bereits vor der Befragung. Bei der anschliessenden Kodierung geht es dann nur noch darum, entsprechende Zahlenwerte den möglichen Antworten zuzuweisen. Es bietet sich häufig an, einen hohen Zahlenwert zu einer hohen Antwortoption (z.B. hohe Zustimmung) zuzuordnen.

Bei qualitativen Erhebungen, die besonders bei offenen Fragen oder Tiefeninterviews vorliegen, ist ein Kodieren der Daten deutlich komplexer. Die Kodierung kann nicht automatisch erfolgen, eine Interpretation durch die kodierende Person ist erforderlich.

Zunächst werden hier die Daten auf wiederholende Regelmässigkeiten hin geprüft. Solche Regelmässigkeiten bilden dann die Basis für ein erstes Kategoriensystem. Nun ordnet man einzelne Antworten den verschiedenen Kategorien zu.

Folgendes sollte man dabei besonders beachten:

  • interne Homogenität
    • Daten innerhalb der Kategorie ähneln sich dabei möglichst stark
  • externe Heterogenität
    • Kategorien unterscheiden sich deutlich voneinander


Ein Kategoriensystem aufzustellen, ist sehr aufwendig. Der Kodierer muss schliesslich folgende Kriterien für die Kategorisierung beachten:

  • Die Kategorien sollten gleichzeitig alle wichtigen Facetten des untersuchten Problems abdecken und in sich konsistent sein.
  • Alle vorhandenen Daten sollte man in das Kategoriensystem einordnen können.
  • Das Kategoriensystem sollte reproduzierbar sein, sobald ein zweiter, unabhängiger Analyst dieselben Daten kategorisiert.

 

Originalartikel  erschienen auf my-business-blog.de.
Oberstes Bild: © SSilver – shutterstock.com

Publireportagen

Empfehlungen

jQuery(document).ready(function(){if(jQuery.fn.gslider) {jQuery('.g-22').gslider({groupid:22,speed:10000,repeat_impressions:'Y'});}});