T. 0355 869 500 74 - E. kontakt@leetinnovation.de

Exzellent dokumentiert

Ihre Kunden sind anspruchsvoll und haben individuelle Fragestellungen. Wir bieten Ihnen die Software zur fundierten Untersuchung und Beantwortung dieser Fragestellungen – ohne methodische Tiefenkenntnisse.

Konzeption einer Conjointstudie

Ein Attribut beschreibt ein Merkmal oder eine Eigenschaft eines Produkts. Zu den Attributen zählen z.B. Marke, Preis oder Farbe eines Produkts.
Eine Ausprägung beschreibt ein Attribut näher. Die Ausprägungen des Attributs Preis können z.B. 2,99 EUR, 3,99 EUR oder 4,99 EUR sein.
Untersuchungen haben gezeigt, dass problemlos 20 CBC-Fragen (exklusive Demografika) angefragt werden können, ohne dass die Datenqualität abnimmt. Wir empfehlen Ihnen 15-20 CBC-Fragen pro Umfrageteilnehmer zu stellen. Ab 25 Conjoint-Fragen können beim Umfrageteilnehmer Ermüdungseffekte in Form von verminderter Konzentration auftreten, was eine Verringerung der Datenqualität zur Folge haben kann.
Wir empfehlen Ihnen 3-4 Produkte oder Dienstleistungsangebote pro Conjoint-Frage zu vergleichen. Umso mehr mögliche Kombinationen abgefragt werden, desto höher ist der Informationsgehalt. Dennoch sollte Sie Ihre Umfrageteilnehmer nicht überfordern und maximal 4-5 Produkte gleichzeitig vergleichen lassen.
Die Nicht-Wahl-Option ist ein wichtiger Bestandteil einer Choice-based Conjointanalyse. Die Umfrageteilnehmer werden in eine realistischere Einkaufssituation versetzt, da sie sich gegen die zu vergleichenden Produkte entscheidenden können, sobald ihnen keines davon zusagt. Wenn Sie jedoch möchten, dass sich Ihre Umfrageteilnehmer zwischen den aufgeführten Alternativen entscheiden müssen, so lassen Sie die Nicht-Wahl-Option nicht zu.
Balanced Overlap

Dies ist die Standardmethode zur Erzeugung von Umfragen. Mit dieser Methode werden sowohl die Haupteffekte eines Produkts (z.B. der Preis) als auch die Interaktionseffekte eines Produkts (z.B. zwischen Marke und Preis) berücksichtigt. Innerhalb einer Frage können die Ausprägungen einer Eigenschaften doppelt vorkommen („Overlap“). Um die Messung der Haupteffekte nicht zu sehr zu beeinträchtigen, wird darauf geachtet, dass sich nicht zu viele Ausprägungen einer Eigenschaft überlappen („balanced“). Wir empfehlen Ihnen die Nutzung dieser Methode.

Complete Enumeration

Mithilfe dieser Methode können die Haupteffekte eines Produkts (z.B. Marke, Preis, Design etc.) zuverlässig bestimmt werden. Innerhalb der Fragen finden sich keinen Überlappungen zwischen den Ausprägungen der Eigenschaften. Das heißt, es kommen keine doppelten Ausprägungen innerhalb einer Frage vor. Es wird darauf geachtet, dass die Produkte innerhalb einer Frage so verschieden voneinander sind wie möglich. Eine sehr gute Methode, wenn Sie keine Interaktionseffekte zwischen den Eigenschaften Ihres Produkts berücksichtigen möchten.

Short Cut

Diese Methode ist sehr gut für große Problemstellungen geeignet, wenn die Erzeugung der Umfragen mit Balanced Overlap oder Complete Enumeration zu viel Rechenzeit in Anspruch nehmen würden. Es werden hierbei nur die Haupteffekte eines Produkts (z.B. Marke, Preis, Design etc.) berücksichtigt. Das heißt, die Produkte innerhalb einer Frage sind so verschieden voneinander wie möglich.

Random

Bei dieser Methode werden die Produkte innerhalb einer Frage zufällig erzeugt. Hierdurch entstehen viele Überlappungen zwischen den Ausprägungen der Eigenschaften („Overlap“). Wie Short Cut kommt diese Methode insbesondere in Frage, wenn Balanced Overlap oder Complete Enmueration zu viel Zeit für die Erzeugung der Umfragen benötigen. Allerdings werden hier vor allem Interaktionseffekte (z.B. zwischen Marke und Preis) und weniger die Haupteffekte eines Produkts (z.B. Marke, Preis, Design) berücksichtigt.

Die Voreinstellung hierzu ist 300. Das heißt, es werden 300 verschiedene Umfragebögen erzeugt. Im Allgemeinen ist es so, dass umso mehr Produkte oder Dienstleistungen zur Bewertung herangezogen werden können, desto aussagekräftiger können die Ergebnisse sein. Je mehr Umfragen erzeugt werden, desto länger dauert die Erzeugung dieser. Gibt es mehr Umfrageteilnehmer als erzeugte Umfragen, so bekommen einige Probanden Umfragen, die bereits verwendet wurden.
Verbotene Paarungen, z.B. wenn der niedrigste Preis nicht der Premiummarke zugeordnet werden soll, haben einen Einfluss auf die Qualität der erzeugten Umfragen. Verbotene Paarungen sollte man wohldosiert einsetzen. Ist die Anzahl von verbotenen Paarungen zu groß, kann dies unerwünschte Ergebnisse zur Folge haben.

Durchführung einer Conjointstudie

Im Normalfall können Sie von einer Befragungsdauer von 5-15 Minuten ausgehen. Dies hängt davon, wie viele Fragen Sie insgesamt stellen, wie viele Produkte Sie innerhalb einer Frage vergleichen lassen möchten und wie komplex die zu bewertenden Produkte sind.
Das kommt auf die zu befragende Zielgruppe an. Umso mehr Umfrageteilnehmer Sie befragen, desto besser werden die Ergebnisse. Je heterogener Sie die Präferenzen vermuten, je mehr Probanden sollten Sie befragen. Bei hoch speziellen Fragegstellungen im B2B-Bereich können unter Umstäden auch 30 Umfrageteilnehmer reichen. Im B2C-Bereich empfehlen wir Ihnen Stichprobengrößen ab 300 Probanden aufwärts, obwohl diese Frage immer im Kontext des zu betrachtenden Produkts/Dienstleistung gesehen werden sollte.
Ja, für Ihre Conjointstudie können individuelle Designs verwendet werden. Wir bitten Sie, sich in einem solchen Fall an unseren freundlichen und hilfsbereiten Support zu wenden.
Ja, die Verwendung eines einzelnen, zentralen Umfrage-Links ist möglich. Es handelt sich hierbei um eine Standardeinstellung der LEET Conjoint.
Ja, jeder Umfrageteilnehmer bekommt einen individuellen Umfrage-Link zugewiesen. So wird gewährleistet, dass die Umfrage seitens des Probanden pausiert und wieder aufgenommen werden kann. Sobald die Umfrage vollständig vom Probanden beantwortet wurde, wird der Link deaktiviert.
Ja, die Umfrage-Links können als CSV-Datei exportiert und somit bequem weiterverarbeitet werden.

Auswertung einer Conjointstudie

Ein Haupteffekt beschreibt die Auswirkungen der gegebenen Antworten auf eine spezielle Ausprägung.
Ein Interaktionseffekt beschreibt die Auswirkungen der gegebenen Antworten auf zwei Ausprägungen. Stellen Sie sich beispielsweise vor, Sie haben zwei Produktalternativen zur Auswahl. Beide haben die Ausprägung BMW, aber eine unterschiedliche Farbe. Der Umfrageteilnehmer muss sich nun entscheiden, ob er den BMW mit der Farbe Rot oder Blau bevorzugt. Hierdurch bekommt man als Marktforscher nun Informationen darüber, welche Präferenz der Proband bezüglich der Farbe des Autos bei gleicher Marke hat. Die Eigenschaften Marke und Farbe treten hier also in Interaktion. Hieraus resultiert ein höherer Informationsgehalt, da es Probanden geben könnte, die egal bei welcher Farbe eine bestimmte Marke gegenüber den anderen bevorzugen könnten. Somit könnten keine zusätzlichen Informationen über die Farbpräferenz gewonnen werden, was sich nachteilhaft auf die Qualität der Ergebnisse auswirken könnte.
Hierarchische Bayes-Schätzung der Kundenpräferenzen (HB)

Die hierarchische Bayes-Schätzung (HB) ist die wichtigste Methode zur Bestimmung der Kundenpräferenzen in der auswahlbasierten Conjointanalyse. Sie hat den großen Vorteil, dass die Uneinheitlichkeit der Präferenzen der Kunden berücksichtigt wird. So lassen sich die Präferenzen jedes einzelnen Umfrageteilnehmers bzw. Kunden individuell bestimmen, wodurch eine sehr genaue Prognose über die Kaufentscheidungen der Kunden abgeleitet werden kann. Da für diese Methode sehr viele aufwendige und komplexe Berechnungen durchgeführt werden müssen, kann es ein paar Minuten dauern, bis das Ergebnis auf dem Bildschirm erscheint. Wir empfehlen Ihnen diese Methode als Standardschätzverfahren.

Logitanalyse

Logitanalyse mittels Maximum-Likelihood-Methode (ML)

Die hierarchische Bayes-Schätzung sollte mindestens 20.000 Iterationen haben. Umso größer die Anzahl der Attribute und/oder umso kleiner die Anzahl der Umfrageteilnehmer, desto mehr Iterationen sollten durchgeführt werden. Im Zweifel wenden Sie sich bitte an unseren kompetenten und freundlichen Support.
Der Parameter keep gibt an, in welcher Schrittweite die Ergebnisse der Iterationen gespeichert werden. Der Grund hierfür liegt darin, dass die Ergebnisse aus den Iterationen nicht aufeinander aufbauen sollen, weshalb die direkt darauf folgenden Iterationen nicht in die Berechnungen einbezogen werden sollen.
Die Teilnutzenwerte der LEET Conjoint sind intervallskaliert (wie z.B die Temperatur). Innerhalb eines Attributs summieren sich die Teilnutzenwerte zu Null und sind somit effektkodiert. Anhand des Attributs „Motorisierung“ eines Autos soll folgendes Beispiel die Interpretation von Teilnutzenwerten illustrieren:

Motorisierung Teilnutzenwert
100 PS -1.0
140 PS 0
180 PS 1.0

In diesem Beispiel besitzt die schwächste Motorisierung einen negativen Teilnutzenwert. Das heißt allerdings nicht zwangsläufig, dass diese Alternative für den oder die Kunden inakzeptabel ist und ihn am Kauf des Produkts würde. Im Verhältnis zu den anderen Teilnutzenwerte sind 100 PS nicht so vorziehenswürdig wie 140 PS oder 180 PS. Zum Einfluss einer Eigenschaft auf die Kaufentscheidung sollten zusätzlich also noch andere Kenngrößen herangezogen werden, wie z.B. die relativen Wichtigkeiten der Produkteigenschaften und/oder die ZC-Diffs und/oder eine Sensitivitätsanalyse mithilfe einer Marktsimulation.

Teilnutzenwerte dürfen nicht eigenschaftsübergreifend verglichen werden. Es ist beispielsweise unzulässig, den Teilnutzenwert der Motorisierung mit dem Teilnutzenwert einer bestimmten Automarke zu vergleichen. Der Grund hierfür liegt in der Intervallskalierung der Teilnutzenwerte, die lediglich die Ausprägungen einer Eigenschaft untereinander vergleichbar macht. Man kann die Teilnutzenwerte allerdings über alle Eigenschaftsausprägungen hinweg normieren, um diese vergleichen zu können. Siehe hierzu die ZC-Diffs.

Mithilfe der ZC-Diffs (Zero-centered Differences) werden die Teilnutzenwerte normalisiert. Das Ziel ist zum einen, die Level verschiedener Attribute eines Umfrageteilnehmers untereinander vergleichbar zu machen. Zum anderen wird die Skala der Teilnutzenwerte weiter auseinandergezogen. Der Zweck dahinter ist, dass Umfrageteilnehmer, die kleinere Teilnutzenwerte besitzen (die gegebenen Antworten sind nicht immer konsistent; statistisch gesehen als Rauschen zu verstehen) mit Umfrageteilnehmern, die eine größere Spannweite in ihren Teilnutzenwerten besitzen (da sie durchgehend konsistent geantwortet haben), vergleichbar zu machen. Berechnet werden sie immer für jeden einzelnen Umfrageteilnehmer, indem die Differenz des größten und des kleinsten Teilnutzenwerts für jedes Attribut berechnet wird. Danach wird die Anzahl der Attribute multipliziert mit 100 durch die Summe dieser Differenzen dividiert und mit jedem Teilnutzenwert multipliziert.

Die ZC-Diffs können zum Clustern, also zum Segmentieren, verwendet werden.

Der Kernaussage ist: ZC-Diffs machen die Präferenzen der Umfrageteilnehmer über alle Attribute hinweg vergleichbar. Und sie machen die Präferenzen zwischen den Umfrageteilnehmern besser vergleichbar.

Die relative Wichtigkeit einer Produkteigenschaft gibt an, wie wichtig den Kunden z.B. die Marke, der Preis oder die Farbe eines Produkts ist. Hierbei ist darauf zu achten, dass die Wichtigkeiten nur innerhalb einer Studie vergleichbar sind (deswegen „relative Wichtigkeiten“) und nicht studienübergreifend verglichen werden dürfen. Betrachtet man alle relativen Wichtigkeiten der Produkteigenschaften, so summieren sich diese zum Wert 100 auf. Bei der Beurteilung des Einflusses bestimmter Eigenschaften auf die Kaufentscheidung sollte beachtet werden, dass sich Eigenschaften, die kaum bzw. keinen Einfluss auf die Kaufentscheidung in ihrer Wichtigkeit überbewertet werden könnten. Diesem Problem kann Abhilfe durch eine Sensitivitätsanalyse mittels einer Marktsimulation geschaffen werden.
Die Standardabweichung der Teilnutzenwerte ist ein Maß für die Streuung um den Erwartungswert des Teilnutzenwerts. Der Erwartungswert entspricht dem gemittelten Teilnutzenwert aus den einzelnen Schätzungen aus der Hierarchischen-Bayes-Schätzung. Umso geringer die Standardabweichung ist, desto geringer ist also die Streuung um den Erwartungswert. Eine möglichst geringe Standardabweichung ist wünschenswert.
Der Root-Likelihood-Wert (RLH) ist ein Maß für die Anpassungsgüte des geschätzten Modells. Dieser Wert bewegt sich im Intervall [1/k,1] und ist das geometrische Mittel der vorausgesagten Produktauswahlwahrscheinlichkeiten, wobei k der Anzahl von Auswahlalternativen in den CBC-Fragen entspricht. Wenn man in jeder CBC-Frage vier Produktalternativen abgefragt werden und man diese Fragen zufällig beantworten würde, bekäme man eine Auswahlwahrscheinlichkeit von 0,25, da die Wahrscheinlichkeit eines von vier Produkten auszuwählen, gleich ¼ wäre. Liegt der RLH-Wert über diesem Referenzwert, so besitzt das geschätzte Modell eine höhere Anpassungsgüte als ein Zufallsmodell. Ist der RLH-Wert gleich 1, so entspräche dies einer perfekten Modellanpassung. Generell gilt, umso größer der RLH-Wert, desto besser ist die Anpassungsgüte des Modells.
Der Percent-Certainty-Wert gibt als Maß für die Anpassungsgüte eines Modells an, wie viel besser das geschätzte Modell als das Zufallsmodell ist. Er nimmt typischerweis Werte zwischen 0 und 1 an. Ist der Wert Null, so ist das geschätzte Modell nicht besser als das Zufallsmodell. Liegt der Wert bei 1, so ist die Anpassungsgüte perfekt. Percent Certainty und RLH treffen im Grunde genommen die gleichen Aussagen.
Der Counts-Report hilft Ihnen dabei, ein Gefühl dafür zu bekommen, wie die Umfrageteilnehmer geantwortet haben und er komplettiert das Gesamtbild der Analyse.

Im Countsreport werden die anteilsmäßigen Auswahlhäufigkeiten der Haupt- und Interaktionseffekte dargestellt. Es wird ermittelt, wie groß das Verhältnis zwischen dem Erscheinen der Ausprägungen in den Umfragen und der tatsächlichen Auswahl der Umfrageteilnehmer ist.

Beispiel für Haupteffekte:

Marke Verhältnis in %
Marke 1 13.2
Marke 2 50.0
Marke 3 20.5
Nicht-Wahl-Option 16.3

In diesem Beispiel sieht man, dass „Marke 2“ am häufigsten gewählt wurde, wenn sie zur Wahl stand. Nämlich jedes zweite Mal. Man könnte hieraus als schlussfolgern, dass dieser Marke eine hohe Wichtigkeit zukommt. Summiert man die Prozent-Werte auf, ergeben sie zusammen mit der Nicht-Wahl-Option nicht immer 100%. Dieser Effekt tritt nur in Spezialfällen auf (genauso viele Level innerhalb eines Attributs wie die Anzahl zu vergleichender Produkte in einer Conjointfrage sowie eine Gleichverteilung des Erscheinens in der Studie).

Beispiel für Interaktionseffekte:

Marke x Preis Verhältnis in %
Marke 1 x Preis 1 14.1
Marke 1 x Preis 2 10.5
Marke 2 x Preis 1 44.4
Marke 2 x Preis 2 25.0
Nicht-Wahl-Option 15.0

Hier sehen Sie zwei Marken und zwei Preise. Sie können hieraus z.B. ablesen, dass die Kombination aus „Marke 1“ und „Preis 1“ in 14,1% der Fälle, in denen diese beiden Ausprägungen zusammen auftraten, von den Umfrageteilnehmern gewählt wurden.

Der Chi-Quadrat-Wert gibt ein Gefühl dafür, ob die Verhältnisse innerhalb der Haupt- und Interaktionseffekte sich signifikant voneinander unterscheiden. Innerhalb einer Eigenschaft zeigt der Chi-Quadrat-Wert an, ob sich die Auswahlhäufigkeiten der Ausprägungen signifikant voneinander unterscheiden.
Der p-Wert ist der Signifikanzwert. Er deutet an, wie wahrscheinlich es ist, ein solches Stichprobenereignis oder ein noch extremeres zu erhalten, wenn die Nullhypothese wahr ist. Im Rahmen der LEET Conjoint ist die Nullhypothese immer: Die Teilnutzenwerte sind nicht verschieden von Null oder es existieren keine Unterschiede in den Auswahlwahrscheinlichkeiten beim Chi-Quadrat-Test. Ist der p-Wert also kleiner als ein vom Marktforscher gewähltes Signifikanzniveau, so ist der untersuchte Effekt signifikant. Wenn das Signifikanzniveau kleiner als der p-Wert ist, so sind die untersuchten Effekte nicht signifikant.
Das Consistent Akaike Information Criterion (CAIC) ist ein Maß für die Güte des Modells. Umso kleiner es ist, desto besser. Als absolute Größe nützt dieser Wert weniger. Er wird vor allem in Vergleich zu anderen Modellen nützlich.
nach oben