Von Alexander Staats | Conversion Optimierung Hintergründe Strategie | 8 Reaktionen

Die wirklich wahren Conversion-Killer – Mit 5 Maßnahmen zur Testing-Exzellenz

Agilität, schnelle Prozesse und in Rekordtempo erreichte Testergebnisse sind ein Traum für jeden Conversionoptimierer – im Bestfall durch Erreichen hoher Uplifts auch für die C-Level-Etage. Jedoch lauern auf dem Weg zum Best-Practice-Optimierungsprozess jede Menge Fallstricke und Bäreneisen, deren Umgehung eine weitsichtige und sorgsame Planung voraussetzen.

Die wirklich wahren Killer

Eine kleine interne Umfrage brachte es ans Licht: Neben den klassischen Konversion-Killern wie schlecht umgesetzte Formulare oder fehlenden Unique Value Propositions können vor allem taktische, (Unternehmens)politische und menschliche Faktoren zu großen Hemmschwellen für eine erfolgreiche Implementierung einer testgetriebenen Kultur in Online-Businesses werden.

Fallstricke identifizieren – was ist wichtig?

Die tägliche Arbeit in Optimierungsprojekten lehrt vor allem zwei Dinge, die für das Erreichen der gesetzten Ziele (und darüber hinaus der Erreichung wirklicher Exzellenz  – Das Erreichen kontinuierlich hoher Uplifts in schnellen, iterativen Zyklen) stehen:

Hypothesen

Die methodische Erarbeitung von starken Testhypothesen – bloßes Ausprobieren sollte gestern gewesen sein. Strukturiertes Lernen aus und sinnvolles Bewerten von Testergebnissen wird erst dann möglich, wenn eine zugrunde liegende Hypothese verprobt wird. Sehr anschaulich formuliert hat das André Morys im Artikel Die Testing-Falle, in die jeder mal tappt.

Testkomplexität

In folgendem Artikel soll der Fokus allerdings anders gesetzt sein, nämlich auf die Transformation einer Testhypothese (wie zum Beispiel „Die visuell und inhaltlich stärkere Kommunikation meiner Unique Value Propositions auf Produktdetailseitenebene steigert Add-to-Cart- sowie Revenue Conversions“) in einen funktionierenden Test in einer Liveumgebung.

Hierbei gelten (leider) in den allermeisten Fällen die folgenden Grundsätze:

  • Je skalierter mein Projekt, desto komplexer.
  • Je tradierter und damit unbeweglicher mein Unternehmen, desto komplexer.
  • Je markenorientierter mein Unternehmen, desto komplexer.
  • je weiter meine Hypothese von reinen Hygienefaktoren der Usability („Der Kaufen-Button wird nicht gefunden“) entfernt ist  – verdammt, desto komplexer!

Starke Testhypothesen verlangen oft nach einer anderen Art von Änderung – Elemente, die sich über Prozesstrecken hinweg ziehen und an verschiedenen Stellen im Prozess jeweils andere Kreuzeffekte nach sich ziehen können. Konzeptuelle Hypothesen, die an verschiedenen Stellen im Customer-Journey-Prozess jeweils angepasste Änderungen nach sich ziehen können. Da raucht der Kopf!

Und ja, es gibt noch mehr… Andere, komplexere Testszenarien können beispielsweise sein:

  •  Responsive Design-Prozess-Tests – wer das wirklich schon mal umgesetzt hat, weiss was geht.
  • Änderungen an Seitenstrukturen
  • Änderungen an Navigationskonzepten
  • Änderungen an impliziten Signalen wie Farbwelten, Stilistik oder Dramaturgien auf Prozessschritten oder über Prozesse hinweg.

3. „Du kannst nicht vorbei!“ – Die Wächter der Marke

Man kann schon ahnen wo dass alles hinführt. Jeder Test, der in einem festgelegten Gefüge von Strukturen, Zuständigkeiten und (mit Sicherheit auch meistens sinnvollen) Konsistenzkorsetten das Brecheisen ansetzt, wird an entsprechender Stelle Reibung erzeugen.

Das können wir nicht testen, das kriegen wir nie durch die CI.– Projektmanagement

 

Ein Satz, der wohl schon unzähligen, ernsthaft an Verbesserung interessierten Optimieren das Blut hat in den Adern rauschen lassen. Ein Thema, das analog zur wachsenden Unternehmensgröße immer breiteren Raum fordert.

Tatsächlich ist nicht jeder Test von den Vorgaben und Einschränkungen einer konsistenten Corporate Identity zu lösen. Eine einheitliche Markenkommunikation, besonders in Bezug auf konsistente Erlebniswelten, gestalterische Elemente und die verwendete Sprache macht absolut Sinn. Somit macht es genau so wenig Sinn, eherne Grundgesetze der Markenkommunikation in Abrede zu stellen und die Bastion schleifen zu wollen. Da wartet jede Menge Teer von oben!

Sinnvollerweise ist eher eine Stealth-Taktik einzusetzen: Wohlmöglich mit Zahlen aus vergangenen Tests belegt, lassen sich kleinere ,"unkonforme" Änderungen so verbauen, dass sie implizit wirken (damit explizit nicht wirklich wahrnehmbar ist) und trotzdem die gewünschte Wirkung entfalten....
Sinnvollerweise ist eher eine Stealth-Taktik einzusetzen: Wohlmöglich mit Zahlen aus vergangenen Tests belegt, lassen sich kleinere ,“unkonforme“ Änderungen so verbauen, dass sie implizit wirken (damit explizit nicht wirklich wahrnehmbar ist) und trotzdem die gewünschte Wirkung entfalten….

Hier sind starke und erfahrene Konzepter und Designer gesucht – Haben Sie diese? Kümmern Sie sich gut um sie, es wird sich lohnen…

Damit ist auch schon der erste Tipp für den an Ergebnissen orientierten ConversionOptimierer gegeben: Ein stumpfes Anrennen gegen die Windmühlen Corporate Identity/ Corporate Design wird zum Don Quichotte-Effekt führen: Viel Aufwand und am Schluss ist doch kein Korn zu Brot gebacken worden.

 

4. Tools können nicht alles

Die  ersten Schritte sind gemacht, Hypothesen entwickelt, schicke Testpläne aufgestellt, Designer haben Höchstleistungen vollbracht und alle sind mit dem Ergebnis hochzufrieden – bis auf die Entwickler, die „mal eben“ ein hochkomplexes Testszenario in irgend ein von oben ausgewähltes Testingtool Geißen sollen, und dass natürlich alles in einer Woche.
Hier soll Vorsicht walten! Neben Eigenheiten, Unzulänglichkeiten und Macken, die jedes Testing Tool an den Tag legt (an dieser Stelle sei auf die vorzügliche Artikelserie des Kollegen Brückmann verwiesen: Welches Testingtool? 10 Conversion Testingtools im Vergleich: Teil ITeil II & Teil III) muss im Vorfeld gut geplant werden, was mit gegebenen Budgets denn auch umgesetzt werden kann. Darüber hinaus ist im Hinblick auf Messung und Verifizierung eine frühzeitige Prüfung im Hinblick auf die Heirat von Testing Tools und Webanalyse-Systemen zu achten.

 

5. Kleiner Uplift, lange Laufzeit

Testen kann Nerven rauben. Besonders, wenn sich hart erkämpfte Tests nicht so entwickeln wie ursprünglich gedacht. Und mal ehrlich, wer plant bei dem ganzen Aufwand nicht schon zweistellige Uplifts auf allen möglichen Zielmetriken ein, die sich dann wunderbar nach oben präsentieren lassen? Um so größer die Enttäuschung, wenn sich ein Test mal seitwärts bewegt, oder sogar nach unten.

Da werden schnell die Haare gerauft und im Schnellschussverfahren Urteile gefällt. An dieser Stelle kann eine vorausschauende Kommunikation vieles erleichtern – bedienen Sie sich doch dem inversen Kommunikationsmodell von Thorsten Hubert und Apple aus dem vorherigen Beitrag: Inspirierende Produktseiten – das Geheimnis der Apple Informationsarchitekten. Wer frühzeitig das „Warum“ für Optimierung und Testing richtig und zielbezogen kommuniziert (und auch auf methodische Einschränkungen eingeht), wird es später viel leichter haben…

Lösungen

 

1. Stay hungry & foolish

Dieser allseits bekannte und gern zitierte Leitsatz von Steve Jobs beschreibt die optimale Grundeinstellung eines Optimierers sehr anschaulich. Ein ums andere Mal bewahrheitet sich: Wer mit einem geschlossenen Denksystem Optimierung betreiben will, manövriert sich schnell ins Abseits. Jedes System ist abhängig von seinem Kontext und von unzähligen Variablen, die im zeitlichen Verlauf Einfluss nehmen können. Extpertenwissen, heuristische Evaluationen und qualitative Nutzertests alleine bringen zwar Insights – doch nur in der methodischen Kombination treten die wahren Potentiale zu Tage.

Darauf folgt: Kombiniere Methoden! Stelle den Gegenstand der Optimierung jedes mal wieder in seinen Kontext! Sei dir nie zu sicher!

 

2. Nein heißt nicht Nein

Zurück zum Markenwächter-Dilemma. Es ist ein leichtes, Verantwortung für Verzögerungen oder auch für das „Scheitern“ einer Optimierungsmaßnahme der (aus klassischer Marketersicht) Verweigerungshaltung oder umgekehrt dem ungestümen Vorpreschen der verrückten Optimierer zuzuschreiben. By the way: Ein Test der Downlift produziert bedeutet keine Scheitern – das Ergebnis fordert nur dazu auf, die Nullhypothese beizubehalten und umso stärkere neue Hypothesen bilden zu können.

Markenwächter - stylisch, irgendwie sexy, aber knallhart
Markenwächter – stylisch, irgendwie sexy, aber knallhart

Das Fazit lautet wie so oft: Gegenseitiges Verständnis, die Bildung von gedanklichen Common Grunds und einer gemeinsamen Sprache!, der gemeinsame Zieldefinition für jeden einzelnen Test und der Integration von klassischem Marketing, zahlengetriebenen Onlinemarketern, Entwicklern, Konzeptern, Designern und allen weiteren Beteiligten sollte hohe Priorität zugeschrieben werden.

Zugegeben – im ersten Moment hört sich das  an wie das genaue Gegenteil zum Agilitätskonzept – stimmt aber nicht! Neben Konzepten des Neuromarketing und der Verkaufspsychologie muss für die erfolgreiche Etablierung von  Optimierungsprozesse und -denke eine Menge Fingerspitzengefühl eingesetzt werden.

 

3. Machs wie der Busfahrer – Hol jeden da ab wo er steht

Die grundlegenden Gedankengänge gegenüber Testingprozessen und -verfahren sind in unterschiedlichen Unternehmen oft weitaus differenzierter als man gemeinhin annehmen würde. Wichtig ist besonders der Versuch, als Optimierer nicht als „die mit der Sense“ rüberzukommen. Alle Beteiligten haben Ihre Zielvorgaben, persönlich Ziele, Steckenpferde, heilige Kühe. Oft ist eine Lernphase unvermeidlich – aber wenn es geschafft ist und alle an einem Strang ziehen, können erstaunliche Dinge bewegt werden!

 

4. Kleine Schritte versus großer Wurf

Viel hilft viel – selbst in der Medizin ist dieser Grundsatz heutzutage eher überholt. Die Versuchung  ist groß, möglichst viele Änderungen („Ha! Liegt doch auf der Hand!“) in einen Test zu gießen, um die größtmögliche Wirksamkeit zu erzielen. Jedoch steigt mit größerer Komplexität und Aussagekraft auch die Anforderung an das Gesamtsystem – Entscheider werden schneller nervös, Konzepte umfangreich, Entwicklungsaufwände können sich schneller aufblähen als Luftballons und hat eigentlich schon mal jemand über Qualitätssicherung nachgedacht?

Sollte sich Ihre Testplanung dem annähern, sind Sie entweder genial oder "a beautifu mind".
Sollte sich Ihre Testplanung dem annähern, sind Sie entweder genial oder „a beautiful mind“.

Was für Testtypen gibt es denn aus dieser Sicht nun eigentlich?

4.1 – Elementtests

Der klassische ABCD-Test, vielleicht auch multivariat umsetzbar.
Oft auf Landing Pages oder Produktdetailseiten, werden hier inhaltliche oder gestalterische Variationen eines oder mehrerer Elemente vorgenommen.

Tatsächlich sind meistens kleinere Änderungen zwar nicht im selben Maße wirksam, jedoch lassen sich diese weitaus schneller und agiler umsetzen. Außerdem können Testhypothesen um so schärfer heraus gearbeitet werden, je weniger geändert wird.

4.2- Prozesstests

Eins rauf mit Mappe – jetzt wird’s spannend.

Prozesstests verproben Konzepte über Prozessteile oder ganze Customer Journeys hinweg – wie zum Beispiel wirken sich Sicherheits- und Vertrauenssymboliken über den Checkoutprozess hinweg aus? Dieses Testsetup wird von der Umsetzung und Auswertung schon komplexer. Es sind oft mehrere Stakeholder involviert. Es empfiehlt sich, frühzeitig alle mit ins Boot zu nehmen.

4.3 – Konzept- und Strukturtests

Die Königsdisziplin: Der „große Wurf“ in Form von Struktur- oder Konzepttests läßt sich nicht immer vermeiden. Navigationsstrukturen, Struktur und Dramaturgie von Seitentypen, Änderungen von Prozessen – Hallo, Gastbestellung 😉 – sobald die Testumsetzung über die reine Frontendmanipulation mit Testing Tools hinweg geht, muss der Planung weitaus mehr Raum gegeben werden. Agiles Testen und Deployment Cycles verhalten sich nämlich zueinander ähnlich wie zwei magnetische Nordpole – je fester man drückt, desto mehr tuts nachher weh.

 

5. Lehrsatz Nummer eins: Der Kopf steuert den Körper

Der letzte Ratschlag ist ebenso lapidar wie wichtig und wirkungsvoll: Ohne den Kopf zu überzeugen läuft die Kuh wohin sie will. Oft ist es gar nicht so schwer, mit geeignetem Zahlen- und Anschauungsmaterial die Entscheiderebende zu gewinnen. Sobald an dieser Stelle Verständnis und Begeisterung geschaffen wird, bewegen sich viele Dinge wie von selbst.

In diesem Sinne zitiere ich Tita von Hardenberg: Bleiben Sie stark!

Alexander Staats

Alexander Staats beschäftigt sich als Informationswissenschaftler mit dem interdisziplinären Blickwinkel auf Evaluationsmethoden und deren Erkenntnisgewinn für die Conversion-Optimierung. Als Google AdWords-Professional und Konzeptioner ist ihm eine ganzheitliche und prozessbezogene Sichtweise auf Optimierungsmaßnahmen wichtig.
    Frage zum Artikel? Frag den Autor

    8 Reaktionen auf „Die wirklich wahren Conversion-Killer – Mit 5 Maßnahmen zur Testing-Exzellenz

    1. Das Lesen des informativen Artikels wird durch den überproportionalen Einsatz von Marketing-Sprech zu einer echten Qual. Nichts gegen Fachbegriffe aber „Uplift“, „Add-to-Cart- sowie Revenue Conversions“ sind ein echtes No-go.

      • Erstmal: tolle Seite!;-)

        Eine Frage zu Punkt 4: Es gibt die Faustregel für kleinere Unternehmen/Websites, dass je kleiner die Conversionanzahl, desto radikaler sollte die Testvariante sein, d.h. hier hilft viel auch viel, zumindest beim Eruieren von ersten Versionen. Wenn ich lese, für signifkante Ergebnisse bräuchte man x-tausend Tests, mag das statistisch valide sein, geht aber bei vielen Firmen ander Realität vorbei. Der weitaus größte Anteil von Websites und Shops haben solche Conversionsmengen nicht (solange man nicht amazon oder zalando heißt). Und das Konfidenzniveau auf 10% zu setzen, kann ja auch keine Lösung sein;-). Was ist euer/dein Rat für „kleinere Websites“?

        Danke und Gruß

        • Korrektur: es muss natürlich 50% heissen;-)

          • von Alexander Staats

            Hallo @JK,

            Die Frage nach der „Radikalität“ von Testalternativen – besonders bei kleineren Projekten mit weniger Traffic – ist natürlich berechtigt. Man kann hier zwei Dinge unterscheiden: Die Schärfe der Ausprägung einer Hypothese versus die Mischung verschiedener Hypothesen, um in einem Test eine möglichst hohe Durchschlagskrat zu erreichen (wenn beispielsweise zu wenig Traffic für parallele Tests per Trafficsplit vorhanden ist).

            Hier gilt es abzuwägen: Je schärfer eine Hypothese ausgearbeitet wird, desto größer sind Chancen für hohe Uplifts – aber auch die Risiken, dass die Hypothese im Kontext nicht funktioniert und im schlechtesten Fall beim Nutzer durchfällt. Ein gutes Beispiel wären Sort- versus Longcopy-Landingpages: Je nach Branche/Kontext/Zielsetzung können diese Konzepte sehr gute, aber auch ebenso negative Ergebnisse hervorbringen.

            Bezüglich Konfidenz- bzw. Signifikanzniveaus bei der Testauswertung: Eine Herabsetzung des Konfidenzniveaus für die Signifikanz ist immer problematisch. Wenn ich dieses auf 50 % absenke kann ich mir den Test eigentlich sparen und einen Würfel benutzen – diese Methode hätte die gleiche Aussagekraft ;).

            Darüber hinaus existieren statistische Methoden, um in kleinen Stichproben (wenig Traffic) robustere Ergebnisse zu errechnen. So kann man für die Signifikanzbetrachtung statt dem Standardverfahren studentischer T-Test Verfahren wie den Wilcoxon-Vorzeichen-Test verwenden – sollte allerdings einen erfahrenen Statistiker an seiner Seite haben :).

            Jeoch sind diese Vorgehensweisen – obwohl mathematisch und testtheoretisch korrekt – immer mit Vorsicht anzuwenden. Repräsentative Stichproben und genügende Testlaufzeit sind hiermit leider nicht zu ersetzen.

            Ableitungen für kleinere Webseiten könnten also sein:

            – Wenn möglich, Beschränkung auf klass. A/B-Tests um den vorhandenen Traffic möglichst wenig zu „stressen“.

            – Hypothesen verproben, die für einen möglichst großen Teil der Nutzer anzuwenden sind

            – Hypothesen nicht vermischen

            – einzelne Hypothesen möglichst scharf ausarbeiten: Sollte meine Hypothese beispielsweise „Reduktion von ablenkenden Inhalten zur Fokussierung des Nutzers auf die gewünschte Aktion“ lauten, dann sollten tatsächlich möglichst alle „störenden“ Elemente entfernt werden. Selbst wenn dies nach Testabschluss nicht vollständig ausgerollt werden kann – wichtig ist in diesem Fall der Beweis der Tragfähigkeit des zugrundeliegenden Konzeptes.

            – mit längeren Laufzeiten leben und diese gegenüber Entscheidern verteidigen

            eine gute langfristige Projektplanung erleichtert die Umsetzung einer solchen Strategie.

            Grade fällt mir auf – Es gibt zum Thema Testing auf kleinen Webseiten noch so viel zu sagen, dass hier ein eigener Blogartikel nötig ist. Diese Anregung nehme ich mit und hoffe dass solange erste Denkanstöße gesetzt sind :).

            • Klasse Antwort, danke. Wir basteln gerade an A/B Tests für unsere Startseite, für diese Art von Seiten kann man eigentlich nur Hypothesen mischen:-)
              Ja, über kleinere Websites liest man zu wenig bzgl. Testing. Ist aber das nicht gerade die Realität? Wo seid ihr ‚am häufigsten im Einsatz‘?:-)
              Gruß

              Schreibe einen Kommentar

              Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.