Modelowanie atrybucyjne – klucz do zrozumienia efektywności działań marketingowych

W dobie rosnącej liczby kanałów komunikacji i punktów kontaktu z marką, właściwa identyfikacja wagi i wpływu każdego z nich nabiera coraz większego znaczenia. Poprawna odpowiedź na pytanie: w jakim stopniu wykorzystanie danego komunikatu i kanału wpłynęło na realizację celu jest kluczowa dla optymalizacji działań i maksymalizowania zwrotu z zainwestowanego budżetu marketingowego. Problem jest tyleż ważny, co trudny. Z pomocą przychodzi jednak modelowanie atrybucyjne i metody data science.

Czym jest modelowanie atrybucyjne?

Modelowanie atrybucyjne to proces budowy modelu służącego do przydzielania wartości każdemu z punktów kontaktu (touchpointów) na ścieżce konwersji klienta. Ma na celu zrozumienie, które kanały marketingowe i działania przyczyniają się do osiągnięcia celów biznesowych, takich jak np. sprzedaż, pozyskanie nowego klienta, aktywizacja klientów uśpionych, rekrutacja nowych uczestników programu lojalnościowego czy zwiększenie świadomości marki.  Pod pojęciem modelu atrybucyjnego może kryć się wiele różnych konstruktów, od bardzo (zbyt) prostych do bardzo złożonych. Generalnie modele można podzielić na: jednopunktowe, wielopunktowe oparte o reguły i algorytmiczne modele wielopunktowe.

Modelowanie jednopunktowe

Modele jednopunktowe przydzielają całą wartość konwersji (czy szerzej osiągnięcia celu) tylko jednemu punktowi kontaktu. Typowe podejścia to pierwsze kliknięcie (first-click) lub ostatnie kliknięcie (last-click). Są to uproszczone modele. Nie uwzględniają całej ścieżki konwersji klienta. Nie uwzględniają interakcji między różnymi punktami kontaktu oraz kontekstu w jakim się on odbywa. Ich zaletą jest prostota i łatwość zastosowania. W złożonym świecie dzisiejszego marketingu są jednak zbyt proste aby wiarygodnie odzwierciedlać rzeczywistość.

Modele wielopunktowe oparte o reguły

Modele wielopunktowe rozdzielają wartość pomiędzy różne punkty kontaktu na ścieżce klienta. Przy czym dzielą się one na oparte o reguły i modele algorytmiczne. Te pierwsze przypisują wartość poszczególnym kontaktom w oparciu o predefiniowane reguły. Przykładowo:

  • model liniowy – przydziela jednakową wartość każdemu punktowi kontaktu, z jakim zetknął się konsument na swojej ścieżce do konwersji;

  • model U-kształtny – przydziela największą wartość pierwszemu i ostatniemu punktowi kontaktu, punkty pośrednie mają w tym modelu mniejsze (choć niezerowe) znaczenie;

  • model oparty o czas konwersji – przydziela tym większą wartość im punkt był bliżej momentowi konwersji. W tym modelu największa waga przypisywana jest do ostatniego kontaktu bezpośrednio poprzedzającego konwersję.

Zaletą modeli opartych o reguły jest ich klarowność i względna prostota. Także to, że nie pomijają żadnych punktów kontaktu na ścieżce prowadzącej do konwersji. Ich wagi nadawane są jednak w oparciu o arbitralnie dobrane reguły. Dla każdej z nich można znaleźć uzasadnienie. Nie sposób jednak stwierdzić, która z nich jest najlepsza. Podobnie jak w przypadku modeli jednopunktowych ich wadą jest również to, że nie uwzględniają interakcji pomiędzy różnymi punktami styku i nie biorą pod uwagę kontekstu.

Algorytmiczne modele wielopunktowe

Modele algorytmiczne podobnie jak modele oparte o reguły przypisują wagę każdemu punktowi kontaktu na ścieżce klienta. Jednak zamiast arbitralnych reguł wykorzystują do określenia tych wag zaawansowane metody statystyczne. Zamiast więc przyjmować predefiniowane reguły, modele te „uczą się reguł” na podstawie rzeczywistych danych (przy pomocy metod uczenia maszynowego). Modele takie uwzględniają kolejność punktów kontaktu i interakcje pomiędzy nimi. Przykładowo wpływ emaila na konwersję może być większy, gdy był on poprzedzony wyświetleniem banera. Uwzględniają także kontekst np. porę roku, pogodę, aktywność medialną konkurencji, ceny. Mogą działać na bardzo szczegółowym poziomie np. rozróżniać wpływ poszczególnych wariantów kreacji bądź miejsca i czasu ich wyświetlenia.

Trudno nie zgodzić się ze stwierdzeniem, że dziś to właśnie tego typu modele są „złotym standardem”. Tylko one pozwalają uwzględnić całą złożoność ścieżek kontaktu konsumenta z marką. Za dokładnością i korzyściami płynącymi z modeli algorytmicznych idą jednak związane z nimi wyzwania. W szczególności co do ilości, jakości i zakresu danych oraz kompetencji analitycznych niezbędnych do ich stworzenia. Ich wadą jest też ograniczona transparentność wynikająca ze złożoności reguł jakie rządzą rzeczywistością i są identyfikowane przez model. Modele algorytmiczne pozwalają jednak na zaawansowana symulację (what if?) różnych scenariuszy np. co jeśli zrezygnowalibyśmy zupełnie z kanału A? co jeśli ograniczylibyśmy budżet na kanał B? co jeśli zamienilibyśmy kolejność komunikatów w sekwencji? To z kolei pozwala na optymalizację budżetu i działań. Inwestycja w tego typu model może się więc z nawiązką zwrócić.

Podsumowanie

Marketingowe modele atrybucyjne przeszły długą ewolucję od prostych jednopunktowych, do wielopunktowych opartych o złożone algorytmy uczenia maszynowego i metody statystyczne (m.in. oparte o głębokie sztuczne sieci neuronowe). Jest to przy tym wciąż obszar intensywnych badań i eksperymentów zarówno w środowisku naukowym, jak i wśród praktyków. Pomimo złożoności i wyzwań związanych z ich tworzeniem i zastosowaniem, są one coraz bardziej dostępne dzięki spadającym kosztom gromadzenia i przetwarzania danych. Wkraczamy więc w epokę, w której nie powinniśmy pytać „czy” warto je stosować, ale „jak” w sposób efektywny je budować i wykorzystywać.

Przewidywanie sprzedaży w nieprzewidywalnych czasach. Dlaczego warto prognozować nie tylko sprzedaż, ale także popyt?

Niestety niestabilna sytuacja gospodarcza sprawia, że utrzymanie rentownego biznesu sprzedaży detalicznej staje się coraz trudniejsze. Sprzedawcy muszą być w stanie przewidzieć przyszłość z pewną dokładnością, aby prowadzić dochodowy biznes. Prognozowanie sprzedaży i popytu stają się zatem dwoma kluczowymi aspektami planowania biznesowego.

Predykcja sprzedaży czy predykcja popytu – co wybrać?

Określenia predykcja sprzedaży i predykcja popytu niekiedy używane są zamiennie. Jest jednak pomiędzy nimi zasadnicza różnica. Czego owa różnica dotyczy i na której predykcji powinniśmy się szczególnie skupić? O tym w dzisiejszym artykule.

Na początek warto poświęcić chwilę na przypomnienie relacji pomiędzy kluczowymi pojęciami: popyt, sprzedaż i podaż. Popyt odnosi się do ilości produktów lub usług, jakie klienci chcieliby nabyć w danym okresie. Sprzedaż zaś to ilość produktów lub usług, które faktycznie zostały sprzedane w tymże  okresie. Do zaistnienia sprzedaży, konieczna jest podaż produktów lub usług, która zdolna jest zaspokoić popyt. Podaż bowiem to ilość dostarczonych produktów i usług, które są dostępne w danym okresie. Nie ma zatem sprzedaży, gdy nie ma popytu. Nie ma jednak również sprzedaży gdy jest popyt, a brakuje wystarczającej podaży. Generalnie, możemy mieć zatem do czynienia z trzema sytuacjami:

  1. Popyt = podaż
    Sytuacja idealna: klienci są usatysfakcjonowani możliwością zaspokojenia swoich potrzeb, a firma jest zadowolona gdyż sprzedaje cały dostępny zapas.

  2. Popyt > podaż
    Nie wszyscy klienci są w stanie zaspokoić swoje potrzeby, firma ponosi zaś koszty utraconej potencjalnej sprzedaży. Z sytuacją taką mamy do czynienia np. wtedy gdy brakuje danego towaru w magazynie, czy na półce sklepowej w momencie, w którym konsument chciałby go nabyć. W warunkach konkurencji rynkowej, klient może w takim wypadku kupić substytucyjny produkt/usługę u konkurencji.

  3. Popyt < podaż
    Sytuacja niekorzystna dla firmy, która zamroziła pieniądze w towarze zalegającym na półkach, traci możliwość wykorzystania powierzchni sklepowej i zasobów logistycznych na dostarczenie produktów na który jest popyt oraz ponosi ryzyko całkowitej utraty wartości produktu (np. w wyniki przekroczenia terminu przydatności do spożycia).

Trafne prognozy popytu pozwalają unikać sytuacji nr 2 i 3 albo przynajmniej minimalizować ich skalę i związane z nimi koszty. Jednocześnie możemy wskazać 5 obszarów, w których predykcja popytu przynosi korzyści.

Korzyści z prognozowania popytu

  • Optymalizacja produkcji i zapasów
    Dzięki trafnej predykcji popytu, firma może lepiej przewidzieć, jaką ilość produktów będzie potrzebowała na dany okres To pozwala na zoptymalizowanie procesów produkcyjnych oraz kontrolowanie poziomu zapasów.

  • Zwiększenie sprzedaży
    Zapewnienie odpowiedniej ilości produktów w magazynie pozwala firmie zwiększyć swoją sprzedaż oraz zadowolenie klientów.

  • Lepsze planowanie kampanii marketingowych
    Dysponując trafną predykcją popytu firma może lepiej zaplanować, które produkty (lub kategorie produktowe) i w jakim okresie opłaca się promować.

  • Optymalizacja cen
    Dzięki predykcji popytu i znajomości stanów magazynowych, firma może optymalizować cenę produktu, tak aby zrównoważyć popyt z podażą i zmaksymalizować zysk.

  • Redukcja kosztów
    Dzięki dokładnej predykcji popytu firma może uniknąć kosztów nadmiernych zapasów i niepotrzebnych kosztów logistycznych.

Predykcja sprzedaży a predykcja popytu – różnice

Co jeśli jednak zamiast predykcji popytu będziemy przygotowywać predykcję sprzedaży? W takiej sytuacji ryzykujemy niedoszacowanie. Jak już zauważyliśmy, sprzedaż następuje wtedy, gdy popyt spotyka się z podażą. W sytuacji, w której podaż jest niewystarczająca (brak towaru) to popyt nie zostanie zaspokojony i sprzedaż będzie niższa niż mogłaby być. W skrajnym przypadku przy całkowitym braku towaru na półce, sprzedaż będzie wynosić 0. Model predykcyjny sprzedaży może w takim wypadku prawidłowo przewidzieć brak sprzedaży. Wykorzystanie jednak takiego modelu do podjęcia decyzji o właściwym zapasie produktu skutkować będzie niedoszacowaniem i utratą potencjalnej sprzedaży. Co gorsza wskaźniki dokładności takiego modelu mogą być bardzo wysokie. Możemy mieć do czynienia bowiem z samospełniającą się przepowiednią:

Brak towaru → zerowa sprzedaż → model przewiduje brak sprzedaży w kolejnym okresie →
decyzja o braku dostawy produktu (skoro zakładany jest brak sprzedaży) → brak towaru.

I koło się zamyka.

Jest to potencjalnie kosztowny błąd na etapie przygotowywania koncepcji modelu i pułapka w którą niekiedy wpadają firmy. Tymczasem metody uczenia maszynowego pozwalają zbudować i wytrenować modele predykcyjne zdolne do predykcji popytu (a nie tylko sprzedaży). Modele takie biorą pod uwagę szereg różnych czynników wpływających na popyt (m.in. sezonowość, cenę, pogodę, promocje) i mogą działać na dowolnym poziomie agregacji (grupa produktowa/pojedynczy produkt, region/grupa sklepów/pojedynczy sklep itd.).

Podsumowanie

Trafna predykcja popytu to klucz do osiągnięcia sukcesu. Pozwala na redukcję kosztów, zwiększenie sprzedaży oraz podniesienie zadowolenia klientów. Jednak korzyści te może zapewnić tylko właściwy dobór metod data science odpowiednich do rozwiązania tego rodzaju problemu.

Gdzie mam szukać klientów?

Baza klientów to istotne aktywo każdego przedsiębiorstwa. Gromadzone o klientach dane pozwalają na lepsze targetowanie komunikacji i przygotowanie bardziej dopasowanej oferty. Zdrowy biznes potrzebuje jednak stałego dopływu nowych klientów. Na ich temat zaś nie ma zazwyczaj danych (lub jest ich niewiele). Gdzie szukać klientów? I czy data science może więc pomóc w docieraniu do nich?

Na postawione powyżej pytanie najlepiej odpowiedzieć na przykładzie. Jakiś czas temu jedna z firm chciała istotnie poszerzyć bazę klientów kupujących jej flagowy produkt. Doświadczenie podpowiadało, że produkt ten jest atrakcyjny dla zupełnie innej grupy konsumentów niż typowy klient firmy. Planowana była akcja reklamowa z wykorzystaniem bilbordów i ulotek. Przy ograniczonym budżecie firma nie chciała jednak „zasypać” materiałami całego miasta i okolic, w których działa. Zamierzała skupić swoje wysiłki i budżet w lokalizacjach o największym prawdopodobieństwie wysokiego zwrotu z inwestycji.

Pierwszym pomysłem, jak wykorzystać dane do rozwiązania tego problemu, było sprawdzenie skąd pochodzą aktualni klienci nabywający produkt. Ich dane adresowe były w bazie dzięki prowadzonemu programowi lojalnościowemu. Przeprowadzono analizę profilu demograficzno-behawioralnego klientów kupujących flagowy artykuł – przedmiot kampanii. W stosunku do typowych klientów, grupa ta cechowała się nadreprezentacją grupy wiekowej 30-35 lat o ponad 10 punktów proc. wyższym udziałem mężczyzn i wyższymi dochodami. Założono, że szczególnie atrakcyjne z punktu widzenia planowanej kampanii będą rejony o ponadprzeciętnym udziale mieszkańców o takiej właśnie charakterystyce. Wytypowano zatem obszary (osiedla, dzielnice, gminy) na podstawie kilku źródeł danych. Pochodziły one m.in. z informacji udostępnianych publicznie przez Główny Urząd Statystyczny oraz oferowanych komercyjnie przez różnych dostawców prywatnych.

W obawie, że samo wskazanie miejsc zamieszkania klientów o podwyższonym zainteresowaniu nie wystarczy, potrzebne było bardziej precyzyjne oszacowanie potencjału sprzedażowego poszczególnych lokalizacji. Krótko mówiąc, szukano odpowiedzi na pytanie: na jaką sprzedaż możemy liczyć? W tym celu zbudowany został model predykcyjny, który był w stanie dla każdego obszaru wskazać przewidywaną przyszłą sprzedaż w dowolnie zdefiniowanym okresie. Model wykorzystywał m.in. takie zmienne, jak struktura wieku i płci w poszczególnych dystryktach, dochody na gospodarstwo domowe, czas dojazdu do punktu obsługi, zachowania zakupowe istniejących klientów z danej okolicy. Przeciętny błąd predykcji modelu wahał się w granicach +/- 6%.  Dla zilustrowania poziomu szczegółowości, z jaką model był w stanie wskazać lokalizacje poniższa tabela zawiera definicję dwóch topowych rekomendacji modelu predykcyjnego.

Obszary z największym potencjałem wskazane przez model zostały także zwizualizowane na mapach (przykład jednej z nich poniżej).

W celu dokonania oceny trafności rekomendacji modelu porównane zostały efekty przeprowadzonych działań w grupie 10 najlepszych miejsc wskazanych przez model z 10 lokalizacjami z miejsc 11-20 rankingu. Zwrot z inwestycji w grupie rekomendowanej przez model był o ponad 21% wyższy w stosunku do grupy porównawczej.

Data science w odpowiedni sposób, łącząc wewnętrzne i zewnętrzne źródła danych o różnym poziomie szczegółowości (dane dotyczące indywidualnego klienta z danymi zagregowanymi opisującymi całe obszary), może pomagać rozwiązywać różnorakie problemy, przed jakimi staje biznes. Tym samym przyczynia się do zwiększania zwrotu z inwestycji.

Jak dzięki data science optymalizować działania marketingowe?

Komunikacja mailowa to wciąż wiodący kanał bezpośredniego kontaktu z konsumentami. Istnieje wiele przykładów firm, które wykorzystując ten kanał, z powodzeniem zwiększają zaangażowanie konsumentów i obroty. Zbyt agresywne prowadzenie kampanii może powodować jednak spadek otwieralności i pozytywnych efektów maili.  Zbyt zachowawcze podejście do wykorzystania mailingów może uniemożliwić realizację pełnego potencjału zakupowego bazy konsumentów. Wraz z wzrastającą liczbą sprzedawanych produktów, coraz bardziej wyśrubowanymi oczekiwaniami klientów oraz coraz silniejszą konkurencją, optymalne planowanie kampanii staje się jeszcze większym wyzwaniem. Na szczęście data science może pomóc.

Recepta na sukces jest prosta. Trzeba wysyłać do konsumenta maksymalnie dużo wiadomości email, nie więcej i nie częściej jednak niż jest on w stanie znieść. Trzeba wysyłać do konsumenta wiadomości o potencjalnie najbardziej dochodowych produktach, nie takich jednak, które go zupełnie nie interesują. Wreszcie trzeba wysyłać wiadomości w odpowiednich momentach, zarówno pod względem preferencji konsumenta, jak i kalendarza kampanii i potrzeb „dopalenia” sprzedaży. No i dobrze byłoby nie informować klienta o produktach, które i tak zamierza kupić. Zasady są okrutnie proste. Dlaczego więc ich realizacja w praktyce bywa tak trudna?

Jak optymalizować działania marketingowe – przykład

Poszukując odpowiedzi na to pytanie, posłużymy się następującym bardzo uproszczonym z konieczności przykładem.  Firma sprzedaje trzy produkty A, B i C. Każdy z nich będzie przedmiotem kampanii, które realizowane będą w rozważanym 4-tygodniowym okresie.

Produkt A promowany będzie w tygodniu 23, produkt B we wszystkich tygodniach, a produkt C tylko w ostatnim 24 tygodniu. Najbardziej dochodowy dla firmy jest produkt C – każda sztuka to 250 zł marży. Dla produktu A i B jest to zaś odpowiednio 100 i 50 zł. Powyższe informacje podsumowane są w tabeli

Produkt / Tydzień kampanii21222324Zaysk jednostkowy
AX100
BXXXX50
CX250

Załóżmy też, że firma ma tylko 100 klientów i każdy z nich ma inne preferencje co do częstotliwości wysyłek. Przykładowo konsument nr 1 akceptuje częstotliwość nie większą niż raz na 2 tygodnie. Wysyłka do niego może być więc zrealizowana albo w tygodniach 21 i 23  bądź w 22 i 24 tygodniu. Konsument nr 2 jest nieco bardziej przewrażliwiony na punkcie częstotliwości komunikacji i już wysyłki częstsze niż raz na 4 tygodnie jest skłonny uznać za nadmierne  spamowanie.  Wysyłka do niego może być więc zrealizowana tylko w jednym z 4 tygodni itd.

Załóżmy wreszcie, że naszym celem jest maksymalizacja efektu dla całego czterotygodniowego okresu. Przez efekt zaś rozumiemy łączną wygenerowaną dzięki kampanii dodatkową sprzedaż. Zakładamy także, że w jednym tygodniu nie można wysłać do danego odbiorcy więcej niż jednej wiadomości. W tygodniach więc, w których prowadzone są więcej niż jedna kampania musimy wybrać, którą wyślemy. Nie wysyłamy też więcej niż jednej wiadomości dotyczącej danej kampanii do tego samego klienta.

Nawet przy tak skromnej bazie: 3 produkty, 4 tygodnie, 100 konsumentów mamy do podjęcia 24 x 3 x 100, czyli 4800 zerojedynkowych decyzji czy wysyłać danemu klientowi daną kampanię w danym tygodniu czy nie. Wystarczy, że dołożymy tylko jeszcze jeden produkt i rozszerzymy okres do 5 tygodni a liczba decyzji rośnie do 12800. Gdybyśmy chcieli optymalizować kalendarz dla kwartału (12 tygodni) przy tej samej liczbie produktów i klientów dochodzimy już do 1638400 kombinacji. A przecież mało która firma ma tylko 100 klientów i sprzedaje 4 produkty…

Widzimy więc, że liczba decyzji, które trzeba podjąć rośnie bardzo dynamicznie. Nawet dla tak małej bazy nie sposób podjąć tylu decyzji ręcznie.

Co więc w takiej sytuacji robimy? 

  1. Możemy zrezygnować z optymalizacji i wysyłać każdemu wszystko zawsze albo wybierać losowo.
  2. Możemy przyjąć metodę przybliżoną, która nie gwarantuje znalezienia optymalnego rozwiązania, ale daje szansę na znalezienie rozwiązania lepszego niż losowe. Przykładowo dla każdego konsumenta przypisujmy kolejno najbardziej dochodowe kampanie. Ten intuicyjny sposób nie gwarantuje wcale jednak osiągnięcia maksymalnego globalnego efektu. Być może, biorąc pod uwagę wszystkie ograniczenia jakie mamy, dla danego konsumenta lepiej byłoby zrezygnować z wysyłki najbardziej dochodowej kampanii i dzięki temu mieć możliwość wysłania mu dwóch nieco mniej dochodowych, które jednak w sumie przyniosą wyższy zysk.
  3. możemy skorzystać z programowania matematycznego i zaawansowanych silników optymalizujących aby znaleźć najlepszą możliwą kombinację wysyłek. Warto wiedzieć, że około 85% firm z listy Fortune 500 wykorzystuje tego rodzaju metody w swoich operacjach biznesowych. Przykładowe efekty jakie w obszarze optymalizacji kampanii mailowych były osiągane przy wdrożeniach takich rozwiązań:
  • ponad 30-procentowy wzrost wskaźnika open rate (dzięki optymalnej częstotliwości),
  • ponad 6-procentowy wzrost wartości sprzedaży w grupie targetowanej w optymalny sposób w stosunku do grupy targetowanej przy pomocy uproszczonych metod decyzyjnych,
  • blisko 50-procentowa oszczędność czasu i zasobów ludzkich przy planowaniu kampanii.

Podsumowanie

Na koniec warto wspomnieć, że w świecie, w którym oprócz mailingów wysyłamy także smsy oraz kontaktujemy się z klientami innymi kanałami liczba możliwych kombinacji decyzji jest jeszcze większa. Tym większe będą zatem korzyści z optymalizacji matematycznej. Unikniemy też sytuacji, w której z trudem ułożony ręcznie plan (a i tak nie optymalny) posypie się gdy trzeba będzie „tylko o tydzień” przesunąć jedną kampanię, a ze względu na problemy z dostawami pewnego produktu wolumen wiadomości z nim związanych trzeba będzie ograniczyć o 50%. Ludzki planista nie zdoła zmodyfikować w terminie planu, lub z dnia na dzień odejdzie z pracy. Odpowiednio napisany program optymalizacji matematycznej poradzi sobie z tym zadaniem w przeciągu minut lub godzin. Pozwoli przy tym osiągnąć maksymalny możliwy w danych warunkach i przy danych ograniczeniach zysk z kampanii.