Blog

Jak rozwijać sieć sprzedaży
z pomocą data science

Dodano:
Autor:
30 czerwca 2021
Daniel Szulc

Kanał stacjonarny w zdecydowanej większość branż odgrywa kluczową rolę. Mimo obserwowanego dynamicznego wzrostu udziału e-commerce, nie zmieni się to w najbliższych latach. Otwarcie nowego punktu sprzedaży pociąga za sobą zazwyczaj konieczność znacznych inwestycji związanych z budową lub najmem i adaptacją lokalu, rekrutacją pracowników, a także ze zmianami w logistyce sieci. Dodatkowo istotny jest potencjalny negatywny wpływ nowego punktu na już istniejące. Dlatego decyzje o poszerzaniu sieci sprzedaży wiążą się z dużym ryzykiem. W dzisiejszym artykule pokażemy, w jaki sposób data science w połączeniu z danymi geoprzestrzennymi może pomóc w ograniczeniu tego ryzyka i ułatwić podejmowanie lepszych decyzji.

Kluczowe pytania

W kontekście lokalizacji punktów sprzedaży pytania, na jakie data science może pomóc znaleźć odpowiedź, to m.in.:

1) Czy to dobre miejsce na otwarcie nowego sklepu?

2) Czy nowy sklep nie będzie „kanibalizował” sprzedaży moich istniejących sklepów?

3) Jak dużo sklepów powinienem otworzyć, gdzie powinien je otwierać, jak powinna wyglądać optymalna sieć?

4)Które sklepy powinienem zamknąć? Jaki będzie efekt netto zamknięcia sklepu?

5) Czy istniejący sklep wykorzystuje potencjał swojej lokalizacji?

6) Czy jeśli nie otworzę sklepu w danym miejscu, ale zrobi to konkurencja, to wpłynie to negatywnie na moje istniejące sklepy? Na które? Jak bardzo?

Dzisiaj chciałbym skupić my się na dwóch pierwszych pytaniach i pokazać, w jaki sposób analiza danych pomoże podjąć właściwe decyzje.

Dane, dane, dane…

Na początek warto poświecić chwilę na przyjrzenie się źródłom danym, które wykorzystujemy w analizie. Można podzielić je na dane wewnętrzne i konieczne do pozyskania na zewnątrz. Do kluczowych danych wewnętrznych należą:

– historyczne dane sprzedażowe,

– charakterystyka punktów (powierzchnia, charakter lokalizacji – galeria, samodzielny lokal itd., zakres dostępnego asortymentu),

– lokalna aktywność (promocje, obecność w mediach, ulotki, gazetki, bilboardy),

– dane adresowe punktów.

Dane, które trzeba pozyskać z zewnątrz to przede wszystkim:

– dotyczące populacji, charakterystyki demograficznej (rozkład grup wiekowych, płci), dochodów i siły nabywczej,

– o sieci dróg, ich jakości/klasie i natężeniu ruchu,

– geolokalizacja punktów konkurencji,

– czas dojazdu do punktów własnych i konkurencji różnymi środkami lokomocji (w zależności od charakteru i gęstości sieci sprzedaży istotne mogą być różne sposoby transportu).

– czas dojazdu do punktów własnych i konkurencji różnymi środkami lokomocji (w zależności od charakteru i gęstości sieci sprzedaży istotne mogą być różne sposoby transportu).

Niektóre dane mogą być dostępne tylko na poziomie całej gminy (szczególnie dane z Głównego Urzędu Statystycznego). Jednak tam, gdzie to możliwe należy wykorzystywać dane o jak największej ziarnistości. Istnieją źródła, z których można pozyskać dane dla poszczególnych punktów adresowych (konkretnych bloków).

Przy analizie i prezentacji danych rozsądnym kompromisem pomiędzy szczegółem a ogółem może być tzw. siatka kilometrowa. Mapa jest wtedy dzielona na kwadraty o boku długości 1km. Przykłady takich właśnie map będą pojawiać się w dalszej części artykułu.

Dlaczego dokładne dane geograficzne są istotne?

Poniżej zobrazowany został prosty przykład różnic we wnioskach, do jakich można dojść w zależności od danych, jakie są do dyspozycji. Mapa po lewej stronie pokazuje odległość od sklepu (do 20 km). Jest to bardzo prosta do wyliczenia miara. Mogłoby się wydawać, że będzie wystarczającym przybliżeniem czasu dotarcia do sklepu. Niestety, jak widać na mapie po prawej stronie, uwzględnienie samej odległości od sklepu wprowadza nas w błąd. Dopiero pokazanie rzeczywistego czasu dojazdu na mapie pokazuje realny obraz zasięgu sklepu. Można zauważyć, że zasięg sklepu rozciąga się wzdłuż ciągów komunikacyjnych (w tym przykładzie rozchodzących się promieniście). Obszary leżące blisko siebie w rzeczywistości mogą cechować się różnym czasem dojazdu. Zbyt duże uproszczenie i rezygnacja z dokładnych danych geograficznych prowadzi do niepoprawnego oszacowania potencjału sklepu i potencjalnie błędnych decyzji.

W jakim kierunku opłaca się rozwijać sieć?

Przeanalizujemy teraz przykład sieci składającej się aktualnie z 4 sklepów. Na mapie poniżej widać ich zasięg. Z każdego obszaru (kwadratu) obliczony został czas dojazdu do najbliższego sklepu. Kierownictwo rozważa różne scenariusze dalszego rozwoju. Jednym z nich jest uzupełnienie „białych plam” w zasięgu sieci. Taki ruch może być interesujący z co najmniej dwóch względów. Po pierwsze na tym obszarze znajduje się miejscowość o, jak się wydaje, potencjale demograficznym, w której można by zlokalizować nowy punkt sprzedaży. Po drugie nowy sklep utworzony pomiędzy już istniejącymi można idealnie wpasować w istniejący łańcuch logistyczny.

W celu oparcia decyzji o dane zostaje przeprowadzona estymacja potencjału nowego sklepu oraz zasymulowany zostaje jego wpływ na dotychczasową sieć.

Mapa po lewej stronie pokazuje zasięg sklepów przed rozszerzeniem. Obszary zostały przypisane do sklepu o najkrótszym czasie dojazdu. Mapa po prawej stronie ilustruje, w jaki sposób zmieni się zasięg istniejących lokalizacji po poszerzeniu sieci oraz jaki będzie zasięg nowego punktu. Widać wyraźnie, że ogólny zasięg sieci zostanie rozszerzony o nowe obszary. Można też zauważyć, że obszary wszystkich z wyjątkiem jednego z dotychczasowych sklepów zostaną nieco uszczuplone. Do podjęcia decyzji nie wystarczy jednak wzrokowa ocena i analiza mapy. Potrzeba precyzyjnych prognoz. Tylko dokładne liczby pozwolą oszacować opłacalność rozważanej inwestycji.

Model predykcyjny

Z pomocą przychodzi model predykcyjny zbudowany w oparciu o uczenie maszynowe. Wykorzystując szeroki zakres dostępnych danych (sprzedażowych, demograficznych, geograficznych), model pozwala na precyzyjną estymację potencjału nowego sklepu i jego wpływu na istniejące punkty. Wykres poniżej przedstawia wyniki modelowania. Jego lewy słupek (‘Dotychczasowa sieć’) przedstawia poziom bazowy, czyli prognozowany poziom sprzedaży całej sieci, gdyby nowy sklep nie został uruchomiony. Kolejny słupek to estymacja sprzedaży w nowym punkcie. Wynik pokazuje, że zwiększy on potencjał sieci. Jednak w porównaniu z innymi, jego wkład będzie relatywnie niższy.

Nowy punkt zwiększy obroty sieci o około 12%. Kolejne słupki pokazują kanibalizację sprzedaży w dotychczasowych punktach. Tak jak przypuszczaliśmy, podczas analizy map, kanibalizacja dotknie 3 z 4 sklepów. Może się wydawać, że żaden sklep nie ucierpi znacząco – przeciętnie zaledwie o około 6% obrotu. Jednak będzie ona stanowiła aż 54% sprzedaży nowego punktu. Zatem większość obrotu nowego sklepu realizowałaby się kosztem dotychczasowych sklepów, a inkrementalny wpływ nowego punktu na łączne obroty sieci wyniósłby tylko około 5%.

Podsumowanie

Ostateczna decyzja o opłacalności inwestycji w otwarcie sklepu w rozważanym miejscu wymaga zestawienia inkrementalnych obrotów (i marży) z koniecznymi nakładami i kosztami działalności. W związku z tym analizę powinno rozszerzyć się także o prognozę marży. Bez tego mogłoby się okazać, że nowy sklep będzie różnił się od dotychczasowych pod względem typowego koszyka produktów, a co za tym idzie ich marżowości. Z pewnością warto rozważyć inne potencjalne lokalizacje, gdyż uzyskany w nich zwrot z inwestycji mógłby okazać się wyższy. Dodatkowo należałoby wziąć pod uwagę także możliwe działania potencjalnej konkurencji. Najwłaściwszym kierunkiem działania byłoby przeprowadzenie kompleksowej analizy i symulacji obejmującej wiele potencjalnych lokalizacji.

Nowoczesne metody optymalizacyjne, jakie na co dzień wykorzystujemy przy projektach w Data Science Logic, pozwalają na symulację wielu równoległych scenariuszy i znalezienie optymalnego kształtu sieci. Dzięki temu modele są w stanie wskazać, które lokalizacje warto otworzyć, a które należy zamknąć. Ostateczne decyzje zawsze należą do ludzi, jednak precyzyjne dane w połączeniu z odpowiednimi metodami ich analizy mogą pomóc je podjąć.