Bol.com
Productonderzoek op bol.com: Van winkelwagen methode naar algoritme met MarktMentor
In de dynamische wereld van e-commerce is het cruciaal om toegang te hebben tot nauwkeurige en betrouwbare data, vooral als je productonderzoek op bol.com doet. Bij MarktMentor streven we ernaar om de meest waardevolle inzichten te leveren aan onze gebruikers. In deze blogpost onthullen we het proces achter onze dataverzameling, analyse, en hoe we onze algoritmen hebben geëvolueerd van de traditionele winkelwagenmethode naar geavanceerde algoritmische schattingen.
- Lars HurkmansMede-oprichter12 juli 2023Leestijd 10 minuten
Waarom MarktMentor is gestopt met de winkelwagenmethode voor productonderzoek op bol.com
MarktMentor begon oorspronkelijk, net zoals veel andere trackingtools, met het schatten van verkoopcijfers door middel van de welbekende winkelwagenmethode. Deze methode houdt in dat je op een bepaald moment bij een product kijkt wat de voorraadstand is, en dan op een later tijdstip de voorraad opnieuw meet. Door naar de verschillen te kijken, kun je een schatting maken van hoeveel stuks er van een product tussen de twee meetmomenten verkocht zijn.
Echter, de winkelwagenmethode kent een aantal beperkingen die het moeilijk maken om altijd accurate schattingen te maken:
- Verkopen buiten bol.com: Veel verkopers hebben een integraal voorraadsysteem van waaruit zij al hun verkopen beheren. Dit betekent dat de voorraadstand die je op bol.com ziet de totale voorraadstand is van hun product. Als verkopers dit product ook buiten bol.com verkopen, is het niet te achterhalen of een verkoop op bol.com heeft plaatsgevonden of daarbuiten.
- Voorraad boven de 500: Dit is een welbekend probleem bij tools die gebruik maken van de winkelwagenmethode op bol.com. Op bol.com kun je voorraden boven de 500 niet zien. Dit betekent dat het dus niet mogelijk is om te meten wat er gebeurt wanneer een product meer dan 500 stuks op voorraad heeft. Daarnaast is het zo dat er bepaalde productcategorieën zijn (zoals games) waarbij je maar een beperkt aantal producten tegelijk in je winkelwagen kunt hebben. Dit betekent dat het heel moeilijk is om verkopen voor deze producten in beeld te brengen op basis van de informatie over deze voorraden.
- Retours: Wanneer producten retour worden gestuurd en deze vervolgens als goed genoeg worden bevonden om opnieuw te verkopen, worden deze producten weer bij de voorraad gevoegd. Dit betekent dat hetzelfde product meerdere keren over de toonbank kan gaan. Dit geeft een overschatting van het totaal aantal keer dat een product verkocht is, zeker voor productgroepen met hoge retourpercentages.
- Veranderingen door de verkoper: Het is niet mogelijk om te zien of veranderingen in de winkelwagen het gevolg zijn van aanpassingen die de verkoper aan zijn voorraden heeft gedaan, als je alleen naar deze veranderingen kijkt. De verkoper kan bijvoorbeeld zelf producten uit voorraad halen, ze verplaatsen, of juist producten aan de voorraad toevoegen.
- Meerdere voorraadmutaties die kort achter elkaar plaatsvinden: Het is mogelijk dat de voorraad aangevuld wordt precies op het moment dat er ook verkopen plaatsvinden. In zo'n situatie blijft de netto voorraadstand ongewijzigd, ondanks dat er daadwerkelijk verkopen hebben plaatsgevonden.
Hoewel sommige van deze problemen kunnen worden geminimaliseerd door frequenter te meten, brengt dit weer andere uitdagingen met zich mee op het gebied van schaalbaarheid.
Schaalbaarheidsproblemen
Als je dagelijks honderdduizenden of zelfs miljoenen producten wilt volgen, wordt het uitdagend om meerdere keren per dag de voorraden te meten. Dit hangt samen met de omvang van de data, de complexiteit van de systemen en vooral de limieten die bol.com stelt aan het ophalen van voorraadgegevens van hun website. In feite belanden we in een soort kat-en-muisspel wanneer we proberen om op grote schaal en frequent de voorraadniveaus van producten op bol.com te meten. Dit komt door de beperkingen die bol.com oplegt aan het scrapen van hun website.
Scrapen is een proces waarbij geautomatiseerde programma's webpagina's 'lezen' en waardevolle informatie, zoals voorraadniveaus van producten, extraheren. Echter, om hun website te beschermen tegen overbelasting of misbruik, heeft bol.com maatregelen ingevoerd om excessief of intensief scrapen tegen te gaan. Als we dagelijks miljoenen producten willen volgen, vereist dit frequent scrapen, wat kan leiden tot extra aandacht van bol.com. Dit resulteert in een complex spel waarin we proberen onder de radar te blijven, terwijl we nog steeds de benodigde informatie verzamelen. Dit kan deels bereikt worden door technieken zoals IP-rotatie of 'rate limiting' toe te passen, maar deze oplossingen zijn verre van perfect.
Daarom, ondanks dat het technisch mogelijk is om de voorraden van miljoenen producten meerdere keren per dag te meten, maken de beperkingen van bol.com en het resulterende kat-en-muisspel dit in de praktijk zeer uitdagend. Dit betekent dat we mogelijk de frequentie van onze voorraadmetingen moeten verminderen om te voorkomen dat we door bol.com geblokkeerd worden. Dit heeft onvermijdelijk gevolgen voor de schaalbaarheid en frequentie van onze voorraadmetingen. In het kort: de winkelwagenmethode wordt onpraktisch wanneer je de verkoop van miljoenen producten wilt volgen. Om deze en andere redenen hebben we besloten om niet langer de winkelwagenmethode te gebruiken, maar over te stappen op een door onszelf ontwikkeld systeem dat gebaseerd is op algoritmische schattingen.
Daarnaast is het belangrijk om te benadrukken dat MarktMentor veel waarde hecht aan een goede verstandhouding met bol.com. Bol.com tolereert het scrapen van hun website tot op zekere hoogte, maar het intensieve gebruik van de winkelwagenmethode, zeker op grote schaal, wordt niet gewaardeerd. Dit kan de prestaties van hun website negatief beïnvloeden en de ervaring van andere gebruikers hinderen. Wij respecteren deze standpunten en hebben ervoor gekozen om hun beleid en wensen hierin te volgen. Doordat wij ons aan deze regels houden zijn wij ook zilveren bol.com partner kunnen worden.
Deze uitdagingen met betrekking tot schaalbaarheid en het respecteren van de wensen van bol.com, gecombineerd met de beperkingen van de winkelwagenmethode, hebben ons doen besluiten om over te stappen op een algoritmische aanpak voor het schatten van verkoopcijfers. Dit stelt ons in staat om op grote schaal schattingen te maken die we nooit zouden kunnen bereiken met de winkelwagenmethode.
Het algoritme van MarktMentor
Het algoritme van MarktMentor is gebouwd op basis van grote hoeveelheden data. Om deze data te verzamelen, hebben wij databronnen nodig. De databronnen die wij gebruiken zijn onder andere de Retailer API, Open API en Advertising API van bol.com. De informatie uit deze bronnen combineren wij met web scraping om aanvullende informatie te verkrijgen.
Nadat de data is verzameld, starten we met de grondige verwerking ervan. Dit betekent op de eerste plaats data wij de data moeten "cleanen", wat betekent dat wij mogelijke fouten of inconsistenties verwijderen. Vervolgens bereiden wij de data voor zodat die gebruik kan worden in onze algoritmes.
Onze volgende stap is de analyse van de gegevens met behulp van geavanceerde technieken zoals machine learning en regressiemodellen. Hiervoor gebruiken wij onder meer de volgende variabelen:
- Historische populariteitsposities voor Nederland & België
- Productcategorie
- Product offer informatie (prijs, levertijd) voor Nederland & België
- Weekdag
Op basis van onder andere deze databronnen wordt vervolgens een schatting gemaakt van de historische afzet. Hierbij gebruiken machine-learning technieken die vallen onder de categorie “supervised learning”, wat wilt zeggen dat wij ons model trainen op een dataset met echte afzetdata, met het doel om parameters te krijgen die in staat zijn schatten hoe veranderingen in de variabelen gebruikt kunnen worden om tot een afzetschatting te komen. In het algemeen betekent dit dan ook dat naarmate het model meer data ziet, de afzetschattingen zullen verbeteren. Wij testen de nauwkeurigheid van ons model dus ook op bestaande data.
Om de nauwkeurigheid van ons systeem te bepalen en op basis hiervan ons systeem te verbeteren, kijken wij zowel naar de productpopulatie als geheel, als naar geconditioneerde subpopulaties (die bepaald worden op basis van de gemiddelde historische afzet van producten). De nauwkeurigheid op basis van de gehele productpopulatie wordt gebruikt om de algemene parameters te optimaliseren, terwijl de nauwkeurigheid die betrekking heeft op de geconditioneerde subpopulaties gebruikt wordt om de nauwkeurigheid in specifieke situaties te verbeteren. Voor de geconditioneerde subpopulaties kijken wij naar de verschillende ordergroottes van producten (op basis van de gerealiseerde gemiddelde historische afzet) en optimaliseren de parameters aand de hand van iedere subpopulatie.
De nauwkeurigheid van de data van MarktMentor
Het is belangrijk om op te merken dat, hoewel ons nieuwe systeem een aanzienlijke verbetering is ten opzichte van de winkelwagenmethode, geen enkel schattingsmodel perfect is. Daarom is het belangrijk om de nauwkeurigheid van onze schattingen te begrijpen.
Voor 80% van onze producten hebben we een maximale foutmarge van 25%. Dit betekent dat voor 80% van de producten onze schatting van de verkoop binnen een bereik van 25% van de werkelijke verkoop ligt. Dit kunnen wij het beste illustreren aan de hand van een voorbeeld.
Stel je voor dat je een e-commerce winkel runt die verschillende soorten producten verkoopt, zoals kleding, elektronica en boeken. Je moet regelmatig een schatting maken van hoeveel van elk product je in de toekomst gaat verkopen om je voorraad effectief te kunnen beheren.
Echter, deze schattingen zijn niet altijd perfect. Soms schat je bijvoorbeeld dat je 100 paar schoenen gaat verkopen, maar uiteindelijk verkoop je er maar 80. Dit betekent dat er een verschil is tussen je schatting en de daadwerkelijke verkoop, ook wel een foutmarge genoemd. In dit geval is de foutmarge 20 paar schoenen, of uitgedrukt in procenten, 20% (omdat 20 van de 100 geschatte paar schoenen niet zijn verkocht).
Je doet dit voor elk product dat je verkoopt, waardoor je uiteindelijk met een hele lijst aan foutmarges voor al je producten komt te zitten. Wanneer je deze foutmarges van laag naar hoog sorteert, blijkt dat bij 80% van je producten de foutmarge 25% of minder is. Dat wil zeggen, voor deze 80% van je producten was je schatting van de verkoop binnen een bereik van 25% van de werkelijke verkoop.
Bijvoorbeeld, als je 100 verschillende soorten producten op je website verkoopt, was je schatting voor 80 van die producten binnen 25% van de daadwerkelijke verkoop. Bij de overige 20 producten was het verschil tussen je schatting en de daadwerkelijke verkoop groter dan 25%. Dit laat zien dat je schattingssysteem vrij nauwkeurig is voor het merendeel van de producten die je verkoopt.
Hoe kun je de afzetata van MarktMentor het beste interpreteren
Het is belangrijk om te onthouden dat de afzetdata die wij in onze productonderzoek features geven schattingen zijn. De algoritmes zijn zo ingericht en geoptimaliseerd dat zij een goede indruk geven van wat de ordergrootte van een product is. De data kan dus gebruikt worden om een goede indicatie te krijgen hoeveel vraag er is naar producten op bol.com.
Voor 80% van onze producten is de foutmarge beperkt tot 25%. Dat wil zeggen: we slagen er meestal in om vrij dicht bij de daadwerkelijke verkoopcijfers te komen. Maar let op, het kan voorkomen dat we voor een specifiek product op een bepaald moment meer dan 25% afwijken van de werkelijkheid.
Om de meest waardevolle inzichten te verkrijgen, adviseren we je om de data op verschillende manieren te onderzoeken:
- Bekijk verkoopcijfers over tijd: In het Productoverzicht kun je wekelijkse verkoopschattingen bekijken. Dit biedt gedetailleerde informatie die je helpt om de prestaties van een product beter te begrijpen.
- Kijk naar meerdere soortgelijke producten: Met behulp van onze 'Product Radar' kun je diverse producten opnemen in je analyse. Door meer producten van een soortgelijke aard te bestuderen, krijg je een algemener beeld van de verkoopprestaties van dat producttype.
Houd er rekening mee dat we de verkoopgegevens dagelijks bijwerken. Dit betekent dat de informatie in de Product Database voortdurend verandert. Ook in het geval dat je onze Chrome-extensie gebruikt, worden de gegevens daar elke dag bijgewerkt. Het is dus van essentieel belang om niet alleen te focussen op maandcijfers, die binnen een paar dagen aanzienlijk kunnen veranderen. Kijk daarom ook naar data over langere perioden, zoals de afgelopen drie maanden of het afgelopen jaar.
Conclusie
In deze blogpost hebben we de vernieuwende benadering van bol.com op het gebied van productonderzoek met MarktMentor belicht. We zijn overgestapt van de traditionele winkelwagenmethode naar een algoritmische aanpak, waarbij gebruik wordt gemaakt van geavanceerde technieken zoals machine learning en regressiemodellen. Hoewel er een zekere foutmarge in onze schattingen zit, blijkt ons nieuwe systeem significant beter dan de voorgaande methodes. We zijn constant bezig met het verfijnen van onze methodes om waardevolle en nauwkeurige inzichten te bieden. Bedankt voor het lezen en blijf op de hoogte voor meer inzichten van MarktMentor!
Veelgestelde vragen
Waarom laten jullie geen echte afzet zien?
Om de exacte afzet van een product te kennen, zou je de bestellingen van een product moeten bijhouden en de retouren ervan aftrekken. Helaas hebben we geen toegang tot deze specifieke gegevens. Bovendien, zelfs als we dat wel hadden, zouden we vanwege privacyoverwegingen deze informatie niet openbaar maken. We maken gebruik van slimme algoritmes om een zo nauwkeurig mogelijke inschatting te maken van de verkoopcijfers van een product.
Waarom wijkt jullie data af van Boloo of Rylee?
Onze benadering van het schatten van afzet is gebaseerd op algoritmes, wat verschilt van de aanpak van Boloo en Rylee die de winkelwagenmethode gebruiken. We hebben in het verleden ook de winkelwagenmethode gebruikt, maar ontdekten dat deze methode aan nauwkeurigheid inboet wanneer je op grote schaal (bijvoorbeeld honderdduizenden of miljoenen producten) probeert bij te houden. Daarom zijn we overgestapt naar een algoritmische methode om verkoopcijfers te schatten, waardoor we een hogere nauwkeurigheid hebben bereikt dan met de winkelwagenmethode mogelijk was.
Voorspellen jullie hoeveel een product in de toekomst gaat verkopen?
We voorspellen niet hoeveel een product in de toekomst zal verkopen. Wat we wel doen, is schattingen geven van hoeveel een product in het verleden heeft verkocht.