Retentiepercentage wordt gedefinieerd als het aantal klanten dat een product/dienst blijft gebruiken. Het is moeilijk om een cohortretentieanalyse te berekenen. Hier leest u hoe u de retentiegraad in SQL kunt berekenen voor analyse van klantretentie. U kunt het gebruiken om de retentiegraad in MySQL, PostgreSQL, SQL Server en Oracle te berekenen. We zullen ook kijken naar de SQL-query voor klantbehoud. Het retentiepercentage wordt gemeten als het aantal terugkerende gebruikers, met een regelmatig interval, zoals elke week of maand, gegroepeerd op de week van aanmelding.
We berekenen de retentie per wekelijkse cohort in SQL en eindigen met een tabel zoals hieronder, die het aantal klanten weergeeft dat opnieuw heeft ingelogd nadat ze zich een paar weken geleden voor het eerst hadden aangemeld, voor elke week van aanmelding.
Hoe de retentiegraad in SQL berekenen?
Hier zijn de stappen om de retentiegraad in SQL te berekenen. Stel dat u de volgende tabel heeft waarin user_id en login_date van het bezoek van elke gebruiker zijn opgeslagen.
mysql> create table login(login_date date,user_id int, id int not null auto_increment, primary key (id)); mysql> insert into login(login_date,user_id) values('2020-01-01',10),('2020-01-02',12),('2020-01-03',15), ('2020-01-04',11),('2020-01-05',13),('2020-01-06',9), ('2020-01-07',21),('2020-01-08',10),('2020-01-09',10), ('2020-01-10',2),('2020-01-11',16),('2020-01-12',12), ('2020-01-13',10),('2020-01-14',18),('2020-01-15',15), ('2020-01-16',12),('2020-01-17',10),('2020-01-18',18), ('2020-01-19',14),('2020-01-20',16),('2020-01-21',12), ('2020-01-22',21),('2020-01-23',13),('2020-01-24',15), ('2020-01-25',20),('2020-01-26',14),('2020-01-27',16), ('2020-01-28',15),('2020-01-29',10),('2020-01-30',18); mysql> select * from login; +------------+---------+----+ | login_date | user_id | id | +------------+---------+----+ | 2020-01-01 | 10 | 1 | | 2020-01-02 | 12 | 2 | | 2020-01-03 | 15 | 3 | | 2020-01-04 | 11 | 4 | | 2020-01-05 | 13 | 5 | | 2020-01-06 | 9 | 6 | | 2020-01-07 | 21 | 7 | | 2020-01-08 | 10 | 8 | | 2020-01-09 | 10 | 9 | | 2020-01-10 | 2 | 10 | | 2020-01-11 | 16 | 11 | | 2020-01-12 | 12 | 12 | | 2020-01-13 | 10 | 13 | | 2020-01-14 | 18 | 14 | | 2020-01-15 | 15 | 15 | | 2020-01-16 | 12 | 16 | | 2020-01-17 | 10 | 17 | | 2020-01-18 | 18 | 18 | | 2020-01-19 | 14 | 19 | | 2020-01-20 | 16 | 20 | | 2020-01-21 | 12 | 21 | | 2020-01-22 | 21 | 22 | | 2020-01-23 | 13 | 23 | | 2020-01-24 | 15 | 24 | | 2020-01-25 | 20 | 25 | | 2020-01-26 | 14 | 26 | | 2020-01-27 | 16 | 27 | | 2020-01-28 | 15 | 28 | | 2020-01-29 | 10 | 29 | | 2020-01-30 | 18 | 30 | +------------+---------+----+
We zullen een wekelijkse cohortanalyse maken. Afhankelijk van uw product/dienst kunt u dit wijzigen in maandelijks/dagelijks.
We zullen MySQL gebruiken om de retentiegraad in SQL te berekenen. U kunt ook het verlooppercentage voor PostgreSQL berekenen.
1. Emmerbezoeken per week
Om de retentiegraad in SQL te berekenen, groeperen we eerst elk bezoek op de week van inloggen.
mysql> SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date); +---------+------------+ | user_id | login_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 10 | 1 | | 10 | 2 | | 10 | 4 | | 11 | 0 | | 12 | 0 | | 12 | 2 | | 12 | 3 | | 13 | 1 | | 13 | 3 | | 14 | 3 | | 14 | 4 | | 15 | 0 | | 15 | 2 | | 15 | 3 | | 15 | 4 | | 16 | 1 | | 16 | 3 | | 16 | 4 | | 18 | 2 | | 18 | 4 | | 20 | 3 | | 21 | 1 | | 21 | 3 | +---------+------------+
Bekijk ook Hoe bereken je wekelijks actieve gebruikers (WAU) in MySQL.
2. Bereken de EERSTE WEEK van aanmelding voor elke gebruiker
Om vervolgens de retentiegraad in SQL te berekenen, moeten we de eerste week van inloggen voor elke gebruiker berekenen. We gebruiken gewoon de MIN-functie en GROUP BY om de eerste inlogweek voor elke gebruiker te berekenen
mysql> SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id; +---------+------------+ | user_id | first_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 11 | 0 | | 12 | 0 | | 13 | 1 | | 14 | 3 | | 15 | 0 | | 16 | 1 | | 18 | 2 | | 20 | 3 | | 21 | 1 | +---------+------------+
3. Voeg de 2 tabellen samen voor login_week en first_week
Vervolgens krijgen we login_week en first_week naast elkaar voor elke gebruiker met behulp van de onderstaande query, met een INNER JOIN, om de retentiegraad in SQL te berekenen.
mysql> select a.user_id,a.login_week,b.first_week as first_week from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+ | user_id | login_week | first_week | +---------+------------+------------+ | 2 | 1 | 1 | | 9 | 1 | 1 | | 10 | 0 | 0 | | 10 | 1 | 0 | | 10 | 2 | 0 | | 10 | 4 | 0 | | 11 | 0 | 0 | | 12 | 0 | 0 | | 12 | 2 | 0 | | 12 | 3 | 0 | | 13 | 1 | 1 | | 13 | 3 | 1 | | 14 | 3 | 3 | | 14 | 4 | 3 | | 15 | 0 | 0 | | 15 | 2 | 0 | | 15 | 3 | 0 | | 15 | 4 | 0 | | 16 | 1 | 1 | | 16 | 3 | 1 | | 16 | 4 | 1 | | 18 | 2 | 2 | | 18 | 4 | 2 | | 20 | 3 | 3 | | 21 | 1 | 1 | | 21 | 3 | 1 | +---------+------------+------------+
4. Bereken weeknummer
Vanaf hier is het eenvoudig om de retentiegraad in SQL te berekenen. Vervolgens berekenen we het verschil tussen login_week en first_week om week_number (aantal weken) te berekenen
mysql> select a.user_id,a.login_week,b.first_week as first_week, a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+-------------+ | user_id | login_week | first_week | week_number | +---------+------------+------------+-------------+ | 2 | 1 | 1 | 0 | | 9 | 1 | 1 | 0 | | 10 | 0 | 0 | 0 | | 10 | 1 | 0 | 1 | | 10 | 2 | 0 | 2 | | 10 | 4 | 0 | 4 | | 11 | 0 | 0 | 0 | | 12 | 0 | 0 | 0 | | 12 | 2 | 0 | 2 | | 12 | 3 | 0 | 3 | | 13 | 1 | 1 | 0 | | 13 | 3 | 1 | 2 | | 14 | 3 | 3 | 0 | | 14 | 4 | 3 | 1 | | 15 | 0 | 0 | 0 | | 15 | 2 | 0 | 2 | | 15 | 3 | 0 | 3 | | 15 | 4 | 0 | 4 | | 16 | 1 | 1 | 0 | | 16 | 3 | 1 | 2 | | 16 | 4 | 1 | 3 | | 18 | 2 | 2 | 0 | | 18 | 4 | 2 | 2 | | 20 | 3 | 3 | 0 | | 21 | 1 | 1 | 0 | | 21 | 3 | 1 | 2 | +---------+------------+------------+-------------+
5. Draai het resultaat
Ten slotte moeten we het resultaat draaien, de retentiegraad in SQL berekenen en een cohorttabel genereren. In onze draaitabel hebben we één rij voor elke first_week waarde, en één kolom voor elk week_nummer met daarin het aantal gebruikers dat na ‘n’ weken terug is om uw product/dienst te gebruiken. Hiervoor gebruiken we de volgende query.
mysql> select first_week, SUM(CASE WHEN week_number = 0 THEN 1 ELSE 0 END) AS week_0, SUM(CASE WHEN week_number = 1 THEN 1 ELSE 0 END) AS week_1, SUM(CASE WHEN week_number = 2 THEN 1 ELSE 0 END) AS week_2, SUM(CASE WHEN week_number = 3 THEN 1 ELSE 0 END) AS week_3, SUM(CASE WHEN week_number = 4 THEN 1 ELSE 0 END) AS week_4, SUM(CASE WHEN week_number = 5 THEN 1 ELSE 0 END) AS week_5, SUM(CASE WHEN week_number = 6 THEN 1 ELSE 0 END) AS week_6, SUM(CASE WHEN week_number = 7 THEN 1 ELSE 0 END) AS week_7, SUM(CASE WHEN week_number = 8 THEN 1 ELSE 0 END) AS week_8, SUM(CASE WHEN week_number = 9 THEN 1 ELSE 0 END) AS week_9 from ( select a.user_id,a.login_week,b.first_week as first_week,a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a,(SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id ) as with_week_number group by first_week order by first_week; +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | first_week | week_0 | week_1 | week_2 | week_3 | week_4 | week_5 | week_6 | week_7 | week_8 | week_9 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | 0 | 4 | 1 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | | 1 | 5 | 0 | 3 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | | 2 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 3 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+
Nu weten we hoe we de retentiegraad in SQL kunnen berekenen. U kunt ook de bovenstaande vragen gebruiken om de retentiegraad in MySQL, PostgreSQL te berekenen.
Ten slotte kunt u een tool voor gegevensvisualisatie gebruiken om de bovenstaande retentiecohortanalyse in een tabel uit te zetten. Hier is een cohortretentietabel gemaakt met Ubiq.
Trouwens, als je draaitabellen, grafieken en dashboards wilt maken vanuit de MySQL-database, kun je Ubiq proberen. We bieden een gratis proefperiode van 14 dagen aan.