Степента на задържане се определя като броя на клиентите, които продължават да използват продукт/услуга. Трудно е да се изчисли кохортният анализ на задържането. Ето как да изчислите степента на задържане в SQL за анализ на задържането на клиенти. Можете да го използвате за изчисляване на степента на задържане в MySQL, PostgreSQL, SQL Server &Oracle. Ще разгледаме и SQL заявката за задържане на клиенти. Степента на задържане се измерва като броя на завърналите се потребители на редовен интервал, като например всяка седмица или месец, групирани по седмицата на регистрация.
Ще изчислим задържането по седмична кохорта в SQL и в крайна сметка ще получим таблица като тази по-долу, която показва броя на клиентите, които са влезли отново след първата регистрация преди няколко седмици, за всяка седмица на регистрация.
Как да изчислим степента на задържане в SQL?
Ето стъпките за изчисляване на степента на задържане в SQL. Да приемем, че имате следната таблица, която съхранява user_id и login_date на посещението на всеки потребител.
mysql> create table login(login_date date,user_id int, id int not null auto_increment, primary key (id)); mysql> insert into login(login_date,user_id) values('2020-01-01',10),('2020-01-02',12),('2020-01-03',15), ('2020-01-04',11),('2020-01-05',13),('2020-01-06',9), ('2020-01-07',21),('2020-01-08',10),('2020-01-09',10), ('2020-01-10',2),('2020-01-11',16),('2020-01-12',12), ('2020-01-13',10),('2020-01-14',18),('2020-01-15',15), ('2020-01-16',12),('2020-01-17',10),('2020-01-18',18), ('2020-01-19',14),('2020-01-20',16),('2020-01-21',12), ('2020-01-22',21),('2020-01-23',13),('2020-01-24',15), ('2020-01-25',20),('2020-01-26',14),('2020-01-27',16), ('2020-01-28',15),('2020-01-29',10),('2020-01-30',18); mysql> select * from login; +------------+---------+----+ | login_date | user_id | id | +------------+---------+----+ | 2020-01-01 | 10 | 1 | | 2020-01-02 | 12 | 2 | | 2020-01-03 | 15 | 3 | | 2020-01-04 | 11 | 4 | | 2020-01-05 | 13 | 5 | | 2020-01-06 | 9 | 6 | | 2020-01-07 | 21 | 7 | | 2020-01-08 | 10 | 8 | | 2020-01-09 | 10 | 9 | | 2020-01-10 | 2 | 10 | | 2020-01-11 | 16 | 11 | | 2020-01-12 | 12 | 12 | | 2020-01-13 | 10 | 13 | | 2020-01-14 | 18 | 14 | | 2020-01-15 | 15 | 15 | | 2020-01-16 | 12 | 16 | | 2020-01-17 | 10 | 17 | | 2020-01-18 | 18 | 18 | | 2020-01-19 | 14 | 19 | | 2020-01-20 | 16 | 20 | | 2020-01-21 | 12 | 21 | | 2020-01-22 | 21 | 22 | | 2020-01-23 | 13 | 23 | | 2020-01-24 | 15 | 24 | | 2020-01-25 | 20 | 25 | | 2020-01-26 | 14 | 26 | | 2020-01-27 | 16 | 27 | | 2020-01-28 | 15 | 28 | | 2020-01-29 | 10 | 29 | | 2020-01-30 | 18 | 30 | +------------+---------+----+
Ще създаваме седмичен кохортен анализ. В зависимост от вашия продукт/услуга можете да го промените на месечен/дневен.
Ще използваме MySQL за изчисляване на степента на задържане в SQL. Можете също така да изчислите степента на отказ за PostgreSQL.
1. Посещения по седмица
За да изчислим степента на задържане в SQL, първо ще групираме всяко посещение по седмицата на влизане.
mysql> SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date); +---------+------------+ | user_id | login_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 10 | 1 | | 10 | 2 | | 10 | 4 | | 11 | 0 | | 12 | 0 | | 12 | 2 | | 12 | 3 | | 13 | 1 | | 13 | 3 | | 14 | 3 | | 14 | 4 | | 15 | 0 | | 15 | 2 | | 15 | 3 | | 15 | 4 | | 16 | 1 | | 16 | 3 | | 16 | 4 | | 18 | 2 | | 18 | 4 | | 20 | 3 | | 21 | 1 | | 21 | 3 | +---------+------------+
Вижте също Как се изчисляват седмично активни потребители (WAU) в MySQL.
2. Изчислете ПЪРВАТА СЕДМИЦА от влизане за всеки потребител
След това, за да изчислим степента на задържане в SQL, трябва да изчислим първата седмица от влизане за всеки потребител. Просто ще използваме функцията MIN и GROUP BY, за да изчислим първата седмица за влизане за всеки потребител
mysql> SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id; +---------+------------+ | user_id | first_week | +---------+------------+ | 2 | 1 | | 9 | 1 | | 10 | 0 | | 11 | 0 | | 12 | 0 | | 13 | 1 | | 14 | 3 | | 15 | 0 | | 16 | 1 | | 18 | 2 | | 20 | 3 | | 21 | 1 | +---------+------------+
3. Обединете 2-те таблици за login_week и first_week
След това получаваме login_week и first_week един до друг за всеки потребител, използвайки заявката по-долу, с INNER JOIN, за да изчислим степента на задържане в SQL.
mysql> select a.user_id,a.login_week,b.first_week as first_week from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+ | user_id | login_week | first_week | +---------+------------+------------+ | 2 | 1 | 1 | | 9 | 1 | 1 | | 10 | 0 | 0 | | 10 | 1 | 0 | | 10 | 2 | 0 | | 10 | 4 | 0 | | 11 | 0 | 0 | | 12 | 0 | 0 | | 12 | 2 | 0 | | 12 | 3 | 0 | | 13 | 1 | 1 | | 13 | 3 | 1 | | 14 | 3 | 3 | | 14 | 4 | 3 | | 15 | 0 | 0 | | 15 | 2 | 0 | | 15 | 3 | 0 | | 15 | 4 | 0 | | 16 | 1 | 1 | | 16 | 3 | 1 | | 16 | 4 | 1 | | 18 | 2 | 2 | | 18 | 4 | 2 | | 20 | 3 | 3 | | 21 | 1 | 1 | | 21 | 3 | 1 | +---------+------------+------------+
4. Изчислете номер на седмица
От тук нататък е лесно да се изчисли степента на задържане в SQL. След това изчисляваме разликата между login_week и first_week, за да изчислим week_number (броя на седмицата)
mysql> select a.user_id,a.login_week,b.first_week as first_week, a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a, (SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id; +---------+------------+------------+-------------+ | user_id | login_week | first_week | week_number | +---------+------------+------------+-------------+ | 2 | 1 | 1 | 0 | | 9 | 1 | 1 | 0 | | 10 | 0 | 0 | 0 | | 10 | 1 | 0 | 1 | | 10 | 2 | 0 | 2 | | 10 | 4 | 0 | 4 | | 11 | 0 | 0 | 0 | | 12 | 0 | 0 | 0 | | 12 | 2 | 0 | 2 | | 12 | 3 | 0 | 3 | | 13 | 1 | 1 | 0 | | 13 | 3 | 1 | 2 | | 14 | 3 | 3 | 0 | | 14 | 4 | 3 | 1 | | 15 | 0 | 0 | 0 | | 15 | 2 | 0 | 2 | | 15 | 3 | 0 | 3 | | 15 | 4 | 0 | 4 | | 16 | 1 | 1 | 0 | | 16 | 3 | 1 | 2 | | 16 | 4 | 1 | 3 | | 18 | 2 | 2 | 0 | | 18 | 4 | 2 | 2 | | 20 | 3 | 3 | 0 | | 21 | 1 | 1 | 0 | | 21 | 3 | 1 | 2 | +---------+------------+------------+-------------+
5. Завъртете резултата
И накрая, трябва да завъртим резултата, да изчислим степента на задържане в SQL и да генерираме кохортна таблица. В нашата обобщена таблица ще имаме един ред за всяка първа_седмица стойност и една колона за всеки номер_седмица съдържащ броя на потребителите, които са се върнали след „n“ седмици, за да използват вашия продукт/услуга. За това използваме следната заявка.
mysql> select first_week, SUM(CASE WHEN week_number = 0 THEN 1 ELSE 0 END) AS week_0, SUM(CASE WHEN week_number = 1 THEN 1 ELSE 0 END) AS week_1, SUM(CASE WHEN week_number = 2 THEN 1 ELSE 0 END) AS week_2, SUM(CASE WHEN week_number = 3 THEN 1 ELSE 0 END) AS week_3, SUM(CASE WHEN week_number = 4 THEN 1 ELSE 0 END) AS week_4, SUM(CASE WHEN week_number = 5 THEN 1 ELSE 0 END) AS week_5, SUM(CASE WHEN week_number = 6 THEN 1 ELSE 0 END) AS week_6, SUM(CASE WHEN week_number = 7 THEN 1 ELSE 0 END) AS week_7, SUM(CASE WHEN week_number = 8 THEN 1 ELSE 0 END) AS week_8, SUM(CASE WHEN week_number = 9 THEN 1 ELSE 0 END) AS week_9 from ( select a.user_id,a.login_week,b.first_week as first_week,a.login_week-first_week as week_number from (SELECT user_id, week(login_date) AS login_week FROM login GROUP BY user_id,week(login_date)) a,(SELECT user_id, min(week(login_date)) AS first_week FROM login GROUP BY user_id) b where a.user_id=b.user_id ) as with_week_number group by first_week order by first_week; +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | first_week | week_0 | week_1 | week_2 | week_3 | week_4 | week_5 | week_6 | week_7 | week_8 | week_9 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+ | 0 | 4 | 1 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | | 1 | 5 | 0 | 3 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | | 2 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 3 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +------------+--------+--------+--------+--------+--------+--------+--------+--------+--------+--------+
Сега знаем как да изчислим степента на задържане в SQL. Можете също да използвате горните заявки, за да изчислите степента на задържане в MySQL, PostgreSQL.
И накрая, можете да използвате инструмент за визуализация на данни, за да начертаете горния анализ на кохортата на задържане в таблица. Ето таблица за задържане на кохорти, създадена с Ubiq.
Между другото, ако искате да създадете централни таблици, диаграми и табла за управление от MySQL база данни, можете да опитате Ubiq. Предлагаме 14-дневен безплатен пробен период.