sql >> Database >  >> RDS >> PostgreSQL

PostgreSQL:terugkerende bezoekers identificeren op basis van datum - joins of vensterfuncties?

Eerst verwijder ik event_sequence met een DISTINCT (ervan uitgaande dat alle gebeurtenissen op dezelfde dag plaatsvinden), dan gebruik ik de vensterfunctie lead en vergelijk met de datum van het volgende bezoek:

SELECT visitor_id,
       session_id,
       COALESCE(
          lead(d_date) OVER w - d_date,
          10
       ) < 7 AS revisited,
       d_date
FROM (SELECT DISTINCT visitor_id,
                      session_id,
                      d_date
      FROM "table"
     ) t
WINDOW w AS (PARTITION BY visitor_id
             ORDER BY d_date
             ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING
            )
ORDER BY visitor_id, session_id;

┌────────────┬────────────┬───────────┬────────────┐
│ visitor_id │ session_id │ revisited │   d_date   │
├────────────┼────────────┼───────────┼────────────┤
│          1 │          1 │ t         │ 2017-01-01 │
│          1 │          2 │ f         │ 2017-01-05 │
│          1 │          3 │ t         │ 2017-01-20 │
│          1 │          4 │ f         │ 2017-01-25 │
│          2 │          1 │ t         │ 2017-01-02 │
│          2 │          2 │ f         │ 2017-01-02 │
│          2 │          3 │ f         │ 2017-01-18 │
└────────────┴────────────┴───────────┴────────────┘
(7 rows)



  1. Waarom is IS NOT NULL false bij het controleren van een rijtype?

  2. Hoe opeenvolgende rijen te vinden op basis van de waarde van een kolom?

  3. MYSQL:selecteer een deel van de tekst en knip het uit op basis van puntlocatie

  4. hoe selecteer je alleen een rij met een maximale reeks zonder een subquery te gebruiken?