sql >> Database >  >> RDS >> PostgreSQL

Som de duur van overlappende perioden op met prioriteit door de overlap zelf uit te sluiten

Bijwerken Mijn oorspronkelijke oplossing was niet correct. De consolidatie van bereiken kan niet in een regulier venster worden afgehandeld. Ik bracht mezelf in de war door dezelfde naam te gebruiken, trange , vergetend dat het venster zich boven de bronrijen bevindt in plaats van de resultaatrijen. Zie de bijgewerkte SQL Fiddle met de volledige zoekopdracht en een toegevoegd record om het probleem te illustreren.

U kunt de overlappende vereiste vereenvoudigen en hiaten en eilanden identificeren met behulp van PostgreSQL-bereiktypen .

De volgende vraag is opzettelijk uitgebreid om elke stap van het proces weer te geven. Een aantal stappen kan worden gecombineerd.

SQL Fiddle

Voeg eerst een inclusief [start, end] . toe bereik naar elk record.

with add_ranges as (
  select id, name, tsrange(start, "end", '[]') as t_range
    from activities
), 

 id | name |                    t_range                    
----+------+-----------------------------------------------
  1 | A    | ["2018-01-09 17:00:00","2018-01-09 20:00:00"]
  2 | A    | ["2018-01-09 18:00:00","2018-01-09 20:30:00"]
  3 | B    | ["2018-01-09 19:00:00","2018-01-09 21:30:00"]
  4 | B    | ["2018-01-09 22:00:00","2018-01-09 23:00:00"]
(4 rows)

Identificeer overlappende bereiken zoals bepaald door de && operator en markeer het begin van nieuwe eilanden met een 1 .

mark_islands as (
  select id, name, t_range,
         case
           when t_range && lag(t_range) over w then 0
           else 1
         end as new_range
    from add_ranges
  window w as (partition by name order by t_range)
),

 id | name |                    t_range                    | new_range 
----+------+-----------------------------------------------+-----------
  1 | A    | ["2018-01-09 17:00:00","2018-01-09 20:00:00"] |         1
  2 | A    | ["2018-01-09 18:00:00","2018-01-09 20:30:00"] |         0
  3 | B    | ["2018-01-09 19:00:00","2018-01-09 21:30:00"] |         1
  4 | B    | ["2018-01-09 22:00:00","2018-01-09 23:00:00"] |         1
(4 rows)

Nummer de groepen op basis van de som van de new_range binnen name .

group_nums as (
  select id, name, t_range, 
         sum(new_range) over (partition by name order by t_range) as group_num
    from mark_islands
),

 id | name |                    t_range                    | group_num 
----+------+-----------------------------------------------+-----------
  1 | A    | ["2018-01-09 17:00:00","2018-01-09 20:00:00"] |         1
  2 | A    | ["2018-01-09 18:00:00","2018-01-09 20:30:00"] |         1
  3 | B    | ["2018-01-09 19:00:00","2018-01-09 21:30:00"] |         1
  4 | B    | ["2018-01-09 22:00:00","2018-01-09 23:00:00"] |         2

Groeperen op name, group_num om de totale tijd op het eiland te krijgen, evenals een volledige t_range te gebruiken bij overlappingsaftrek.

islands as (
  select name,
         tsrange(min(lower(t_range)), max(upper(t_range)), '[]') as t_range,
         max(upper(t_range)) - min(lower(t_range)) as island_time_interval
    from group_nums
   group by name, group_num
),

 name |                    t_range                    | island_time_interval 
------+-----------------------------------------------+----------------------
 A    | ["2018-01-09 17:00:00","2018-01-09 20:30:00"] | 03:30:00
 B    | ["2018-01-09 19:00:00","2018-01-09 21:30:00"] | 02:30:00
 B    | ["2018-01-09 22:00:00","2018-01-09 23:00:00"] | 01:00:00
(3 rows)

Voor de vereiste om overlaptijd te tellen tussen A berichten en B berichten, vind exemplaren van wanneer een A bericht overlapt een B bericht en gebruik de * snijpunt operator om het snijpunt te vinden.

priority_overlaps as (
  select b.name, a.t_range * b.t_range as overlap_range
    from islands a
    join islands b
      on a.t_range && b.t_range
     and a.name = 'A' and b.name != 'A'
),

 name |                 overlap_range                 
------+-----------------------------------------------
 B    | ["2018-01-09 19:00:00","2018-01-09 20:30:00"]
(1 row)

Tel de totale tijd van elke overlap op met name .

overlap_time as (
  select name, sum(upper(overlap_range) - lower(overlap_range)) as total_overlap_interval
    from priority_overlaps
   group by name
),

 name | total_overlap_interval 
------+------------------------
 B    | 01:30:00
(1 row)

Bereken de totale tijd voor elke name .

island_times as (
  select name, sum(island_time_interval) as name_time_interval
    from islands
   group by name
)

 name | name_time_interval 
------+--------------------
 B    | 03:30:00
 A    | 03:30:00
(2 rows)

Doe mee met de totale tijd voor elke name naar aanpassingen van de overlap_time CTE, en trek de correctie af voor de laatste duration waarde.

select i.name,
       i.name_time_interval - coalesce(o.total_overlap_interval, interval '0') as duration
  from island_times i
  left join overlap_time o
    on o.name = i.name
;

 name | duration 
------+----------
 B    | 02:00:00
 A    | 03:30:00
(2 rows)


  1. kan geen verbinding maken met de pg-databasehosting op Heroku

  2. maak MySQL-query kies max tijdstempel met groep op instructie

  3. Is postgres een standaard en speciale gebruiker van PostgreSQL?

  4. PostgreSQL - Sleutel toevoegen aan elk object van een JSONB-array