sql >> Database >  >> RDS >> PostgreSQL

Geaggregeerde functies over arrays

Probeer zoiets als dit:

SELECT id, unnest(array300) as val, ntile(100) OVER (PARTITION BY id) as bucket_num
FROM your_table

Deze SELECT geeft u 300 records per array300 met dezelfde id en geef ze het bucket_num (1 voor de eerste 3 elementen, 2 voor de volgende 3, enzovoort).

Gebruik vervolgens deze selectie om de avg . te krijgen van elementen in de bucket:

SELECT id, avg(val) as avg_val
FROM (...previous select here...)
GROUP BY id, bucket_num

Volgende - verzamel gewoon de avg_val in array:

SELECT id, array_agg(avg_val) as array100
FROM (...previous select here...)
GROUP BY id

Details:unnest , ntile , array_agg , OVER (PARTITIE DOOR )

UPD:probeer deze functie:

CREATE OR REPLACE FUNCTION public.array300_to_100 (
  p_array300 numeric []
)
RETURNS numeric [] AS
$body$
DECLARE
  dim_start int = array_length(p_array300, 1); --size of input array
  dim_end int = 100; -- size of output array
  dim_step int = dim_start / dim_end; --avg batch size
  tmp_sum NUMERIC; --sum of the batch
  result_array NUMERIC[100]; -- resulting array
BEGIN

  FOR i IN 1..dim_end LOOP --from 1 to 100.
    tmp_sum = 0;

    FOR j IN (1+(i-1)*dim_step)..i*dim_step LOOP --from 1 to 3, 4 to 6, ...
      tmp_sum = tmp_sum + p_array300[j];  
    END LOOP; 

    result_array[i] = tmp_sum / dim_step;
  END LOOP; 

  RETURN result_array;
END;
$body$
LANGUAGE 'plpgsql'
IMMUTABLE
RETURNS NULL ON NULL INPUT;

Er is één array300 . nodig en voert één array100 . uit . Om het te gebruiken:

SELECT id, array300_to_100(array300)
FROM table1;

Als je problemen hebt om het te begrijpen, vraag het me dan gewoon.



  1. innodb_lock_wait_timeout time-out verhogen

  2. Joomla:Helperfunctie aanroepen vanuit een model?

  3. mysql krijgt last_insert_id() in een trigger

  4. Hoe kunnen we in PostgreSQL zien of elke index van een tabel is geclusterd of niet?