sql >> Database >  >> RDS >> Oracle

Gegevens laden naar enorme gepartitioneerde tabel

Ga dit lezen:


Dit werkt.

Heeft u de uitdaging om het verzamelgebied toegankelijk te maken voor online zoekopdrachten of laat arriverende gegevens (kunt u bijvoorbeeld vandaag een rij krijgen voor een andere dag dan vandaag/gisteren)?

Ik heb code die door mijn dataset van records scant die ik ga laden, en markeer de lokale index-subpartities als de subpartitie van de tabel wordt gewijzigd. (Ik gebruik dit in plaats van de referentie van Tim Gorman hierboven omdat ik te laat arriverende gegevens heb en de staging-ruimte en het ware magazijn tegelijkertijd beschikbaar moet hebben voor eindgebruikers.)

Mijn tabel is bereik/lijst, niet bereik/hash. dus je zult het wat moeten wijzigen, waarschijnlijk met behulp van de ORA_HASH-functie om de juiste subpartitie(s) te vinden. Ik schrijf ook naar een tabel welke subpartities ik als onbruikbaar ga markeren, zodat ik dat allemaal in één keer kan doen. Het kan iets efficiënter zijn om alle indexen van de subpartitie als onbruikbaar te markeren in een enkele ALTER TABLE-instructie; Ik schakelde oorspronkelijk alleen de BITMAP-indexen uit, maar zelfs een enkele B*tree-index offline tijdens het laden van gegevens verbeterde de efficiëntie aanzienlijk.

     l_part_name varchar2(30);
     l_subpart_name varchar2(30);
     l_sql varchar2(2000);
     type partition_rec_type is record
     (table_name         varchar2(30),
      partition_name     varchar2(30),
      subpartition_name  varchar2(30),
      list_value         varchar2(10),
      min_ts             timestamp,
      max_ts             timestamp);
     type partition_recs_type
                         is table of partition_rec_type;
     l_partition_recs    partition_recs_type := partition_recs_type();
     l_partition_rec     partition_rec_type;
     l_subpart_id        number := 1;
     l_start_ts          timestamp;
     l_end_ts            timestamp;
     l_found_list_part boolean;
     -- build set of subpartitions
     l_start_ts := to_timestamp ('1970-01-01', 'yyyy-mm-dd');
     for i in (select p.table_name, p.partition_name, sp.subpartition_name,
                      p.high_value as part_high_value, 
                      sp.high_value as subpart_high_value,
                      p.partition_position, sp.subpartition_position
                 from user_tab_subpartitions sp
                      inner join user_tab_partitions p
                         on p.table_name     = sp.table_name
                        and p.partition_name = sp.partition_name
                where p.table_name = 'MY_TARGET_TABLE'
                order by p.partition_position, sp.subpartition_position)
       if ( (i.partition_position <> 1) and (i.subpartition_position = 1) ) then
         l_start_ts    := l_end_ts + to_dsinterval('0 00:00:00.000000001');
       end if;
       if (i.subpartition_position = 1) then
         l_end_ts := high_val_to_ts (i.part_high_value);
         l_end_ts := l_end_ts - to_dsinterval('0 00:00:00.000000001');
       end if;
       l_partition_rec.table_name        := i.table_name;
       l_partition_rec.partition_name    := i.partition_name;
       l_partition_rec.subpartition_name := i.subpartition_name;
       l_partition_rec.list_value        := i.subpart_high_value;
       l_partition_rec.min_ts            := l_start_ts;
       l_partition_rec.max_ts            := l_end_ts;
       l_partition_recs(l_subpart_id) := l_partition_rec;
       l_subpart_id := l_subpart_id + 1;
     end loop;
     -- for every combination of list column and date column
     -- which is going to be pushed to MY_TARGET_TABLE
     -- find the subpartition
     -- otherwise find the partition and default subpartition
     for i in (select distinct LIST_COLUMN, DATE_COLUMN as DATE_VALUE
                 from MY_SOURCE_TABLE
                where IT_IS_BEING_MOVED_TO_TARGET IS TRUE)
       -- iterate over the partitions
       l_found_list_part := false;
       for k in l_partition_recs.first..l_partition_recs.last
         -- find the right partition / subpartition for list_value / date_value
         if (    (i.DATE_VALUE >= l_partition_recs(k).min_ts)
             and (i.DATE_VALUE <= l_partition_recs(k).max_ts) ) then
           if (l_found_list_value = false) then
             if (to_char(i.LIST_COLUMN, '9999') = l_partition_recs(k).LIST_COLUMN) then
               l_found_list_value := true;
             elsif (l_partition_recs(k).LIST_COLUMN = 'DEFAULT') then
               l_partition_rec := l_partition_recs(k);
             end if;
           end if;
         end if;
       end loop;  -- over l_partition_recs
       -- log those partitions for later index rebuild
         insert into index_subpart_rebuild
           (table_name, partition_name, subpartition_name)
           (l_partition_rec.table_name, l_partition_rec.partition_name,
         when dup_val_on_index then null;
         when others then raise;
     end loop;  -- over MY_TARGET_TABLE.DATE_VALUE values
     for i in (select ui.index_name, uis.subpartition_name
                 from user_indexes ui
                      inner join user_ind_subpartitions uis
                         on ui.index_name = uis.index_name
                      inner join index_subpart_rebuild re
                         on re.subpartition_name = uis.subpartition_name
                where ui.table_name = 'MY_TARGET_TABLE')
       l_sql := 'alter index ' || i.index_name ||
                ' modify subpartition ' || i.subpartition_name || ' unusable';
       execute immediate l_sql;
     end loop;

  1. onvolledige informatie van zoekopdracht op pg_views

  2. hoe deze query te optimaliseren (4 mm tabellen betrokken)

  3. Een MySQL-database vergrendelen zodat slechts één persoon tegelijk een query kan uitvoeren?

  4. Postgresql-schemapad permanent instellen