sql >> Database >  >> RDS >> Oracle

Waarom lijk ik Oracle 11g niet te dwingen meer CPU's te verbruiken voor een enkele SQL-query?

Het belangrijkste om te begrijpen over Oracle-parallellisme is dat het ingewikkeld is. Het optimaliseren van parallellisme vereist veel Oracle-kennis, het lezen van de handleidingen, het controleren van veel parameters, het testen van langlopende query's en veel scepsis.

Stel de juiste vragen

Parallelle problemen omvatten eigenlijk drie verschillende vragen:

  1. Hoeveel parallelle servers zijn aangevraagd?
  2. Hoeveel parallelle servers zijn toegewezen?
  3. Hoeveel parallelle servers zijn zinvol gebruikt?

Gebruik de beste tools

Ga direct naar de beste tool - SQL Monitoring met actieve rapportages. Zoek uw SQL_ID en genereer het HTML-rapport:select dbms_sqltune.report_sql_monitor(sql_id => 'your_sql_id', type => 'active') from dual; . Dit is de enige manier om te weten hoeveel tijd aan elke stap in het uitvoeringsplan is besteed. En het zal u vertellen hoeveel parallellisme effectief werd gebruikt, en waar. Bijvoorbeeld:

Een andere goede optie is type => 'text' . Het bevat niet zoveel informatie, maar het is sneller om naar te kijken en gemakkelijker te delen.

SQL Monitoring omvat ook de gevraagde DOP en de toegewezen DOP:

Een 100-lijns parallelle select kan mooi lopen, maar dan stopt alles bij een enkele stap vanwege een niet-gecachete reeks. U kunt uren staren naar een uitlegplan, een trace of een AWR-rapport zonder het probleem te zien. Het actieve rapport maakt de langzame stappen bijna triviaal om te vinden. Verspil geen tijd met raden waar het probleem ligt.

Er zijn echter nog andere hulpmiddelen nodig. Een uitlegplan gegenereerd met explain plan for ... en select * from table(dbms_xplan.display); zal enkele belangrijke informatie verstrekken. Met name de Notes sectie kan vele redenen bevatten waarom de zoekopdracht niet om parallellisme vroeg.

Maar WAAROM heb ik dat aantal parallelle servers gekregen?

De relevante informatie is verspreid over verschillende handleidingen, die zeer nuttig zijn, maar soms onnauwkeurig of misleidend. Er zijn veel mythen en veel slecht advies over parallellisme. En de technologie verandert aanzienlijk bij elke release.

Als je alle betrouwbare bronnen bij elkaar optelt, is de lijst met factoren die van invloed zijn op het aantal parallelle servers verbazingwekkend groot. De onderstaande lijst is grofweg geordend op wat volgens mij de belangrijkste factoren zijn:

  1. Inter-operatie parallellisme Elke query die sortering of groepering gebruikt, wijst twee keer zoveel parallelle servers toe als de DOP. Dit is waarschijnlijk verantwoordelijk voor de mythe "Oracle wijst zoveel mogelijk parallelle servers toe!".
  2. Query-hint Bij voorkeur een hint op instructieniveau zoals /*+ parallel */ , of mogelijk een hint op objectniveau zoals /*+ noparallel(table1) */ . Als een specifieke stap van een plan serieel wordt uitgevoerd, is dit meestal vanwege hints op objectniveau op slechts een deel van de query.
  3. Recursieve SQL Sommige bewerkingen kunnen parallel worden uitgevoerd, maar kunnen effectief worden geserialiseerd door recursieve SQL. Bijvoorbeeld een niet-gecachete reeks op een grote insert. Recursieve SQL die wordt gegenereerd om de instructie te ontleden, is ook serieel; bijvoorbeeld dynamische steekproeven.
  4. Sessie wijzigen alter session [force|enable] parallel [query|dml|ddl]; Merk op dat parallelle DML standaard is uitgeschakeld.
  5. Tafelgraad
  6. Indexgraad
  7. Index was goedkoper Parallelle hints vertellen de optimizer alleen om een ​​volledige tabelscan met een bepaalde DOP te overwegen. Ze dwingen niet echt parallellisme af. De optimizer is nog steeds vrij om een ​​seriële index-toegang te gebruiken als hij denkt dat het goedkoper is. (De FULL hint kan dit probleem helpen oplossen.)
  8. Planbeheer SQL Plan Baselines, contouren, profielen, geavanceerd herschrijven en SQL Translators kunnen allemaal de mate van parallellisme achter uw rug om veranderen. Controleer het gedeelte Opmerking van het abonnement.
  9. Editie Alleen Enterprise en Personal Editions staan ​​parallelle bewerkingen toe. Behalve het pakket DBMS_PARALLEL_EXECUTE.
  10. PARALLEL_ADAPTIVE_MULTI_USER
  11. PARALLEL_AUTOMATIC_TUNING
  12. PARALLEL_DEGREE_LIMIT
  13. PARALLEL_DEGREE_POLICY
  14. PARALLEL_FORCE_LOCAL
  15. PARALLEL_INSTANCE_GROUP
  16. PARALLEL_IO_CAP_ENABLED
  17. PARALLEL_MAX_SERVERS Dit is de bovengrens voor het hele systeem. Er is hier een afweging. Te veel parallelle servers tegelijk draaien is slecht voor het systeem. Maar het downgraden van een zoekopdracht naar serieel kan voor sommige zoekopdrachten rampzalig zijn.
  18. PARALLEL_MIN_PERCENT
  19. PARALLEL_MIN_SERVERS
  20. PARALLEL_MIN_TIME_THRESHOLD
  21. PARALLEL_SERVERS_TARGET
  22. PARALLEL_THREADS_PER_CPU
  23. Aantal RAC-knooppunten Nog een vermenigvuldiger voor standaard DOP.
  24. CPU_COUNT Als de standaard DOP wordt gebruikt.
  25. RECOVERY_PARALLELISME
  26. FAST_START_PARALLEL_ROLLBACK
  27. Profiel SESSIONS_PER_USER beperkt ook parallelle servers.
  28. Bronnenbeheer
  29. Systeembelasting Als parallel_adaptive_multi_user waar is. Waarschijnlijk onmogelijk te raden wanneer Oracle zal gaan smoren.
  30. PROCESSEN
  31. Parallelle DML-beperkingen Parallelle DML werkt niet in een van de volgende gevallen:
    1. COMPATIBEL <9.2 voor intrapartitie
    2. VOEG WAARDEN IN, tabellen met triggers
    3. replicatie
    4. zelf-referentiële integriteit of cascade- of uitgestelde integriteitsbeperkingen verwijderen
    5. toegang tot een objectkolom
    6. niet-gepartitioneerde tabel met LOB
    7. intrapartitie parallellisme met een LOB
    8. verdeelde transactie
    9. geclusterde tabellen
    10. tijdelijke tabellen
  32. Scalaire subquery's lopen niet parallel? Dit staat in de handleiding, en ik wou dat dit was waar, maar mijn tests geven aan dat parallellisme hier werkt in 11g.
  33. ENQUEUE_RESOURCES Verborgen parameter in 10g, is dit meer relevant?
  34. Index-georganiseerde tabellen Kan het pad niet parallel naar IOT's worden ingevoegd? (Is dit nog steeds waar?)
  35. Vereisten voor parallelle pijplijnfunctie Moet een CURSOR . gebruiken (?). TODO.
  36. Functies moeten PARALLEL_ENABLE zijn
  37. Type verklaring Oudere versies beperkten parallellisme op DML, afhankelijk van de partitionering. Sommige van de huidige handleidingen bevatten dit nog steeds, maar het is zeker niet meer waar.
  38. Aantal partities Alleen voor partitiegewijze joins op oudere versies.(?)
  39. Bugs Ik heb met name veel bugs gezien bij het parseren. Oracle zal het juiste aantal parallelle servers toewijzen, maar er gebeurt niets omdat ze allemaal wachten op gebeurtenissen zoals cursor: pin s wait on x .

Deze lijst is zeker niet compleet en bevat geen 12c-functies. En het lost geen problemen met het besturingssysteem en de hardware op. En het geeft geen antwoord op de verschrikkelijk moeilijke vraag, "wat is de beste mate van parallellisme?" (Kort antwoord:meer is meestal beter, maar dit gaat ten koste van andere processen.) Hopelijk geeft het je in ieder geval een idee van hoe moeilijk deze problemen kunnen zijn, en een goede plek om te beginnen met zoeken.



  1. Hoe RANK() werkt in SQL Server

  2. Gegevens opvragen uit XML

  3. Records van de afgelopen 24 uur ophalen in MySQL

  4. Hoe kan ik een kopie van een Oracle-tabel maken zonder de gegevens te kopiëren?