Ik heb een 2-node testbed met Oracle RAC 11.2.0.4 op OL6. Vrijwel alles staat op de systeemschijf. Dit is tenslotte maar een testbed. De rootpartitie loopt vol. Ik kreeg een waarschuwing van EM over het probleem met de schijfruimte en ging naar binnen om wat logbestanden op te schonen. Terwijl ik oude logbestanden aan het opschonen was, vertelden mijn hersenen me dat het gebruik van de logbestandruimte niet uit de hand liep en dat er een ander onderliggend probleem moest zijn. En ja hoor, drie dagen later kreeg ik de melding dat de schijf weer vol raakte. Ik wist dat ik me hier verder in moest verdiepen. Er moeten nog een paar bestanden zijn die de ruimte in beslag nemen. Na wat graven kwam ik bij deze map in mijn Grid Infrastructure-installatie:
[oracle@host01 host01]$ pwd /u01/app/crs11.2.0.4/crf/db/host01 [oracle@host01 host01]$ ls -l total 10945448 -rw-r--r-- 1 root root 1773999 Jul 2 13:54 02-JUL-2014-13:54:50.txt -rw-r--r-- 1 root root 1120665 Jul 2 14:00 02-JUL-2014-14:00:06.txt -rw-r--r-- 1 root root 16953 Mar 25 2014 25-MAR-2014-19:51:58.txt -rw-r----- 1 root root 280764416 Nov 13 16:15 crfalert.bdb -rw-r----- 1 root root 9850126336 Nov 13 16:14 crfclust.bdb -rw-r----- 1 root root 8192 Jul 2 13:59 crfconn.bdb -rw-r----- 1 root root 352174080 Nov 13 16:15 crfcpu.bdb -rw-r----- 1 root root 249356288 Nov 13 16:15 crfhosts.bdb -rw-r----- 1 root root 265261056 Nov 13 16:14 crfloclts.bdb -rw-r----- 1 root root 172232704 Nov 13 16:14 crfts.bdb -rw-r----- 1 root root 24576 Jul 2 13:54 __db.001 -rw-r----- 1 root root 401408 Nov 13 16:15 __db.002 -rw-r----- 1 root root 2629632 Nov 13 16:15 __db.003 -rw-r----- 1 root root 2162688 Nov 13 16:15 __db.004 -rw-r----- 1 root root 1187840 Nov 13 16:15 __db.005 -rw-r----- 1 root root 57344 Nov 13 16:15 __db.006 -rw-r----- 1 root root 16777216 Nov 13 16:06 log.0000008765 -rw-r----- 1 root root 16777216 Nov 13 16:15 log.0000008766 -rw-r--r-- 1 root root 120000000 Jul 2 13:55 host01.ldb -rw-r----- 1 root root 8192 Jul 2 13:54 repdhosts.bdb
Het crfclust.bdb-bestand is ongeveer 9,8 GB. Mijn systeemschijf is slechts 30 GB, dus dit ene bestand neemt 33% van de volledige ruimte in beslag. En het blijft groeien. Om het probleem op te lossen, heb ik deze stappen uitgevoerd:
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl stop bron ora.crf -init
CRS-2673:Poging om 'ora.crf' te stoppen op 'host01'
CRS-2677:Stop van 'ora.crf' op 'host01' geslaagd
[oracle@host01 host01] $ zo
Wachtwoord:
[root@host01 host01]# rm -rf *
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl startbron ora.crf -init
CRS-2672:Poging om 'ora.crf' te starten op 'host01'
CRS-2676:Start van 'ora.crf' op 'host01' geslaagd
Waarom werkte dit? Deze bestanden zijn de Berkeley-database die wordt gebruikt voor de Cluster Health Monitor (CHM). Een van de bestanden zou slechts ongeveer 1 GB groot moeten zijn en regelmatig oudere gegevens verwijderen. Maar de zuiveringsstap werkt niet. Door de bestanden handmatig te verwijderen, verlies ik historische prestatiegegevens, maar dat is op dit moment acceptabel voor mij. Bij het opstarten zal CHM de bestanden opnieuw maken als ze ontbreken.
Nadat ik het probleem had opgelost, vond ik Metalink Note 1343105.1 die het probleem beschrijft. Ik heb nog geen specifiek bugnummer kunnen vinden, maar het is duidelijk dat er een bug bestaat.