Имам тестово стенд с 2 възела, работещ с Oracle RAC 11.2.0.4 на OL6. Почти всичко е на системния диск. В крайна сметка това е просто тестов стенд. Основният дял се запълва. Получих сигнал от EM за проблема с дисковото пространство и влязох и почистих някои регистрационни файлове. Докато почиствах стари регистрационни файлове, мозъкът ми ми казваше, че използването на пространството на регистрационните файлове не е извън контрол и че трябва да има друг основен проблем. Разбира се, три дни по-късно получих сигнал, че дискът отново се запълва. Знаех, че трябва да се задълбоча в това. Трябва да има още един или два файла, които запълват пространството. След известно ровене стигнах до тази директория в моята инсталация на Grid Infrastructure:
[oracle@host01 host01]$ pwd /u01/app/crs11.2.0.4/crf/db/host01 [oracle@host01 host01]$ ls -l total 10945448 -rw-r--r-- 1 root root 1773999 Jul 2 13:54 02-JUL-2014-13:54:50.txt -rw-r--r-- 1 root root 1120665 Jul 2 14:00 02-JUL-2014-14:00:06.txt -rw-r--r-- 1 root root 16953 Mar 25 2014 25-MAR-2014-19:51:58.txt -rw-r----- 1 root root 280764416 Nov 13 16:15 crfalert.bdb -rw-r----- 1 root root 9850126336 Nov 13 16:14 crfclust.bdb -rw-r----- 1 root root 8192 Jul 2 13:59 crfconn.bdb -rw-r----- 1 root root 352174080 Nov 13 16:15 crfcpu.bdb -rw-r----- 1 root root 249356288 Nov 13 16:15 crfhosts.bdb -rw-r----- 1 root root 265261056 Nov 13 16:14 crfloclts.bdb -rw-r----- 1 root root 172232704 Nov 13 16:14 crfts.bdb -rw-r----- 1 root root 24576 Jul 2 13:54 __db.001 -rw-r----- 1 root root 401408 Nov 13 16:15 __db.002 -rw-r----- 1 root root 2629632 Nov 13 16:15 __db.003 -rw-r----- 1 root root 2162688 Nov 13 16:15 __db.004 -rw-r----- 1 root root 1187840 Nov 13 16:15 __db.005 -rw-r----- 1 root root 57344 Nov 13 16:15 __db.006 -rw-r----- 1 root root 16777216 Nov 13 16:06 log.0000008765 -rw-r----- 1 root root 16777216 Nov 13 16:15 log.0000008766 -rw-r--r-- 1 root root 120000000 Jul 2 13:55 host01.ldb -rw-r----- 1 root root 8192 Jul 2 13:54 repdhosts.bdb
Файлът crfclust.bdb е около 9,8 GB. Моят системен диск е само 30GB, така че този файл заема 33% от цялото пространство. И продължава да расте. За да отстраня проблема, изпълних следните стъпки:
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl стоп ресурс ora.crf -init
CRS-2673:Опит за спиране на 'ora.crf' на 'host01'
CRS-2677:Спиране на 'ora.crf' на 'host01' бе успешен
[oracle@host01 host01] $су
Парола:
[root@host01 host01]# rm -rf *
[oracle@host01 host01]$ /u01/app/crs11.2.0.4/bin/crsctl стартов ресурс ora.crf -init
CRS-2672:Опит за стартиране на „ora.crf“ на „host01“
CRS-2676:Стартът на „ora.crf“ на „host01“ беше успешен
Защо това проработи? Тези файлове са базата данни на Berkeley, използвана за Cluster Health Monitor (CHM). Един от файловете трябва да е с размер само около 1 GB и редовно да почиства по-старите данни. Но стъпката за прочистване не работи. Чрез ръчно премахване на файловете ще загубя исторически данни за ефективността, но това е приемливо за мен в този момент. При стартиране CHM ще създаде файловете наново, ако липсват.
След като поправих проблема, намерих Metalink Note 1343105.1, който описва проблема. Все още не успях да намеря конкретен номер на грешка, но е ясно, че има грешка.