MySQL verbinden met Apache nutch

Bron ophalen van https://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip

Open org.apache.nutch.crawl.Crawl class in je editor.

Opzoekvariabele Path crawlDb = new Path(dir + "/crawldb");

De variabele geeft een hint over waar de code moet worden vervangen om uw eigen CustomMySQLCrawl te krijgen klasse.

De persistentie gebeurt tijdens deze aanroep:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb Dus daar moet je het in de database opslaan. U kunt overwegen om op dit moment hibernate te integreren.