sql >> Database >  >> RDS >> Oracle

Breid Endeca's diakritische vouwtoewijzing uit

In de documentatie die u verstrekt, staat:

Dit suggereert dat Grieks niet wordt ondersteund omdat het niet in een van deze tekensets valt (ik geloof dat Grieks Latijn-7 is). Dat gezegd hebbende, zou u kunnen proberen een taalvlag in te stellen op recordniveau (aangezien u aangeeft dat uw gegevens zowel Engels als Grieks bevatten) ervan uitgaande dat elke taal zijn eigen record heeft of proberen een globale taal te implementeren met behulp van de dgidx en dgraph parameters, maar dit heeft invloed op zaken als stammen voor records of eigenschappen die niet in de algemene taal zijn.

dgidx --lang el
dgraph --lang el

Hoewel ik niet zeker weet of het zal werken op basis van de oorspronkelijke verklaring.

Als alternatief kunt u een proces van diakritische verwijdering implementeren met behulp van een aangepaste Accessor , die de atg.repository.search.indexing.PropertyAccessorImpl uitbreidt class (een optie aangezien je verwijst naar Nucleus , dus ik neem aan dat je ATG/Oracle Commerce gebruikt). Hiermee specificeert u een genormaliseerd doorzoekbaar veld in uw index dat de doorzoekbare velden in uw huidige index dupliceert, maar nu met alle diakritische tekens verwijderd. Dezelfde logica die u toepast in de Accessor moet vervolgens worden toegepast als een preprocessor op uw zoektermen, zodat u de invoer normaliseert om overeen te komen met de geïndexeerde waarden. Maak ten slotte uw originele velden in de index (met de geaccentueerde tekens) alleen-weergave en de genormaliseerde velden doorzoekbaar (maar toon ze niet).

Het resultaat komt overeen met uw genormaliseerde tekst, maar het nadeel is dat u dubbele gegevens hebt, zodat uw index groter zal zijn. Geen groot probleem met kleine datasets. Er kan ook een impact zijn op hoe de OOTB-functionaliteit, zoals stammen, zich gedraagt ​​​​met de genormaliseerde dataset. Je zult wat tests moeten doen met verschillende scenario's in het Grieks en Engels om te zien of de precisie en terugroepactie nadelig worden beïnvloed.




  1. Is de primaire sleutel ook index?

  2. Ontvang datums van een weeknummer in T-SQL

  3. Reguliere expressie op datums in Oracle

  4. MySQL hoe u een som van start-/einddatums krijgt met mogelijk overlappende datums