sql >> Database >  >> RDS >> Mysql

Wordnet SQL-uitleg

WordNet is een supercoole woordendatabase. Ik heb er zelf onderzoek naar gedaan. Ik zal mijn bevindingen hieronder opsommen - en hopelijk helpt het je om de tabellen beter te begrijpen.

De Synset-tabel De synsets-tabel is een van de belangrijkste tabellen in de database. Het is verantwoordelijk voor het onderbrengen van alle definities in WordNet. Elke rij in de synset-tabel heeft een synsetid, een definitie, een pos (delen van spraakveld) en een lexdomainid (die linkt naar de lexdomain-tabel). Er zijn 117373 synsets in de WordNet-database.

De Woordentabel WordNet heeft ook een "woorden"-tabel, die slechts twee velden heeft:een wordid en een "lemma". De woordentabel is verantwoordelijk voor het huisvesten van alle lemma's (basiswoorden) in de Wordnet-database. Er zijn 146625 vermeldingen in deze tabel

Dus.. hoe zijn deze twee tabellen met elkaar verbonden? Het antwoord? De zintuigentafel!

De Sense Table De sense-tabel is verantwoordelijk voor het aan elkaar koppelen van woorden (in de woordentabel), met definities (in de synset-tabel). is één volledige betekenis van een woord - een "zin van het woord".
Er zijn in totaal 206.354 woordbetekenissen in de WordNet-database.

De Lexdomains-tabel De tabel Lexdomains wordt verwezen door de betekenistabel en wordt gebruikt om te definiëren tot welk lexicaal domein een woord-betekenispaar behoort. Er zijn 45 lexicale domeinen in de lexdomains-tabel. De lexdomain-tabel is daarom WordNet's manier om een ​​woord-betekenis-paar te "taggen". Het is echter vrij beperkt, omdat een woord-zintuigpaar maar tot EEN lexicaal domein kan behoren.

De 45 lexicale domeinen omvatten:

Bijvoeglijke naamwoorden: allemaal, pert

Bijwoorden alle

Zelfstandige naamwoorden tops, act, dier, artefact, attribuut, lichaam, cognitie, communicatie, gebeurtenis, gevoel, voedsel, groep, locatie, motief, object, persoon, fenomeen, plant, bezit, proces, hoeveelheid, linkdef, vorm, staat, substantie, tijd,

Werkwoorden lichaam, verandering, cognitie, communicatie, competitie, consumptie, contact, creatie, emotie, beweging, perceptie, bezit, sociaal, statief, weer, ppl

De tabel met hoofdletters Sommige woorden in de woordentabel hebben natuurlijk de eerste letter met een hoofdletter, dat wil zeggen:“A-team”. Aangezien de woordentabel alle woorden in kleine letters opslaat, gebruikt WordNet deze tabel om de hoofdletterversie van het woord te specificeren. Deze tabel bevat 40313 vermeldingen.

Er zijn veel andere tabellen in de WordNet DB, zodra ik ze heb onderzocht, zal ik ze opnieuw posten.

Uw synoniemen vinden Om uw vraag over synoniemen te beantwoorden, moet u het volgende doen.

Stel dat u de synoniemen voor het woord "Carry" wilt vinden. Om dit te doen, zoekt u eerst in de woordentabel naar een lemma dat overeenkomt met het woord "dragen". Dit zou de wordid 21253 opleveren. Je zou dan de zintuigentabel doorzoeken om alle woord-zin-paren voor het woord carry te vinden. Dit levert 41 resultaten op - elk resultaat bevat de wordid 21253, en een senseid (wat de index is van het woord-sense-paar) en een synsetid.

Nu moet u de synset-tabel opvragen voor elk van de geretourneerde synsetid's, zodat u toegang hebt tot het bijbehorende definitieveld in de synset-tabel.

Om de synoniemen voor elk van de vermelde synsets te vinden, hoeft u alleen maar in de betekenistabel te zoeken naar andere woord-zin-paren die dezelfde synset delen.

Voorbeeld:Een van de 41 woord-zin-paren voor het woord "dragen" staat hieronder:Als we de definitie voor deze synsetid 202083512 opzoeken, vindt u "verzenden of dienen als medium voor verzending"

Om alle synoniemen voor deze definitie te vinden, zoekt u vervolgens in de sense-tabel naar dezelfde synsetid 202083512. Dit levert synoniemen op:channel, conduct, transfer, bring, en transmit (let op:u moet naar links toetreden tot de woordentabel om de eigenlijke lemma's)

Ik hoop dat dit je helpt WordNet te ontraadselen.. Ik vind het best cool...



  1. SQLException:geen geschikt stuurprogramma gevonden voor jdbc:oracle:thin:@//localhost:1521/orcl

  2. Hekaton met een twist:In-memory TVP's – Deel 3

  3. MySQL crasht bij opstarten

  4. Hoe krijg ik Sum van twee tabellen?