Resurse Lexicale
Wim Peters
NLP group
Department of Computer Science
University of Sheffield
w.peters@dcs.shef.ac.uk

Introducere

Formatul de reprezentare a resurselor lingvistice

Standardizarea descrierii lingvistice

Metadate pentru descrierea lexicala

Compararea resurselor utilizand metadatele

Introducere

 

Resursele referitoare la limbaj contin o gama larga de informatii lingvistice in functie de natura si functia lor. Ele variaza de la liste simple la resurse complexe continand diverse tipuri de informatii lingvistice asociate intrarilor sau elementelor lor. Documentul de fata se va concentra asupra unui anumit tip de astfel de resurse, si anume resursele lexicale. In general, acestea pot fi de diferite tipuri (lista de mai jos nefiind exhaustiva):

Resursele lexicale sunt extrem de folosite in domeniul ingineriei limbajului si al ingineriei cunostintelor. Atat in mediile monolingve, cat si in cele multilingve, resursele referitoare la limbaj joaca un rol crucial in pregatirea, procesarea si gestionarea informatiei si a cunostintelor necesare atat calculatoarelor, cat si oamenilor. Ariile de cercetare relevante includ lingvistica computationala, lexicografia computerizata si ingineria limbajului. Lingvistica computationala si ingineria limbajului ofera metodologia pentru pregatirea, inregistrarea, procesarea si refolosirea resurselor referitoare la limbaj. Lexicografia computerizata furnizeaza instrumentele pentru pregatirea si prelucrarea eficienta a datelor lexicale. Ingineria limbajului ne furnizeaza instrumentele necesare in reprezentarea, gestionarea si accesarea cunostintelor obtinute prin intermediul datelor lingvistice cu grade diferite de complexitate. Gestionarea resurselor referitoare la limbaj nu poate fi eficienta fara existenta unei componente puternice de inginerie a limbajului.