Εθνικός Θησαυρός Ελληνικής Γλώσσας (ΕΘΕΓ)™

Εθνικός Θησαυρός Ελληνικής Γλώσσας (ΕΘΕΓ)™:

Το Σώμα Κειμένων (Corpus) του ΙΕΛ

Το σώμα κειμένων του Ινστιτούτου Επεξεργασίας του Λόγου αναπτύχθηκε επί σειρά ετών και σήμερα περιλαμβάνει περισσότερες από 47.000.000 λέξεις, οι οποίες αυξάνονται σε τακτά χρονικά διαστήματα. Ο χρήστης έχει τη δυνατότητα να εμφανίσει προτάσεις του ΕΘΕΓ χρησιμοποιώντας από ένα μέχρι τρία κριτήρια. Κάθε κριτήριο μπορεί να είναι είτε μια λέξη είτε ένα λήμμα είτε κάποιος γραμματικός προσδιορισμός. Επιπλέον ο χρήστης μπορεί να καθορίσει τη μέγιστη απόσταση μεταξύ των κριτηρίων καθώς και το υποσύνολο κειμένων στο οποίο θα περιοριστεί η ανεύρεση. Τέλος, υπάρχουν διαθέσιμα κάποια στατιστικά στοιχεία για το γλωσσικό περιεχόμενο του ΕΘΕΓ.

Ολόκληρο το σώμα κειμένων του ΙΕΛ είναι διαθέσιμο από τις ιστοσελίδες που ακολουθούν. Για οδηγίες χρήσης και περιορισμούς, καθώς και για γενικές πληροφορίες για το σώμα κειμένων, μπορείτε δείτε στις πληροφορίες.

Τα ονόματα “Εθνικός Θησαυρός Ελληνικής Γλώσσας και “Hellenic National Corpus αποτελούν Trademarks (™) του Ινστιτούτου Επεξεργασίας του Λόγου.

http://hnc.ilsp.gr/

Add a Comment

Your email address will not be published.