abnet.agrino.org  
 » αρχή
   η ιστορία της γλώσσας
   γλώσσα & τεχνολογία
   διάλεκτοι στο χρόνο
   γραμματική & ορθογραφία
   η ελληνική, εκτός συνόρων
   ετυμολογία & θησαυρός
    τα λεξικά της Νέας Ελληνικής
    πλουσιότερη γλώσσα, η ελληνική
    οι ελληνικές λέξεις στην Αγγλική
    οι ελληνικές λέξεις στη Γερμανική
    1 στις 4 αγγλικές λέξεις είναι ελληνική
    η λεξιπενία των Ελλήνων μαθητών
    ετυμολογία & το λεξικό της ΝΕ
    από το κύριο όνομα στο... ουσιαστικό
    η οικουμενική διάσταση της Ελληνικής
    κι όμως είναι ελληνικές !
    το ταξίδι των ελληνικών λέξεων
    εθνικός θησαυρός ελληνικής γλώσσας
    αποθησαυρίσματα - εκφράσεις της ΝΕ
    νεοελληνική & μελωδικός τονισμός
    οι ιστορικοί λόγοι του Ξ. Ζολώτα
    η Ελληνική μεταξύ ανατολής και δύσης
    πίσω στις "πρώτες έννοιες" των λέξεων
   το γλωσσικό ζήτημα
   διάφορα θέματα

   σχετική βιβλιογραφία
   ειδήσεις - ανακοινώσεις

 

Εθνικός Θησαυρός Ελληνικής Γλώσσας· συλλογή κειμένων στο διαδίκτυο

»»»  Ο ΕΘΕΓ είναι μία δομημένη συλλογή κειμένων της Νέας Ελληνικής γλώσσας, που αναπτύχθηκε από το Ινστιτούτο Επεξεργασίας Λόγου και είναι διαθέσιμος για ερευνητική χρήση μέσω του Διαδικτύου. 
Στην παρούσα έκδοσή του περιλαμβάνει περίπου 20.000.000 λέξεις (γραπτά κείμενα) από ευρύ φάσμα μέσων (Βιβλία, Περιοδικά, Εφημερίδες κ.λπ.), τα οποία ανήκουν σε ποικίλα κειμενικά είδη (Aρθρα, Δοκίμια, Λογοτεχνικά έργα, Αναφορές, Βιογραφίες κτλ.) και καλύπτουν ποικίλη θεματολογία (Οικονομία, Ιατρική, Ελεύθερος Χρόνος, Εικαστικά, Ανθρωπιστικές Επιστήμες, κ.λπ.).

Οι χρήστες του ΕΘΕΓ έχουν τη δυνατότητα να κάνουν αναζητήσεις για το λεξιλόγιο, τη μορφολογία, τα συντακτικά φαινόμενα, και τις χρήσεις της νέας ελληνικής γλώσσας μέσα στο φυσικό λόγο, σχετικά με:

α. συγκεκριμένες λέξεις (π.χ. παιδιού), 
β. λήμματα (π.χ. το λήμμα παιδί συγκεντρώνει όλες τις κλιτές μορφές παιδί, παιδιού, παιδιά, κτλ. 
γ. μέρη του λόγου και 
δ. μέχρι τρεις συνδυασμούς όλων των παραπάνω, με δυνατότητα καθορισμού της μεταξύ τους απόστασης (π.χ. λέξη + λέξη, λήμμα + λέξη, λήμμα + λέξη + λέξη, λήμμα + μέρος του λόγου). 

Για κάθε αναζήτηση, οι χρήστες μπορούν να ορίζουν οι ίδιοι το υποσύνολο των κειμένων του ΕΘΕΓ στο οποίο επιθυμούν να επικεντρώσουν την έρευνά τους. Το υποσύνολο αυτό μπορεί να αποτελείται από ένα ή περισσότερα επικοινωνιακά μέσα, κειμενικά είδη ή/και θέματα. Μπορεί επίσης να αποθηκεύεται από τους χρήστες για μελλοντική χρήση.

Τα αποτελέσματα κάθε αναζήτησης παρουσιάζονται στους χρήστες με τη μορφή ολόκληρων προτάσεων, όπου τα προς αναζήτηση αντικείμενα είναι χρωματισμένα, έτσι ώστε να διακρίνονται με ευκολία. Εναλλακτικά, τα αποτελέσματα παρουσιάζονται με τα προς αναζήτηση αντικείμενα στο κέντρο της σελίδας, έτσι ώστε να διακρίνεται εύκολα το περιβάλλον τους στο φυσικό λόγο.

Τέλος, οι χρήστες του ΕΘΕΓ έχουν τη δυνατότητα να ζητήσουν στατιστικές πληροφορίες για τη συχνότητα εμφάνισης λέξεων, λημμάτων ή/και μερών του λόγου μέσα στα κείμενα του ΕΘΕΓ. Υπάρχουν επίσης στη διάθεσή τους πληροφορίες για τις 100 και 1.000 συχνότερες λέξεις και λήμματα στα κείμενα αυτά.

'Ετσι, ο ΕΘΕΓ αποτελεί πολύτιμο εργαλείο για ποικίλες μελέτες πάνω στην Ελληνική γλώσσα και μπορεί να χρησιμοποιηθεί - μεταξύ άλλων - για: γλωσσολογική έρευνα, λεξικογραφία, ποσοτικές μετρήσεις της γλώσσας, επεξεργασία φυσικής γλώσσας και φωνής.

από το Ινστιτούτο Επεξεργασίας Λόγου


© 2001-2007 Αρβανίτης Διονύσιος  για καλύτερη προβολή, ανάλυση 1280x1024 
κεφαλίδα Top