»»»
Ο ΕΘΕΓ είναι μία δομημένη συλλογή κειμένων της Νέας Ελληνικής γλώσσας, που αναπτύχθηκε από το Ινστιτούτο Επεξεργασίας Λόγου και είναι διαθέσιμος για ερευνητική χρήση μέσω του Διαδικτύου.
Στην παρούσα έκδοσή του περιλαμβάνει περίπου 20.000.000 λέξεις (γραπτά κείμενα) από ευρύ φάσμα μέσων (Βιβλία, Περιοδικά, Εφημερίδες
κ.λπ.), τα οποία ανήκουν σε ποικίλα κειμενικά είδη (Aρθρα, Δοκίμια, Λογοτεχνικά έργα, Αναφορές, Βιογραφίες κτλ.) και καλύπτουν ποικίλη θεματολογία (Οικονομία, Ιατρική, Ελεύθερος Χρόνος, Εικαστικά, Ανθρωπιστικές Επιστήμες,
κ.λπ.).
Οι χρήστες του ΕΘΕΓ έχουν τη δυνατότητα να κάνουν αναζητήσεις για το λεξιλόγιο, τη μορφολογία, τα συντακτικά φαινόμενα, και τις χρήσεις της νέας ελληνικής γλώσσας μέσα στο φυσικό λόγο, σχετικά με:
α. συγκεκριμένες λέξεις (π.χ. παιδιού),
β. λήμματα (π.χ. το λήμμα παιδί συγκεντρώνει όλες τις κλιτές μορφές παιδί, παιδιού, παιδιά, κτλ.
γ. μέρη του λόγου και
δ. μέχρι τρεις συνδυασμούς όλων των παραπάνω, με δυνατότητα καθορισμού της μεταξύ τους απόστασης (π.χ. λέξη + λέξη, λήμμα + λέξη, λήμμα + λέξη + λέξη, λήμμα + μέρος του λόγου).
Για κάθε αναζήτηση, οι χρήστες μπορούν να ορίζουν οι ίδιοι το υποσύνολο των κειμένων του ΕΘΕΓ στο οποίο επιθυμούν να επικεντρώσουν την έρευνά τους. Το υποσύνολο αυτό μπορεί να αποτελείται από ένα ή περισσότερα επικοινωνιακά μέσα, κειμενικά είδη ή/και θέματα. Μπορεί επίσης να αποθηκεύεται από τους χρήστες για μελλοντική χρήση.
Τα αποτελέσματα κάθε αναζήτησης παρουσιάζονται στους χρήστες με τη μορφή ολόκληρων προτάσεων, όπου τα προς αναζήτηση αντικείμενα είναι χρωματισμένα, έτσι ώστε να διακρίνονται με ευκολία. Εναλλακτικά, τα αποτελέσματα παρουσιάζονται με τα προς αναζήτηση αντικείμενα στο κέντρο της σελίδας, έτσι ώστε να διακρίνεται εύκολα το περιβάλλον τους στο φυσικό λόγο.
Τέλος, οι χρήστες του ΕΘΕΓ έχουν τη δυνατότητα να ζητήσουν στατιστικές πληροφορίες για τη συχνότητα εμφάνισης λέξεων, λημμάτων ή/και μερών του λόγου μέσα στα κείμενα του ΕΘΕΓ. Υπάρχουν επίσης στη διάθεσή τους πληροφορίες για τις 100 και 1.000 συχνότερες λέξεις και λήμματα στα κείμενα αυτά.
'Ετσι, ο ΕΘΕΓ αποτελεί πολύτιμο εργαλείο για ποικίλες μελέτες πάνω στην Ελληνική γλώσσα και μπορεί να χρησιμοποιηθεί - μεταξύ άλλων - για:
γλωσσολογική έρευνα, λεξικογραφία, ποσοτικές μετρήσεις της γλώσσας,
επεξεργασία φυσικής γλώσσας και φωνής.
από
το Ινστιτούτο Επεξεργασίας Λόγου
|