Title Details: | |
Σώματα κειμένων και εφαρμογές |
|
Authors: |
Tantos, Alexandros |
Reviewer: |
Gkotsoulia, Paraskevi |
Subject: | HUMANITIES AND ARTS > LINGUISTICS > FIELDS OF LINGUISTICS > DESCRIPTIVE LINGUISTICS > COMPUTATIONAL LINGUISTICS HUMANITIES AND ARTS > LINGUISTICS > LANGUAGE TECHNOLOGY |
Keywords: |
Computational Linguistics
Language Texhnology Algorithms Programming Symbolic And Statistical Natural Language Processing Chomsky Hierarchy Regular Expressions Automata Ontologies Syntactic Parsing |
Description: | |
Abstract: |
Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο.
|
Technical Editors: |
Minos, Panagiotis |
Type: |
Chapter |
Creation Date: | 2015 |
Item Details: | |
License: |
http://creativecommons.org/licenses/by-nc-sa/3.0/gr |
Handle | http://hdl.handle.net/11419/2210 |
Bibliographic Reference: | Tantos, A. (2015). Σώματα κειμένων και εφαρμογές [Chapter]. In Tantos, A., Markantonatou, S., Anastassiadis Symeonidis, A., & Kyriakopoulou, P. 2015. Υπολογιστική γλωσσολογία [Undergraduate textbook]. Kallipos, Open Academic Editions. https://hdl.handle.net/11419/2210 |
Language: |
Greek |
Is Part of: |
Υπολογιστική γλωσσολογία |
Publication Origin: |
Kallipos, Open Academic Editions |