Adobe PDF (1.32 MB)
Title Details:
Σώματα κειμένων και εφαρμογές
Authors: Tantos, Alexandros
Reviewer: Gkotsoulia, Paraskevi
Subject: HUMANITIES AND ARTS > LINGUISTICS > FIELDS OF LINGUISTICS > DESCRIPTIVE LINGUISTICS > COMPUTATIONAL LINGUISTICS
HUMANITIES AND ARTS > LINGUISTICS > LANGUAGE TECHNOLOGY
Keywords:
Computational Linguistics
Language Texhnology
Algorithms
Programming
Symbolic And Statistical Natural Language Processing
Chomsky Hierarchy
Regular Expressions
Automata
Ontologies
Syntactic Parsing
Description:
Abstract:
Τα Σώματα Κειμένων (ΣΚ) αποτελούν έναν από τους κυριότερους γλωσσικούς πόρους για την αυτοματοποιημένη επεξεργασία φυσικού λόγου. Το παρόν κεφάλαιο θα περιέχει βασικές έννοιες για α) την κατάρτιση και β) την αξιοποίηση των ΣΚ. Αρχικά, αφού αναδειχθεί η ποιοτική διαφορά ανάμεσα σε επισημειωμένα και μη επισημειωμένα ΣΚ, θα αναλυθούν τα βασικά κριτήρια επιλογής και ταξινόμησης των ΣΚ για στοχευμένη και πιο αποτελεσματική γλωσσολογική ή μη επεξεργασία των κειμενικών δεδομένων. Η κατάρτιση ενός ΣΚ αποτελεί μια δύσκολη υπόθεση και προϋποθέτει την τήρηση διαφόρων βασικών κριτηρίων επιλογής των κειμένων, προκειμένου το γλωσσικό δείγμα που θα συλλεχθεί να είναι αντιπροσωπευτικό της γλωσσικής ποικιλίας που φιλοδοξεί να εκπροσωπεί. Θα παρουσιαστούν τα είδη ΣΚ και οι πρακτικές αξιοποίησής τους μέσα από τη χρήση παραδειγμάτων. Επιπλέον, ο αναγνώστης θα εξοικειωθεί με τη γλώσσα σήμανσης XML που αποτελεί την κυρίαρχη γλώσσα σήμανση για την πλειονότητα των επισημειωμένων ΣΚ σημέρα. Στο τελευταίο μέρος του κεφαλαίου, θα παρουσιαστούν οι βασικές αρχές της θεωρίας πιθανοτήτων που είναι απαραίτητες για μια σειρά εφαρμογών στην υπολογιστική γλωσσολογία. Σε αυτή την κατεύθυνση και ως παράδειγμα για την ανάλυση κατηγορικών μεταβλητών που αφορούν τα γλωσσικά δεδομένα, θα λειτουργήσουν η διατύπωση και ο έλεγχος υποθέσεων. Εκεί, περιγράφεται βήμα προς βήμα η διαδικασία ελέγχου υποθέσεων πάνω σε ΣΚ στη βάση ενός απτού παραδείγματος. Ο ελέγχος υποθέσεων αποτελεί ένα απαραίτητο καθημερινό εργαλείο για την επεξεργασία γλωσσικών δεδομένων για τον υπολογιστικό γλωσσολόγο και όχι μόνο.
Technical Editors: Minos, Panagiotis
Type: Chapter
Creation Date: 2015
Item Details:
License: http://creativecommons.org/licenses/by-nc-sa/3.0/gr
Handle http://hdl.handle.net/11419/2210
Bibliographic Reference: Tantos, A. (2015). Σώματα κειμένων και εφαρμογές [Chapter]. In Tantos, A., Markantonatou, S., Anastassiadis Symeonidis, A., & Kyriakopoulou, P. 2015. Υπολογιστική γλωσσολογία [Undergraduate textbook]. Kallipos, Open Academic Editions. https://hdl.handle.net/11419/2210
Language: Greek
Is Part of: Υπολογιστική γλωσσολογία
Publication Origin: Kallipos, Open Academic Editions