Adobe PDF (7.27 MB)
Title Details:
Υπολογιστικές Μέθοδοι για Ανάλυση Μεγάλων Δεδομένων (Hadoop και MapReduce)
Authors: Verykios, Vasileios
Kagklis, Vasileios
Stavropoulos, Ilias
Reviewer: Kalles, Dimitrios
Subject: MATHEMATICS AND COMPUTER SCIENCE > COMPUTER SCIENCE > INFORMATION MANAGEMENT > DATA MINING
MATHEMATICS AND COMPUTER SCIENCE > COMPUTER SCIENCE > INFORMATION MANAGEMENT > DATABASE SYSTEMS
MATHEMATICS AND COMPUTER SCIENCE > COMPUTER SCIENCE > INFORMATION MANAGEMENT
ENGINEERING AND TECHNOLOGY > TECHNOLOGICAL SCIENCES AND ENGINEERING > INDUSTRIAL TECHNOLOGY AND ENGINEERING > DECISION SUPPORT SYSTEMS AND EXPERT SYSTEMS
MATHEMATICS AND COMPUTER SCIENCE > COMPUTER SCIENCE > INTELLIGENT SYSTEMS > BASIC MACHINE LEARNING
MATHEMATICS AND COMPUTER SCIENCE > COMPUTER SCIENCE > INTELLIGENT SYSTEMS > ADVANCED MACHINE LEARNING
Keywords:
Data Mining
Statistics
Data Science
Big Data Analytics
Machine Learning
Decision Trees
Association Rules
Classification
Clustering
Data Cleaning
NoSQL Databases
OLAP
Hadoop
Mapreduce
Description:
Abstract:
Η λύση του Hadoop & ΜapReduce και των συνεργαζόμενων εφαρμογών τους περιλαμβάνει μεταξύ άλλων μια απλή αλλά πολύ ισχυρή μέθοδο για την επεξεργασία και την ανάλυση των εξαιρετικά μεγάλων συνόλων δεδομένων, ακόμη και μέχρι το επίπεδο πολλαπλών PetaByte. Κατά βάση το MapReduce είναι μια διαδικασία για το συνδυασμό των δεδομένων από πολλαπλές εισόδους (δημιουργώντας το «map»), και μετά αναγωγή (reduce) χρησιμοποιώντας μία λειτουργία που θα διυλίσει τα επιθυμητά αποτελέσματα. Στο κεφάλαιο αυτό παρουσιάζονται πολλαπλές περιπτώσεις χρήσης των Hadoop & MapReduce και των εφαρμογών τους για περιπτώσεις πολλών TB ακόμη και αρκετών PB. το Hadoop χρησιμοποιεί ένα κατανεμημένο σύστημα αρχείων, το HDFS. Το σύστημα του Hadoop/MapReduce είναι χρήσιμο για δεδομένα τα οποία είναι λιγότερο δομημένα όπως για παράδειγμα οι σελίδες Διαδικτύου ή πολλαπλά δεδομένα εγγράφων ή εικόνων τα οποία δεν είναι πλήρως οργανωμένα-δομημένα.
Type: Chapter
Creation Date: 2015
Item Details:
License: http://creativecommons.org/licenses/by-nc-nd/3.0/gr
Handle http://hdl.handle.net/11419/2973
Bibliographic Reference: Verykios, V., Kagklis, V., & Stavropoulos, I. (2015). Υπολογιστικές Μέθοδοι για Ανάλυση Μεγάλων Δεδομένων (Hadoop και MapReduce) [Chapter]. In Verykios, V., Kagklis, V., & Stavropoulos, E. 2015. Η επιστήμη των δεδομένων μέσα από τη γλώσσα R [Undergraduate textbook]. Kallipos, Open Academic Editions. https://hdl.handle.net/11419/2973
Language: Greek
Is Part of: Η επιστήμη των δεδομένων μέσα από τη γλώσσα R
Publication Origin: Kallipos, Open Academic Editions