Navigation

News

Courses

Quick Links

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ

Ακ. έτος 2015-2016, 9ο Εξάμηνο ΗΜ&ΜΥ

ΔΙΔΑΣΚΟΝΤΕΣ:

Νεκτάριος Κοζύρης, Καθηγητής ΕΜΠ
ΓΡΑΦΕΙA: Κτήριο ΗΜ&ΜΥ, 2ος όροφος, Αίθουσα 21.7 και 21.10
ΤΗΛΕΦΩΝΟ: 210-772 1531 και 210-772 2541
E-MAIL: nkoziris@cslab.ece.ntua.gr

ΩΡΕΣ ΓΡΑΦΕΙΟΥ: Παρασκευή (9:30-10:30) ή κατόπιν συνεννοήσεως
ΒΟΗΘΟΙ: Δρ. Γιάννης Κωνσταντίνου ikons@cslab.ece.ntua.gr
ΩΡΕΣ ΜΑΘΗΜΑΤΟΣ: ΒΙΒΛΙA:
  1. Συστήματα Βάσεων Δεδομένων Silberschatz, Korth, Suda.
  2. Θεμελιώδεις αρχές συστημάτων βάσεων δεδομένων Elmasri Ramez,Navathe Shamkant B.
  3. Συστήματα διαχείρισης βάσεων δεδομένων Ramakrishnan Raghu, Gehrke Johannes
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ: Δοσοληψίες, ιδιότητες ACID, συντονισμός δοσοληψιών. Έλεγχος ταυτοχρονισμού, κλείδωμα δυο φάσεων 2PL, αναβάθμιση κλειδώματος. Κατανεμημένες δοσοληψίες. Τεχνικές ανάνηψης. Αποτίμηση και βελτιστοποίηση ερωτημάτων. Χαλάρωση απαιτήσεων ACID, Θεώρημα CAP και BASE. Βάσεις NoSQL, Κατανεμημένο σύστημα αρχείων Google File System, Οι βάσεις BigTable, Dynamo και Cassandra. Κατανεμημένη διαχείριση δεδομένων με τον αλγόριθμο MapReduce, αλγόριθμοι συνένωσης με την εκτέλεση MapReduce. Τα συστήματα επεξεργασίας HIVE,sparksql, elasticsearch.

Αναλυτική Περιγραφή:
  1. Δοσοληψίες,
    ιδιότητες ACID,
    συντονισμός δοσοληψιών
    χρονοπρογράμματα,
    γράφος σειριοποιησιμότητας,
    συγκρούσεις και σειριοποιησιμότητα
  2. Ταυτοχρονισμός,
    κλείδωμα δυο φάσεων 2PL,
    αναβάθμιση κλειδώματος,
    γράφοι αναμονής,
    αδιέξοδα, SQL και συνναλαγές
  3. Κατανεμημένες δοσοληψίες
  4. Τεχνικές ανάνηψης
    Αλγόριθμος WAL
    Checkpoints
    steal-no-force
  5. Αποτίμηση και βελτιστοποίηση ερωτημάτων.
    Ενναλακτικά πλάνα,
    υλοποιήσεις join,
    κανόνες βελτιστοποίησης,
    αριστεροβαθή δέντρα,
    εκτίμηση κόστους,
    δυναμικός προγραμματισμός,
    ιστογράμματα
  6. Χαλάρωση απαιτήσεων ACID
    Θεώρημα CAP
    Θεώρημα BASE.
  7. Βάσεις NoSQL και Google File System
    column stores and row stores,
    Κατανεμημένο σύστημα αρχείων Google File System,
    Οι βάσεις BigTable, Dynamo και Cassandra
  8. Κατανεμημένη διαχείριση δεδομένων
    Ο αλγόριθμος MapReduce
    αλγόριθμοι συνένωσης με την εκτέλεση MapReduce,
    είδη συνενώσεων με χρήση mapreduce: map side join, reduce side join
  9. Κατανεμημένα συστήματα επεξεργασίας δεδομένων
    HIVE
    Sparksql
    Elasticsearch

ΣΧΗΜΑ ΒΑΘΜΟΛΟΓΙΑΣ: Εξαμηνιαίo project 30%, Γραπτή εξέταση 70%.

ΒΙΒΛΙΟΓΡΑΦΙΑ
  1. Concurrency control and recovery, M. J. Franklin,, The computer science and engineering handbook, pp. 1058–1077, 1997.
  2. The Google File System Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung, In 19th ACM Symposium on Operating Systems Principles, Lake George, NY, October, 2003.
  3. Bigtable: A Distributed Storage System for Structured Data Fay Chang, Jeffrey Dean, Sanjay Ghemawat, Wilson C. Hsieh, Deborah A. Wallach, Mike Burrows, Tushar Chandra, Andrew Fikes, and Robert E. Gruber, OSDI'06: Seventh Symposium on Operating System Design and Implementation, Seattle, WA, November, 2006.
  4. Dynamo: Amazon’s Highly Available Key-value Store Giuseppe DeCandia, Deniz Hastorun, Madan Jampani, Gunavardhan Kakulapati, Avinash Lakshman, Alex Pilchin, Swaminathan Sivasubramanian, Peter Vosshall and Werner Vogels, In SOSP '07
  5. Cassandra - A Decentralized Structured Storage System, Avinash Lakshman,Prashant Malik