›› Μαθήματα σχετικά με τα ερευνητικά ενδιαφέροντα του DM&PG

Τα δυο ακόλουθα μαθήματα προσφέρονται στο Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων του Πανεπιστημίου Θεσσαλίας και σχετίζονται με το αντικείμενο έρευνας του DM&PG:

Για οποιαδήποτε πληροφορία αφορά τα παραπάνω μαθήματα και την ύλη που διδάσκεται μπορείτε να επικοινωνήσετε μαζί μας με αποστολή email στο λογαριασμό dmpg AT inf DOT uth DOT gr.

 

Σχετική Βιβλιογραφία

 

Διδακτορικές Διατριβές

[1] Αρης Γκουλαλάς-Διβάνης: From Itemsets Through Trajectories to Location Based Services: A Knowledge Hiding Privacy Approach. 2009, Βόλος. PDF

 

›› Διπλωματικές εργασίες μεταπτυχιακού επιπέδου

[1] Παλέτσου Μαρία: Ιδιωτικότητα και Ασφάλεια Πληροφορίας. Νοέμβριος 2007, Βόλος. PDF

[2] Μητρογιάννης Βασίλειος: Ασφαλής Διασύνδεση Εγγραφών Κατανεμημένων Βάσεων Δεδομένων με χρήση Πρωτόκολλων Κρυπτογράφησης, Ιούλιος 2008, Βόλος. PDF

 

›› Διπλωματικές εργασίες προπτυχιακού επιπέδου

[1] Γουγούλας Δημήτριος: Προστασία Γνώσης από Κατανεμημένους Αλγορίθμους Εξόρυξης Δεδομένων. Ιούλιος 2005, Βόλος. PDF

[2] Δίντσης Θωμάς: Διατήρηση Ιδιωτικότητας στην Εξόρυξη Κανόνων Συσχέτισης. Ιούλιος 2005, Βόλος. PDF

[3] Μητρογιάννης Βασίλειος: Διατήρηση της Εμπιστευτικότητας κατά την Ενοποίηση των Δεδομένων σε Κατανεμημένες Βάσεις Δεδομένων. Σεπτέμβριος 2005, Βόλος. PDF

[4] Ζαχαρούλη Πολυξένη: Μέθοδοι για τη διατήρηση της ιδιωτικότητας κατά την εξόρυξη χωρο-χρονικών δεδομένων. Οκτώβριος 2006, Βόλος. PDF

[5] Αντωνοπούλου Γαρυφαλιά: Συγκριτική μελέτη αλγορίθμων ανίχνευσης διπλότυπων εγγραφών. Μάιος 2007, Βολος. PDF

[6] Γιαννακόπουλος Σπύρος: Σχεδιασμός και Υλοποίηση Αλγορίθμων προστασίας της ιδιωτικότητας σε χωρο-χρονικά δεδομένα. Νοέμβριος 2007, Βόλος. PDF

[7] Κατσάρου Αλίκη: Διατήρηση της Ιδιωτικότητας κατά την Εξόρυξη Κανόνων Κατηγοριοποίησης, Ιούνιος 2008, Βόλος. PDF

[8] Δούρας Δημήτριος: Κ-ανωνυμία σε Χωροχρονικές Βάσεις Δεδομένων, Οκτώβριος 2008, Βόλος. PDF

[9] Μυστρίδης Παναγιώτης: Διατήρηση της Ιδιωτικότητας κατά τη Συσταδοποίηση Τροχιών Κινούμενων Αντικειμένων, Οκτώβριος 2008, Βόλος. PDF

[10] Πετράκη Ελένη : Ιδιωτικότητα στην Εξόρυξη Γνώσης Τροχιών Κινουμένων Αντικειμένων , Σεπτέμβριος 2009, Βόλος. PDF

[11] Καραμάρκου Χρυσούλα : Απόκρυψη Ευαίσθητων Προτύπων σε Τροχιές Κινούμενων Αντικειμένων , Σεπτέμβριος 2009, Βόλος. PDF

 

›› Διπλωματικές εργασίες και ειδικά θέματα που προσφέρονται

Εαν ενδιαφέρεστε να εκπονήστε μια εργασία σχετική με κάποιο από τα αντικείμενα μελέτης του DM&PG, δείτε την παρακάτω λίστα με τα προσφερόμενα θέματα και επικοινωνήστε κατόπιν μαζί μας μέσω email.

 


Λίστα θεμάτων *

Δημιουργία βάσης για διαχείριση αρχαιολογικών ανασκαφικών φωτογραφιών

Η διπλωματική αυτή γίνεται σε συνεργασία με την Αρχαιολογική Εφορεία Σπάρτης.

Κάθε αρχαιολογική ανασκαφή συνοδεύεται από λήψη σημαντικού αριθμού φωτογραφιών των αρχαιολογικών ευρημάτων και του αρχαιολογικού ανασκαφικού χώρου γενικότερα. Ας σημειωθεί ότι οι περισσότεροι από τους εν λόγω χώρους καταστρέφονται μετά την ολοκλήρωση των ανασκαφικών εργασιών προκειμένου να δώσουν τη θέση τους σε σύγχρονες κατασκευές. Γίνεται συνεπώς εμφανές ότι το φωτογραφικό υλικό καθίσταται μια από τις ελάχιστες πηγές μέσω των οποίων οι αρχαιολόγοι και ερευνητές του μέλλοντος μπορούν να αντλήσουν στοιχεία για τη πολιτιστική δραστηριότητα μιας περιοχής μέσα στο χρόνο. Η διάσωση επομένως της εν λόγω πληροφορίας με τη βοήθεια των σημερινών ηλεκτρονικών μέσων αποθήκευσης καθίσταται περισσότερο από επιτακτική.

Το σύστημα που θα δημιουργηθεί θα πρέπει να έχει τη δυνατότητα καταχώρησης φωτογραφιών καθώς και συνοδευτικού κειμένου περιγραφής τους. Επίσης θα πρέπει να διαθέτει δυνατότητα αναζήτησης φωτογραφιών σύμφωνα με διάφορα κλειδιά ή/και με άλλους κανόνες οι οποίοι όμως θα αφορούν αποκλειστικά κείμενο. Η φιλικότητα στο χρήστη θα πρέπει να είναι από τα κύρια μελήματα της διπλωματικής αφού το τελικό σύστημα απευθύνεται σε άτομα με μικρή έως ελάχιστη εμπειρία σε ηλεκτρονικούς υπολογιστές.

 

Σχεδιασμός και υλοποίηση αλγορίθμων προστασίας της ιδιωτικότητας σε χωρο-χρονικά δεδομένα
(Προγρ. σε Perl) - 2 άτομα

Δύο από τις πιο σημαντικές εργασίες στον τομέα της εξόρυξης γνώσεων είναι η εξόρυξη γνώσης από χωρικά δεδομένα και η εξόρυξη γνώσης από χρονικά δεδομένα.

Τα χωρικά δεδομένα είναι δεδομένα τα οποία έχουν μια χωρική συνιστώσα ή συνιστώσα θέσης. Μπορούν να θεωρηθούν ως δεδομένα αντικειμένων τα οποία βρίσκονται σε ένα φυσικό χώρο. Ένα χαρακτηριστικό παράδειγμα αποτελούν τα Συστήματα Γεωγραφικών Πληροφοριών (Geographical Information Systems - GIS) που αποθηκεύουν πληροφορία που σχετίζεται με κάποια θέση. (Για περισσότερες πληροφορίες δείτε το κεφάλαιο 8 από το βιβλίο "Data Mining" της Margaret Dunham).

Τα χρονικά δεδομένα είναι δεδομένα που αναφέρονται ή μεταβάλλονται στο χρόνο. Ένα χαρακτηριστικό παράδειγμα αποτελούν οι δορυφόροι που συλλέγουν συνεχώς εικόνες και δεδομένα από διάφορους αισθητήρες. Οι πληροφορίες αυτές είναι χρονικές και σχετίζονται με συγκεκριμένες στιγμές στο χρόνο. (Για περισσότερες πληροφορίες δείτε το κεφάλαιο 9 από το βιβλίο "Data Mining" της Margaret Dunham).

Από τα παραπάνω γίνεται εύκολα αντιληπτό ότι τα περιεχόμενα των συγκεκριμένων δεδομένων είναι ιδιαίτερα σημαντικά και συνεπώς θα πρέπει να είναι προσβάσιμα μόνο από εξουσιοδοτημένα άτομα. Σκοπός, λοιπόν, της διπλωματικής εργασίας είναι η μελέτη και ο σχεδιασμός αποτελεσματικών μεθόδων για την προστασία των προαναφερθέντων τύπων δεδομένων.

 

Βιβλιογραφική έρευνα σχετικά με τις αποθήκες χωρο-χρονικών δεδομένων (spatio-temporal data warehouses)

1 άτομο

 

Στη σημερινή εποχή οι αποθήκες δεδομένων διαδραματίζουν ιδιαίτερα σημαντικό ρόλο όσον αφορά τη διαχείριση των πληροφοριών καθώς υποστηρίζουν την ενοποίηση δεδομένων από διαφορετικές πηγές και διευκολύνουν την εξερεύνηση και ανάλυση των δεδομένων για τη λήψη αποφάσεων.

 

Τα προαναφερθέντα βρίσκουν άμεση εφαρμογή και στις χωρο-χρονικές βάσεις δεδομένων. Ωστόσο, τα χωροχρονικά-δεδομένα από τη φύση τους εισάγουν πάρα πολλά ζητήματα που αποτελούν προκλήσεις για τους ερευνητές. Παράλληλα, η ταχεία εξάπλωση των γεωμετρικών δεδομένων, των ιστορικών δεδομένων και των metadata που αυξάνει συνεχώς το μέγεθος των αποθηκών χωρο-χρονικών δεδομένων δημιουργεί ανάγκες για νέες εξιδικευμένες τεχνικές.

 

Σκοπός της διπλωματικής εργασίας είναι η ανασκόπηση της βιβλιογραφίας σχετικά με τις αποθήκες χωρο-χρονικών δεδομένων.

 

Σχεδιασμός και υλοποίηση συστήματος ανίχνευσης διπλότυπων εγγραφών
(Προγρ. σε Perl ή Python) - 3 άτομα

Στο σημερινό ανταγωνιστικό περιβάλλον, οι εταιρείες εστιάζουν την προσοχή τους στους πελάτες τους, έτσι ώστε να διατηρήσουν, αλλά και να αυξήσουν το μερίδιο της αγοράς το οποίο κατέχουν.

Είναι ταυτόχρονα αδιαμφισβήτητο γεγονός, ότι σε αντιδιαστολή με μία καλώς ορισμένη προσπάθεια συλλογής πληροφορίας, η κωδικοποίηση των δεδομένων που καθημερινά συλλέγεται σε λειτουργικές βάσεις δεδομένων, δεν ελέγχεται για την ποιότητα της. Έτσι, δύο από τα πιο σημαντικά προβλήματα που προκύπτουν σε αυτό το χώρο, είναι (α) πως θα βρούμε τις εγγραφές σε ένα σύνολο από πηγές δεδομένων, οι οποίες σχετίζονται με την ίδια φυσική οντότητα (π.χ., άνθρωπος, εταιρεία, νοικοκυριό, κτλ) και (β) πως θα αναγνωρίσουμε διπλο-εγγραφές μέσα σε μία βάση δεδομένων.

Σε αυτήν την διπλωματική, στόχος θα είναι η μελέτη της υπάρχουσας βιβλιογραφίας και η ανάπτυξη ενός συστήματος, το οποίο θα μαθαίνει από δεδομένα, και το οποίο θα ανιχνεύει με τον πιο αποτελεσματικό τρόπο, την ύπαρξη διπλο-εγγραφών σε μεγάλες βάσεις δεδομένων. Ένα σημαντικό κομμάτι της διπλωματικής αυτής, είναι η αξιολόγηση των τεχνικών με τη χρήση συνθετικών και πραγματικών δεδομένων.

 

Υλοποίηση αλγορίθμων απόκρυψης ευαίσθητων στοιχειοσυνόλων στο WEKA
(Προγρ. σε JAVA) - 2 ή 3 άτομα

Οι σύγχρονες τεχνικές εξόρυξης γνώσης από μεγάλες βάσεις δεδομένων όπως η επαγωγή κανόνων κατηγοριοποίησης και η επαγωγή κανόνων συσχέτισης είναι σε θέση να εκμαιεύουν μικρά κομμάτια πληροφοριών τα οποία είναι κρυμμένα μέσα σε τεράστιες πηγές δεδομένων. Όσον αφορά την ασφάλεια, μερικές φορές κάτι τέτοιο είναι επιθυμητό αλλά άλλες πάλι φορές παραβαίνει τις βασικές αρχές του θεμιτού ανταγωνισμού μεταξύ των εταιρειών, ή ακόμα και τα προσωπικά δικαιώματα των ανθρώπων.

Σκοπός της διπλωματικής αυτής είναι η μελέτη τεχνικών απόκρυψης ευαίσθητων στοιχειοσυνόλων που προκύπτουν κατά τη διαδικασία ανακάλυψης συσχετιστικών κανόνων πάνω σε ένα πλήθος συναλλαγών. Οι τεχνικές αυτές χρησιμεύουν στο να διατηρήσουν την ασφάλεια των δεδομένων ή πιθανόν κάποιας πληροφορίας η οποία μπορεί αλλά δεν πρέπει να κοινοποιηθεί.

Αφού γίνει μελέτη της σχετικής βιβλιογραφίας, οι φοιτητές θα πρέπει να υλοποιήσουν κάποιους συγκεκριμένους αλγορίθμους επαγωγής κανόνων συσχέτισης (από αυτούς που ήδη υπάρχουν στην βιβλιογραφία αλλά και καινούργιους) και να χρησιμοποιήσουν συνθετικά αλλά και πραγματικά δεδομένα, για να κάνουν συγκριτική μελέτη της συμπεριφοράς των αλγορίθμων που υλοποιήθηκαν, όπως επίσης και αξιολόγησή τους. Η υλοποίηση των αλγορίθμων θα πρέπει να γίνει στη γλώσσα προγραμματισμού Java και οι υλοποιημένοι αλγόριθμοι θα ενταχθούν στο περιβάλλον του πακέτου εξόρυξης γνώσης WEKA, αυξάνοντας κατά τον τρόπο αυτό τη λειτουργικότητά του.

 

Υλοποίηση τεχνικών διατήρησης ιδιωτικότητας για την ενοποίηση δεδομένων
Ομάδα 2 ατόμων

Στη σύγχρονη εποχή οι διάφοροι οργανισμοί διαχειρίζονται έναν τεράστιο όγκο πληροφοριών. Προκειμένου να μπορέσουν να διαχειριστούν αποτελεσματικά όλες αυτές τις πληροφορίες απαιτείται η ύπαρξη τεχνικών ενοποίησης των δεδομένων.

Με τον όρο ενοποίηση των δεδομένων εννοούμε τον συνδυασμό ή αλλιώς την συνάθροιση των εγγραφών, και γενικότερα των πληροφοριών, που διαθέτουν δυο ή περισσότερες Βάσεις Δεδομένων από διαφορετικές πηγές. Κατά την ενοποίηση των δεδομένων ανακύπτουν ιδιαίτερα ζητήματα ασφαλείας. Θα πρέπει λοιπόν να διασφαλιστεί η ακεραιότητα και εμπιστευτικότητα των δεδομένων.

Στόχος της διπλωματικής εργασίας είναι η  διερεύνηση των τεχνικών που έχουν υλοποιηθεί στη βιβλιογραφία με τις οποίες μπορεί  να επιτευχθεί η ενοποίηση των πληροφοριών μεταξύ των Βάσεων Δεδομένων, διατηρώντας παράλληλα την εμπιστευτικότητα των δεδομένων.

 

Σχεδιασμός και υλοποίηση συστήματος για την παραγωγή συνόλων δεδομένων ελέγχου για αλγόριθμους εξόρυξης γνώσης
(Προγρ. σε JAVA, C++ ή Perl) - Ομάδα 2 ατόμων  

Συνεχώς υλοποιούνται νέοι αλγόριθμοι εξόρυξης δεδομένων. Υπάρχει λοιπόν η ανάγκη σύγκρισης με τους ήδη υπάρχοντες αλγορίθμους έτσι ώστε να εξεταστεί η αποτελεσματικότητα τους. Προκειμένου να επιτευχθεί αυτό, απαιτείται η ύπαρξη συνόλων δεδομένων τα οποία θα αποτελούνται από χιλιάδες ή ακόμη και εκατομμύρια εγγραφές τα οποία θα δίνονται ως είσοδος στον εκάστοτε αλγόριθμο. Το μεγάλο πλήθος των εγγραφών είναι απαραίτητο προκειμένου να διασφαλίσουμε την αντιπροσωπευτικότητα των αποτελεσμάτων.

Σκοπός της διπλωματικής εργασίας είναι ο σχεδιαμός και η υλοποίηση ενός συστήματος που θα παράγει σύνολα δεδομένων ελέγχου (data sets) για τις διάφορες τεχνικές εξόρυξης γνώσης όπως κανόνες συσχέτισης (association rules), κατηγοριοποίηση (classification), συσταδοποίηση (clustering), εξόρυξη κειμένων (text mining), ανάλυση χρονικών σειρών (time series analysis) κ.α..

 

Σχεδιασμός και υλοποίηση συστήματος για την παραγωγή συνόλων δεδομένων ελέγχου για αλγόριθμους διατήρησης ιδιωτικότητας στην εξόρυξη γνώσης
(Προγρ. σε JAVA, C++ ή Perl) - 2 άτομα

Τα τελευταία χρόνια αυξάνεται συνεχώς ο όγκος των πληροφοριών που αποθηκεύονται σε Βάσεις Δεδομένων. Πολλές από αυτές τις πληροφορίες είναι ιδιαίτερα σημαντικές και θα πρέπει να προστατευθούν έναντι οποιουδήποτε δεν έχει εξουσιοδοτημένη πρόσβαση σε αυτές. Υπάρχει, λοιπόν, η ανάγκη δημιουργίας αποτελεσματικών μεθόδων για την αποτελεσματική προστασία των "ευαίσθητων πληροφοριών".  Στη βιβλιογραφία έχουν υλοποιηθεί πάρα πολλές τέτοιες τεχνικές.

Σκοπός της διπλωματικής εργασίας είναι ο σχεδιασμός και η υλοποίηση ενός συστήματος που θα παράγει σύνολα δεδομένων ελέγχου (data sets) ώστε να ελέγχεται η αποτελεσματικότητα των διαφόρων τεχνικών διατήρησης της ιδιωτικότητας (privacy preserving).

 

Υλοποίηση αλγόριθμου επαγωγής δέντρου απόφασης με δυνατότητα περικοπής βασισμένη στην πολυπλοκότητα της εφαρμογής ανίχνευσης διπλότυπων εγγραφών
(Προγρ. σε Perl) - 2 άτομα

Το πρόβλημα της ανίχνευσης διπλότυπων εγγραφών μπορεί να θεωρηθεί ως ένα πρόβλημα κατηγοριοποίησης. Ο στόχος στην κατηγοριοποίηση είναι η αντιστοίχηση των δεδομένων στον επιθυμητό αριθμό κατηγοριών - κλάσεων. Με ανάλογο τρόπο, στόχος του προβλήματος ανίχνευσης διπλότυπων εγγραφών είναι ο προσδιορισμός ζευγών παρόμοιων εγγραφών. Οι μέθοδοι μηχανικής μάθησης όπως τα δέντρα επαγωγής αποφάσεων, τα νευρωνικά δίκτυα, η κατηγοριοποίηση κ.α. χρησιμοποιούνται ευρέως για την κατηγοριοποίηση προτύπων.

Σκοπός της διπλωματικής εργασίας είναι η υλοποίηση ενός αλγορίθμου επαγωγής δέντρου απόφασης με δυνατότητα περικοπής που θα βασίζεται στην ανίχνευση διπλότυπων εγγραφών.

 


* Για όλα τα παραπάνω θέματα ζητείται η παράδοση τεχνικής αναφοράς και πρωτοτύπου σε CD (κώδικας και demo). Επιπλέον, εάν ενδιαφέρεστε για κάποιο θέμα παρεμφερές με τα αντικείμενα μελέτης του εργαστηρίου μας, μπορείτε να επικοινωνήστε μαζί μας για να το συζητήσουμε.