{"componentChunkName":"component---src-templates-section-template-js","path":"/el/4/3","result":{"data":{"markdown":{"htmlAst":{"type":"root","children":[{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"lead","properties":{},"children":[{"type":"text","value":"Ο κύριος στόχος εκμάθησης στην παρούσα ενότητα είναι ένα ακόμη καλό παράδειγμα μεθόδων επιβλεπόμενης μάθησης, σχεδόν εξίσου απλό με τον ταξινομητή πλησιέστερου γείτονα: η γραμμική παλινδρόμηση. Θα παρουσιάσουμε επίσης το πρώτο ξαδερφάκι του, τη λογιστική παλινδρόμηση.\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Διαφορά μεταξύ ταξινόμησης και παλινδρόμησης","description":"Υπάρχει μια μικρή αλλά σημαντική διαφορά όσον αφορά το είδος των προβλέψεων στις οποίες θα πρέπει να καταλήγουμε στο πλαίσιο διαφορετικών σεναρίων. Παρότι, για παράδειγμα, ο ταξινομητής πλησιέστερου γείτονα επιλέγει μια ετικέτα κλάσης για οποιοδήποτε στοιχείο από ένα σύνολο εναλλακτικών επιλογών ετικετών (όπως spam/ham, ή 0,1,2,...,9), με τη γραμμική παλινδρόμηση προκύπτει μια αριθμητική πρόβλεψη η οποία δεν περιορίζεται σε ακέραιους (πλήρης αριθμός, σε αντίθεση με έναν αριθμό όπως το 3,14). Συνεπώς, η γραμμική παλινδρόμηση είναι καταλληλότερη για χρήση σε περιπτώσεις όπου η μεταβλητή εξόδου μπορεί να είναι οποιοσδήποτε αριθμός όπως η τιμή ενός προϊόντος, η απόσταση από ένα εμπόδιο, οι εισπράξεις της επόμενης ταινίας του Πολέμου των Άστρων, και ούτω καθεξής."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η βασική ιδέα στη γραμμική παλινδρόμηση συνίσταται στην άθροιση των επιδράσεων καθεμιάς από τις μεταβλητές χαρακτηριστικών με σκοπό τον υπολογισμό της προβλεπόμενης τιμής. Ο τεχνικός όρος για τη διαδικασία άθροισης είναι "},{"type":"element","tagName":"em","properties":{},"children":[{"type":"text","value":"«γραμμικός συνδυασμός»"}]},{"type":"text","value":". Η ιδέα είναι πολύ απλή, και μπορεί να απεικονιστεί σε ένα λογαριασμό αγορών σας."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Θεώρηση της γραμμικής παλινδρόμησης ως λογαριασμού αγορών","description":"Υποθέστε ότι πηγαίνετε στο σουπερμάρκετ και αγοράζετε 2,5 κιλά πατάτες, 1,0 κιλό καρότα, και δύο μπουκάλια γάλα. Εάν η τιμή για τις πατάτες είναι 2 ευρώ το κιλό, η τιμή των καρότων 4 ευρώ το κιλό, και ένα μπουκάλι γάλα κοστίζει 3 ευρώ, τότε ο λογαριασμός, όπως τον υπολογίζει ο ταμίας, ανέρχεται σε 2,5 × 2 ευρώ + 1,0 × 4 ευρώ + 2 × 3 ευρώ = 15 ευρώ. Στη γραμμική παλινδρόμηση, η ποσότητα των πατατών, των καρότων και του γάλακτος είναι οι είσοδοι δεδομένων. Η έξοδος είναι το κόστος των αγορών σας, το οποίο είναι σαφές ότι εξαρτάται τόσο από την τιμή όσο και από την ποσότητα κάθε προϊόντος που αγοράζετε."},"children":[{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η λέξη «γραμμική» σημαίνει ότι η αύξηση της εξόδου, όταν ένα χαρακτηριστικό της εισόδου αυξάνεται κατά κάποιο σταθερό ποσό, είναι πάντοτε η ίδια. Με άλλα λόγια, όποτε προσθέτετε, για παράδειγμα, δύο κιλά καρότα στο καλάθι των αγορών σας, ο λογαριασμός αυξάνεται κατά 8 ευρώ. Όταν προσθέτετε ακόμη δύο κιλά, ο λογαριασμός αυξάνεται κατά ακόμη 8 ευρώ, ενώ εάν προσθέσετε τη μισή ποσότητα, δηλ. 1 κιλό, ο λογαριασμός αυξάνεται ακριβώς κατά το ήμισυ, δηλ. 4 ευρώ."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"key-terminology","properties":{"terminologies":"[\n      {\"title\":\"Συντελεστές ή βάρη\",\"content\":\"Στην ορολογία γραμμικής παλινδρόμησης οι τιμές των διαφόρων προϊόντων ονομάζονται συντελεστές ή βάρη (λέξη η οποία, παρότι φαίνεται ότι μπορεί να προκαλέσει σύγχυση, δεδομένου ότι μετρήσαμε την ποσότητα των πατατών και των καρότων με βάση το βάρος, δεν θα πρέπει να σας μπερδεύει). Ένα από τα βασικά πλεονεκτήματα της γραμμικής παλινδρόμησης είναι ότι ερμηνεύεται εύκολα: η εκμάθηση των βαρών μπορεί, στην πραγματικότητα, να παρουσιάζει πολύ μεγαλύτερο ενδιαφέρον από ό,τι οι προβλέψεις των εξόδων.<br><br>Για παράδειγμα, όταν χρησιμοποιούμε τη γραμμική παλινδρόμηση για να προβλέψουμε το προσδόκιμο ζωής, το βάρος του καπνίσματος (τσιγάρα ανά ημέρα) ισοδυναμεί με μείωση κατά περίπου μισό έτος, δηλ. ένα τσιγάρο περισσότερο την ημέρα έχει ως συνέπεια να μειώνεται το προσδόκιμο ζωής σας κατά μισό έτος κατά μέσο όρο. Παρομοίως, το βάρος της κατανάλωσης λαχανικών (μια μερίδα λαχανικών την ημέρα) ισοδυναμεί με αύξηση ενός έτους, δηλ. η κατανάλωση μιας μερίδας λαχανικών κάθε ημέρα έχει ως συνέπεια να αυξάνεται το προσδόκιμο της ζωής σας κατά ένα έτος κατά μέσο όρο.\"}\n  ]"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"quiz","properties":{"quizid":"d937f663-b20a-512d-b374-ef006a121fc8"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στην παραπάνω άσκηση, ως αφετηρία για τον υπολογισμό χρησιμοποιήθηκε το προσδόκιμο ζωής των μη καπνιστριών που απεχθάνονται τα λαχανικά, που είναι 80 έτη. Ο τεχνικός όρος που χρησιμοποιείται για την αφετηρία είναι ο "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"«σταθερός όρος» (ή τεταγμένη)"}]},{"type":"text","value":". Θα επιστρέψουμε στα παραπάνω, όταν εξετάσουμε τον τρόπο εκμάθησης μοντέλων γραμμικής παλινδρόμησης από δεδομένα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Εκμάθηση γραμμικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Προηγουμένως, εξετάσαμε τον τρόπο πραγματοποίησης προβλέψεων με βάση τη γραμμική παλινδρόμηση, όταν είναι γνωστά τόσο τα βάρη όσο και τα χαρακτηριστικά εισόδου. Ως εκ τούτου, εφόσον μας δίνονται οι είσοδοι και το βάρος, μπορούμε να υπολογίσουμε την προβλεπόμενη έξοδο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όταν μας δίνονται οι είσοδοι και οι έξοδοι για σειρά στοιχείων, μπορούμε να υπολογίσουμε τα βάρη ούτως ώστε η προβλεπόμενη έξοδος να παρουσιάζει τη μεγαλύτερη δυνατή αντιστοιχία με την πραγματική έξοδο. Αυτό είναι το πρόβλημα που επιλύεται μέσω της μηχανικής μάθησης."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Παράδειγμα","description":"Σε αναλογία με την αγορά προϊόντων, ας υποθέσουμε ότι μας δίνεται το περιεχόμενο μιας σειράς καλαθιών αγορών και ο συνολικός λογαριασμός για καθένα από αυτά, και μας ζητείται να υπολογίσουμε την τιμή καθενός από τα προϊόντα (πατάτες, καρότα, και ούτω καθεξής). Από ένα μόνο καλάθι που περιέχει, για παράδειγμα, 1 κιλό κόντρα φιλέτο, 2 κιλά καρότα, και ένα μπουκάλι Chianti, ακόμη και αν γνωρίζαμε ότι ο συνολικός λογαριασμός είναι 35 ευρώ, δεν θα μπορούσαμε να προσδιορίσουμε τις τιμές, διότι υπάρχουν πολλά σύνολα τιμών που αντιστοιχούν στο ίδιο σύνολο λογαριασμού. Ωστόσο, το πρόβλημα μπορεί συνήθως να λυθεί, εάν έχουμε πολλά καλάθια."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Εντούτοις, το πρόβλημα γίνεται ακόμη δυσκολότερο εξαιτίας του γεγονότος ότι στον πραγματικό κόσμο, η πραγματική έξοδος δεν καθορίζεται πάντοτε εξ ολοκλήρου με βάση την είσοδο, λόγω των διαφόρων παραγόντων που εισάγουν στη διαδικασία αβεβαιότητα ή «θόρυβο». Υποθέστε ότι κάνετε τις αγορές σας σε μια αγορά όπου οι τιμές κάθε συγκεκριμένου προϊόντος μπορεί να μεταβάλλονται με τον χρόνο, ή ότι βρίσκεστε σε ένα εστιατόριο όπου στον τελικό λογαριασμό περιλαμβάνεται και ένα μεταβλητό ποσό φιλοδωρήματος. Σε τέτοιου είδους καταστάσεις, μπορούμε να προβούμε σε μια εκτίμηση των τιμών, αλλά όχι με απόλυτη ακρίβεια."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ο προσδιορισμός των βαρών που βελτιστοποιούν την αντιστοιχία μεταξύ των προβλεπόμενων και των πραγματικών εξόδων στα δεδομένα εκπαίδευσης αποτελεί κλασικό πρόβλημα στατιστικής που ανάγεται στις αρχές του 19ου αιώνα, και το οποίο επιλύεται εύκολα ακόμη και για σύνολα μεγάλων δεδομένων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Δεν θα υπεισέλθουμε στις λεπτομέρειες των αλγορίθμων προσδιορισμού των πραγματικών βαρών, όπως η κλασική τεχνική των ελαχίστων τετραγώνων, καθώς είναι απλοί. Ωστόσο, στις επόμενες ασκήσεις μπορείτε να αποκτήσετε μια ιδέα του τρόπου προσδιορισμού τάσεων στα δεδομένα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Οπτικοποίηση γραμμικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ένας καλός τρόπος να αποκτήσετε μια ιδέα του τι μπορεί να μας προσφέρει η γραμμική παλινδρόμηση είναι να σχεδιάσετε ένα διάγραμμα με τα δεδομένα μας και τα αποτελέσματα της παλινδρόμησης. Ως απλό ενδεικτικό παράδειγμα, θεωρούμε ότι το σύνολο δεδομένων έχει μία μεταβλητή, τον αριθμό των κουπών καφέ που πίνει ένας εργαζόμενος ανά ημέρα, και, ως έξοδο, τον αριθμό των γραμμών κώδικα που γράφει ανά ημέρα ο ίδιος εργαζόμενος. Δεν πρόκειται για πραγματικό σύνολο δεδομένων, καθώς είναι προφανές ότι εκτός από τον καφέ υπάρχουν και άλλοι παράγοντες που επηρεάζουν την παραγωγικότητα ενός εργαζόμενου και οι οποίοι αλληλεπιδρούν με περίπλοκους τρόπους. Επίσης, η αύξηση της παραγωγικότητας μέσω της αύξησης της ποσότητας καφέ είναι αξιόπιστη μέχρι ένα ορισμένο σημείο, μετά το οποίο οι διαταραχές είναι σημαντικές."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"linearreg","properties":{},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όταν παρουσιάζουμε τα δεδομένα μας στο ανωτέρω διάγραμμα ως σημεία, καθένα εκ των οποίων αναπαριστά έναν εργαζόμενο, μπορούμε να διαπιστώσουμε μια σαφή τάση που συνίσταται στο ότι η κατανάλωση περισσότερου καφέ συνεπάγεται τη συγγραφή περισσότερων γραμμών κώδικα (υπενθυμίζεται ότι πρόκειται για απολύτως φανταστικά δεδομένα). Από το συγκεκριμένο σύνολο δεδομένων μπορούμε να μάθουμε τον συντελεστή, ή το βάρος, σε σχέση με την κατανάλωση καφέ, και μπορούμε ήδη να διαπιστώσουμε εμπειρικά ότι φαίνεται να είναι κοντά στο πέντε, δεδομένου ότι για κάθε κούπα καφέ που καταναλώνεται, ο αριθμός των γραμμών κώδικα που προγραμματίζονται φαίνεται να αυξάνεται κατά πέντε, κατά προσέγγιση. Για παράδειγμα, οι εργαζόμενοι που πίνουν δύο περίπου κούπες καφέ την ημέρα φαίνεται να παράγουν 20 περίπου γραμμές κώδικα την ημέρα, ενώ, παρομοίως, στις τέσσερις κούπες καφέ, η ποσότητα των παραγόμενων γραμμών είναι περίπου 30."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μπορεί επίσης να επισημανθεί ότι οι εργαζόμενοι που δεν πίνουν καθόλου καφέ παράγουν επίσης κώδικα, ο οποίος, με βάση το διάγραμμα, είναι περίπου δέκα γραμμές. Αυτός ο αριθμός είναι ο σταθερός όρος (η τεταγμένη) που αναφέρθηκε παραπάνω. Ο σταθερός όρος είναι μία ακόμη παράμετρος του μοντέλου, όπως τα βάρη, την οποία μπορούμε να μάθουμε με βάση τα δεδομένα. Όπως και στο παράδειγμα του προσδόκιμου ζωής, μπορούμε να θεωρήσουμε τον σταθερό όρο ως αφετηρία για τους υπολογισμούς μας, προτού συνυπολογίσουμε τις επιδράσεις της μεταβλητής εισόδου, ή των μεταβλητών εισόδου εφόσον είναι περισσότερες από μία, είτε πρόκειται για κούπες καφέ στο παρόν παράδειγμα είτε για τσιγάρα στο προηγούμενο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η γραμμή στο διάγραμμα αναπαριστά την προβλεπόμενη έξοδο, ενώ ο σταθερός όρος και ο συντελεστής έχουν υπολογιστεί με χρήση μιας πραγματικής τεχνικής γραμμικής παλινδρόμησης που ονομάζεται τεχνική ελαχίστων τετραγώνων. Η γραμμή αυτή μπορεί να χρησιμοποιηθεί για την πρόβλεψη του αριθμού γραμμών, όταν η είσοδος είναι ο αριθμός των κουπών καφέ. Επισημαίνεται ότι η πρόβλεψη είναι εφικτή ακόμη και αν επιτραπεί η χρήση κλασμάτων της κούπας (όπως μισή κούπα, 1/4 της κούπας, και ούτω καθεξής)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise17","properties":{"quizid":"03ed00e3-066d-5308-871a-3eb5c726941d"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise18","properties":{"quizid":"9daaaa74-625a-5bfd-965a-592018882b7b"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Πρέπει να τονιστεί ότι μελέτες όπως αυτές που χρησιμοποιούνται στις παραπάνω ασκήσεις δεν μπορούν να εντοπίσουν αιτιώδεις σχέσεις. Με άλλα λόγια, δεν είναι δυνατόν, με βάση τα εν λόγω δεδομένα και μόνο, να αποφανθούμε κατά πόσον οι σπουδές αυξάνουν πράγματι το προσδόκιμο ζωής μέσω ενός καλύτερα ενημερωμένου και πιο υγιούς τρόπου ζωής ή άλλων μηχανισμών, ή εάν η προφανής συσχέτιση μεταξύ προσδόκιμου ζωής και εκπαίδευσης οφείλεται σε υποκείμενους παράγοντες που επηρεάζουν αμφότερους τους όρους. Για παράδειγμα, είναι πιθανό, σε χώρες όπου οι άνθρωποι τείνουν να έχουν υψηλό επίπεδο εκπαίδευσης, τα επίπεδα της διατροφής, της υγειονομικής περίθαλψης και της ασφάλειας να είναι επίσης καλύτερα, γεγονός που αυξάνει το προσδόκιμο ζωής. Με αυτού του είδους την απλή ανάλυση, μπορούμε απλώς να εντοπίσουμε συσχετίσεις, οι οποίες είναι εντούτοις χρήσιμες για την πρόβλεψη."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h3","properties":{},"children":[{"type":"text","value":"Εφαρμογές της γραμμικής παλινδρόμησης στη μηχανική μάθηση"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η γραμμική παλινδρόμηση αποτελεί την πραγματική κινητήρια δύναμη για πολλές εφαρμογές τεχνητής νοημοσύνης (ΤΝ) και επιστήμης δεδομένων. Η συγκεκριμένη τεχνική έχει τους περιορισμούς της, οι οποίοι αντισταθμίζονται, ωστόσο, από την απλότητα, την ευκολία ερμηνείας και την αποτελεσματικότητά της. Η γραμμική παλινδρόμηση έχει χρησιμοποιηθεί με επιτυχία, για παράδειγμα, στα ακόλουθα προβλήματα:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"ul","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη ποσοστών κλικ σε διαφημίσεις στο διαδίκτυο"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη της λιανικής ζήτησης προϊόντων"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη των εισπράξεων κινηματογραφικών ταινιών του Χόλιγουντ"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη του κόστους λογισμικού"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη του κόστους ασφάλισης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη της εγκληματικότητας"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη τιμών ακινήτων"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Μπορούμε να χρησιμοποιήσουμε τη γραμμική παλινδρόμηση για την πρόβλεψη ετικετών;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όπως αναφέρθηκε παραπάνω, με τη γραμμική παλινδρόμηση και τη μέθοδο πλησιέστερου γείτονα προκύπτουν διαφορετικά είδη προβλέψεων. Οι έξοδοι της γραμμικής παλινδρόμησης είναι αριθμητικές ενώ η μέθοδος πλησιέστερου γείτονα παράγει ετικέτες από ένα καθορισμένο σύνολο εναλλακτικών επιλογών («κλάσεις»)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Εκεί που η γραμμική παλινδρόμηση υπερέχει σε σύγκριση με τη μέθοδο πλησιέστερου γείτονα είναι η ευκολία ερμηνείας. Τι εννοούμε με αυτό; Μπορούμε να πούμε ότι, κατά κάποιο τρόπο, η μέθοδος πλησιέστερου γείτονα καθώς και οποιαδήποτε μεμονωμένη πρόβλεψη που προκύπτει ερμηνεύονται εύκολα: δεν πρόκειται παρά απλώς για το πλησιέστερο στοιχείο δεδομένων εκπαίδευσης! Αυτό είναι αλήθεια, ωστόσο, όταν πρόκειται για την ερμηνεία του εκπαιδευμένου μοντέλου, η διαφορά είναι εμφανής. Η ερμηνεία του εκπαιδευμένου μοντελου πλησιέστερου γείτονα κατά τρόπο παρόμοιο με την ερμηνεία των βαρών στο πλαίσιο της γραμμικής παλινδρόμησης δεν είναι δυνατή: το εκπαιδευμένο μοντέλο αφορά βασικά το σύνολο των δεδομένων, γεγονός που το καθιστά συνήθως υπερβολικά μεγάλου μεγέθους και σύνθετο, με αποτέλεσμα να μην είναι εφικτή η εξαγωγή σημαντικών συμπερασμάτων. Τι μπορούμε λοιπόν να κάνουμε σε περίπτωση που επιθυμούμε μια μέθοδο που παράγει ίδιου είδους εξόδους με τη μέθοδο του πλησιέστερου γείτονα, τις ετικέτες, και παρουσιάζει την ίδια ευκολία ερμηνείας με τη γραμμική παλινδρόμηση;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Η λύση της λογιστικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Σας έχουμε καλά νέα: μπορούμε να μετατρέψουμε τις εξόδους της μεθόδου γραμμικής παλινδρόμησης σε προβλέψεις για ετικέτες. Η συγκεκριμένη τεχνική ονομάζεται λογιστική παλινδρόμηση. Χωρίς να υπεισέλθουμε στις τεχνικές λεπτομέρειες, αρκεί να πούμε ότι στην απλούστερη περίπτωση, λαμβάνουμε την έξοδο της γραμμικής παλινδρόμησης, δηλ. έναν αριθμό, και προβαίνουμε σε πρόβλεψη μίας ετικέτας A εάν η ετικέτα υπερβαίνει το μηδέν, και μία άλλη ετικέτα B εάν η ετικέτα είναι μικρότερη ή ίση του μηδενός. Στην πραγματικότητα, αντί για την απλή πρόβλεψη κάποιας κλάσης, η λογιστική παλινδρόμηση μπορεί επίσης να μας παράσχει ένα μέτρο της αβεβαιότητας της πρόβλεψης. Συνεπώς, εάν η πρόβλεψή μας αφορά το κατά πόσον ένας πελάτης θα αγοράσει ένα καινούργιο έξυπνο τηλέφωνο το τρέχον έτος, μπορούμε να προβλέψουμε ότι ο πελάτης A θα αγοράσει τηλέφωνο με πιθανότητα 90%, ενώ σε ό,τι αφορά έναν άλλο, λιγότερο προβλέψιμο πελάτη, μπορούμε να προβλέψουμε ότι δεν θα αγοράσει ένα τηλέφωνο με πιθανότητα 55% (ή με άλλα λόγια, ότι θα αγοράσει τηλέφωνο με πιθανότητα 45%)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μπορούμε επίσης να χρησιμοποιήσουμε την ίδια τεχνική για να λάβουμε προβλέψεις για περισσότερες από δύο πιθανές ετικέτες, οπότε, αντί η πρόβλεψή μας να συνίσταται πάντοτε σε ναι ή όχι (θα αγοράσει νέο τηλέφωνο ή όχι, είναι οι ειδήσεις ψευδείς ή πραγματικές, και ούτω καθεξής), μπορούμε να χρησιμοποιήσουμε τη λογιστική παλινδρόμηση για την ταυτοποίηση, για παράδειγμα, χειρόγραφων ψηφίων, περίπτωση κατά την οποία υπάρχουν δέκα πιθανές ετικέτες."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h3","properties":{},"children":[{"type":"text","value":"Παράδειγμα λογιστικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ας υποθέσουμε ότι συλλέγουμε δεδομένα σπουδαστών που παρακολουθούν σειρά εισαγωγικών μαθημάτων μαγειρικής. Πέραν των βασικών στοιχείων όπως τα στοιχεία ταυτότητας, το ονοματεπώνυμο του σπουδαστή, και ούτω καθεξής, ζητούμε επίσης από τους σπουδαστές να αναφέρουν πόσες ώρες μελέτησαν για τις εξετάσεις (όμως μελετά κανείς για εξετάσεις μαγειρικής, μάλλον μαγειρεύοντας, έτσι δεν είναι;) – ελπίζοντας ότι οι απαντήσεις τους στις αναφορές τους θα είναι λίγο έως πολύ ειλικρινείς. Μετά τις εξετάσεις, θα γνωρίζουμε εάν ο σπουδαστής πέρασε με επιτυχία τις εξετάσεις. Στη συνέχεια παρουσιάζονται ορισμένα δεδομένα:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"table","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"tbody","properties":{},"children":[{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Στοιχεία ταυτότητας σπουδαστή"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Ώρες μελέτης"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Επιτυχία/αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"24"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"15"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"41"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"9.5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"58"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"2"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"101"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"103"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"6.5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"215"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"6"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Με βάση τον πίνακα, τι συμπέρασμα θα βγάζατε από τη συσχέτιση των ωρών μελέτης και της επιτυχίας στις εξετάσεις; Μπορούμε να σκεφτούμε ότι εάν διαθέτουμε δεδομένα από εκατοντάδες σπουδαστές, μπορούμε ίσως να υπολογίσουμε τις ώρες μελέτης που απαιτούνται για επιτυχία στις εξετάσεις. Μπορούμε να παρουσιάσουμε τα εν λόγω δεδομένα σε διάγραμμα, όπως φαίνεται παρακάτω."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise19","properties":{"quizid":"65e65573-5fcc-5d75-a4c1-5b7319565957"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η λογιστική παλινδρόμηση χρησιμοποιείται επίσης σε μεγάλο αριθμό εφαρμογών ΤΝ στον πραγματικό κόσμο όπως η πρόβλεψη χρηματοοικονομικών κινδύνων, στο πλαίσιο ιατρικών μελετών, και ούτω καθεξής. Ωστόσο, όπως και στη γραμμική παλινδρόμηση, υπάρχει ο περιορισμός της ιδιότητας της γραμμικότητας, με αποτέλεσμα να χρειαζόμαστε πολλές άλλες μεθόδους στην εργαλειοθήκη μας. Θα επανέλθουμε στο ζήτημα της γραμμικότητας αργότερα, όταν θα εξετάσουμε τα νευρωνικά δίκτυα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Τα όρια της μηχανικής μάθησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Συνοψίζοντας, η μηχανική μάθηση είναι ένα ιδιαίτερα ισχυρό εργαλείο για τη δημιουργία εφαρμογών ΤΝ. Πέραν της μεθόδου πλησιέστερου γείτονα, της γραμμικής παλινδρόμησης και της λογιστικής παλινδρόμησης, υπάρχουν κυριολεκτικά εκατοντάδες, εάν όχι χιλιάδες, διαφορετικές τεχνικές μηχανικής μάθησης, οι οποίες, ωστόσο, συνοψίζονται στο ίδιο πράγμα: την προσπάθεια εξαγωγής προτύπων και εξαρτήσεων από δεδομένα και τη χρήση τους είτε για την κατανόηση ενός φαινομένου είτε για την πρόβλεψη μελλοντικών αποτελεσμάτων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η μηχανική μάθηση μπορεί να αποτελέσει ένα ιδιαίτερα δύσκολο πρόβλημα, και, συνήθως, δεν μπορούμε να επιτύχουμε την τέλεια μέθοδο που θα δίνει πάντοτε την ορθή ετικέτα. Εντούτοις, στις περισσότερες περιπτώσεις, μια καλή, αλλά όχι τέλεια, πρόβλεψη είναι προτιμότερη από καμία πρόβλεψη. Μερικές φορές, παρότι μπορεί να είμαστε σε θέση να κάνουμε καλύτερες προβλέψεις μόνοι μας, ενδέχεται να εξακολουθούμε να προτιμούμε να χρησιμοποιήσουμε τη μηχανική μάθηση, διότι η μηχανή παράγει προβλέψεις ταχύτερα και σε μεγάλες ποσότητες χωρίς να κουράζεται. Καλά παραδείγματα είναι τα συστήματα συστάσεων που πρέπει να προβλέπουν τι είδους μουσική, ποια βίντεο ή ποιες διαφημίσεις είναι πιθανότερο να σας ενδιαφέρουν περισσότερο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι παράγοντες που επηρεάζουν την ποιότητα του αποτελέσματος είναι οι εξής:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"ul","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η δυσκολία της εργασίας: στην αναγνώριση χειρόγραφων ψηφίων, εάν τα ψηφία έχουν γραφτεί πολύ πρόχειρα, ακόμη και ένας άνθρωπος δεν είναι πάντοτε σε θέση να μαντέψει σωστά τις προθέσεις του συντάκτη"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η μέθοδος της μηχανικής μάθησης: ορισμένες μέθοδοι είναι πολύ καλύτερες για συγκεκριμένη εργασία από ό,τι άλλες"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Ο όγκος των δεδομένων εκπαίδευσης: είναι αδύνατος ο υπολογισμός ενός καλού ταξινομητή με βάση μερικά μόνο παραδείγματα"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η ποιότητα των δεδομένων."}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Η ποιότητα των δεδομένων μετράει","description":"Στην αρχή του παρόντος κεφαλαίου, τονίσαμε τη σημασία της επάρκειας των δεδομένων και τους κινδύνους της υπερπροσαρμογής. Ένας άλλος εξίσου σημαντικός παράγοντας είναι η <b>ποιότητα</b> των δεδομένων. Για τη διαμόρφωση ενός μοντέλου που επιτρέπει τη γενίκευση σε δεδομένα πέραν των δεδομένων εκπαίδευσης, τα δεδομένα εκπαίδευσης πρέπει να περιέχουν επαρκείς πληροφορίες συναφείς με το εκάστοτε πρόβλημα. Για παράδειγμα, εάν δημιουργήσετε έναν ταξινομητή εικόνων που σας πληροφορεί σχετικά με το τι αφορά η εικόνα που παρέχεται στον αλγόριθμο, και τον έχετε εκπαιδεύσει μόνο με εικόνες σκύλων και γατών, θα αναγνωρίσει ό,τι βλέπει είτε ως σκύλο είτε ως γάτα. Αυτό έχει νόημα εφόσον ο αλγόριθμος χρησιμοποιείται σε περιβάλλον όπου θα βλέπει μόνο γάτες και σκύλους, ενώ δεν έχει νόημα σε περίπτωση που αναμένεται να βλέπει σκάφη, αυτοκίνητα και λουλούδια.<br><br>Θα επανέλθουμε στα πιθανά προβλήματα που προκαλούν τα «μεροληπτικά» δεδομένα."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Πρέπει επίσης να τονιστεί ότι διαφορετικές μέθοδοι μηχανικής μάθησης είναι κατάλληλες για διαφορετικές εργασίες. Ως εκ τούτου, δεν υπάρχει μία βέλτιστη μέθοδος για όλα τα προβλήματα («ένας αλγόριθμος για την επίλυση όλων...”). Ευτυχώς, μπορεί κανείς να δοκιμάσει έναν μεγάλο αριθμό διαφορετικών μεθόδων για να εντοπίσει ποια από αυτές λειτουργεί καλύτερα σε σχέση με το εκάστοτε πρόβλημα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στο σημείο αυτό ερχόμαστε αντιμέτωποι με ένα ζήτημα που είναι ιδιαίτερα σημαντικό αλλά συχνά παραγνωρίζεται στην πράξη: τι σημαίνει «λειτουργεί καλύτερα». Σε ό,τι αφορά την εργασία της αναγνώρισης ψηφίων, είναι φυσικό ότι μια καλή μέθοδος παράγει την ορθή ετικέτα τις περισσότερες φορές. Αυτό μπορούμε να το μετρήσουμε βάσει του σφάλματος ταξινόμησης: το κλάσμα των περιπτώσεων στις οποίες οι έξοδοι του ταξινομητή ανήκουν σε εσφαλμένη κλάση. Όταν προβλέπουμε τις τιμές διαμερισμάτων, μέτρο της ποιότητας είναι συνήθως κάτι όπως η διαφορά μεταξύ της προβλεπόμενης τιμής και της τελικής τιμής πώλησης του διαμερίσματος. Σε πολλές εφαρμογές της καθημερινότητας, το να διαπράττεις σφάλμα προς μία συγκεκριμένη κατεύθυνση είναι χειρότερο από το να διαπράττεις σφάλμα προς μια άλλη κατεύθυνση: ο προσδιορισμός υπερβολικά υψηλής τιμής μπορεί να καθυστερήσει τη διαδικασία για πολλούς μήνες, ενώ ο προσδιορισμός υπερβολικά χαμηλής τιμής συνεπάγεται μείωση του κέρδους του πωλητή. Και, για να χρησιμοποιήσουμε ένα ακόμη παράδειγμα, η αδυναμία εντοπισμού ενός πεζού μπροστά από ένα αυτοκίνητο είναι πολύ χειρότερο σφάλμα από τον εσφαλμένο εντοπισμό ενός πεζού που δεν υπάρχει πραγματικά."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όπως αναφέρθηκε προηγουμένως, συνήθως δεν μπορούμε να επιτύχουμε μηδενικό σφάλμα, αλλά θα πρέπει ίσως να είμαστε ικανοποιημένοι με σφάλμα κάτω του 1 στα 100 (ή 1%). Αυτό εξαρτάται επίσης από την εφαρμογή: δεν θα είμαστε ικανοποιημένοι εάν είχαμε μόνο 99% ασφαλή αυτοκίνητα στους δρόμους, αλλά το να μπορούμε να προβλέπουμε κατά πόσον θα σας αρέσει ένα νέο τραγούδι με αυτήν την ακρίβεια μπορεί να είναι υπεραρκετό για μια ευχάριστη εμπειρία ακρόασης. Το να μην λησμονούμε ποτέ τον πραγματικό στόχο μας βοηθά να εξασφαλίζουμε ότι δημιουργούμε πραγματική προστιθέμενη αξία."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"part-summary","properties":{"chapter":"4","heading":"Αφού ολοκληρώσετε το κεφάλαιο 4, θα πρέπει να μπορείτε:","listitems":"[\n  {\"content\":\"Να εξηγήσετε τους λόγους για τους οποίους χρησιμοποιούνται οι τεχνικές μηχανικής μάθησης\"},\n  {\"content\":\"Να διακρίνετε μεταξύ των σεναρίων μη επιβλεπόμενης και επιβλεπόμενης μηχανικής μάθησης\"},\n  {\"content\":\"Να εξηγείτε τις αρχές των τριών μεθόδων επιβλεπόμενης ταξινόμησης: της μεθόδου πλησιέστερου γείτονα, της γραμμικής παλινδρόμησης και της λογιστικής παλινδρόμησης.\"}\n    ]"},"children":[{"type":"text","value":">\n  "}]},{"type":"text","value":"\n"}]}],"data":{"quirksMode":false}},"frontmatter":{"path":"/el/4/3","title":"Παλινδρόμηση","section":3,"part":4,"lang":"el"}},"allRelatedSections":{"totalCount":3,"edges":[{"node":{"htmlAst":{"type":"root","children":[{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"lead","properties":{},"children":[{"type":"text","value":"Οι χειρόγραφοι αριθμοί αποτελούν κλασική περίπτωση που χρησιμοποιείται συχνά όταν εξετάζουμε γιατί χρησιμοποιούμε τη μηχανική μάθηση, και ούτε εμείς θα ξεφύγουμε από αυτή την πρακτική."}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μπορείτε να δείτε παρακάτω παραδείγματα χειρόγραφων εικόνων από το ευρέως χρησιμοποιούμενο σύνολο δεδομένων MNIST."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"mnist"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η ορθή ετικέτα (ποιον αριθμό ήθελε να γράψει ο γράφων) φαίνεται πάνω από κάθε εικόνα. Επισημαίνεται ότι ορισμένες από τις «ορθές» ετικέτες κλάσεων είναι αμφισβητήσιμες: δείτε για παράδειγμα τη δεύτερη εικόνα από αριστερά: είναι πράγματι 7, ή μήπως είναι 4;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"MNIST – Τι είναι;","description":"Κάθε σπουδαστής της μηχανικής μάθησης γνωρίζει το σύνολο δεδομένων MNIST. Λιγότεροι ωστόσο γνωρίζουν σε τι αντιστοιχεί το ακρωνύμιο. Κι εμείς χρειάστηκε να το κοιτάξουμε για να σας πούμε ότι το Μ σημαίνει «τροποποιημένος» (Modified) και ότι το NIST σημαίνει «Εθνικό Ινστιτούτο Προτύπων και Τεχνολογίας» (National Institute of Standards and Technology). Τώρα γνωρίζετε κάτι που ένας μέσος ειδικός στη μηχανική μάθηση πιθανότατα δεν γνωρίζει!"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στα συνηθέστερα προβλήματα μηχανικής μάθησης, ακριβώς μια ετικέτα κλάσης είναι ορθή σε μια δεδομένη στιγμή. Αυτό ισχύει επίσης στην περίπτωση του MNIST, αν και, όπως είπαμε, συχνά μπορεί να είναι δύσκολο να πει κανείς ποια είναι η ορθή απάντηση. Σε αυτό το είδος προβλήματος, δεν είναι δυνατό ένα στιγμιότυπο να ανήκει ταυτόχρονα σε πολλαπλές κλάσεις (ή σε καμία). Αυτό που θέλουμε να επιτύχουμε είναι μια μέθοδος ΤΝ στην οποία μπορεί να δίνεται μια εικόνα όπως οι παραπάνω και αυτή να δίνει αυτόματα την ορθή ετικέτα (έναν αριθμό μεταξύ 0 και 9)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Πώς να μην λύσετε το πρόβλημα","description":"Μια αυτόματη μηχανή αναγνώρισης αριθμών θα μπορούσε θεωρητικά να δημιουργηθεί χειρωνακτικά, γράφοντας κανόνες όπως οι εξής:\n    <ul>\n    <li>εάν τα μαύρα εικονοστοιχεία έχουν κυρίως τη μορφή ενός μόνο κύκλου, τότε η ετικέτα είναι 0</li>\n    <li>εάν τα μαύρα εικονοστοιχεία έχουν τη μορφή δύο τεμνόμενων κύκλων, τότε η ετικέτα είναι 8</li>\n    <li>εάν τα μαύρα εικονοστοιχεία έχουν κυρίως τη μορφή ευθείας κατακόρυφης γραμμής στη μέση του σχήματος, τότε η ετικέτα είναι 1</li>\n    </ul>\n    και ούτω καθεξής...<br><br>\nΜε αυτό τον τρόπο αναπτύχθηκαν ως επί το πλείστον οι μέθοδοι ΤΝ τη δεκαετία του 1980 (τα λεγόμενα «έμπειρα συστήματα»). Ωστόσο, ακόμη και για μια τόσο απλή εργασία όπως η αναγνώριση αριθμών, η εργασία της γραφής τέτοιων κανόνων είναι πολύ κοπιαστική. Πράγματι, οι κανόνες του παραπάνω παραδείγματος δεν θα ήταν αρκετά συγκεκριμένοι ώστε να υλοποιηθούν μέσω προγραμματισμού – θα έπρεπε να καθορίσουμε με ακρίβεια τι εννοούμε με τις λέξεις «κυρίως», «κύκλος», «γραμμή», «μέση» κ.λπ.<br><br>\nΑκόμα και αν κάναμε όλη αυτή την εργασία, το αποτέλεσμα θα ήταν πιθανότατα μια κακή μέθοδος ΤΝ διότι, όπως μπορείτε να δείτε, οι χειρόγραφοι αριθμοί βρίσκονται συχνά κάπου ανάμεσα, οπότε για κάθε κανόνα θα απαιτούνταν δεκάδες εξαιρέσεις.\n"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Τρία είδη μηχανικής μάθησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι ρίζες της μηχανικής μάθησης βρίσκονται στη στατιστική, η οποία μπορεί επίσης να θεωρηθεί ως η τέχνη της "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"εξαγωγής γνώσεων από δεδομένα"}]},{"type":"text","value":". Ιδίως μέθοδοι όπως η γραμμική παλινδρόμηση και η στατιστική του Μπέυζ, οι οποίες έχουν αμφότερες ηλικία άνω των δύο αιώνων (!), βρίσκονται ακόμη και σήμερα στο επίκεντρο της μηχανικής μάθησης. Για περισσότερα παραδείγματα και μια σύντομη ιστορική αναδρομή, δείτε το "},{"type":"element","tagName":"a","properties":{"href":"https://en.wikipedia.org/wiki/Timeline_of_machine_learning","target":"_blank","rel":["noopener","noreferrer"]},"children":[{"type":"text","value":"ιστορικό της μηχανικής μάθησης"}]},{"type":"text","value":" (Wikipedia)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ο τομέας της μηχανικής μάθησης συχνά υποδιαιρείται σε υποτομείς ανάλογα με τα είδη των προβλημάτων που αντιμετωπίζονται. Μια πρόχειρη κατηγοριοποίηση είναι η εξής:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"Επιβλεπόμενη μάθηση"}]},{"type":"text","value":": Μας δίνεται μια είσοδος, για παράδειγμα μια φωτογραφία με μια πινακίδα οδικής σήμανσης και η εργασία είναι να προβλέψουμε την ορθή έξοδο ή ετικέτα, για παράδειγμα ποια πινακίδα οδικής σήμανσης αναπαριστάται στην εικόνα (όριο ταχύτητας, σήμα στοπ κ.λπ.). Στις απλούστερες περιπτώσεις, οι απαντήσεις έχουν τη μορφή ναι/όχι (οι περιπτώσεις αυτές ονομάζονται "},{"type":"element","tagName":"em","properties":{},"children":[{"type":"text","value":"δυαδικά προβλήματα ταξινόμησης"}]},{"type":"text","value":")."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"Μη επιβλεπόμενη μάθηση"}]},{"type":"text","value":": Δεν υπάρχουν ετικέτες ούτε ορθές έξοδοι. Η εργασία συνίσταται στην ανακάλυψη της δομής των δεδομένων: για παράδειγμα, με την ομαδοποίηση παρόμοιων στοιχείων για τον σχηματισμό «συστάδων» ή τη μείωση των δεδομένων σε έναν μικρό αριθμό σημαντικών «διαστάσεων». Η οπτικοποίηση δεδομένων μπορεί επίσης να θεωρηθεί μη επιβλεπόμενη μάθηση."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"Ενισχυτική μάθηση"}]},{"type":"text","value":": Χρησιμοποιείται συνήθως σε καταστάσεις όπου ένα σύστημα ΤΝ, όπως ένα αυτοοδηγούμενο αυτοκίνητο, πρέπει να λειτουργήσει σε ένα περιβάλλον και όπου η ανατροφοδότηση σχετικά με καλές ή κακές επιλογές είναι διαθέσιμη με κάποια καθυστέρηση. Χρησιμοποιείται επίσης σε παιχνίδια στα οποία το αποτέλεσμα μπορεί να αποφασιστεί μόνο στο τέλος του παιχνιδιού."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι κατηγορίες επικαλύπτονται και είναι σχετικά ασαφείς, οπότε ενίοτε είναι δύσκολο μια συγκεκριμένη μέθοδος να ενταχθεί σε μία κατηγορία. Για παράδειγμα, όπως υποδηλώνει η ονομασία της, η λεγόμενη "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"ημιεπιβλεπόμενη μάθηση"}]},{"type":"text","value":" είναι εν μέρει επιβλεπόμενη και εν μέρει μη επιβλεπόμενη."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Ταξινόμηση","description":"Όσον αφορά τη μηχανική μάθηση, θα εστιάσουμε κυρίως στην επιβλεπόμενη μάθηση και, ειδικότερα, στις εργασίες ταξινόμησης. Στην ταξινόμηση, παρατηρούμε μια είσοδο, όπως τη φωτογραφία μιας πινακίδας οδικής σήμανσης, και προσπαθούμε να βρούμε την «κλάση» της, όπως το είδος της πινακίδας (όριο ταχύτητας 80 χλμ/ώρα, διάβαση πεζών, σήμα στοπ κ.λπ.). Άλλα παραδείγματα εργασιών ταξινόμησης είναι τα εξής: εντοπισμός ψεύτικων λογαριασμών στο Twitter (στις εισόδους περιλαμβάνονται ο κατάλογος των ακολουθούντων και ο ρυθμός με τον οποίο άρχισαν να ακολουθούν τον λογαριασμό, και η κλάση είναι 'πραγματικός' ή 'ψεύτικος' λογαριασμός) και αναγνώριση χειρόγραφων αριθμών (η είσοδος είναι μια εικόνα, η κλάση είναι 0,.....,9)."},"children":[{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"supervised-learning"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Άνθρωποι διδάσκουν μηχανές: επιβλεπόμενη μάθηση"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Αντί να γράφουμε με το χέρι ακριβείς κανόνες για την εκτέλεση της ταξινόμησης, το νόημα της επιβλεπόμενης μάθησης είναι ότι παίρνουμε διάφορα παραδείγματα, δίνουμε στο καθένα την ορθή ετικέτα και τα χρησιμοποιούμε για να «εκπαιδεύσουμε» μια μέθοδο ΤΝ να αναγνωρίζει αυτομάτως την ορθή ετικέτα για τα παραδείγματα εκπαίδευσης καθώς και (ευελπιστούμε) οποιεσδήποτε άλλες εικόνες. Αυτό προϋποθέτει ασφαλώς την παροχή των ορθών ετικετών, γι’ αυτό μιλάμε για επιβλεπόμενη μάθηση. Ο χρήστης που παρέχει τις ορθές ετικέτες είναι ο επιβλέπων ο οποίος καθοδηγεί τον αλγόριθμο μάθησης προς ορθές απαντήσεις ώστε, τελικά, ο αλγόριθμος να μπορεί να τις παράγει ανεξάρτητα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Πέραν της εκμάθησης τρόπων πρόβλεψης της ορθής ετικέτας σε ένα πρόβλημα ταξινόμησης, η επιβλεπόμενη μάθηση μπορεί επίσης να χρησιμοποιείται σε καταστάσεις στις οποίες το προβλεπόμενο αποτέλεσμα είναι ένας αριθμός. Παραδείγματα αποτελούν η πρόβλεψη του αριθμού των ατόμων που θα κάνουν κλικ σε μια διαφήμιση της Google βάσει του περιεχομένου της διαφήμισης και δεδομένων σχετικά με την προηγούμενη διαδικτυακή συμπεριφορά του χρήστη, η πρόβλεψη του αριθμού των τροχαίων ατυχημάτων βάσει των οδικών συνθηκών και του ορίου ταχύτητας, ή η πρόβλεψη της τιμής πώλησης ακινήτων βάσει της τοποθεσίας, του μεγέθους και της κατάστασής τους. Τα προβλήματα αυτά ονομάζονται "},{"type":"element","tagName":"em","properties":{},"children":[{"type":"text","value":"παλινδρόμηση"}]},{"type":"text","value":". Θα αναγνωρίζετε ίσως τον όρο "},{"type":"element","tagName":"em","properties":{},"children":[{"type":"text","value":"γραμμική παλινδρόμηση"}]},{"type":"text","value":", που είναι μια κλασική, δημοφιλής μέχρι σήμερα, τεχνική παλινδρόμησης."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Παράδειγμα","description":"Ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων που αποτελείται από δεδομένα πωλήσεων διαμερισμάτων. Για κάθε αγορά έχουμε προφανώς την τιμή που καταβλήθηκε, μαζί με το μέγεθος του διαμερίσματος σε τετραγωνικά μέτρα (ή τετραγωνικά πόδια, αν προτιμάτε), και τον αριθμό των υπνοδωματίων, το έτος κατασκευής, την κατάσταση (σε κλίμακα από «ερείπιο» έως «νεόδμητο»). Θα μπορούσαμε στη συνέχεια να χρησιμοποιήσουμε τη μηχανική μάθηση για να εκπαιδεύσουμε ένα μοντέλο παλινδρόμησης το οποίο προβλέπει την τιμή πώλησης βάσει αυτών των χαρακτηριστικών. Δείτε <a target='_blank' rel='noopener noreferrer' href='http://kannattaakokauppa.fi/#/fi/'>ένα πραγματικό παράδειγμα εδώ</a>."},"children":[{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"price-real-estate","color":"#85a0ff","frombottom":"4%","totalheight":"81%"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Προειδοποίηση: προσοχή με τον συγκεκριμένο αλγόριθμο μηχανικής μάθησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Υπάρχουν ορισμένα πιθανά σφάλματα για τα οποία θέλουμε να σας ενημερώσουμε. Συνδέονται με το γεγονός ότι αν δεν είστε προσεκτικοί όσον αφορά τον τρόπο με τον οποίο εφαρμόζετε τις μεθόδους μηχανικής μάθησης, μπορεί να αποκτήσετε υπέρμετρη σιγουριά σχετικά με την ακρίβεια των προβλέψεών σας και να νιώθετε μεγάλη απογοήτευση όταν η ακρίβεια αποδεικνύεται χειρότερη από το αναμενόμενο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Το πρώτο που πρέπει να έχετε υπόψη ώστε να αποφεύγετε σοβαρά σφάλματα είναι να χωρίζετε το σύνολο δεδομένων σας σε δύο μέρη: τα "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"δεδομένα εκπαίδευσης"}]},{"type":"text","value":" και τα "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"δεδομένα ελέγχου"}]},{"type":"text","value":". Πρώτα εκπαιδεύουμε τον αλγόριθμο χρησιμοποιώντας μόνο τα δεδομένα εκπαίδευσης. Με τον τρόπο αυτό δημιουργούμε ένα μοντέλο ή έναν κανόνα που προβλέπει την έξοδο βάσει των μεταβλητών εισόδου."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Για να αξιολογήσουμε πόσο καλά μπορούμε στην πραγματικότητα να προβλέψουμε τις εξόδους, δεν μπορούμε να βασιζόμαστε στα δεδομένα εκπαίδευσης. Παρότι ένα μοντέλο μπορεί να αποτελεί πολύ καλό προβλέπτη για τα δεδομένα εκπαίδευσης, δεν αποδεικνύεται ότι μπορεί να "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"γενικευθεί"}]},{"type":"text","value":" σε οποιαδήποτε άλλα δεδομένα. Σε αυτό χρησιμεύουν τα δεδομένα ελέγχου: μπορούμε να εφαρμόσουμε το εκπαιδευμένο μοντέλο για την πρόβλεψη των εξόδων για τα δεδομένα ελέγχου και να συγκρίνουμε τις προβλέψεις με τις πραγματικές εξόδους (για παράδειγμα, μελλοντικές τιμές πώλησης διαμερισμάτων)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Πολύ προσαρμοσμένο για να είναι αληθινό! Προειδοποίηση υπερπροσαρμογής","description":"Είναι πολύ σημαντικό να έχετε υπόψη ότι η ακρίβεια ενός προβλέπτη που αποκτάται μέσω μηχανικής μάθησης μπορεί να διαφέρει αρκετά στα δεδομένα εκπαίδευσης και στα διαφορετικά δεδομένα ελέγχου. Αυτό είναι το λεγόμενο φαινόμενο της υπερπροσαρμογής και η έρευνα σχετικά με τη μηχανική μάθηση επικεντρώνεται σε μεγάλο βαθμό στην αποτροπή του φαινόμενου αυτού με τον έναν ή τον άλλον τρόπο. Διαισθητικά, <b>υπερπροσαρμογή</b> σημαίνει ότι προσπαθούμε να είμαστε πολύ έξυπνοι. Όταν προβλέπετε την επιτυχία ενός νέου τραγουδιού γνωστού καλλιτέχνη, μπορεί να εξετάσετε το ιστορικό προηγούμενων τραγουδιών του καλλιτέχνη και να διατυπώσετε έναν κανόνα του τύπου «εάν το τραγούδι είναι ερωτικό και περιλαμβάνει πιασάρικο ρεφρέν, θα βρεθεί στα 20 καλύτερα τραγούδια». Ωστόσο, μπορεί να υπάρχουν δύο ερωτικά τραγούδια με πιασάρικα ρεφρέν τα οποία δεν βρέθηκαν στα 20 καλύτερα τραγούδια, οπότε αποφασίζετε να συνεχίσετε τον κανόνα προσθέτοντας τη φράση «... εκτός εάν αναφέρονται η Σουηδία ή η γιόγκα», προκειμένου να τον βελτιώσετε. Με τον τρόπο αυτό ο κανόνας σας προσαρμόζεται τέλεια στα παρελθόντα δεδομένα, αλλά στην πραγματικότητα μπορεί να λειτουργεί <b>χειρότερα σε μελλοντικά δεδομένα ελέγχου</b>.<br><br>Οι μέθοδοι μηχανικής μάθησης είναι ιδιαίτερα επιρρεπείς στην υπερπροσαρμογή, διότι μπορεί να δοκιμάζουν έναν τεράστιο αριθμό διαφορετικών «κανόνων» έως ότου βρεθεί αυτός που προσαρμόζεται τέλεια στα δεδομένα εκπαίδευσης. Ιδιαίτερα μέθοδοι οι οποίες είναι πολύ ευέλικτες και μπορούν να προσαρμόζονται σε σχεδόν κάθε πρότυπο στα δεδομένα μπορεί να εμφανίσουν υπερπροσαρμογή εκτός εάν ο όγκος των δεδομένων είναι τεράστιος. Για παράδειγμα, σε σύγκριση με τα αρκετά περιορισμένα γραμμικά μοντέλα που προκύπτουν από τη γραμμική παλινδρόμηση, τα νευρωνικά δίκτυα μπορεί να απαιτήσουν τεράστιους όγκους δεδομένων προτού παραγάγουν αξιόπιστες προβλέψεις."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μία από τις βασικότερες δεξιότητες ενός επιστήμονα δεδομένων είναι η αποφυγή της υπερπροσαρμογής και η επιλογή μοντέλων που δεν είναι ούτε υπερβολικά περιορισμένα ούτε υπερβολικά ευέλικτα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Μάθηση χωρίς δάσκαλο: μη επιβλεπόμενη μάθηση"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Εξετάσαμε ανωτέρω την επιβλεπόμενη μάθηση στο πλαίσιο της οποίας οι ορθές απαντήσεις είναι διαθέσιμες και η εργασία του αλγορίθμου μηχανικής μάθησης συνίσταται στην εξεύρεση ενός μοντέλου που προβλέπει τις απαντήσεις βάσει των δεδομένων εισόδου."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στη μη επιβλεπόμενη μάθηση, οι ορθές απαντήσεις δεν παρέχονται. Αυτό καθιστά την κατάσταση αρκετά διαφορετική καθώς δεν μπορούμε να δημιουργήσουμε ένα μοντέλο βάζοντάς το να προσαρμόσει τις ορθές απαντήσεις στα δεδομένα εκπαίδευσης. Καθιστά επίσης περιπλοκότερη την αξιολόγηση των επιδόσεων, δεδομένου ότι δεν μπορούμε να ελέγξουμε αν το μοντέλο βάσει μάθησης λειτουργεί καλά ή όχι."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι συνήθεις μέθοδοι μη επιβλεπόμενης μάθησης προσπαθούν να μάθουν ένα είδος «δομής» που διέπει τα δεδομένα. Αυτό μπορεί να σημαίνει, για παράδειγμα, "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"οπτικοποίηση"}]},{"type":"text","value":" στο πλαίσιο της οποίας παρόμοια αντικείμενα τοποθετούνται κοντά το ένα στο άλλο, ενώ ανόμοια αντικείμενα τοποθετούνται μακριά το ένα από το άλλο. Μπορεί να σημαίνει επίσης "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"συσταδοποίηση"}]},{"type":"text","value":", στο πλαίσιο της οποίας χρησιμοποιούμε τα δεδομένα για τον προσδιορισμό ομάδων ή «συστάδων» στοιχείων που είναι παρόμοια μεταξύ τους αλλά ανόμοια από δεδομένα σε άλλες συστάδες."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Παράδειγμα","description":"Απτό παράδειγμα αποτελούν οι αλυσίδες καταστημάτων τροφίμων που συλλέγουν δεδομένα σχετικά με την αγοραστική συμπεριφορά των πελατών τους (σε αυτό χρησιμεύουν όλες αυτές οι κάρτες για πιστούς πελάτες). Για να κατανοήσει καλύτερα τους πελάτες του, το κατάστημα μπορεί είτε να οπτικοποιήσει τα δεδομένα με χρήση γράφου στον οποίο κάθε πελάτης αναπαριστάται με μια κουκκίδα και οι πελάτες που τείνουν να αγοράζουν τα ίδια προϊόντα τοποθετούνται πιο κοντά μεταξύ τους σε σχέση με πελάτες που αγοράζουν διαφορετικά προϊόντα. Ή το κατάστημα θα μπορούσε να εφαρμόσει συσταδοποίηση ώστε να λάβει ένα σύνολο ομάδων πελατών όπως «λάτρεις της υγιεινής διατροφής χαμηλού προϋπολογισμού», «λάτρεις των ακριβών ψαριών», «αναψυκτικά και πίτσα 6 ημέρες την εβδομάδα» και ούτω καθεξής. Επισημαίνεται ότι η μέθοδος μηχανικής μάθησης θα ομαδοποιούσε απλώς τους πελάτες σε συστάδες, αλλά δεν θα παρήγαγε αυτομάτως τις ετικέτες των συστάδων («λάτρεις των ψαριών» και ούτω καθεξής). Την εργασία αυτή θα την εκτελούσε ο χρήστης."},"children":[{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Άλλο ένα παράδειγμα μη επιβλεπόμενης μάθησης μπορεί να ονομαστεί "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"γενετική μοντελοποίηση"}]},{"type":"text","value":". Τα τελευταία χρόνια η προσέγγιση αυτή κατέχει εξέχουσα θέση, καθώς μια τεχνική βαθιάς μάθησης που ονομάζεται «παραγωγικά αντιπαραθετικά δίκτυα» (ΠΑΔ) έχει οδηγήσει σε σημαντικά επιτεύγματα. Με τη λήψη ορισμένων δεδομένων, για παράδειγμα, φωτογραφιών προσώπων, ένα παραγωγικό μοντέλο μπορεί να παραγάγει περισσότερα από τα ίδια: περισσότερο αληθοφανείς εικόνες τεχνητών προσώπων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Θα επανέλθουμε στα ΠΑΔ και στις συνέπειες της δυνατότητας παραγωγής συνθετικών εικόνων υψηλής ποιότητας λίγο αργότερα στο μάθημα. Πρώτα όμως θα εξετάσουμε προσεκτικότερα την επιβλεπόμενη μάθηση, ενώ παράλληλα θα εξετάσουμε αναλυτικότερα ορισμένες ειδικές μεθόδους."}]}],"data":{"quirksMode":false}},"excerpt":"Μπορείτε να δείτε παρακάτω παραδείγματα χειρόγραφων εικόνων από το ευρέως χρησιμοποιούμενο σύνολο δεδομένων MNIST. Η ορθή ετικέτα (ποιον…","frontmatter":{"path":"/el/4/1","title":"Τα είδη της μηχανικής μάθησης","part":4,"type":"section","lang":"el","section":1}}},{"node":{"htmlAst":{"type":"root","children":[{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"lead","properties":{},"children":[{"type":"text","value":"Ο ταξινομητής πλησιέστερου γείτονα είναι από τους απλούστερους ταξινομητές. Όταν του δίνεται ένα στοιχείο προς ταξινόμηση, βρίσκει το στοιχείο των δεδομένων εκπαίδευσης που μοιάζει περισσότερο με το νέο στοιχείο και παράγει την ετικέτα του. Ενα παράδειγμα δίνεται στο ακόλουθο διάγραμμα."}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"nearest-neighbor-graph-EL"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στο παραπάνω διάγραμμα δείχνουμε μια συλλογή στοιχείων δεδομένων εκπαίδευσης, ορισμένα από τα οποία ανήκουν σε μία κλάση (πράσινη) και τα υπόλοιπα σε άλλη (μπλε). Επιπλέον, υπάρχουν δύο στοιχεία δεδομένων ελέγχου τα οποία θα ταξινομήσουμε χρησιμοποιώντας τη μέθοδο του πλησιέστερου γείτονα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Τα δύο στοιχεία ελέγχου ταξινομούνται αμφότερα στην «πράσινη» κλάση διότι οι πλησιέστεροι γείτονές τους έχουν και οι δύο πράσινο χρώμα (βλέπε διάγραμμα β) ανωτέρω)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η θέση των σημείων στο σχέδιο αντιπροσωπεύει με κάποιον τρόπο τις ιδιότητες των στοιχείων. Καθώς σχεδιάζουμε το διάγραμμα σε μια επίπεδη επιφάνεια δύο διαστάσεων, μπορείτε να μετακινηθείτε σε δύο ανεξάρτητες διευθύνσεις: πάνω-κάτω ή αριστερά-δεξιά – τα στοιχεία έχουν δύο ιδιότητες τις οποίες μπορούμε να χρησιμοποιήσουμε για σκοπούς σύγκρισης. Φανταστείτε για παράδειγμα την αναπαράσταση των ασθενών μιας κλινικής βάσει της ηλικίας τους και του επιπέδου ζαχάρου στο αίμα τους. Ωστόσο, το ανωτέρω διάγραμμα θα πρέπει να εκληφθεί μόνο ως οπτικό εργαλείο για την απεικόνιση της γενικής ιδέας, δηλαδή της συσχέτισης των τιμών των κλάσεων με την ομοιότητα ή την εγγύτητα. Η γενική ιδέα σε καμία περίπτωση δεν περιορίζεται σε δύο διαστάσεις και ο ταξινομητής πλησιέστερου γείτονα μπορεί εύκολα να εφαρμοστεί σε στοιχεία που χαρακτηρίζονται από πολλές περισσότερες ιδιότητες από δύο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Τι εννοούμε με το «πλησιέστερος»;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ένα ενδιαφέρον ερώτημα που σχετίζεται (μεταξύ άλλων) με τον ταξινομητή πλησιέστερου γείτονα είναι ο ορισμός της απόστασης ή της ομοιότητας μεταξύ στιγμιοτύπων. Στην παραπάνω απεικόνιση, θεωρήσαμε σιωπηρά ότι χρησιμοποιείται η συνήθης γεωμετρική απόσταση, η οποία σε τεχνικούς όρους ονομάζεται ευκλείδεια απόσταση. Αυτό σημαίνει απλώς ότι εάν τα σημεία σχεδιάζονται σε ένα κομμάτι χαρτί (ή εμφανίζονται στην οθόνη σας), μπορείτε να μετρήσετε την απόσταση μεταξύ οποιωνδήποτε δύο στοιχείων τραβώντας μια ευθεία γραμμή από το ένα στο άλλο και μετρώντας το μήκος."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Ορισμός του «πλησιέστερου»","description":"Η χρήση της γεωμετρικής απόστασης για τον προσδιορισμό του πλησιέστερου στοιχείου ενδέχεται να μην είναι πάντα λογική ή και εφικτή: το είδος της εισόδου μπορεί, για παράδειγμα, να είναι κείμενο, οπότε δεν είναι σαφές με ποιον τρόπο μπορούν να σχεδιαστούν τα στοιχεία σε μια γεωμετρική αναπαράσταση και πώς θα πρέπει να μετρηθούν οι αποστάσεις. Ως εκ τούτου, θα πρέπει να χρησιμοποιείτε τον τρόπο μέτρησης της απόστασης κατά περίπτωση."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στην περίπτωση της αναγνώρισης αριθμών του MNIST, ένας συνήθης τρόπος μέτρησης της ομοιότητας των εικόνων είναι η μέτρηση των εικονοστοιχείων που ταιριάζουν. Με άλλα λόγια, συγκρίνουμε μεταξύ τους τα εικονοστοιχεία στην πάνω αριστερά γωνία κάθε εικόνας και όσο πιο παρόμοιο χρώμα (απόχρωση του γκρι) έχουν, τόσο πιο παρόμοιες είναι οι δύο εικόνες. Συγκρίνουμε επίσης τα εικονοστοιχεία στην κάτω δεξιά γωνία κάθε εικόνας και όλα τα εικονοστοιχεία στο ενδιάμεσο. Η τεχνική αυτή είναι αρκετά ευαίσθητη στη μετατόπιση των εικόνων ή στην αναπαράστασή τους υπό κλίμακα: εάν πάρουμε την εικόνα ενός «1» και τη μετατοπίσουμε έστω ελαφρά προς τα αριστερά ή προς τα δεξιά, το αποτέλεσμα είναι ότι οι δύο εικόνες (πριν και μετά τη μετατόπιση) είναι πολύ διαφορετικές διότι τα μαύρα εικονοστοιχεία βρίσκονται σε διαφορετικές θέσεις στις δύο εικόνες. Ευτυχώς, τα δεδομένα του MNIST έχουν υποβληθεί σε προεπεξεργασία με κεντράρισμα των εικόνων, οπότε το πρόβλημα αυτό έχει περιοριστεί."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"recommendation-EL","color":"#ebe9ef","frombottom":"0","totalheight":"50%"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Χρήση των πλησιέστερων γειτόνων για την πρόβλεψη της συμπεριφοράς των χρηστών"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Χαρακτηριστικό παράδειγμα εφαρμογής της μεθόδου του πλησιέστερου γείτονα είναι η πρόβλεψη της συμπεριφοράς των χρηστών σε εφαρμογές ΤΝ όπως τα συστήματα συστάσεων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η ιδέα είναι να χρησιμοποιείται η πολύ απλή αρχή σύμφωνα με την οποία οι χρήστες με παρόμοια προηγούμενη συμπεριφορά τείνουν να έχουν παρόμοια συμπεριφορά στο μέλλον. Φανταστείτε ένα σύστημα συστάσεων μουσικής που συλλέγει δεδομένα σχετικά με τη συμπεριφορά ακρόασης των χρηστών. Ας πούμε ότι ακούσατε μουσική ντίσκο της δεκαετίας του 1980 (υποθετικά μιλάμε). Μια μέρα, ο πάροχος υπηρεσιών αποκτά ένα δυσεύρετο κλασικό κομμάτι ντίσκο της δεκαετίας του 1980 και το προσθέτει στη μουσική βιβλιοθήκη. Το σύστημα πρέπει τώρα να προβλέψει αν θα σας αρέσει ή όχι. Ένας τρόπος να το κάνει είναι να χρησιμοποιήσει πληροφορίες σχετικά με το είδος, τον καλλιτέχνη και άλλα μεταδεδομένα, που εισάγονται από τους καλούς ανθρώπους του παρόχου υπηρεσιών. Ωστόσο, οι πληροφορίες αυτές είναι σχετικά λιγοστές και προσεγγιστικές και μπορούν να παράσχουν μόνο χονδρικές προβλέψεις."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Αντί μεταδεδομένων που εισάγονται χειρωνακτικά, τα τρέχοντα συστήματα συστάσεων χρησιμοποιούν μια μέθοδο που ονομάζεται συνεργατικό φιλτράρισμα. Η συνεργατική πτυχή του φιλτραρίσματος συνίσταται στο ότι χρησιμοποιεί δεδομένα άλλων χρηστών για να προβλέψει τις προτιμήσεις σας. Η λέξη «φίλτρο» αναφέρεται στο γεγονός ότι θα σας συσταθεί μόνο περιεχόμενο το οποίο περνά από φίλτρο: περιεχόμενο το οποίο είναι πιθανό να σας αρέσει θα περάσει, ενώ άλλο περιεχόμενο όχι (αυτού του είδους τα φίλτρα μπορεί να οδηγήσουν στις λεγόμενες αλγοριθμικές γυάλες που αναφέραμε στο κεφάλαιο 1. Θα επανέλθουμε σε αυτές αργότερα)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ας πούμε τώρα ότι σε άλλους χρήστες που άκουσαν μουσική ντίσκο της δεκαετίας του 1980 αρέσει το νέο κομμμάτι και το ακούν ξανά και ξανά. Το σύστημα θα εντοπίσει την παρόμοια προηγούμενη συμπεριφορά που χαρακτηρίζει εσάς και άλλους λάτρεις της μουσικής ντίσκο της δεκαετίας του 1980 και, καθώς η νέα κυκλοφορία αρέσει σε άλλους χρήστες σαν εσάς, το σύστημα θα προβλέψει ότι θα αρέσει και σε εσάς. Ως εκ τούτου, θα εμφανιστεί στην κορυφή του καταλόγου συστάσεων για εσάς. Σε μια εναλλακτική πραγματικότητα, μπορεί το τραγούδι που προστέθηκε να μην είναι τόσο καλό και να μην αρέσει σε άλλους χρήστες που εμφανίζουν παρόμοια προηγούμενη συμπεριφορά με τη δική σας. Στην περίπτωση αυτή, το σύστημα δεν θα σας το συστήσει ή, τουλάχιστον, δεν θα το τοποθετήσει στην κορυφή του καταλόγου συστάσεων για εσάς."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στην παρακάτω άσκηση απεικονίζεται αυτό το σκεπτικό."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"quiz","properties":{"quizid":"b1c514d8-bccf-5c1c-a8a5-e1877e432251"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"illustrations","properties":{"motive":"nearest-neighbor","color":"#ebe9ef","frombottom":"24.7%","totalheight":"63%"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στο παραπάνω παράδειγμα διαθέταμε δεδομένα μόνο έξι χρηστών και η πρόβλεψή μας ήταν πιθανότατα πολύ αναξιόπιστη. Ωστόσο, οι ιστότοποι διαδικτυακών αγορών συχνά έχουν εκατομμύρια χρήστες και ο όγκος δεδομένων τον οποίο παράγουν είναι τεράστιος. Σε πολλές περιπτώσεις, υπάρχουν πολλοί χρήστες των οποίων η προηγούμενη συμπεριφορά είναι σε μεγάλο βαθμό παρόμοια με τη δική σας και των οποίων το ιστορικό αγορών παρέχει μια αρκετά καλή ένδειξη των ενδιαφερόντων σας."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι προβλέψεις αυτές μπορεί να είναι επίσης αυτοεκπληρούμενες προφητείες, υπό την έννοια ότι είναι πιθανότερο να αγοράσετε ένα προϊόν εάν σας το συστήσει το σύστημα, στοιχείο που καθιστά δύσκολη την αξιολόγηση της πραγματικής αποτελεσματικότητάς των προβλέψεων. Συστήματα συστάσεων του ίδιου είδους χρησιμοποιούνται επίσης για συστάσεις μουσικής, ταινιών, ειδήσεων και περιεχόμενου μέσων κοινωνικής δικτύωσης σε χρήστες. Στο πλαίσιο των ειδήσεων και των μέσων κοινωνικής δικτύωσης, τα φίλτρα που δημιουργούνται από τα συστήματα αυτά μπορούν να οδηγήσουν σε αλγοριθμικές γυάλες."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"quiz","properties":{"quizid":"5e109f37-37e1-5c09-8f4f-88d4508bf4c2","peerreviewid":"21ebe9c2-d7e7-4307-bc60-ad76fb4410dd"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]}],"data":{"quirksMode":false}},"excerpt":"Στο παραπάνω διάγραμμα δείχνουμε μια συλλογή στοιχείων δεδομένων εκπαίδευσης, ορισμένα από τα οποία ανήκουν σε μία κλάση (πράσινη) και τα…","frontmatter":{"path":"/el/4/2","title":"Ο ταξινομητής πλησιέστερου γείτονα","part":4,"type":"section","lang":"el","section":2}}},{"node":{"htmlAst":{"type":"root","children":[{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"lead","properties":{},"children":[{"type":"text","value":"Ο κύριος στόχος εκμάθησης στην παρούσα ενότητα είναι ένα ακόμη καλό παράδειγμα μεθόδων επιβλεπόμενης μάθησης, σχεδόν εξίσου απλό με τον ταξινομητή πλησιέστερου γείτονα: η γραμμική παλινδρόμηση. Θα παρουσιάσουμε επίσης το πρώτο ξαδερφάκι του, τη λογιστική παλινδρόμηση.\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Διαφορά μεταξύ ταξινόμησης και παλινδρόμησης","description":"Υπάρχει μια μικρή αλλά σημαντική διαφορά όσον αφορά το είδος των προβλέψεων στις οποίες θα πρέπει να καταλήγουμε στο πλαίσιο διαφορετικών σεναρίων. Παρότι, για παράδειγμα, ο ταξινομητής πλησιέστερου γείτονα επιλέγει μια ετικέτα κλάσης για οποιοδήποτε στοιχείο από ένα σύνολο εναλλακτικών επιλογών ετικετών (όπως spam/ham, ή 0,1,2,...,9), με τη γραμμική παλινδρόμηση προκύπτει μια αριθμητική πρόβλεψη η οποία δεν περιορίζεται σε ακέραιους (πλήρης αριθμός, σε αντίθεση με έναν αριθμό όπως το 3,14). Συνεπώς, η γραμμική παλινδρόμηση είναι καταλληλότερη για χρήση σε περιπτώσεις όπου η μεταβλητή εξόδου μπορεί να είναι οποιοσδήποτε αριθμός όπως η τιμή ενός προϊόντος, η απόσταση από ένα εμπόδιο, οι εισπράξεις της επόμενης ταινίας του Πολέμου των Άστρων, και ούτω καθεξής."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η βασική ιδέα στη γραμμική παλινδρόμηση συνίσταται στην άθροιση των επιδράσεων καθεμιάς από τις μεταβλητές χαρακτηριστικών με σκοπό τον υπολογισμό της προβλεπόμενης τιμής. Ο τεχνικός όρος για τη διαδικασία άθροισης είναι "},{"type":"element","tagName":"em","properties":{},"children":[{"type":"text","value":"«γραμμικός συνδυασμός»"}]},{"type":"text","value":". Η ιδέα είναι πολύ απλή, και μπορεί να απεικονιστεί σε ένα λογαριασμό αγορών σας."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Θεώρηση της γραμμικής παλινδρόμησης ως λογαριασμού αγορών","description":"Υποθέστε ότι πηγαίνετε στο σουπερμάρκετ και αγοράζετε 2,5 κιλά πατάτες, 1,0 κιλό καρότα, και δύο μπουκάλια γάλα. Εάν η τιμή για τις πατάτες είναι 2 ευρώ το κιλό, η τιμή των καρότων 4 ευρώ το κιλό, και ένα μπουκάλι γάλα κοστίζει 3 ευρώ, τότε ο λογαριασμός, όπως τον υπολογίζει ο ταμίας, ανέρχεται σε 2,5 × 2 ευρώ + 1,0 × 4 ευρώ + 2 × 3 ευρώ = 15 ευρώ. Στη γραμμική παλινδρόμηση, η ποσότητα των πατατών, των καρότων και του γάλακτος είναι οι είσοδοι δεδομένων. Η έξοδος είναι το κόστος των αγορών σας, το οποίο είναι σαφές ότι εξαρτάται τόσο από την τιμή όσο και από την ποσότητα κάθε προϊόντος που αγοράζετε."},"children":[{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η λέξη «γραμμική» σημαίνει ότι η αύξηση της εξόδου, όταν ένα χαρακτηριστικό της εισόδου αυξάνεται κατά κάποιο σταθερό ποσό, είναι πάντοτε η ίδια. Με άλλα λόγια, όποτε προσθέτετε, για παράδειγμα, δύο κιλά καρότα στο καλάθι των αγορών σας, ο λογαριασμός αυξάνεται κατά 8 ευρώ. Όταν προσθέτετε ακόμη δύο κιλά, ο λογαριασμός αυξάνεται κατά ακόμη 8 ευρώ, ενώ εάν προσθέσετε τη μισή ποσότητα, δηλ. 1 κιλό, ο λογαριασμός αυξάνεται ακριβώς κατά το ήμισυ, δηλ. 4 ευρώ."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"key-terminology","properties":{"terminologies":"[\n      {\"title\":\"Συντελεστές ή βάρη\",\"content\":\"Στην ορολογία γραμμικής παλινδρόμησης οι τιμές των διαφόρων προϊόντων ονομάζονται συντελεστές ή βάρη (λέξη η οποία, παρότι φαίνεται ότι μπορεί να προκαλέσει σύγχυση, δεδομένου ότι μετρήσαμε την ποσότητα των πατατών και των καρότων με βάση το βάρος, δεν θα πρέπει να σας μπερδεύει). Ένα από τα βασικά πλεονεκτήματα της γραμμικής παλινδρόμησης είναι ότι ερμηνεύεται εύκολα: η εκμάθηση των βαρών μπορεί, στην πραγματικότητα, να παρουσιάζει πολύ μεγαλύτερο ενδιαφέρον από ό,τι οι προβλέψεις των εξόδων.<br><br>Για παράδειγμα, όταν χρησιμοποιούμε τη γραμμική παλινδρόμηση για να προβλέψουμε το προσδόκιμο ζωής, το βάρος του καπνίσματος (τσιγάρα ανά ημέρα) ισοδυναμεί με μείωση κατά περίπου μισό έτος, δηλ. ένα τσιγάρο περισσότερο την ημέρα έχει ως συνέπεια να μειώνεται το προσδόκιμο ζωής σας κατά μισό έτος κατά μέσο όρο. Παρομοίως, το βάρος της κατανάλωσης λαχανικών (μια μερίδα λαχανικών την ημέρα) ισοδυναμεί με αύξηση ενός έτους, δηλ. η κατανάλωση μιας μερίδας λαχανικών κάθε ημέρα έχει ως συνέπεια να αυξάνεται το προσδόκιμο της ζωής σας κατά ένα έτος κατά μέσο όρο.\"}\n  ]"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"quiz","properties":{"quizid":"d937f663-b20a-512d-b374-ef006a121fc8"},"children":[{"type":"text","value":"\n"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στην παραπάνω άσκηση, ως αφετηρία για τον υπολογισμό χρησιμοποιήθηκε το προσδόκιμο ζωής των μη καπνιστριών που απεχθάνονται τα λαχανικά, που είναι 80 έτη. Ο τεχνικός όρος που χρησιμοποιείται για την αφετηρία είναι ο "},{"type":"element","tagName":"strong","properties":{},"children":[{"type":"text","value":"«σταθερός όρος» (ή τεταγμένη)"}]},{"type":"text","value":". Θα επιστρέψουμε στα παραπάνω, όταν εξετάσουμε τον τρόπο εκμάθησης μοντέλων γραμμικής παλινδρόμησης από δεδομένα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Εκμάθηση γραμμικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Προηγουμένως, εξετάσαμε τον τρόπο πραγματοποίησης προβλέψεων με βάση τη γραμμική παλινδρόμηση, όταν είναι γνωστά τόσο τα βάρη όσο και τα χαρακτηριστικά εισόδου. Ως εκ τούτου, εφόσον μας δίνονται οι είσοδοι και το βάρος, μπορούμε να υπολογίσουμε την προβλεπόμενη έξοδο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όταν μας δίνονται οι είσοδοι και οι έξοδοι για σειρά στοιχείων, μπορούμε να υπολογίσουμε τα βάρη ούτως ώστε η προβλεπόμενη έξοδος να παρουσιάζει τη μεγαλύτερη δυνατή αντιστοιχία με την πραγματική έξοδο. Αυτό είναι το πρόβλημα που επιλύεται μέσω της μηχανικής μάθησης."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Παράδειγμα","description":"Σε αναλογία με την αγορά προϊόντων, ας υποθέσουμε ότι μας δίνεται το περιεχόμενο μιας σειράς καλαθιών αγορών και ο συνολικός λογαριασμός για καθένα από αυτά, και μας ζητείται να υπολογίσουμε την τιμή καθενός από τα προϊόντα (πατάτες, καρότα, και ούτω καθεξής). Από ένα μόνο καλάθι που περιέχει, για παράδειγμα, 1 κιλό κόντρα φιλέτο, 2 κιλά καρότα, και ένα μπουκάλι Chianti, ακόμη και αν γνωρίζαμε ότι ο συνολικός λογαριασμός είναι 35 ευρώ, δεν θα μπορούσαμε να προσδιορίσουμε τις τιμές, διότι υπάρχουν πολλά σύνολα τιμών που αντιστοιχούν στο ίδιο σύνολο λογαριασμού. Ωστόσο, το πρόβλημα μπορεί συνήθως να λυθεί, εάν έχουμε πολλά καλάθια."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Εντούτοις, το πρόβλημα γίνεται ακόμη δυσκολότερο εξαιτίας του γεγονότος ότι στον πραγματικό κόσμο, η πραγματική έξοδος δεν καθορίζεται πάντοτε εξ ολοκλήρου με βάση την είσοδο, λόγω των διαφόρων παραγόντων που εισάγουν στη διαδικασία αβεβαιότητα ή «θόρυβο». Υποθέστε ότι κάνετε τις αγορές σας σε μια αγορά όπου οι τιμές κάθε συγκεκριμένου προϊόντος μπορεί να μεταβάλλονται με τον χρόνο, ή ότι βρίσκεστε σε ένα εστιατόριο όπου στον τελικό λογαριασμό περιλαμβάνεται και ένα μεταβλητό ποσό φιλοδωρήματος. Σε τέτοιου είδους καταστάσεις, μπορούμε να προβούμε σε μια εκτίμηση των τιμών, αλλά όχι με απόλυτη ακρίβεια."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ο προσδιορισμός των βαρών που βελτιστοποιούν την αντιστοιχία μεταξύ των προβλεπόμενων και των πραγματικών εξόδων στα δεδομένα εκπαίδευσης αποτελεί κλασικό πρόβλημα στατιστικής που ανάγεται στις αρχές του 19ου αιώνα, και το οποίο επιλύεται εύκολα ακόμη και για σύνολα μεγάλων δεδομένων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Δεν θα υπεισέλθουμε στις λεπτομέρειες των αλγορίθμων προσδιορισμού των πραγματικών βαρών, όπως η κλασική τεχνική των ελαχίστων τετραγώνων, καθώς είναι απλοί. Ωστόσο, στις επόμενες ασκήσεις μπορείτε να αποκτήσετε μια ιδέα του τρόπου προσδιορισμού τάσεων στα δεδομένα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Οπτικοποίηση γραμμικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ένας καλός τρόπος να αποκτήσετε μια ιδέα του τι μπορεί να μας προσφέρει η γραμμική παλινδρόμηση είναι να σχεδιάσετε ένα διάγραμμα με τα δεδομένα μας και τα αποτελέσματα της παλινδρόμησης. Ως απλό ενδεικτικό παράδειγμα, θεωρούμε ότι το σύνολο δεδομένων έχει μία μεταβλητή, τον αριθμό των κουπών καφέ που πίνει ένας εργαζόμενος ανά ημέρα, και, ως έξοδο, τον αριθμό των γραμμών κώδικα που γράφει ανά ημέρα ο ίδιος εργαζόμενος. Δεν πρόκειται για πραγματικό σύνολο δεδομένων, καθώς είναι προφανές ότι εκτός από τον καφέ υπάρχουν και άλλοι παράγοντες που επηρεάζουν την παραγωγικότητα ενός εργαζόμενου και οι οποίοι αλληλεπιδρούν με περίπλοκους τρόπους. Επίσης, η αύξηση της παραγωγικότητας μέσω της αύξησης της ποσότητας καφέ είναι αξιόπιστη μέχρι ένα ορισμένο σημείο, μετά το οποίο οι διαταραχές είναι σημαντικές."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"linearreg","properties":{},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όταν παρουσιάζουμε τα δεδομένα μας στο ανωτέρω διάγραμμα ως σημεία, καθένα εκ των οποίων αναπαριστά έναν εργαζόμενο, μπορούμε να διαπιστώσουμε μια σαφή τάση που συνίσταται στο ότι η κατανάλωση περισσότερου καφέ συνεπάγεται τη συγγραφή περισσότερων γραμμών κώδικα (υπενθυμίζεται ότι πρόκειται για απολύτως φανταστικά δεδομένα). Από το συγκεκριμένο σύνολο δεδομένων μπορούμε να μάθουμε τον συντελεστή, ή το βάρος, σε σχέση με την κατανάλωση καφέ, και μπορούμε ήδη να διαπιστώσουμε εμπειρικά ότι φαίνεται να είναι κοντά στο πέντε, δεδομένου ότι για κάθε κούπα καφέ που καταναλώνεται, ο αριθμός των γραμμών κώδικα που προγραμματίζονται φαίνεται να αυξάνεται κατά πέντε, κατά προσέγγιση. Για παράδειγμα, οι εργαζόμενοι που πίνουν δύο περίπου κούπες καφέ την ημέρα φαίνεται να παράγουν 20 περίπου γραμμές κώδικα την ημέρα, ενώ, παρομοίως, στις τέσσερις κούπες καφέ, η ποσότητα των παραγόμενων γραμμών είναι περίπου 30."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μπορεί επίσης να επισημανθεί ότι οι εργαζόμενοι που δεν πίνουν καθόλου καφέ παράγουν επίσης κώδικα, ο οποίος, με βάση το διάγραμμα, είναι περίπου δέκα γραμμές. Αυτός ο αριθμός είναι ο σταθερός όρος (η τεταγμένη) που αναφέρθηκε παραπάνω. Ο σταθερός όρος είναι μία ακόμη παράμετρος του μοντέλου, όπως τα βάρη, την οποία μπορούμε να μάθουμε με βάση τα δεδομένα. Όπως και στο παράδειγμα του προσδόκιμου ζωής, μπορούμε να θεωρήσουμε τον σταθερό όρο ως αφετηρία για τους υπολογισμούς μας, προτού συνυπολογίσουμε τις επιδράσεις της μεταβλητής εισόδου, ή των μεταβλητών εισόδου εφόσον είναι περισσότερες από μία, είτε πρόκειται για κούπες καφέ στο παρόν παράδειγμα είτε για τσιγάρα στο προηγούμενο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η γραμμή στο διάγραμμα αναπαριστά την προβλεπόμενη έξοδο, ενώ ο σταθερός όρος και ο συντελεστής έχουν υπολογιστεί με χρήση μιας πραγματικής τεχνικής γραμμικής παλινδρόμησης που ονομάζεται τεχνική ελαχίστων τετραγώνων. Η γραμμή αυτή μπορεί να χρησιμοποιηθεί για την πρόβλεψη του αριθμού γραμμών, όταν η είσοδος είναι ο αριθμός των κουπών καφέ. Επισημαίνεται ότι η πρόβλεψη είναι εφικτή ακόμη και αν επιτραπεί η χρήση κλασμάτων της κούπας (όπως μισή κούπα, 1/4 της κούπας, και ούτω καθεξής)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise17","properties":{"quizid":"03ed00e3-066d-5308-871a-3eb5c726941d"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise18","properties":{"quizid":"9daaaa74-625a-5bfd-965a-592018882b7b"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Πρέπει να τονιστεί ότι μελέτες όπως αυτές που χρησιμοποιούνται στις παραπάνω ασκήσεις δεν μπορούν να εντοπίσουν αιτιώδεις σχέσεις. Με άλλα λόγια, δεν είναι δυνατόν, με βάση τα εν λόγω δεδομένα και μόνο, να αποφανθούμε κατά πόσον οι σπουδές αυξάνουν πράγματι το προσδόκιμο ζωής μέσω ενός καλύτερα ενημερωμένου και πιο υγιούς τρόπου ζωής ή άλλων μηχανισμών, ή εάν η προφανής συσχέτιση μεταξύ προσδόκιμου ζωής και εκπαίδευσης οφείλεται σε υποκείμενους παράγοντες που επηρεάζουν αμφότερους τους όρους. Για παράδειγμα, είναι πιθανό, σε χώρες όπου οι άνθρωποι τείνουν να έχουν υψηλό επίπεδο εκπαίδευσης, τα επίπεδα της διατροφής, της υγειονομικής περίθαλψης και της ασφάλειας να είναι επίσης καλύτερα, γεγονός που αυξάνει το προσδόκιμο ζωής. Με αυτού του είδους την απλή ανάλυση, μπορούμε απλώς να εντοπίσουμε συσχετίσεις, οι οποίες είναι εντούτοις χρήσιμες για την πρόβλεψη."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h3","properties":{},"children":[{"type":"text","value":"Εφαρμογές της γραμμικής παλινδρόμησης στη μηχανική μάθηση"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η γραμμική παλινδρόμηση αποτελεί την πραγματική κινητήρια δύναμη για πολλές εφαρμογές τεχνητής νοημοσύνης (ΤΝ) και επιστήμης δεδομένων. Η συγκεκριμένη τεχνική έχει τους περιορισμούς της, οι οποίοι αντισταθμίζονται, ωστόσο, από την απλότητα, την ευκολία ερμηνείας και την αποτελεσματικότητά της. Η γραμμική παλινδρόμηση έχει χρησιμοποιηθεί με επιτυχία, για παράδειγμα, στα ακόλουθα προβλήματα:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"ul","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη ποσοστών κλικ σε διαφημίσεις στο διαδίκτυο"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη της λιανικής ζήτησης προϊόντων"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη των εισπράξεων κινηματογραφικών ταινιών του Χόλιγουντ"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη του κόστους λογισμικού"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη του κόστους ασφάλισης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη της εγκληματικότητας"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"πρόβλεψη τιμών ακινήτων"}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Μπορούμε να χρησιμοποιήσουμε τη γραμμική παλινδρόμηση για την πρόβλεψη ετικετών;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όπως αναφέρθηκε παραπάνω, με τη γραμμική παλινδρόμηση και τη μέθοδο πλησιέστερου γείτονα προκύπτουν διαφορετικά είδη προβλέψεων. Οι έξοδοι της γραμμικής παλινδρόμησης είναι αριθμητικές ενώ η μέθοδος πλησιέστερου γείτονα παράγει ετικέτες από ένα καθορισμένο σύνολο εναλλακτικών επιλογών («κλάσεις»)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Εκεί που η γραμμική παλινδρόμηση υπερέχει σε σύγκριση με τη μέθοδο πλησιέστερου γείτονα είναι η ευκολία ερμηνείας. Τι εννοούμε με αυτό; Μπορούμε να πούμε ότι, κατά κάποιο τρόπο, η μέθοδος πλησιέστερου γείτονα καθώς και οποιαδήποτε μεμονωμένη πρόβλεψη που προκύπτει ερμηνεύονται εύκολα: δεν πρόκειται παρά απλώς για το πλησιέστερο στοιχείο δεδομένων εκπαίδευσης! Αυτό είναι αλήθεια, ωστόσο, όταν πρόκειται για την ερμηνεία του εκπαιδευμένου μοντέλου, η διαφορά είναι εμφανής. Η ερμηνεία του εκπαιδευμένου μοντελου πλησιέστερου γείτονα κατά τρόπο παρόμοιο με την ερμηνεία των βαρών στο πλαίσιο της γραμμικής παλινδρόμησης δεν είναι δυνατή: το εκπαιδευμένο μοντέλο αφορά βασικά το σύνολο των δεδομένων, γεγονός που το καθιστά συνήθως υπερβολικά μεγάλου μεγέθους και σύνθετο, με αποτέλεσμα να μην είναι εφικτή η εξαγωγή σημαντικών συμπερασμάτων. Τι μπορούμε λοιπόν να κάνουμε σε περίπτωση που επιθυμούμε μια μέθοδο που παράγει ίδιου είδους εξόδους με τη μέθοδο του πλησιέστερου γείτονα, τις ετικέτες, και παρουσιάζει την ίδια ευκολία ερμηνείας με τη γραμμική παλινδρόμηση;"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Η λύση της λογιστικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Σας έχουμε καλά νέα: μπορούμε να μετατρέψουμε τις εξόδους της μεθόδου γραμμικής παλινδρόμησης σε προβλέψεις για ετικέτες. Η συγκεκριμένη τεχνική ονομάζεται λογιστική παλινδρόμηση. Χωρίς να υπεισέλθουμε στις τεχνικές λεπτομέρειες, αρκεί να πούμε ότι στην απλούστερη περίπτωση, λαμβάνουμε την έξοδο της γραμμικής παλινδρόμησης, δηλ. έναν αριθμό, και προβαίνουμε σε πρόβλεψη μίας ετικέτας A εάν η ετικέτα υπερβαίνει το μηδέν, και μία άλλη ετικέτα B εάν η ετικέτα είναι μικρότερη ή ίση του μηδενός. Στην πραγματικότητα, αντί για την απλή πρόβλεψη κάποιας κλάσης, η λογιστική παλινδρόμηση μπορεί επίσης να μας παράσχει ένα μέτρο της αβεβαιότητας της πρόβλεψης. Συνεπώς, εάν η πρόβλεψή μας αφορά το κατά πόσον ένας πελάτης θα αγοράσει ένα καινούργιο έξυπνο τηλέφωνο το τρέχον έτος, μπορούμε να προβλέψουμε ότι ο πελάτης A θα αγοράσει τηλέφωνο με πιθανότητα 90%, ενώ σε ό,τι αφορά έναν άλλο, λιγότερο προβλέψιμο πελάτη, μπορούμε να προβλέψουμε ότι δεν θα αγοράσει ένα τηλέφωνο με πιθανότητα 55% (ή με άλλα λόγια, ότι θα αγοράσει τηλέφωνο με πιθανότητα 45%)."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Μπορούμε επίσης να χρησιμοποιήσουμε την ίδια τεχνική για να λάβουμε προβλέψεις για περισσότερες από δύο πιθανές ετικέτες, οπότε, αντί η πρόβλεψή μας να συνίσταται πάντοτε σε ναι ή όχι (θα αγοράσει νέο τηλέφωνο ή όχι, είναι οι ειδήσεις ψευδείς ή πραγματικές, και ούτω καθεξής), μπορούμε να χρησιμοποιήσουμε τη λογιστική παλινδρόμηση για την ταυτοποίηση, για παράδειγμα, χειρόγραφων ψηφίων, περίπτωση κατά την οποία υπάρχουν δέκα πιθανές ετικέτες."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h3","properties":{},"children":[{"type":"text","value":"Παράδειγμα λογιστικής παλινδρόμησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Ας υποθέσουμε ότι συλλέγουμε δεδομένα σπουδαστών που παρακολουθούν σειρά εισαγωγικών μαθημάτων μαγειρικής. Πέραν των βασικών στοιχείων όπως τα στοιχεία ταυτότητας, το ονοματεπώνυμο του σπουδαστή, και ούτω καθεξής, ζητούμε επίσης από τους σπουδαστές να αναφέρουν πόσες ώρες μελέτησαν για τις εξετάσεις (όμως μελετά κανείς για εξετάσεις μαγειρικής, μάλλον μαγειρεύοντας, έτσι δεν είναι;) – ελπίζοντας ότι οι απαντήσεις τους στις αναφορές τους θα είναι λίγο έως πολύ ειλικρινείς. Μετά τις εξετάσεις, θα γνωρίζουμε εάν ο σπουδαστής πέρασε με επιτυχία τις εξετάσεις. Στη συνέχεια παρουσιάζονται ορισμένα δεδομένα:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"table","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"tbody","properties":{},"children":[{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Στοιχεία ταυτότητας σπουδαστή"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Ώρες μελέτης"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"th","properties":{},"children":[{"type":"text","value":"Επιτυχία/αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"24"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"15"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"41"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"9.5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"58"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"2"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"101"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"103"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"6.5"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Αποτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n  "},{"type":"element","tagName":"tr","properties":{},"children":[{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"215"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"6"}]},{"type":"text","value":"\n    "},{"type":"element","tagName":"td","properties":{},"children":[{"type":"text","value":"Επιτυχία"}]},{"type":"text","value":"\n  "}]},{"type":"text","value":"\n"}]}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Με βάση τον πίνακα, τι συμπέρασμα θα βγάζατε από τη συσχέτιση των ωρών μελέτης και της επιτυχίας στις εξετάσεις; Μπορούμε να σκεφτούμε ότι εάν διαθέτουμε δεδομένα από εκατοντάδες σπουδαστές, μπορούμε ίσως να υπολογίσουμε τις ώρες μελέτης που απαιτούνται για επιτυχία στις εξετάσεις. Μπορούμε να παρουσιάσουμε τα εν λόγω δεδομένα σε διάγραμμα, όπως φαίνεται παρακάτω."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"exercise19","properties":{"quizid":"65e65573-5fcc-5d75-a4c1-5b7319565957"},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η λογιστική παλινδρόμηση χρησιμοποιείται επίσης σε μεγάλο αριθμό εφαρμογών ΤΝ στον πραγματικό κόσμο όπως η πρόβλεψη χρηματοοικονομικών κινδύνων, στο πλαίσιο ιατρικών μελετών, και ούτω καθεξής. Ωστόσο, όπως και στη γραμμική παλινδρόμηση, υπάρχει ο περιορισμός της ιδιότητας της γραμμικότητας, με αποτέλεσμα να χρειαζόμαστε πολλές άλλες μεθόδους στην εργαλειοθήκη μας. Θα επανέλθουμε στο ζήτημα της γραμμικότητας αργότερα, όταν θα εξετάσουμε τα νευρωνικά δίκτυα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"h2","properties":{},"children":[{"type":"text","value":"Τα όρια της μηχανικής μάθησης"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Συνοψίζοντας, η μηχανική μάθηση είναι ένα ιδιαίτερα ισχυρό εργαλείο για τη δημιουργία εφαρμογών ΤΝ. Πέραν της μεθόδου πλησιέστερου γείτονα, της γραμμικής παλινδρόμησης και της λογιστικής παλινδρόμησης, υπάρχουν κυριολεκτικά εκατοντάδες, εάν όχι χιλιάδες, διαφορετικές τεχνικές μηχανικής μάθησης, οι οποίες, ωστόσο, συνοψίζονται στο ίδιο πράγμα: την προσπάθεια εξαγωγής προτύπων και εξαρτήσεων από δεδομένα και τη χρήση τους είτε για την κατανόηση ενός φαινομένου είτε για την πρόβλεψη μελλοντικών αποτελεσμάτων."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Η μηχανική μάθηση μπορεί να αποτελέσει ένα ιδιαίτερα δύσκολο πρόβλημα, και, συνήθως, δεν μπορούμε να επιτύχουμε την τέλεια μέθοδο που θα δίνει πάντοτε την ορθή ετικέτα. Εντούτοις, στις περισσότερες περιπτώσεις, μια καλή, αλλά όχι τέλεια, πρόβλεψη είναι προτιμότερη από καμία πρόβλεψη. Μερικές φορές, παρότι μπορεί να είμαστε σε θέση να κάνουμε καλύτερες προβλέψεις μόνοι μας, ενδέχεται να εξακολουθούμε να προτιμούμε να χρησιμοποιήσουμε τη μηχανική μάθηση, διότι η μηχανή παράγει προβλέψεις ταχύτερα και σε μεγάλες ποσότητες χωρίς να κουράζεται. Καλά παραδείγματα είναι τα συστήματα συστάσεων που πρέπει να προβλέπουν τι είδους μουσική, ποια βίντεο ή ποιες διαφημίσεις είναι πιθανότερο να σας ενδιαφέρουν περισσότερο."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Οι παράγοντες που επηρεάζουν την ποιότητα του αποτελέσματος είναι οι εξής:"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"ul","properties":{},"children":[{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η δυσκολία της εργασίας: στην αναγνώριση χειρόγραφων ψηφίων, εάν τα ψηφία έχουν γραφτεί πολύ πρόχειρα, ακόμη και ένας άνθρωπος δεν είναι πάντοτε σε θέση να μαντέψει σωστά τις προθέσεις του συντάκτη"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η μέθοδος της μηχανικής μάθησης: ορισμένες μέθοδοι είναι πολύ καλύτερες για συγκεκριμένη εργασία από ό,τι άλλες"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Ο όγκος των δεδομένων εκπαίδευσης: είναι αδύνατος ο υπολογισμός ενός καλού ταξινομητή με βάση μερικά μόνο παραδείγματα"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"li","properties":{},"children":[{"type":"text","value":"Η ποιότητα των δεδομένων."}]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"note","properties":{"heading":"Η ποιότητα των δεδομένων μετράει","description":"Στην αρχή του παρόντος κεφαλαίου, τονίσαμε τη σημασία της επάρκειας των δεδομένων και τους κινδύνους της υπερπροσαρμογής. Ένας άλλος εξίσου σημαντικός παράγοντας είναι η <b>ποιότητα</b> των δεδομένων. Για τη διαμόρφωση ενός μοντέλου που επιτρέπει τη γενίκευση σε δεδομένα πέραν των δεδομένων εκπαίδευσης, τα δεδομένα εκπαίδευσης πρέπει να περιέχουν επαρκείς πληροφορίες συναφείς με το εκάστοτε πρόβλημα. Για παράδειγμα, εάν δημιουργήσετε έναν ταξινομητή εικόνων που σας πληροφορεί σχετικά με το τι αφορά η εικόνα που παρέχεται στον αλγόριθμο, και τον έχετε εκπαιδεύσει μόνο με εικόνες σκύλων και γατών, θα αναγνωρίσει ό,τι βλέπει είτε ως σκύλο είτε ως γάτα. Αυτό έχει νόημα εφόσον ο αλγόριθμος χρησιμοποιείται σε περιβάλλον όπου θα βλέπει μόνο γάτες και σκύλους, ενώ δεν έχει νόημα σε περίπτωση που αναμένεται να βλέπει σκάφη, αυτοκίνητα και λουλούδια.<br><br>Θα επανέλθουμε στα πιθανά προβλήματα που προκαλούν τα «μεροληπτικά» δεδομένα."},"children":[]},{"type":"text","value":"\n"}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Πρέπει επίσης να τονιστεί ότι διαφορετικές μέθοδοι μηχανικής μάθησης είναι κατάλληλες για διαφορετικές εργασίες. Ως εκ τούτου, δεν υπάρχει μία βέλτιστη μέθοδος για όλα τα προβλήματα («ένας αλγόριθμος για την επίλυση όλων...”). Ευτυχώς, μπορεί κανείς να δοκιμάσει έναν μεγάλο αριθμό διαφορετικών μεθόδων για να εντοπίσει ποια από αυτές λειτουργεί καλύτερα σε σχέση με το εκάστοτε πρόβλημα."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Στο σημείο αυτό ερχόμαστε αντιμέτωποι με ένα ζήτημα που είναι ιδιαίτερα σημαντικό αλλά συχνά παραγνωρίζεται στην πράξη: τι σημαίνει «λειτουργεί καλύτερα». Σε ό,τι αφορά την εργασία της αναγνώρισης ψηφίων, είναι φυσικό ότι μια καλή μέθοδος παράγει την ορθή ετικέτα τις περισσότερες φορές. Αυτό μπορούμε να το μετρήσουμε βάσει του σφάλματος ταξινόμησης: το κλάσμα των περιπτώσεων στις οποίες οι έξοδοι του ταξινομητή ανήκουν σε εσφαλμένη κλάση. Όταν προβλέπουμε τις τιμές διαμερισμάτων, μέτρο της ποιότητας είναι συνήθως κάτι όπως η διαφορά μεταξύ της προβλεπόμενης τιμής και της τελικής τιμής πώλησης του διαμερίσματος. Σε πολλές εφαρμογές της καθημερινότητας, το να διαπράττεις σφάλμα προς μία συγκεκριμένη κατεύθυνση είναι χειρότερο από το να διαπράττεις σφάλμα προς μια άλλη κατεύθυνση: ο προσδιορισμός υπερβολικά υψηλής τιμής μπορεί να καθυστερήσει τη διαδικασία για πολλούς μήνες, ενώ ο προσδιορισμός υπερβολικά χαμηλής τιμής συνεπάγεται μείωση του κέρδους του πωλητή. Και, για να χρησιμοποιήσουμε ένα ακόμη παράδειγμα, η αδυναμία εντοπισμού ενός πεζού μπροστά από ένα αυτοκίνητο είναι πολύ χειρότερο σφάλμα από τον εσφαλμένο εντοπισμό ενός πεζού που δεν υπάρχει πραγματικά."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"p","properties":{},"children":[{"type":"text","value":"Όπως αναφέρθηκε προηγουμένως, συνήθως δεν μπορούμε να επιτύχουμε μηδενικό σφάλμα, αλλά θα πρέπει ίσως να είμαστε ικανοποιημένοι με σφάλμα κάτω του 1 στα 100 (ή 1%). Αυτό εξαρτάται επίσης από την εφαρμογή: δεν θα είμαστε ικανοποιημένοι εάν είχαμε μόνο 99% ασφαλή αυτοκίνητα στους δρόμους, αλλά το να μπορούμε να προβλέπουμε κατά πόσον θα σας αρέσει ένα νέο τραγούδι με αυτήν την ακρίβεια μπορεί να είναι υπεραρκετό για μια ευχάριστη εμπειρία ακρόασης. Το να μην λησμονούμε ποτέ τον πραγματικό στόχο μας βοηθά να εξασφαλίζουμε ότι δημιουργούμε πραγματική προστιθέμενη αξία."}]},{"type":"text","value":"\n"},{"type":"element","tagName":"div","properties":{},"children":[{"type":"text","value":"\n  "},{"type":"element","tagName":"part-summary","properties":{"chapter":"4","heading":"Αφού ολοκληρώσετε το κεφάλαιο 4, θα πρέπει να μπορείτε:","listitems":"[\n  {\"content\":\"Να εξηγήσετε τους λόγους για τους οποίους χρησιμοποιούνται οι τεχνικές μηχανικής μάθησης\"},\n  {\"content\":\"Να διακρίνετε μεταξύ των σεναρίων μη επιβλεπόμενης και επιβλεπόμενης μηχανικής μάθησης\"},\n  {\"content\":\"Να εξηγείτε τις αρχές των τριών μεθόδων επιβλεπόμενης ταξινόμησης: της μεθόδου πλησιέστερου γείτονα, της γραμμικής παλινδρόμησης και της λογιστικής παλινδρόμησης.\"}\n    ]"},"children":[{"type":"text","value":">\n  "}]},{"type":"text","value":"\n"}]}],"data":{"quirksMode":false}},"excerpt":"Η βασική ιδέα στη γραμμική παλινδρόμηση συνίσταται στην άθροιση των επιδράσεων καθεμιάς από τις μεταβλητές χαρακτηριστικών με σκοπό τον…","frontmatter":{"path":"/el/4/3","title":"Παλινδρόμηση","part":4,"type":"section","lang":"el","section":3}}}]},"allParts":{"totalCount":6,"edges":[{"node":{"frontmatter":{"title":"Τι είναι η ΤΝ;","path":"/el/1","section":null,"part":1,"lang":"el","bannerImage":{"publicURL":"/static/5cb707dcbce557b358c736c82a82b847/banner1.png"}}}},{"node":{"frontmatter":{"title":"Επίλυση προβλημάτων με την ΤΝ","path":"/el/2","section":null,"part":2,"lang":"el","bannerImage":{"publicURL":"/static/3217219fe81de9c2f030e51f04557962/banner2.png"}}}},{"node":{"frontmatter":{"title":"Η ΤΝ στον πραγματικό κόσμο","path":"/el/3","section":null,"part":3,"lang":"el","bannerImage":{"publicURL":"/static/8433f94cdf930cb1172a332eda51a0ae/banner3.png"}}}},{"node":{"frontmatter":{"title":"Μηχανική μάθηση","path":"/el/4","section":null,"part":4,"lang":"el","bannerImage":{"publicURL":"/static/fdc0e4c1dc187a976325542364658e54/banner4.png"}}}},{"node":{"frontmatter":{"title":"Νευρωνικά δίκτυα","path":"/el/5","section":null,"part":5,"lang":"el","bannerImage":{"publicURL":"/static/8d6d86ca3c422d98b6213f5ddfbe8c07/banner5.png"}}}},{"node":{"frontmatter":{"title":"Συνέπειες της ΤΝ","path":"/el/6","section":null,"part":6,"lang":"el","bannerImage":{"publicURL":"/static/2943d36053a6dd8bd40b3dc3832bb0f8/banner6.png"}}}}]},"currentPart":{"htmlAst":{"type":"root","children":[],"data":{"quirksMode":false}},"frontmatter":{"path":"/el/4","title":"Μηχανική μάθηση","part":4,"lang":"el","quote":"Αποτελεί διαχρονική διαπίστωση ότι η μάθηση αποτελεί βασικό στοιχείο της νοημοσύνης. Αυτό ισχύει τόσο για τη φυσική νοημοσύνη —όλοι γινόμαστε πιο έξυπνοι μαθαίνοντας— όσο και για την τεχνητή νοημοσύνη.","quoteAuthor":"","bannerImage":{"publicURL":"/static/fdc0e4c1dc187a976325542364658e54/banner4.png"}}},"allSections":{"totalCount":18,"edges":[{"node":{"frontmatter":{"title":"Πώς πρέπει να ορίσουμε την ΤΝ;","path":"/el/1/1","section":1,"part":1,"lang":"el"}}},{"node":{"frontmatter":{"title":"Αναζήτηση και επίλυση προβλημάτων","path":"/el/2/1","section":1,"part":2,"lang":"el"}}},{"node":{"frontmatter":{"title":"Λόγος πιθανοτήτων και πιθανότητες","path":"/el/3/1","section":1,"part":3,"lang":"el"}}},{"node":{"frontmatter":{"title":"Τα είδη της μηχανικής μάθησης","path":"/el/4/1","section":1,"part":4,"lang":"el"}}},{"node":{"frontmatter":{"title":"Βασικά στοιχεία νευρωνικών δικτύων","path":"/el/5/1","section":1,"part":5,"lang":"el"}}},{"node":{"frontmatter":{"title":"Σχετικά με την πρόβλεψη του μέλλοντος","path":"/el/6/1","section":1,"part":6,"lang":"el"}}},{"node":{"frontmatter":{"title":"Σχετικοί τομείς","path":"/el/1/2","section":2,"part":1,"lang":"el"}}},{"node":{"frontmatter":{"title":"Επίλυση προβλημάτων με την ΤΝ","path":"/el/2/2","section":2,"part":2,"lang":"el"}}},{"node":{"frontmatter":{"title":"Ο κανόνας του Μπέυζ","path":"/el/3/2","section":2,"part":3,"lang":"el"}}},{"node":{"frontmatter":{"title":"Ο ταξινομητής πλησιέστερου γείτονα","path":"/el/4/2","section":2,"part":4,"lang":"el"}}},{"node":{"frontmatter":{"title":"Πώς κατασκευάζονται τα νευρωνικά δίκτυα","path":"/el/5/2","section":2,"part":5,"lang":"el"}}},{"node":{"frontmatter":{"title":"Οι κοινωνικές επιπτώσεις της ΤΝ","path":"/el/6/2","section":2,"part":6,"lang":"el"}}},{"node":{"frontmatter":{"title":"Η φιλοσοφία της ΤΝ","path":"/el/1/3","section":3,"part":1,"lang":"el"}}},{"node":{"frontmatter":{"title":"Αναζήτηση και παιχνίδια","path":"/el/2/3","section":3,"part":2,"lang":"el"}}},{"node":{"frontmatter":{"title":"Αφελής ταξινόμηση Μπέυζ","path":"/el/3/3","section":3,"part":3,"lang":"el"}}},{"node":{"frontmatter":{"title":"Παλινδρόμηση","path":"/el/4/3","section":3,"part":4,"lang":"el"}}},{"node":{"frontmatter":{"title":"Προηγμένες τεχνικές νευρωνικών δικτύων","path":"/el/5/3","section":3,"part":5,"lang":"el"}}},{"node":{"frontmatter":{"title":"Σύνοψη","path":"/el/6/3","section":3,"part":6,"lang":"el"}}}]},"site":{"siteMetadata":{"languages":{"defaultLangKey":"en","langs":["en","fi","se","de","ee","fr","it","fr-be","no","lt","lv","nl-be","mt","hr","pl","en-ie","ga","nl","sk","da","ro","sl","is","de-at","en-lu","bg","cs","pt","es","el"]}}}},"pageContext":{"part":4,"type":"section","lang":"el"}},"staticQueryHashes":["3539470774","3539470774"]}