Πώς σχετίζεται ο Υπολογισμός σε Δεδομένα του Ocean με Άλλες Προσεγγίσεις Διατήρησης του Απορρήτου;

Μια έρευνα που καλύπτει την Ομοσπονδιακή Μάθηση, την Ομομορφική Κρυπτογράφηση, τον Πολυμερή Υπολογισμό και άλλα
Εισαγωγή
Στο Πρωτόκολλο Ocean, κυκλοφορήσαμε πρόσφατα τον Υπολογισμό σε Δεδομένα του Ocean. Βοηθά τους επαγγελματίες της Τεχνητής Νοημοσύνης (AI) να έχουν πρόσβαση σε πολύτιμα, ιδιωτικά δεδομένα για ακριβέστερα μοντέλα Τεχνητής Νοημοσύνης (AI). Οι ιδιοκτήτες δεδομένων διατηρούν την ιδιωτικότητα και τον έλεγχο των δεδομένων τους.
Ο Υπολογισμός σε Δεδομένα λειτουργεί ως εξής. Πρώτον, οι ιδιοκτήτες δεδομένων εγκρίνουν αλγόριθμους Τεχνητής Νοημοσύνης (AI) για να εκτελεστούν στα δεδομένα τους. Στη συνέχεια, ο Υπολογισμός σε Δεδομένα ενορχηστρώνει τον εξ αποστάσεως υπολογισμό και την εκτέλεση σε δεδομένα για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης (AI). Ο υπολογισμός είναι επαρκώς "αθροιστικός" ή "ανώνυμος" ώστε να ελαχιστοποιείται ο κίνδυνος προστασίας της ιδιωτικότητας. Ωστόσο, καταλήγει σε ένα μοντέλο που είναι χρήσιμο για την έρευνα ή την επιχείρηση.
Αυτό το άρθρο θέτει το εξής ερώτημα: πώς σχετίζεται Ο Υπολογισμός του Ocean με άλλες προσεγγίσεις διατήρησης της ιδιωτικότητας;
Εδώ είναι η γρήγορη απάντηση: είναι συμπληρωματικό. Κάθε τεχνολογία έχει τη δική της χρήση και τους δικούς της περιορισμούς.
Θα δώσουμε τώρα μια πιο λεπτομερή απάντηση, με τρόπο που να είναι προσιτός σε λιγότερο βαθιά τεχνικό κοινό. Θα εξετάσουμε ορισμένες αξιοσημείωτες τεχνολογίες διατήρησης της ιδιωτικότητας. Για καθεμία από αυτές, συζητάμε τις προκλήσεις της, τον τρόπο με τον οποίο αντιμετωπίζονται αυτές οι προκλήσεις και τον τρόπο με τον οποίο η τεχνική σχετίζεται με το Ocean. Το ίδιο κάνουμε και για τον Υπολογισμό σε Δεδομένα του Ocean. Κλείνουμε με μια ευρύτερη συζήτηση για το Ocean στο οικοσύστημα της διατήρησης της ιδιωτικότητας.
Έρευνα
Κρυπτογράφηση και αποκρυπτογράφηση
Η κρυπτογράφηση μετατρέπει τα δεδομένα σε μορφή που μπορεί να αποσταλεί με ασφάλεια μέσω ενός μη ασφαλούς καναλιού. Κατά τη λήψη, ο παραλήπτης χρησιμοποιεί ένα κλειδί για να μετατρέψει τα δεδομένα πίσω στην αρχική τους μορφή απλού κειμένου.
Συμμετρική κρυπτογράφηση είναι όταν το ίδιο κλειδί χρησιμοποιείται για την κρυπτογράφηση και την αποκρυπτογράφηση- σχήματα όπως το Diffie-Hellman χρησιμοποιούνται για την ασφαλή αποστολή του ίδιου του κλειδιού μέσω ενός μη ασφαλούς καναλιού.
Η ασύμμετρη κρυπτογράφηση έχει "δημόσια κλειδιά και ιδιωτικά κλειδιά, που έρχονται σε ζεύγη. Ό,τι κάνει το ένα, το άλλο το αναιρεί" [Αναφορά]. Η Alice κρυπτογραφεί ένα μήνυμα με το δημόσιο κλειδί του Bob και στη συνέχεια στέλνει το μήνυμα μέσω ενός μη ασφαλούς καναλιού. Μόνο ο Bob μπορεί να το αποκρυπτογραφήσει, με το ιδιωτικό του κλειδί.
Η κρυπτογράφηση και η αποκρυπτογράφηση χρησιμοποιούνται ευρέως, για εφαρμογές όπως οι ασφαλείς διαδικτυακές πληρωμές (το "https" που βλέπετε στο πρόγραμμα περιήγησής σας) και η ασφαλής ανταλλαγή μηνυμάτων (κρυπτογράφηση από άκρο σε άκρο, όπως το Signal).
Το Πρωτόκολλο Ocean χρησιμοποιεί κρυπτογράφηση/αποκρυπτογράφηση ως μέρος της υποδομής ελέγχου πρόσβασης του.
Ομομορφική Κρυπτογράφηση (HE)
Στην Ομομορφική Κρυπτογράφηση (HE), ο υπολογισμός πραγματοποιείται σε κρυπτογραφημένα δεδομένα. Επομένως, τα μη έμπιστα μέρη μπορούν να εκτελούν υπολογισμούς χωρίς να μαθαίνουν ποτέ το περιεχόμενο των δεδομένων.
Πρόκληση: Η Ομομορφική Κρυπτογράφηση (HE) εξακολουθεί να είναι πολύ υπολογιστικά εντατική για να χρησιμοποιηθεί στις περισσότερες εφαρμογές.
Προς την επίλυση: Η ταχύτητα θα συνεχίσει να βελτιώνεται με τον καιρό λόγω καλύτερων αλγορίθμων, ταχύτερων τσιπ και ειδικών τσιπ.
Η Ομομορφική Κρυπτογράφηση (HE) είναι μια αξιοσημείωτη ιδέα, σχεδόν σαν να είναι βγαλμένη από επιστημονική φαντασία. Ανυπομονούμε να δούμε πότε θα κλιμακωθεί αρκετά ώστε να λειτουργήσει σε περισσότερες εφαρμογές, καθώς θα είναι χρήσιμο να το έχουμε ως μέρος της τεχνολογικής στοίβας του Ocean. Θα συνδυαστεί καλά με τα άλλα χαρακτηριστικά του Ocean, όπως η διαχείριση περιουσιακών στοιχείων δεδομένων και οι αγορές.
Ασφαλείς Θύλακες / Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEE)
Στα Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEE), οι υπολογισμοί εκτελούνται σε ειδικά τσιπ που μπορούν να δουν τα ιδιωτικά δεδομένα, αλλά περιορίζονται αυστηρά ως προς τις πληροφορίες που μπορούν να μοιραστούν με το μηχάνημα φιλοξενίας τους. Το Intel SGX είναι το πιο χαρακτηριστικό παράδειγμα υλισμικού.
Πρόκληση: οποιοδήποτε ελάττωμα ασφαλείας βρεθεί στα τσιπ καθιστά το τσιπ άχρηστο, και αυτό έχει συμβεί στο παρελθόν.
Προς την επίλυση: Τα τσιπ Αξιόπιστων Περιβαλλόντων Εκτέλεσης (TEE) έχουν σταθεροποιηθεί με την πάροδο του χρόνου· Σήμερα βρισκόμαστε κοντά στο κατώφλι της παραγωγικής χρήσης.
Τα Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEEs) λειτουργούν καλά με το Ocean: Το Ocean μπορεί να διαχειρίζεται περιουσιακά στοιχεία δεδομένων τα οποία στη συνέχεια εκτελούν υπολογισμούς στα Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEE) και τα αποτελέσματα επιστρέφουν στο Ocean.
Σχετικά, η Oasis Labs αξιοποιεί το blockchain για τη διαχείριση ασφαλούς υπολογισμού με βάση τον θύλακα. Υπάρχει δυνατότητα ενσωμάτωσης των Ocean και Oasis.

Πολυμερής Υπολογισμός (MPC)
Στον Πολυμερή Υπολογισμό (MPC), η υπολογιστική εργασία χωρίζεται σε μικρές επιμέρους εργασίες, ένα διαφορετικό μέρος εκτελεί κάθε επιμέρους εργασία και τα αποτελέσματα συγχωνεύονται.
Πρόκληση: το εύρος ζώνης μπορεί να αποτελέσει σημείο συμφόρησης, επειδή απαιτεί πολλή επικοινωνία μεταξύ των μερών.
Προς την επίλυση: οι ερευνητές εργάζονται για τη μείωση των αναγκών εύρους ζώνης.
Ο Πολυμερής Υπολογισμός (MPC) λειτουργεί καλά με το Ocean: To Ocean για τη διαχείριση περιουσιακών στοιχείων δεδομένων, ο Πολυμερής Υπολογισμός (MPC) για τον υπολογισμό. Για παράδειγμα, εδώ είναι ένα πρωτότυπο ολοκλήρωσης που κάνει ταξινόμηση εικόνων για μια περίπτωση χρήσης στον τομέα της υγειονομικής περίθαλψης.
Το έργο blockchain Enigma επικεντρώνεται στα Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEEs) και στον Πολυμερή Υπολογισμό (MPC). Ως εκ τούτου, υπάρχουν μελλοντικές ευκαιρίες για ενσωμάτωση με το Ocean και το Enigma.
Αποδείξεις Μηδενικής Γνώσης (ZKPs)
Στις Αποδείξεις Μηδενικής Γνώσης (ZKPs), η Alice ρωτά τον Bob αν ο Bob γνωρίζει το x και ο Bob μπορεί να απαντήσει αποδεδειγμένα χωρίς να διαρρεύσουν πληροφορίες.
Περιορισμοί: Οι Αποδείξεις Μηδενικής Γνώσης (ZKP) απαιτούν διαδραστικές συνεδρίες, κλιμακώνονται ανεπαρκώς, και απαντούν μόνο σε δυαδικές ερωτήσεις.
Προς την επίλυση: Πρώτον, ορισμένες περιπτώσεις χρήσης είναι απολύτως εντάξει με τους περιορισμούς των Αποδείξεων Μηδενικής Γνώσης (ZKPs). Ίσως το πιο διάσημο παράδειγμα στο blockchain είναι το ZCash, το οποίο προσφέρει λειτουργίες που μοιάζουν με το Bitcoin (π.χ. αποτροπή διπλών δαπανών), αλλά χωρίς να διαρρέουν Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII). Δεύτερον, υπάρχει σταθερή πρόοδος για τη χαλάρωση των περιορισμών που παρατίθενται παραπάνω, ιδίως όσον αφορά το κομμάτι της κλιμάκωσης.
Απαιτώντας διαδραστικές συνεδρίες και δυαδικές εκροές, οι Αποδείξεις Μηδενικής Γνώσης (ZKPs) είναι λιγότερο άμεσα εφαρμόσιμες στο Ocean από την πλευρά της Τεχνητής Νοημοσύνης (AI). Ωστόσο, είμαστε ενθουσιασμένοι με το μέλλον των Αποδείξεων Μηδενικής Γνώσης (ZKPs) αλλού για το Ocean. Όπως στο Zcash, θα μπορούσαν να είναι χρήσιμες για τη μείωση της διαρροής Προσωπικών Αναγνωρίσιμων Πληροφοριών (PII) σχετικά με τις ίδιες τις συναλλαγές blockchain. Για παράδειγμα, η Zokrates παρέχει ιδιωτικές συναλλαγές στο Ethereum. Επιπλέον, με τα ZK Rollups (ή τον πιο ελαφρύ Αισιόδοξο ξάδελφό του) υπάρχει μεγάλη υπόσχεση για την επεκτασιμότητα του blockchain εκτός από την ιδιωτικότητα.

Συνθετικά Δεδομένα
Στην παραγωγή συνθετικών δεδομένων, μια Συνάρτηση Πιθανότητας Πυκνότητας (PDF) υπολογίζεται ή "μαθαίνεται" από το αρχικό σύνολο δεδομένων, δίπλα στα ίδια τα δεδομένα. Στη συνέχεια, εκατομμύρια σημεία δεδομένων μπορούν να αντληθούν από τη Συνάρτηση Πιθανότητας Πυκνότητας (PDF) και να διαμοιραστούν. Τα εν λόγω σημεία δεδομένων είναι φυσικά "ανώνυμα", γεγονός που μειώνει τον κίνδυνο διαρροής Προσωπικών Αναγνωρίσιμων Πληροφοριών (PII).
Πρόκληση 1: δεν είναι ευέλικτα. Η κατασκευή της Συνάρτησης Πιθανότητας Πυκνότητας (PDF) είναι ουσιαστικά μοντελοποίηση τύπου Τεχνητής Νοημοσύνης (AI), όπου η επιλογή του αλγορίθμου γίνεται από τον πάροχο της τεχνολογίας παραγωγής συνθετικών δεδομένων.
Πρόκληση 2: λιγότερο ακριβής. Υπάρχει τώρα μοντελοποίηση σε δύο επίπεδα - η Συνάρτηση Πιθανότητας Πυκνότητας (PDF) και το τελικό μοντέλο Τεχνητής Νοημοσύνης (AI) που κατασκευάζεται από τον επαγγελματία Τεχνητής Νοημοσύνης (AI). Το σφάλμα μοντελοποίησης επιδεινώνεται. Επιπλέον, εάν η Συνάρτηση Πιθανότητας Πυκνότητας (PDF) είναι υπερβολικά προσαρμοσμένη, οι Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII) θα διαρρεύσουν.
Προς την επίλυση: Το πρόβλημα 1 αντιμετωπίζεται αφήνοντας τον επαγγελματία της Τεχνητής Νοημοσύνης (AI) να κατασκευάσει τη Συνάρτηση Πιθανότητας Πυκνότητας (PDF) μόνος του. Το πρόβλημα 2 αντιμετωπίζεται εάν ο επαγγελματίας Τεχνητής Νοημοσύνης (AI) απλώς κατασκευάσει ο ίδιος ένα ενιαίο μοντέλο δίπλα στα δεδομένα. Και στη συνέχεια, έχετε τον Υπολογισμό σε Δεδομένα του Ocean (!). Επομένως, τα συνθετικά δεδομένα είναι μια κακή προσέγγιση για τη μοντελοποίηση της Τεχνητής Νοημοσύνης (AI). Ωστόσο, τα Συνθετικά Δεδομένα εξακολουθούν να είναι χρήσιμα για την οπτικοποίηση για την απόκτηση διαίσθησης σχετικά με τα (συνθετικά) δεδομένα, όπως οι 2D ή 3D οπτικοποιήσεις διαγράμματος διασποράς σε συνθετικά δεδομένα. Αυτό είναι που κάνει τα Συνθετικά Δεδομένα συμπληρωματικά στο Ocean.
Αποκεντρωμένη Εκμάθηση (FL)
Στην Αποκεντρωμένη Εκμάθηση (FL), ένα νευρωνικό δίκτυο αρχικοποιείται τυχαία. Στη συνέχεια, οι ενημερώσεις βάρους υπολογίζονται δίπλα στα ίδια τα δεδομένα στο σιλό δεδομένων #1 και αποστέλλονται στο νευρωνικό δίκτυο. Αυτό επαναλαμβάνεται στο σιλό δεδομένων #2, #3 και ούτω καθεξής. Στο τέλος, ένα νευρωνικό δίκτυο έχει εκπαιδευτεί σε πολλά σιλό δεδομένων, χωρίς τα δεδομένα να εγκαταλείπουν τις εγκαταστάσεις κάθε αντίστοιχου σιλό.
Το Αποκεντρωμένο TensorFlow (TFF) και το OpenMined είναι τα πιο γνωστά έργα Αποκεντρωμένης Εκμάθησης (FL). Το Αποκεντρωμένο TensorFlow (TFF) κάνει την ενορχήστρωση με κεντροποιημένο τρόπο και το OpenMined αποκεντρωμένα. Οι Αποκεντρωμένες Αναλύσεις της Google παίρνουν ένα παράδειγμα από την Αποκεντρωμένη Εκμάθηση (FL) και υπολογίζει απλούστερες συγκεντρωτικές τιμές, όπως μέσους όρους.
Πρόκληση: στην Αποκεντρωμένη Εκμάθηση (FL) τύπου Αποκεντρωμένου TensorFlow (TFF), μια κεντροποιημένη οντότητα (π.χ. Google) πρέπει να εκτελεί την ενορχήστρωση των εργασιών υπολογισμού σε διάφορα σιλό. Έτσι, οι Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII) μπορούν να διαρρεύσουν σε αυτή την οντότητα.
Προς την επίλυση: Το OpenMined αντιμετωπίζει αυτό το πρόβλημα μέσω αποκεντρωμένης ενορχήστρωσης. Όμως, η υποδομή λογισμικού του θα μπορούσε να βελτιωθεί ώστε να διαχειρίζεται τον υπολογισμό σε κάθε σιλό με πιο ασφαλή τρόπο- εδώ είναι που μπορεί να βοηθήσει ο Υπολογισμός σε Δεδομένα.
Αποσυνδεδεμένος Κατακερματισμός (DH)
Ο Αποσυνδεδεμένος Κατακερματισμός (DH) είναι λιγότερο γνωστός από άλλες τεχνικές που ερευνώνται, αλλά αξίζει να τον κατανοήσετε. Πρώτα θα εξετάσουμε τον παραδοσιακό Κατακερματισμό Χαρακτηριστικών (FH). Ο Κατακερματισμός Χαρακτηριστικών (FH) εκπαιδεύει ένα μοντέλο Τεχνητής Νοημοσύνης (AI) ως εξής: (1) Στα δεδομένα εκπαίδευσης, δημιουργήστε ένα κρυπτογράφημα για κάθε συνδυασμό {μεταβλητή εισροής, τιμή εισροής}. (2) Εφαρμόστε έναν αλγόριθμο μάθησης για να μάθετε ένα βάρος για κάθε κρυπτογράφημα. Εκτελείται σε νέες / δοκιμαστικές εισροές ως εξής: (1) Σε δεδομένα δοκιμής, δημιουργήστε ένα κρυπτογράφημα για κάθε συνδυασμό {μεταβλητή εισροής, τιμή εισροής}. (2) Τρέξτε τα κρυπτογραφήματα μέσω του εκπαιδευμένου μοντέλου.
Παραδοσιακά, όλα τα βήματα γίνονται στο ίδιο μηχάνημα. Αλλά δεν χρειάζεται να είναι έτσι! Αυτή είναι η ιδέα του Αποσυνδεδεμένου Κατακερματισμού (DH). Ο Αποσυνδεδεμένος Κατακερματισμός (DH) κάνει το βήμα εκπαίδευσης (1) και το βήμα δοκιμής (1) δίπλα στα δεδομένα. Το αποτέλεσμα είναι φυσικά ανώνυμο. Το βήμα εκπαίδευσης (2) και το βήμα δοκιμής (2) μπορούν να γίνουν οπουδήποτε από οποιονδήποτε, χωρίς να βλέπουν ιδιωτικές πληροφορίες.
Ο Αποσυνδεδεμένος Κατακερματισμός (DH) είναι ρεαλιστικός: έχει ελάχιστη διαρροή πληροφοριών, κλιμακώνεται καλά και δεν απαιτεί νέα άλματα στην τεχνολογία ή την επιστήμη. Η εναπομένουσα πρόκληση είναι πώς να δημιουργηθεί η υποδομή για τον διαχωρισμό των βημάτων (1) και (2) και για τον συντονισμό των φορέων σε κάθε πλευρά. Ο Υπολογισμός σε Δεδομένα του Ocean μπορεί να βοηθήσει με την υποδομή και το συντονισμό για να μειωθούν τα εμπόδια στη χρήση του Αποσυνδεδεμένου Κατακερματισμού (DH).
Διαφορικό Απόρρητο (DP)
Το Διαφορικό Απόρρητο (DP) "είναι ένα σύστημα για τη δημόσια κοινοποίηση πληροφοριών σχετικά με ένα σύνολο δεδομένων περιγράφοντας τα μοτίβα των ομάδων εντός του συνόλου δεδομένων, ενώ αποκρύπτει πληροφορίες σχετικά με τα άτομα στο σύνολο δεδομένων". Η κύρια τακτική είναι η προσθήκη τυχαίου θορύβου σε κάθε σημείο δεδομένων εισροής, ώστε οποιοσδήποτε φορέας που εξετάζει στατιστικά στοιχεία που προκύπτουν από όλα τα σημεία δεδομένων να μην μπορεί να εξάγει Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII).
Το Διαφορικό Απόρρητο (DP) μπορεί να ενισχύσει την ιδιωτικότητα άλλων τεχνικών. Είναι ζωτικής σημασίας για τα συνθετικά δεδομένα: Το Διαφορικό Απόρρητο (DP) είναι ο κύριος αποδεκτός τρόπος για τη δημιουργία τους με αποδεδειγμένα ιδιωτικό τρόπο. Το Διαφορικό Απόρρητο (DP) έχει αποδειχθεί ότι βοηθά την ομοσπονδιακή μάθηση, για παράδειγμα εδώ. Το Διαφορικό Απόρρητο (DP) έχει δυνατότητες και για τα πλαίσια Υπολογισμού σε Δεδομένα.

Υπολογισμός σε Δεδομένα
Η κύρια ιδέα του Υπολογισμού σε Δεδομένα είναι να φέρει τον υπολογισμό στα δεδομένα, ενώ τα δεδομένα παραμένουν στην εγκατάστασή τους. Τα αποτελέσματα των υπολογισμών που επιστρέφονται είναι επαρκώς συγκεντρωτικά ή ανώνυμα, ώστε να ελαχιστοποιείται ο κίνδυνος προστασίας της ιδιωτικότητας.
Η τεχνολογία Υπολογισμού σε Δεδομένα του Ocean βασίζεται σε μια σειρά συναφών ιδεών και τεχνολογιών. Οι ερευνητές βάσεων δεδομένων έχουν διερευνήσει την ιδέα του υπολογισμού δίπλα στα δεδομένα από τη δεκαετία του 1970- η σύγχρονη εκδοχή είναι ο υπολογισμός κοντά στη μνήμη και ο υπολογισμός κοντά στα δεδομένα. Όπως συζητήθηκε, η Αποκεντρωμένη Εκμάθηση (FL) φέρνει τον υπολογισμό δίπλα στα δεδομένα για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης (AI) σε πολλά σιλό δεδομένων, (αν και με κεντροποιημένη ενορχήστρωση). Η Αποκεντρωμένη Εκμάθηση (FL) άρχισε να κερδίζει έδαφος το 2015. Το έργο Fitchain έφερε επίσης τον υπολογισμό δίπλα στα δεδομένα, συμπεριλαμβανομένης της συνεργασίας με το Ocean το 2018. Έχει ένα εμπορικό παρακλάδι. Τέλος, ένα ακαδημαϊκό έγγραφο από την Algorand πρότεινε πρόσφατα μια τεχνολογία που φέρνει τον υπολογισμό στα δεδομένα.
Το Ocean μεταφέρει την ιδέα του Υπολογισμού σε Δεδομένα στο οικοσύστημα του με τον έλεγχο πρόσβασης με βάση το blockchain (σε επίπεδο πλατφόρμας) και τις αγορές δεδομένων για την αγορά και πώληση ιδιωτικών δεδομένων με ταυτόχρονη διατήρηση της ιδιωτικότητας. Πρόκειται για μια μακρά σειρά ιδεών και τεχνολογιών, όλες γύρω από ένα κοινό κίνημα ανάκτησης του ελέγχου των δεδομένων μας. Είμαστε υπερήφανοι που αποτελούμε μέρος αυτού του κινήματος.
Στον Υπολογισμό σε Δεδομένα του Ocean, οι ιδιοκτήτες δεδομένων εγκρίνουν σκριπτς αλγορίθμων Τεχνητής Νοημοσύνης (AI) για να εκτελεστούν στα δεδομένα τους, και στη συνέχεια ο Υπολογισμός σε Δεδομένα ενορχηστρώνει τον απομακρυσμένο υπολογισμό και την εκτέλεση σε δεδομένα για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης (AI).
Πρόκληση: υπάρχει κίνδυνος το παρεχόμενο σκριπτ να διαρρεύσει Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII). Αυτό έχει δύο παραλλαγές: (α) κακόβουλη και (β) υπερβολική προσαρμογή.
Στο στοιχείο (α), το σκριπτ έχει ειδικό κώδικα που στέλνει τα δεδομένα στον προμηθευτή του σκριπτ. Ο προμηθευτής θα συσκοτίσει αυτόν τον κώδικα μέσω μιας, εύκολης να παραλείψετε, ειδικής εισαγωγής όπως το "import sk_learn" (έναντι της σωστής έκδοσης "import sklearn"). Η ειδική βιβλιοθήκη τυλίγει το sklearn, αλλά εισάγει αντιγραφή.
Στο (β), το μοντέλο μαθαίνει πάρα πολλές λεπτομέρειες, έτσι ώστε να μπορεί να εξαχθούν από αυτό Προσωπικές Αναγνωρίσιμες Πληροφορίες (PII). Ένα ακραίο παράδειγμα είναι: στην εκπαίδευση του δέντρου CART, η εκμάθηση κάθε κλάδου σταματά μόνο όταν ο κόμβος φύλλου έχει ένα μόνο σημείο δεδομένων. Ή, το νευρωνικό δίκτυο θα μπορούσε να γίνει υπερπροσαρμοσμένο, έχει μεγάλο αριθμό παραμέτρων σε σύγκριση με τα σημεία δεδομένων του, και δεν κάνει κανονικοποίηση κατά την εκπαίδευση.
Για επίλυση: Ο Πάροχος Δεδομένων επιλέγει ποιους αλγορίθμους θα εμπιστευτεί. Επομένως, είναι η ίδια οντότητα που διακινδυνεύει την έκθεση ιδιωτικών δεδομένων και επιλέγει τον αλγόριθμο που θα εμπιστευτεί. Είναι δική του επιλογή που πρέπει να κάνει, με βάση την προτίμησή του για τον κίνδυνο και την ανταμοιβή. Για το (α): απλά κάνουν επιθεώρηση. Για το (β): ορισμένοι αλγόριθμοι είναι εύκολο να εμπιστευτούν, όπως ο μέσος όρος ή η εκμάθηση ενός μοντέλου λογιστικής οπισθοδρόμισης με γραμμικές συναρτήσεις βάσης. Αλλά για πιο προχωρημένη μοντελοποίηση, είναι λίγο πιο δύσκολο. Για να το διευκολύνουμε αυτό, οραματιζόμαστε μια άνοδο των σκριπτς που επιμελείται η κοινότητα με ουσιαστικό διακύβευμα (staking) για να βοηθήσουμε να "σταθεροποιήσουμε" τα πιο χρήσιμα ή πολλά υποσχόμενα σκριπτς με την πάροδο του χρόνου.

Το Ocean και το Οικοσύστημα Διατήρησης της Ιδιωτικότητας.
Οι ιδιότητες του Υπολογισμού σε Δεδομένα του Ocean το καθιστούν χρήσιμο προς το παρόν. Είναι λιγότερο επιβαρυμένο από ορισμένα από τα ζητήματα που έχουν επιβραδύνει την υιοθέτηση ορισμένων τεχνικών διατήρησης της ιδιωτικότητας. Αυτό δεν είναι τυχαίο: όταν αρχίσαμε να διερευνούμε τον τρόπο διατήρησης της ιδιωτικότητας στο Ocean, εξετάσαμε τις προσεγγίσεις που ερευνήθηκαν παραπάνω και συνειδητοποιήσαμε ότι η μεταφορά του υπολογισμού στα δεδομένα ήταν η πιο ρεαλιστική επιλογή για το εγγύς μέλλον.
Αλλά και άλλες προσεγγίσεις ωριμάζουν όμορφα. Το Πρωτόκολλο Ocean δεν περιορίζεται μόνο στον υπολογισμό μεταξύ δεδομένων ως τεχνική διατήρησης της ιδιωτικότητας. Με την πάροδο του χρόνου και την ωρίμανση άλλων τεχνικών, οραματιζόμαστε τη χρήση άλλων τεχνικών σε συνδυασμό με το Ocean.
Ιδιαίτερο ενδιαφέρον παρουσιάζει η Αποκεντρωμένη Εκμάθηση (FL), η οποία είναι πιο κοντά στο πνεύμα του Υπολογισμού σε Δεδομένα του Ocean, καθώς η Αποκεντρωμένη Εκμάθηση (FL) φέρνει επίσης τον υπολογισμό στα δεδομένα. Στην πραγματικότητα, η Αποκεντρωμένη Εκμάθηση (FL) είναι συμπληρωματική του Ocean: Η Αποκεντρωμένη Εκμάθηση (FL) κάνει διαχείριση υψηλότερου επιπέδου σε πολλά σιλό δεδομένων, και το Ocean διαχειρίζεται με ασφάλεια τον υπολογισμό σε ένα δεδομένο σιλό. Είμαστε ιδιαίτερα ενθουσιασμένοι με τις ενσωματώσεις με την τεχνολογία Αποκεντρωμένης Εκμάθησης (FL) του OpenMined .
Το OpenMined είναι ενδιαφέρον για το Ocean γενικότερα. Έχει εξελιχθεί από μια καθαρή τεχνολογία Αποκεντρωμένης Εκμάθησης (FL) σε μια ευρύτερη εργαλειοθήκη ανοικτού λογισμικού "συνδετικού ιστού" για τεχνολογίες Τεχνητής Νοημοσύνης (AI) που διατηρούν την ιδιωτικότητα, παράλληλα με μια μεγάλη και αυξανόμενη κοινότητα. Ανυπομονούμε για περαιτέρω αλληλεπιδράσεις με την κοινότητα του OpenMined.
Συμπέρασμα
Σε αυτό το άρθρο τέθηκε το ερώτημα: πώς σχετίζεται ο Υπολογισμός σε Δεδομένα του Ocean με άλλες προσεγγίσεις διατήρησης της ιδιωτικότητας;
Βλέπουμε ότι το Ocean είναι συμπληρωματικό. Κάθε τεχνολογία έχει τη δική της χρήση, τους δικούς της περιορισμούς και τη δική της συμπληρωματική σχέση με το Ocean. Κρυπτογράφηση/αποκρυπτογράφηση, Ομομορφική Κρυπτογράφηση (HE), Αξιόπιστα Περιβάλλοντα Εκτέλεσης (TEE), Πολυμερής Υπολογισμός (MPC) και Αποδείξεις Μηδενικής Γνώσης (ZKPs) βρίσκονται δίπλα-δίπλα με το Ocean. Το Διαφορικό Απόρρητο (DP) μπορεί να ενισχύσει περαιτέρω τον Υπολογισμό σε Δεδομένα. Τα συνθετικά δεδομένα και οι ροές Αποκεντρωμένης Εκμάθησης (FL) βελτιώνονται άμεσα από τον Υπολογισμό σε Δεδομένα.
Ευχαριστίες
Ιδιαίτερες ευχαριστίες στους Andrew Trask, David Holtzman, Bruce Pon, Adam Drake και Julien Thevenard για την παροχή ανατροφοδότησης σε αυτό το άρθρο.
Περαιτέρω Ανάγνωση
Το OpenMined έχει μια εξαιρετική σειρά για την επιστήμη των δεδομένων με διατήρηση της ιδιωτικότητας, ξεκινώντας με αυτό το άρθρο.
Ακολουθήστε το Ocean Protocol μέσω του Newsletter και του Twitter, συνομιλήστε μαζί μας στο Telegram ή το Discord και δημιουργήστε στο Ocean ξεκινώντας από τα έγγραφά μας.
Ευχαριστούμε τον Julien Thevenard.
Πρωτότυπο Άρθρο (Αγγλική): How Does Ocean Compute-to-Data Relate to Other Privacy-Preserving Approaches?
Συντάκτης Πρωτότυπου Άρθρου: Trent McConaghy
Ημερομηνία Συγγραφής Πρωτότυπου Άρθρου: 28 Μαΐου 2020