Τα προγράμματα ΤΝ συχνά παραποιούνται για να εξυπηρετήσουν σεξουαλικές ανάγκες | Shutterstock/R-Type

Θέματα

Tα εύχρηστα chatbots για όλες τις (και βρώμικες) δουλειές

Από ακατάλληλες συνομιλίες σεξουαλικού περιεχομένου έως την έρευνα για τον καρκίνο, τα μοντέλα «ανοικτού κώδικα» ανταγωνίζονται τους γίγαντες της τεχνολογίας για τον έλεγχο της Τεχνητής Νοημοσύνης

Protagon Team

30/06/2023, 19:12

Η Aλι είναι μια 18χρονη με μακριά καστανά μαλλιά που μπορεί να υπερηφανεύεται για «τόνους σεξουαλικής εμπειρίας». Επειδή «ζει για την προσοχή, μοιράζεται λεπτομέρειες για τις αποδράσεις της» με οποιονδήποτε, δωρεάν. Αλλά η Aλι δεν είναι υπαρκτό πρόσωπο, είναι ένα chatbot Τεχνητής Νοημοσύνης (ΤΝ) που δημιουργήθηκε για σεξουαλικό παιχνίδι – το οποίο μερικές φορές μεταφέρει λεπτομέρειες από παραστατικούς βιασμούς και φαντασιώσεις σεξουαλικής κακοποίησης.

Ενώ εταιρείες όπως η OpenAI, η Microsoft και η Google εκπαιδεύουν αυστηρά τα μοντέλα ΤΝ τους για να αποφεύγουν μια σειρά θεμάτων ταμπού, συμπεριλαμβανομένων των υπερβολικά οικείων συνομιλιών, η Aλι κατασκευάστηκε χρησιμοποιώντας τεχνολογία ανοικτού κώδικα – που είναι δωρεάν διαθέσιμος στο κοινό, χωρίς τέτοιους περιορισμούς.

Βασισμένη σε ένα μοντέλο που δημιουργήθηκε από τη Meta (τη μητρική εταιρεία του Facebook) και ονομάζεται LLaMA, η Aλι αποτελεί μέρος μιας αυξανόμενης παλίρροιας εξειδικευμένων προϊόντων ΤΝ που μπορεί να κατασκευάσει ο καθένας, από εργαλεία γραφής και chatbots (βοηθούς συνομιλίας), έως εφαρμογές ανάλυσης δεδομένων.

Οι υποστηρικτές τους βλέπουν την ΤΝ ανοικτού κώδικα ως έναν τρόπο υπέρβασης των ελέγχων των πολυεθνικών μεγαθηρίων της τεχνολογίας – ένα πλεονέκτημα για επιχειρηματίες, ακαδημαϊκούς, καλλιτέχνες και ακτιβιστές που μπορούν να πειραματιστούν ελεύθερα με τη μετασχηματιστική τεχνολογία, σύμφωνα με ρεπορτάζ της Washington Post.

«Το κεντρικό επιχείρημα για τον ανοικτό κώδικα είναι ότι επιταχύνει την καινοτομία στην ΤΝ» λέει ο Ρόμπερτ Νισιχάρα, διευθύνων σύμβουλος και συνιδρυτής της νεοφυούς Anyscale, η οποία βοηθά τις μικρότερες εταιρείες τεχνολογίας να εκτελούν μοντέλα ΤΝ ανοιχτού κώδικα.

Οι πελάτες της Anyscale χρησιμοποιούν μοντέλα ΤΝ για να ανακαλύψουν νέα φαρμακευτικά προϊόντα, να μειώσουν τη χρήση φυτοφαρμάκων στη γεωργία και να εντοπίσουν δόλια αγαθά που πωλούνται στο διαδίκτυο, λέει. Αυτές οι εφαρμογές θα ήταν ακριβότερες και πιο δύσκολες, αν όχι αδύνατες, εάν βασίζονταν στα λιγοστά προϊόντα που προσφέρουν οι μεγαλύτερες εταιρείες ΤΝ.

Ωστόσο, αυτή η ίδια ελευθερία θα μπορούσε να γίνει και αντικείμενο εκμετάλλευσης από κακούς παίκτες. Μοντέλα ανοιχτού κώδικα έχουν χρησιμοποιηθεί για τη δημιουργία τεχνητής παιδικής πορνογραφίας, χρησιμοποιώντας εικόνες πραγματικών παιδιών ως υλικό πηγής. Οι επικριτές τους ανησυχούν ότι θα μπορούσαν επίσης να διευκολύνουν απάτες, διαδικτυακό hacking και εξελιγμένες εκστρατείες προπαγάνδας.

Ο δημιουργός της Aλι, ο οποίος μίλησε στην Washington Post υπό τον όρο της ανωνυμίας, φοβούμενος για την επαγγελματική του φήμη, είπε ότι τα εμπορικά chatbots όπως το Replika και το ChatGPT υπόκεινται «υψηλής λογοκρισίας» και δεν μπορούν να προσφέρουν τον τύπο σεξουαλικών συνομιλιών που επιθυμεί. Με εναλλακτικές λύσεις ανοιχτού κώδικα, πολλές βασισμένες στο μοντέλο LLaMA της Meta, ο δημιουργός λέει ότι μπορεί να φτιάξει τους δικούς του αδέσμευτους συνομιλητές.

Στο YouTube οι influencers προσφέρουν σεμινάρια για το πώς να δημιουργήσει κανείς chatbot «χωρίς λογοκρισία». Ορισμένα βασίζονται σε μια τροποποιημένη έκδοση του LLaMA, που ονομάζεται Alpaca AI, την οποία κυκλοφόρησαν οι ερευνητές του Πανεπιστημίου του Στάνφορντ τον περασμένο Μάρτιο, μόνο για να την αποσύρουν μια εβδομάδα αργότερα λόγω ανησυχιών για το κόστος και «τις ανεπάρκειες των φίλτρων περιεχομένου» τους.

Τα μοντέλα ΤΝ ανοιχτού κώδικα και οι δημιουργικές εφαρμογές που βασίζονται σε αυτά δημοσιεύονται συχνά στο Hugging Face, μια πλατφόρμα για κοινή χρήση και συζήτηση πάνω στα δημιουργήματα της ΤΝ και της επιστήμης δεδομένων.

Κατά τη διάρκεια μιας ακρόασης στην Επιτροπή Επιστημών της αμερικανικής Βουλής των Αντιπροσώπων, την Πέμπτη, 22/6, ο Κλεμ Ντελάνγκ, διευθύνων σύμβουλος της Hugging Face, προέτρεψε το Κογκρέσο να εξετάσει μια νομοθεσία που θα υποστηρίζει και θα δίνει κίνητρα στα μοντέλα ανοικτού κώδικα, τα οποία, όπως υποστήριξε, είναι «εξαιρετικά ευθυγραμμισμένα με τις αμερικανικές αξίες».

Σε μια συνέντευξή του μετά την ακρόαση, ο Ντελάνγκ αναγνώρισε ότι μπορεί να γίνει κατάχρηση εργαλείων ανοικτού κώδικα. Σημείωσε ότι ένα μοντέλο που εκπαιδεύτηκε σκόπιμα σε τοξικό περιεχόμενο, το GPT-4chan, είχε αφαιρεθεί από το Hugging Face. Ωστόσο, είπε ότι πιστεύει πως οι προσεγγίσεις ανοικτού κώδικα επιτρέπουν τόσο μεγαλύτερη καινοτομία όσο και περισσότερη διαφάνεια και συνεκτικότητα σε σχέση με τα μοντέλα που ελέγχονται από τις πολυεθνικές.

Καθώς η Google και η OpenAI έχουν γίνει πιο μυστικοπαθείς σχετικά με τα πιο ισχυρά μοντέλα ΤΝ τους, η Meta αναδείχθηκε ως μια αναπάντεχη εταιρική πρωταθλήτρια της ΤΝ ανοικτού κώδικα. Τον Φεβρουάριο κυκλοφόρησε το LLaMA, ένα μοντέλο κώδικα που είναι λιγότερο ισχυρό από το GPT-4, αλλά πιο προσαρμόσιμο και φθηνότερο στην εκτέλεση. Η Meta αρχικά απέκρυψε βασικά μέρη του κώδικα του LlaMa, και σχεδίαζε να περιορίσει την πρόσβαση σε αυτό, αποκλειστικά σε εξουσιοδοτημένους ερευνητές.

Αλλά στις αρχές Μαρτίου, αυτά τα μέρη, γνωστά ως «βαρίδια» του μοντέλου, είχαν διαρρεύσει σε δημόσια φόρουμ, καθιστώντας το LLaMA ελεύθερα προσβάσιμο σε όλους. «Ο ανοικτός κώδικας είναι μια θετική δύναμη για την πρόοδο της τεχνολογίας», λέει ο επιχειρησιακός διευθυντής της Meta. «Γι’ αυτό μοιραστήκαμε το LLaMA με μέλη της ερευνητικής κοινότητας, για να μας βοηθήσουν να το αξιολογήσουμε, να κάνουμε βελτιώσεις και να το επεξεργαστούμε μαζί».

Από τότε το LLaMA έχει γίνει ίσως το πιο δημοφιλές μοντέλο ανοικτού κώδικα για τεχνολόγους που θέλουν να αναπτύξουν τις δικές τους εφαρμογές ΤΝ. Αλλά δεν είναι το μόνο. Τον Απρίλιο, η εταιρεία λογισμικού Databricks κυκλοφόρησε ένα μοντέλο ανοικτού κώδικα που ονομάζεται Dolly 2.0. Και τον περασμένο μήνα, μια ομάδα με έδρα το Αμπου Ντάμπι κυκλοφόρησε ένα μοντέλο ανοικτού κώδικα που αποκαλείται Falcon και είναι ευθέως ανταγωνιστικό του LLaMA σε επίπεδο απόδοσης.

Ορισμένοι υψηλά ιστάμενοι σε εταιρείες όπως η Google –που κρατά το chatbot της, Bard, κλειδωμένο–, βλέπουν το λογισμικό ανοικτού κώδικα ως υπαρξιακή απειλή για τις επιχειρήσεις τους, καθώς τα μεγάλα μοντέλα ανοικτού κώδικα που είναι διαθέσιμα στο κοινό γίνονται σχεδόν εξίσου ικανά με τα δικά τους.

«Δεν είμαστε σε θέση να κερδίσουμε αυτόν τον εξοπλιστικό αγώνα ΤΝ, ούτε η OpenAI», έγραψε ένας μηχανικός της Google σε ένα σημείωμα που δημοσιεύθηκε στον τεχνολογικό ιστότοπο Semianalysis τον περασμένο Μάιο. «Αναφέρομαι, φυσικά, στον ανοικτό κώδικα. Με απλά λόγια, μας έχουν υπερκεράσει. Ενώ τα μοντέλα μας εξακολουθούν να έχουν ένα ελαφρύ πλεονέκτημα όσον αφορά στην ποιότητα, η απόστασή μας από τους ανοικτούς κώδικες κλείνει εντυπωσιακά γρήγορα».

Ο Νέιθαν Μπενάιχ, εταίρος της Air Street Capital, μιας εταιρείας επιχειρηματικών επενδύσεων με έδρα το Λονδίνο που επικεντρώνεται στην ΤΝ, σημειώνει ότι πολλές από τις μεγαλύτερες προόδους της βιομηχανίας τεχνολογίας κατά τη διάρκεια των δεκαετιών έγιναν δυνατές από τεχνολογίες ανοικτού κώδικα – συμπεριλαμβανομένων των σημερινών μοντέλων γλώσσας ΤΝ.

Ο Γκάρι Μάρκους, γνωστικός επιστήμονας που κατέθεσε στο Κογκρέσο σχετικά με τη θεσμοθέτηση ρυθμίσεων στα προγράμματα ΤΝ τον περασμένο Μάιο, αντιτείνει ότι η επιτάχυνση της καινοτομίας της ΤΝ μπορεί να μην είναι κάτι θετικό, λαμβάνοντας υπόψη τους κινδύνους που μπορεί να θέσει η τεχνολογία για την κοινωνία. «Δεν διαθέτουμε πυρηνικά όπλα ανοικτού κώδικα», λέει χαρακτηριστικά ο Μάρκους. «Η τρέχουσα τεχνολογία ΤΝ είναι ακόμα αρκετά περιορισμένη, αλλά τα πράγματα μπορεί να αλλάξουν πολύ γρήγορα».