LOADING

Type to search

A.I News Featured ΝΕΑ

Τα chatbots τεχνητής νοημοσύνης “σκέφτονται” στα αγγλικά, σύμφωνα με έρευνα

Share

Τα μεγάλα γλωσσικά μοντέλα  (LLM) που βρίσκονται πίσω από τα AI chatbots “σκέφτονται” στα αγγλικά, ακόμη και όταν τους γίνονται ερωτήσεις σε άλλες γλώσσες, σύμφωνα με νέα έρευνα. Για να διερευνήσουν αυτό το φαινόμενο, οι ερευνητές του Ελβετικού Ομοσπονδιακού Ινστιτούτου Τεχνολογίας στη Λωζάνη εξέτασαν τρεις εκδόσεις αυτών των μοντέλων AI chatbot και τα άνοιξαν για να δουν τα διάφορα “στρώματα” που συνθέτουν την εσωτερική επεξεργασία αυτών των LLMs.

Ανοίξαμε αυτά τα μοντέλα και εξετάσαμε κάθε ένα από τα στρώματα“, δήλωσε στο New Scientist ο ερευνητής Veniamin Veselovsky. Τα μοντέλα LLM (Language Model) εκπαιδεύτηκαν με τρεις διαφορετικούς τύπους προτροπών σε τέσσερις διαφορετικές γλώσσες. Ο πρώτος τύπος προτροπής ζητούσε από το μοντέλο να επαναλάβει τη λέξη που του δόθηκε. Για παράδειγμα, αν του δόθηκε η λέξη “κάτσε”, το μοντέλο θα έπρεπε να επαναλάβει τη λέξη “κάτσε”. Ο δεύτερος τύπος προτροπής ζητούσε από το LLM να μεταφράσει από μια μη αγγλική λέξη σε μια άλλη. Για παράδειγμα, αν του δόθηκε η λέξη “maison” (σπίτι στα γαλλικά), το μοντέλο θα έπρεπε να τη μεταφράσει στα αγγλικά, δηλαδή “house”. Τέλος, η τρίτη προτροπή ζητούσε από το μοντέλο να συμπληρώσει ένα κενό σε μια πρόταση. Για παράδειγμα, αν δόθηκε η πρόταση “Το χιόνι έπεσε και κάλυψε τον _______”, το μοντέλο θα έπρεπε να συμπληρώσει το κενό, πιθανότατα με τη λέξη “δρόμο”.

Στη συνέχεια, οι ερευνητές κατάφεραν να ανιχνεύσουν όλες τις διαφορετικές αλλαγές και διαδικασίες που έπρεπε να περάσει το LLM προκειμένου να καταλήξει στις απαντήσεις σε αυτά τα ερωτήματα. Αυτό που διαπίστωσαν ήταν ότι όλες αυτές οι LLM και όλες αυτές οι πολυεπίπεδες διαδικασίες έχουν ένα κοινό: όλες περνούν μέσα από αυτό που ονομάζουν “αγγλικό υποδιάστημα“. Αυτό ουσιαστικά σημαίνει ότι αντί να μεταφράζουν απευθείας από τα γαλλικά στα γερμανικά, κάνουν μια παράκαμψη και μεταφράζουν από τα γαλλικά στα αγγλικά και στη συνέχεια στα γερμανικά ή το αντίστροφο. Σύμφωνα με τον Veselvosky, αυτό είναι σημαντικό διότι υποδηλώνει ότι οι εν λόγω LLM χρησιμοποιούν τα αγγλικά προκειμένου να κατανοήσουν ορισμένες έννοιες.

Μιλώντας στο New Scientist, η Aliya Bhatia του Center for Democracy & Technology στην Ουάσιγκτον εξήγησε γιατί αυτά τα αποτελέσματα μπορεί να είναι ανησυχητικά.

“Υπάρχουν περισσότερα διαθέσιμα δεδομένα υψηλής ποιότητας στα αγγλικά απ’ ό,τι στις περισσότερες άλλες γλώσσες και, ως εκ τούτου, οι προγραμματιστές τεχνητής νοημοσύνης εκπαιδεύουν τα μοντέλα τους κυρίως σε δεδομένα αγγλικής γλώσσας”, εξήγησε η ίδια.

Η χρήση της αγγλικής γλώσσας ως μέσο εκπαίδευσης ενός μοντέλου νευρωνικών δικτύων ή άλλου συστήματος μηχανικής μάθησης μπορεί να επιφέρει μια σειρά από προκλήσεις και πιθανούς κινδύνους. Ένας από αυτούς τους κινδύνους είναι η μετάφραση συγκεκριμένων γλωσσικών και πολιτισμικών έννοιων με τρόπο που μπορεί να μην αντανακλά ακριβώς την πραγματικότητα σε άλλες γλωσσικές και πολιτισμικές κοινότητες. Κάθε γλώσσα είναι μοναδική με πλούσιο πολιτισμικό περιεχόμενο. Αν ένα μοντέλο εκπαιδευτεί αποκλειστικά σε δεδομένα αγγλικής γλώσσας, μπορεί να έχει περιορισμένη κατανόηση ή να παρουσιάσει προκαταλήψεις σχετικά με έννοιες που είναι μοναδικές σε άλλες γλωσσικές και πολιτισμικές παραδόσεις. Αυτό μπορεί να οδηγήσει σε ανακρίβειες ή παραπλανητικές αναλύσεις όταν το μοντέλο εφαρμόζεται σε δεδομένα ή κοινότητες εκτός του αγγλόφωνου κόσμου.

Επομένως, η χρήση περισσότερων γλωσσών και πολιτισμικών πηγών κατά την εκπαίδευση των μοντέλων μηχανικής μάθησης είναι σημαντική προκειμένου να διασφαλιστεί η πολυπολιτισμική και γλωσσική ευαισθησία τους και να μειωθεί ο κίνδυνος προκατάληψης και παραπλάνησης.

πηγή

Tags:

You Might also Like