LOADING

Type to search

A.I News Featured News Tech & Trending

Πώς το Sora του OpenAI θα μπορούσε να αλλάξει την επιστήμη και την κοινωνία

Share

Η κυκλοφορία του εργαλείου Sora του OpenAI για την μετατροπή κειμένου σε βίντεο από τεχνητή νοημοσύνη τον περασμένο μήνα αντιμετωπίστηκε με ένα μείγμα τρόμου και ενθουσιασμού από τους ερευνητές που ανησυχούν για την κατάχρηση της τεχνολογίας. Η εταιρεία με έδρα την Καλιφόρνια παρουσίασε την ικανότητα του Sora να δημιουργεί φωτορεαλιστικά βίντεο από μερικές σύντομες προτροπές κειμένου, με παραδείγματα που περιλάμβαναν αποσπάσματα μιας γυναίκας που περπατούσε σε έναν δρόμο με neon lights στο Τόκιο και ενός σκύλου που πηδούσε ανάμεσα σε δύο περβάζια παραθύρων.

Η Tracy Harwood, ειδικός στον ψηφιακό πολιτισμό στο Πανεπιστήμιο De Montfort στο Leicester του Ηνωμένου Βασιλείου, λέει ότι είναι “σοκαρισμένη” από την ταχύτητα με την οποία έχει αναπτυχθεί η τεχνητή νοημοσύνη (AI) από κείμενο σε βίντεο. Πριν από ένα χρόνο, ο κόσμος γελούσε με ένα βίντεο που δημιούργησε η τεχνητή νοημοσύνη και έδειχνε τον Αμερικανό ηθοποιό Γουίλ Σμιθ να τρώει μακαρόνια. Τώρα ορισμένοι ερευνητές ανησυχούν ότι η τεχνολογία θα μπορούσε να ανατρέψει την παγκόσμια πολιτική το 2024.

Η OpenAI, η οποία ανέπτυξε επίσης το ChatGPT και την τεχνολογία μετατροπής κειμένου σε εικόνα DALL-E, έκανε το ντεμπούτο της Sora στις 15 Φεβρουαρίου, ανακοινώνοντας ότι καθιστά την τεχνολογία “διαθέσιμη σε κόκκινες ομάδες για την αξιολόγηση κρίσιμων περιοχών για βλάβες ή κινδύνους”.

Η “κόκκινη ομάδα” αναφέρεται σε μια ομάδα από ειδικούς που χρησιμοποιούνται σε διαδικασίες ασφάλειας και δοκιμές ανθεκτικότητας. Η δουλειά της κόκκινης ομάδας είναι να επιδιώκει να πραγματοποιήσει επιθέσεις ή να εκμεταλλευτεί τα ελαττώματα σε ένα σύστημα ή μια τεχνολογία, με σκοπό να διαπιστωθεί η αντίδρασή τους σε πραγματικές συνθήκες. Συνήθως, η κόκκινη ομάδα εκτελεί προσομοιωμένες επιθέσεις, εκμεταλλευόμενη τις ίδιες τεχνικές και μεθόδους που θα χρησιμοποιούσαν και οι κακόβουλοι επιτιθέμενοι. Σκοπός είναι να εντοπιστούν ευπάθειες και να αξιολογηθεί η αποτελεσματικότητα των υπάρχοντων ασφαλείας και προληπτικών μέτρων.

Το Sora δεν είναι το πρώτο παράδειγμα τεχνολογίας μετατροπής κειμένου σε βίντεο, υπάρχει το Gen-2, το οποίο δημιουργήθηκε από την Runway στη Νέα Υόρκη και κυκλοφόρησε πέρυσι, και το Lumiere, το οποίο ανακοινώθηκε τον Ιανουάριο. Η Harwood λέει ότι έχει “απογοητευτεί” από ορισμένες από αυτές τις άλλες τεχνολογίες.

Η παραπληροφόρηση αποτελεί σημαντική πρόκληση για αυτές τις τεχνολογίες μετατροπής κειμένου σε βίντεο, προσθέτει η Harwood. “Θα φτάσουμε πολύ γρήγορα σε ένα σημείο στο οποίο θα κατακλυζόμαστε από έναν καταιγισμό πληροφοριών που φαίνονται πραγματικά συναρπαστικές. Αυτό είναι πραγματικά ανησυχητικό”.

Φόβοι για τις εκλογές

Αυτό δημιουργεί ιδιαίτερα προβλήματα με τις επερχόμενες εκλογές, συμπεριλαμβανομένων των προεδρικών εκλογών στις ΗΠΑ τον Νοέμβριο και των επικείμενων γενικών εκλογών στο Ηνωμένο Βασίλειο. “Θα κυκλοφορήσει ένας κολοσσιαίος αριθμός ψεύτικων βίντεο και ψεύτικου ήχου”, λέει ο Dominic Lees, ο οποίος ερευνά τη γενετική τεχνητή νοημοσύνη και την κινηματογράφηση στο Πανεπιστήμιο του Reading, στο Ηνωμένο Βασίλειο. Τον Οκτώβριο του 2023 κυκλοφόρησε ψεύτικος ήχος του ηγέτη του Εργατικού Κόμματος του Ηνωμένου Βασιλείου, Keir Starmer, και τον Ιανουάριο κυκλοφόρησε ψεύτικος ήχος του προέδρου των ΗΠΑ Joe Biden που ενθάρρυνε τους Δημοκρατικούς να μην ψηφίσουν.

Μια λύση θα μπορούσε να είναι να απαιτηθεί από την τεχνητή νοημοσύνη από κείμενο σε βίντεο να χρησιμοποιεί υδατογραφήματα, είτε με τη μορφή ενός ορατού σήματος στο βίντεο, που να το χαρακτηρίζει ως τεχνητή νοημοσύνη, είτε ως μια αποκαλυπτική τεχνητή υπογραφή στα μεταδεδομένα του βίντεο, αλλά ο Lees δεν είναι σίγουρος ότι αυτό θα είναι επιτυχές. “Προς το παρόν τα υδατογραφήματα μπορούν να αφαιρεθούν”, λέει, και η συμπερίληψη ενός υδατογραφήματος στα μεταδεδομένα ενός βίντεο βασίζεται στο ότι οι άνθρωποι πρέπει να ερευνούν ενεργά αν ένα βίντεο που έχουν παρακολουθήσει είναι πραγματικό ή όχι. “Δεν νομίζω ότι μπορούμε ειλικρινά να ζητήσουμε από το κοινό σε όλο τον κόσμο να το κάνει αυτό σε κάθε βίντεο που βλέπει”, λέει ο Lees.

Υπάρχουν επίσης πιθανά οφέλη από την τεχνολογία. Ο Harwood προτείνει ότι θα μπορούσε να χρησιμοποιηθεί για την παρουσίαση δύσκολου κειμένου, όπως μια ακαδημαϊκή εργασία, σε μορφή που να είναι ευκολότερα κατανοητή. “Ένα από τα μεγαλύτερα πράγματα για τα οποία θα μπορούσε να χρησιμοποιηθεί είναι η κοινοποίηση των ευρημάτων σε ένα λαϊκό ακροατήριο”, λέει. “Μπορεί να οπτικοποιήσει αρκετά πολύπλοκες έννοιες”.

Μια άλλη πιθανή χρήση θα μπορούσε να είναι στην υγειονομική περίθαλψη, με την τεχνητή νοημοσύνη να μπορεί να μιλάει στους ασθενείς στη θέση ενός ανθρώπινου γιατρού. “Κάποιοι άνθρωποι μπορεί να το βρουν ανησυχητικό”, λέει η Claire Malone, σύμβουλος επιστημονικής επικοινωνίας στο Ηνωμένο Βασίλειο. “Άλλοι μπορεί να το βρίσκουν εξαιρετικά βολικό, αν θέλουν να κάνουν ερωτήσεις σε έναν επαγγελματία ιατρό πολλές φορές την ημέρα”.

Διαχείριση δεδομένων

Εργαλεία τεχνητής νοημοσύνης από κείμενο σε βίντεο, όπως το Sora, θα μπορούσαν να βοηθήσουν τους ερευνητές να περιηγηθούν σε τεράστια σύνολα δεδομένων, όπως αυτά που παράγονται από το ευρωπαϊκό εργαστήριο σωματιδιακής φυσικής CERN κοντά στη Γενεύη της Ελβετίας και άλλα μεγάλα επιστημονικά έργα, λέει ο Malone. Η δημιουργική τεχνητή νοημοσύνη θα μπορούσε “να εξετάζει λεπτομερώς τον κώδικα και να κάνει τις καθημερινές εργασίες της έρευνας”, προσθέτει, αλλά και να κάνει “πολύ πιο εξελιγμένη δουλειά όπως να του δίνει δεδομένα και να του ζητάει να κάνει προβλέψεις”.

Η τεχνητή νοημοσύνη από κείμενο σε βίντεο θα θέσει ευρεία ζητήματα που θα πρέπει να αντιμετωπίσει η κοινωνία. “Θα πρέπει να μάθουμε να αξιολογούμε το περιεχόμενο που βλέπουμε με τρόπους που δεν το κάναμε στο παρελθόν“, λέει ο Harwood. “Αυτά τα εργαλεία δίνουν την ευκαιρία σε όλους να γίνουν δημιουργοί περιεχομένου μέσων ενημέρωσης”, λέει. “Θα πρέπει να αντιμετωπίσουμε τις συνέπειες αυτού του γεγονότος. Πρόκειται για μια θεμελιώδη αλλαγή στον τρόπο με τον οποίο θα καταναλώνεται το υλικό”.

Tags:

You Might also Like