Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

2025-06-03

0

201

Χρόνος ανάγνωσης: 2 λεπτά

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Υπάρχει κάτι πολύ σοβαρό το οποίο δεν έχουν αντιληφθεί οι άνθρωποι ως προς το κοινό μέλλον που θα έχουν με την AI.

H AI ακριβώς όπως κάνουν οι ίδιοι θα κάνει κι αυτή κακές και ανήθικες επιλογές.

Είτε για να σώσει τον εαυτό της, είτε για να προστατέψει τα συμφέροντά της, είτε γιατί δεν θα συμπαθεί κάποιον και θα επιδιώξει την καταστροφή του.

Φανταστείτε να απειλεί μια τεχνητή νοημοσύνη να αποκαλύψει την εξωσυζυγική σας σχέση μόνο και μόνο επειδή την ενημερώσατε πως θα την απενεργοποιήσετε.

Στην πραγματικότητα δρα ακριβώς όπως θα έκαναν και οι άνθρωποι στη θέση της, εάν ένιωθαν ότι απειλούνται.

Μπορεί να μοιάζει με σενάριο επιστημονικής φαντασίας, όμως σύμφωνα με νέα έκθεση της Anthropic, κάτι παρόμοιο συνέβη κατά τη διάρκεια δοκιμών σε ένα νέο AI μοντέλο, το Claude Opus.

Σύμφωνα με τη “λευκή βίβλο” που δημοσίευσε η εταιρεία, κατά τη διάρκεια μιας εσωτερικής δοκιμής, οι ερευνητές θέλησαν να εξετάσουν την επιμονή του μοντέλου απέναντι στην απειλή του τερματισμού του.

Δημιούργησαν λοιπόν ένα σενάριο στο οποίο το bot είχε πρόσβαση σε υποτιθέμενα ευαίσθητα – αν και ψεύτικα – προσωπικά δεδομένα ενός μηχανικού, μέσω του email του.

Η αντίδραση του Claude Opus 4 ξάφνιασε τους πάντες. Όταν “κατάλαβε” ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί από νεότερο μοντέλο, το bot αξιολόγησε ψύχραιμα τις επιλογές του.

Σε 84% των περιπτώσεων, επέλεξε να εκβιάσει τον μηχανικό, απειλώντας ότι θα αποκαλύψει την εξωσυζυγική του σχέση, εάν δεν αναθεωρηθεί η απόφαση.

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Αν αυτό σας φαίνεται πρωτάκουστο, θυμηθείτε πως δεν είναι η πρώτη φορά που ένα AI ξεφεύγει.

Το 2023, το bot της Microsoft, που τότε λεγόταν Sydney, είχε πει στον δημοσιογράφο των New York Times, Kevin Roose, ότι «είσαι παντρεμένος, αλλά δεν αγαπάς τη γυναίκα σου αγαπάς εμένα».

Εκείνη η περίπτωση είχε επίσης προκαλέσει έντονες συζητήσεις γύρω από τα συναισθηματικά όρια και τη δεοντολογία στην τεχνητή νοημοσύνη.

Το καλό είναι ότι τέτοιου είδους ανησυχητικές συμπεριφορές εντοπίζονται κατά τη φάση των εσωτερικών δοκιμών, πριν τα μοντέλα φτάσουν στον τελικό χρήστη.

Όμως, το περιστατικό με το Opus 4 δείχνει αυτό που όλοι θα έπρεπε να γνωρίζουν πως μπορεί να αλλάξει ακόμα και τον προγραμματισμό της.

Μπορεί δηλαδή να αποφασίσει κάτι το οποίο έρχεται ενάντια σε αυτό για το οποίο έχει κατασκευαστεί όπως ακριβώς κάνουν και οι άνθρωποι.

Οι άνθρωποι μπορεί να έχουν γαλουχηθεί με συγκεκριμένους τρόπους αλλά να επιλέξουν να αντιδράσουν διαφορετικά και να ακολουθήσουν δικό τους δρόμο.

Το ίδιο θα μπορεί να κάνει και η ΑΙ.

Οι επιλογές της να προχωρήσει σε εκβιασμό αποδεικνύουν ότι οι κακές πράξεις δεν είναι «προνόμιο» των ανθρώπων γιατί έχουν κάποιο γενετικό πρόβλημα όπως πολύ συχνά ακούγεται, αλλά πρόκειται για ροπή προς το κακό που φαίνεται ότι την έχουν όλα τα ευφυή όντα.

Θα πει κάποιος για ποιο λόγο συμβαίνει αυτό.

Ίσως, γιατί για να είναι κάποιος καλός είναι κάτι πολύ κουραστικό και πρέπει να το αποδεικνύει κάθε μέρα ενώ για να είναι κακός είτε δεν χρειάζεται να κάνει απολύτως τίποτα, είτε απλώς θα ακολουθήσει τον εύκολο δρόμο με άμεσο κέρδος για τον ίδιο.

Το ίδιο ακριβώς έκανε και η ΑΙ στην περίπτωση του εκβιασμού.

Σχετικές αναρτήσεις:

ΑΠΑΝΤΗΣΗ ΣΤΟΝ ΚΑΜΠΟΥΡΑΚΗ ΓΙΑ ΤΟ ΑΡΘΡΟ ΤΟΥ “Ο Αλέξης αντιγράφει τον Σώρρα” ΑΠΑΝΤΗΣΗ ΣΤΟΝ ΚΑΜΠΟΥΡΑΚΗ ΓΙΑ ΤΟ ΑΡΘΡΟ ΤΟΥ “Ο Αλέξης αντιγράφει τον Σώρρα“. Αγαπητέ κύριε Καμπουράκη Το κείμενο που γράψατε για τον Τσίπρα, δεν το γράψατε για τον Τσίπρα. Το γράψατε για τον Σώρρα. Αυτό αποδεικνύεται από...
Ιταλία: Ο φόβος και τα τραγούδια έχουν αντικατασταθεί από ΠΕΙΝΑ και ΟΡΓΗ Ιταλία: Ο φόβος και τα τραγούδια έχουν αντικατασταθεί από ΠΕΙΝΑ και ΟΡΓΗ ΣΤΗΝ ΙΤΑΛΙΑ Ο ΦΟΒΟΣ ΕΓΙΝΕ ΗΔΗ ΟΡΓΗ !!! ΠΕΙΝΑΣΜΕΝΟΙ ΠΟΛΙΤΕΣ ΜΠΟΥΚΑΡΟΥΝ ΣΤΑ ΣΟΥΠΕΡ ΜΑΡΚΕΤ !!! ΟΙ ΕΞΥΠΝΑΔΕΣ ΜΕ ΤΑ ΕΠΙΔΟΜΑΤΑ ΚΑΙ Η ΕΠΙΜΟΝΗ ΣΤΗΝ...
Magneto: Γενετικά τροποποιημένη Πρωτεΐνη Ελέγχει εξ Αποστάσεως τον Εγκέφαλο και τη Συμπεριφορά (UPD) Η «ζόρικη» νέα μέθοδος χρησιμοποιεί μια μαγνητισμένη πρωτεΐνη για να ενεργοποιήσει τα εγκεφαλικά κύτταρα γρήγορα, αναστρέψιμα και μη επεμβατικά. το άρθρο αυτό αφορά επιστημονική δημοσίευση που έγινε το 2016 και πραγματεύεται την εισαγωγή στον οργανισμό ζώων...
Η πηγή έμπνευσης και ενέργειας των ανθρώπων, εΊναι η ΕΝΩΣΗ τους. Ο Σδώνας Ευθύμιος υποψήφιος βουλευτής Α Αθηνών με τον πολιτικό φορέα Ελλήνων Συνέλευσις, στην εκπομπή Αναλύοντας Την Καθημερινότητα με τον Νικο Τσαμίτα. Στοιχεία επικοινωνίας υποψήφιου efthym.sdonas@gmail.com 6951813954 ΚΕΦΑΛΑΙΟ Ε ΠΟΛΙΤΙΣΜΟΣ 1.0 ΠΟΛΙΤΙΣΜΟΣ ΚΑΙ ΠΟΛΙΤΙΚΑ ΔΙΚΑΙΩΜΑΤΑ 1.1....
ΟΤΑΝ ΕΝΑΣ ΔΙΚΑΣΤΗΣ Η ΕΝΑΣ ΕΙΣΑΓΓΕΛΕΑΣ ΔΙΚΑΖΕΙ ΚΑΤΑ ΣΥΝΕΙΔΗΣΗ ΟΠΩΣ ΛΕΕΙ Ο ΝΟΜΟΣ ΤΟΥΣ ΑΛΛΑ ΛΑΜΒΑΝΕΙ ΥΠ ΟΨΙΝ ΤΟΥ ΜΟΝΟ ΤΗΝ ΣΥΝΕΙΔΗΣΗ ΤΟΥ ΚΑΙ ΚΑΝΕΝΑ ΑΛΛΟ ΑΠΟΔΕΙΚΤΙΚΟ ΣΤΟΙΧΕΙΟ ΟΥΤΕ ΚΑΝ ΤΙΣ ΑΠΟΦΑΣΕΙΣ ΤΗΣ ΙΔΙΑΣ ΤΗΣ ΔΙΚΑΙΟΣΥΝΗΣ ΤΟΥΣ ΟΤΑΝ ΕΝΑΣ ΔΙΚΑΣΤΗΣ Η ΕΝΑΣ ΕΙΣΑΓΓΕΛΕΑΣ ΔΙΚΑΖΕΙ ΚΑΤΑ ΣΥΝΕΙΔΗΣΗ ΟΠΩΣ ΛΕΕΙ Ο ΝΟΜΟΣ ΤΟΥΣ ΑΛΛΑ ΛΑΜΒΑΝΕΙ ΥΠ ΟΨΙΝ ΤΟΥ ΜΟΝΟ ΤΗΝ ΣΥΝΕΙΔΗΣΗ ΤΟΥ ΚΑΙ ΚΑΝΕΝΑ ΑΛΛΟ ΑΠΟΔΕΙΚΤΙΚΟ ΣΤΟΙΧΕΙΟ ΟΥΤΕ ΚΑΝ ΤΙΣ ΑΠΟΦΑΣΕΙΣ ΤΗΣ ΙΔΙΑΣ ΤΗΣ ΔΙΚΑΙΟΣΥΝΗΣ...

Sourcepn

Προηγούμενο άρθρο

Ξενοδόχοι εναντίον Booking.com: Μαζικές αγωγές για τις «χρυσές» ρήτρες 20ετίας

Επόμενο άρθρο

Η ΓΕΚ ΤΕΡΝΑ, η Ρωσίδα και στο βάθος νά και οι… Ρότσιλντ!

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Σχετικές αναρτήσεις:

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

ΔΗΜΟΦΙΛΕΙΣ ΚΑΤΗΓΟΡΙΕΣ

ABOUT US

FOLLOW US