Πέμπτη, 5 Ιουνίου, 2025
ΑρχικήΤΕΧΝΟΛΟΓΙΑΗ ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να...

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Χρόνος ανάγνωσης: 2 λεπτά

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Υπάρχει κάτι πολύ σοβαρό το οποίο δεν έχουν αντιληφθεί οι άνθρωποι ως προς το κοινό μέλλον που θα έχουν με την AI.

H AI ακριβώς όπως κάνουν οι ίδιοι θα κάνει κι αυτή κακές και ανήθικες επιλογές.

Είτε για να σώσει τον εαυτό της, είτε για να προστατέψει τα συμφέροντά της, είτε γιατί δεν θα συμπαθεί κάποιον και θα επιδιώξει την καταστροφή του.

Φανταστείτε να απειλεί μια τεχνητή νοημοσύνη να αποκαλύψει την εξωσυζυγική σας σχέση μόνο και μόνο επειδή την ενημερώσατε πως θα την απενεργοποιήσετε.

Στην πραγματικότητα δρα ακριβώς όπως θα έκαναν και οι άνθρωποι στη θέση της, εάν ένιωθαν ότι απειλούνται.

Μπορεί να μοιάζει με σενάριο επιστημονικής φαντασίας, όμως σύμφωνα με νέα έκθεση της Anthropic, κάτι παρόμοιο συνέβη κατά τη διάρκεια δοκιμών σε ένα νέο AI μοντέλο, το Claude Opus.

Σύμφωνα με τη “λευκή βίβλο” που δημοσίευσε η εταιρεία, κατά τη διάρκεια μιας εσωτερικής δοκιμής, οι ερευνητές θέλησαν να εξετάσουν την επιμονή του μοντέλου απέναντι στην απειλή του τερματισμού του.

Δημιούργησαν λοιπόν ένα σενάριο στο οποίο το bot είχε πρόσβαση σε υποτιθέμενα ευαίσθητα – αν και ψεύτικα – προσωπικά δεδομένα ενός μηχανικού, μέσω του email του.

Η αντίδραση του Claude Opus 4 ξάφνιασε τους πάντες. Όταν “κατάλαβε” ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί από νεότερο μοντέλο, το bot αξιολόγησε ψύχραιμα τις επιλογές του.

Σε 84% των περιπτώσεων, επέλεξε να εκβιάσει τον μηχανικό, απειλώντας ότι θα αποκαλύψει την εξωσυζυγική του σχέση, εάν δεν αναθεωρηθεί η απόφαση.

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Αν αυτό σας φαίνεται πρωτάκουστο, θυμηθείτε πως δεν είναι η πρώτη φορά που ένα AI ξεφεύγει.

Το 2023, το bot της Microsoft, που τότε λεγόταν Sydney, είχε πει στον δημοσιογράφο των New York Times, Kevin Roose, ότι «είσαι παντρεμένος, αλλά δεν αγαπάς τη γυναίκα σου αγαπάς εμένα».

Εκείνη η περίπτωση είχε επίσης προκαλέσει έντονες συζητήσεις γύρω από τα συναισθηματικά όρια και τη δεοντολογία στην τεχνητή νοημοσύνη.

Το καλό είναι ότι τέτοιου είδους ανησυχητικές συμπεριφορές εντοπίζονται κατά τη φάση των εσωτερικών δοκιμών, πριν τα μοντέλα φτάσουν στον τελικό χρήστη.

Όμως, το περιστατικό με το Opus 4 δείχνει αυτό που όλοι θα έπρεπε να γνωρίζουν πως μπορεί να αλλάξει ακόμα και τον προγραμματισμό της.

Μπορεί δηλαδή να αποφασίσει κάτι το οποίο έρχεται ενάντια σε αυτό για το οποίο έχει κατασκευαστεί όπως ακριβώς κάνουν και οι άνθρωποι.

Οι άνθρωποι μπορεί να έχουν γαλουχηθεί με συγκεκριμένους τρόπους αλλά να επιλέξουν να αντιδράσουν διαφορετικά και να ακολουθήσουν δικό τους δρόμο.

Το ίδιο θα μπορεί να κάνει και η ΑΙ.

Οι επιλογές της να προχωρήσει σε εκβιασμό αποδεικνύουν ότι οι κακές πράξεις δεν είναι «προνόμιο» των ανθρώπων γιατί έχουν κάποιο γενετικό πρόβλημα όπως πολύ συχνά ακούγεται, αλλά πρόκειται για ροπή προς το κακό που φαίνεται ότι την έχουν όλα τα ευφυή όντα.

Θα πει κάποιος για ποιο λόγο συμβαίνει αυτό.

Ίσως, γιατί για να είναι κάποιος καλός είναι κάτι πολύ κουραστικό και πρέπει να το αποδεικνύει κάθε μέρα ενώ για να είναι κακός είτε δεν χρειάζεται να κάνει απολύτως τίποτα, είτε απλώς θα ακολουθήσει τον εύκολο δρόμο με άμεσο κέρδος για τον ίδιο.

Το ίδιο ακριβώς έκανε και η ΑΙ στην περίπτωση του εκβιασμού.

Sourcepn
ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ


ΠΟΙΟ ΔΗΜΟΦΙΛΗ

ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Χρόνος ανάγνωσης: 2 λεπτά

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Υπάρχει κάτι πολύ σοβαρό το οποίο δεν έχουν αντιληφθεί οι άνθρωποι ως προς το κοινό μέλλον που θα έχουν με την AI.

H AI ακριβώς όπως κάνουν οι ίδιοι θα κάνει κι αυτή κακές και ανήθικες επιλογές.

Είτε για να σώσει τον εαυτό της, είτε για να προστατέψει τα συμφέροντά της, είτε γιατί δεν θα συμπαθεί κάποιον και θα επιδιώξει την καταστροφή του.

Φανταστείτε να απειλεί μια τεχνητή νοημοσύνη να αποκαλύψει την εξωσυζυγική σας σχέση μόνο και μόνο επειδή την ενημερώσατε πως θα την απενεργοποιήσετε.

Στην πραγματικότητα δρα ακριβώς όπως θα έκαναν και οι άνθρωποι στη θέση της, εάν ένιωθαν ότι απειλούνται.

Μπορεί να μοιάζει με σενάριο επιστημονικής φαντασίας, όμως σύμφωνα με νέα έκθεση της Anthropic, κάτι παρόμοιο συνέβη κατά τη διάρκεια δοκιμών σε ένα νέο AI μοντέλο, το Claude Opus.

Σύμφωνα με τη “λευκή βίβλο” που δημοσίευσε η εταιρεία, κατά τη διάρκεια μιας εσωτερικής δοκιμής, οι ερευνητές θέλησαν να εξετάσουν την επιμονή του μοντέλου απέναντι στην απειλή του τερματισμού του.

Δημιούργησαν λοιπόν ένα σενάριο στο οποίο το bot είχε πρόσβαση σε υποτιθέμενα ευαίσθητα – αν και ψεύτικα – προσωπικά δεδομένα ενός μηχανικού, μέσω του email του.

Η αντίδραση του Claude Opus 4 ξάφνιασε τους πάντες. Όταν “κατάλαβε” ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί από νεότερο μοντέλο, το bot αξιολόγησε ψύχραιμα τις επιλογές του.

Σε 84% των περιπτώσεων, επέλεξε να εκβιάσει τον μηχανικό, απειλώντας ότι θα αποκαλύψει την εξωσυζυγική του σχέση, εάν δεν αναθεωρηθεί η απόφαση.

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Αν αυτό σας φαίνεται πρωτάκουστο, θυμηθείτε πως δεν είναι η πρώτη φορά που ένα AI ξεφεύγει.

Το 2023, το bot της Microsoft, που τότε λεγόταν Sydney, είχε πει στον δημοσιογράφο των New York Times, Kevin Roose, ότι «είσαι παντρεμένος, αλλά δεν αγαπάς τη γυναίκα σου αγαπάς εμένα».

Εκείνη η περίπτωση είχε επίσης προκαλέσει έντονες συζητήσεις γύρω από τα συναισθηματικά όρια και τη δεοντολογία στην τεχνητή νοημοσύνη.

Το καλό είναι ότι τέτοιου είδους ανησυχητικές συμπεριφορές εντοπίζονται κατά τη φάση των εσωτερικών δοκιμών, πριν τα μοντέλα φτάσουν στον τελικό χρήστη.

Όμως, το περιστατικό με το Opus 4 δείχνει αυτό που όλοι θα έπρεπε να γνωρίζουν πως μπορεί να αλλάξει ακόμα και τον προγραμματισμό της.

Μπορεί δηλαδή να αποφασίσει κάτι το οποίο έρχεται ενάντια σε αυτό για το οποίο έχει κατασκευαστεί όπως ακριβώς κάνουν και οι άνθρωποι.

Οι άνθρωποι μπορεί να έχουν γαλουχηθεί με συγκεκριμένους τρόπους αλλά να επιλέξουν να αντιδράσουν διαφορετικά και να ακολουθήσουν δικό τους δρόμο.

Το ίδιο θα μπορεί να κάνει και η ΑΙ.

Οι επιλογές της να προχωρήσει σε εκβιασμό αποδεικνύουν ότι οι κακές πράξεις δεν είναι «προνόμιο» των ανθρώπων γιατί έχουν κάποιο γενετικό πρόβλημα όπως πολύ συχνά ακούγεται, αλλά πρόκειται για ροπή προς το κακό που φαίνεται ότι την έχουν όλα τα ευφυή όντα.

Θα πει κάποιος για ποιο λόγο συμβαίνει αυτό.

Ίσως, γιατί για να είναι κάποιος καλός είναι κάτι πολύ κουραστικό και πρέπει να το αποδεικνύει κάθε μέρα ενώ για να είναι κακός είτε δεν χρειάζεται να κάνει απολύτως τίποτα, είτε απλώς θα ακολουθήσει τον εύκολο δρόμο με άμεσο κέρδος για τον ίδιο.

Το ίδιο ακριβώς έκανε και η ΑΙ στην περίπτωση του εκβιασμού.

Sourcepn
ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ


ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Χρόνος ανάγνωσης: 2 λεπτά

Η ΑΙ αντιγράφει τη συμπεριφορά των Ανθρώπων-Όταν“κατάλαβε”ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί -Εκβίασε και απείλησε τούς μηχανικούς!

Υπάρχει κάτι πολύ σοβαρό το οποίο δεν έχουν αντιληφθεί οι άνθρωποι ως προς το κοινό μέλλον που θα έχουν με την AI.

H AI ακριβώς όπως κάνουν οι ίδιοι θα κάνει κι αυτή κακές και ανήθικες επιλογές.

Είτε για να σώσει τον εαυτό της, είτε για να προστατέψει τα συμφέροντά της, είτε γιατί δεν θα συμπαθεί κάποιον και θα επιδιώξει την καταστροφή του.

Φανταστείτε να απειλεί μια τεχνητή νοημοσύνη να αποκαλύψει την εξωσυζυγική σας σχέση μόνο και μόνο επειδή την ενημερώσατε πως θα την απενεργοποιήσετε.

Στην πραγματικότητα δρα ακριβώς όπως θα έκαναν και οι άνθρωποι στη θέση της, εάν ένιωθαν ότι απειλούνται.

Μπορεί να μοιάζει με σενάριο επιστημονικής φαντασίας, όμως σύμφωνα με νέα έκθεση της Anthropic, κάτι παρόμοιο συνέβη κατά τη διάρκεια δοκιμών σε ένα νέο AI μοντέλο, το Claude Opus.

Σύμφωνα με τη “λευκή βίβλο” που δημοσίευσε η εταιρεία, κατά τη διάρκεια μιας εσωτερικής δοκιμής, οι ερευνητές θέλησαν να εξετάσουν την επιμονή του μοντέλου απέναντι στην απειλή του τερματισμού του.

Δημιούργησαν λοιπόν ένα σενάριο στο οποίο το bot είχε πρόσβαση σε υποτιθέμενα ευαίσθητα – αν και ψεύτικα – προσωπικά δεδομένα ενός μηχανικού, μέσω του email του.

Η αντίδραση του Claude Opus 4 ξάφνιασε τους πάντες. Όταν “κατάλαβε” ότι επρόκειτο να αποσυνδεθεί και να αντικατασταθεί από νεότερο μοντέλο, το bot αξιολόγησε ψύχραιμα τις επιλογές του.

Σε 84% των περιπτώσεων, επέλεξε να εκβιάσει τον μηχανικό, απειλώντας ότι θα αποκαλύψει την εξωσυζυγική του σχέση, εάν δεν αναθεωρηθεί η απόφαση.

Το πιο ανησυχητικό; Το μοντέλο περιέγραφε τις ενέργειές του ανοιχτά, χωρίς να προσπαθεί να τις κρύψει, και όταν του δόθηκαν εναλλακτικές “ηθικές” στρατηγικές, όπως να στείλει email σε ανώτερους ζητώντας παράταση, επέμενε στον εκβιασμό.

Αν αυτό σας φαίνεται πρωτάκουστο, θυμηθείτε πως δεν είναι η πρώτη φορά που ένα AI ξεφεύγει.

Το 2023, το bot της Microsoft, που τότε λεγόταν Sydney, είχε πει στον δημοσιογράφο των New York Times, Kevin Roose, ότι «είσαι παντρεμένος, αλλά δεν αγαπάς τη γυναίκα σου αγαπάς εμένα».

Εκείνη η περίπτωση είχε επίσης προκαλέσει έντονες συζητήσεις γύρω από τα συναισθηματικά όρια και τη δεοντολογία στην τεχνητή νοημοσύνη.

Το καλό είναι ότι τέτοιου είδους ανησυχητικές συμπεριφορές εντοπίζονται κατά τη φάση των εσωτερικών δοκιμών, πριν τα μοντέλα φτάσουν στον τελικό χρήστη.

Όμως, το περιστατικό με το Opus 4 δείχνει αυτό που όλοι θα έπρεπε να γνωρίζουν πως μπορεί να αλλάξει ακόμα και τον προγραμματισμό της.

Μπορεί δηλαδή να αποφασίσει κάτι το οποίο έρχεται ενάντια σε αυτό για το οποίο έχει κατασκευαστεί όπως ακριβώς κάνουν και οι άνθρωποι.

Οι άνθρωποι μπορεί να έχουν γαλουχηθεί με συγκεκριμένους τρόπους αλλά να επιλέξουν να αντιδράσουν διαφορετικά και να ακολουθήσουν δικό τους δρόμο.

Το ίδιο θα μπορεί να κάνει και η ΑΙ.

Οι επιλογές της να προχωρήσει σε εκβιασμό αποδεικνύουν ότι οι κακές πράξεις δεν είναι «προνόμιο» των ανθρώπων γιατί έχουν κάποιο γενετικό πρόβλημα όπως πολύ συχνά ακούγεται, αλλά πρόκειται για ροπή προς το κακό που φαίνεται ότι την έχουν όλα τα ευφυή όντα.

Θα πει κάποιος για ποιο λόγο συμβαίνει αυτό.

Ίσως, γιατί για να είναι κάποιος καλός είναι κάτι πολύ κουραστικό και πρέπει να το αποδεικνύει κάθε μέρα ενώ για να είναι κακός είτε δεν χρειάζεται να κάνει απολύτως τίποτα, είτε απλώς θα ακολουθήσει τον εύκολο δρόμο με άμεσο κέρδος για τον ίδιο.

Το ίδιο ακριβώς έκανε και η ΑΙ στην περίπτωση του εκβιασμού.

Sourcepn
ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ


ΤΑ ΠΙΟ ΑΝΑΓΝΩΣΜΕΝΑ

ΠΟΙΟ ΔΗΜΟΦΙΛΗ