Ρομπότ έμαθε να κινεί τα χείλη του σαν άνθρωπος χάρη σε έναν καθρέφτη και πολύ YouTube

0 8 1 minute read

Για πρώτη φορά, επιστήμονες κατάφεραν να κατασκευάσουν ένα ρομπότ που μπορεί να κινεί το στόμα του με τρόπο σχεδόν πανομοιότυπο με τον ανθρώπινο.

Το επίτευγμα ανήκει σε ερευνητές του Πανεπιστημίου Κολούμπια και παρουσιάστηκε σε μελέτη που δημοσιεύθηκε στο επιστημονικό περιοδικό Science Robotics.

Το ανθρωποειδές ρομπότ, με την ονομασία EMO, εκπαιδεύτηκε παρατηρώντας αρχικά τον εαυτό του σε έναν καθρέφτη. Διαθέτει ένα εύκαμπτο πρόσωπο με χείλη από σιλικόνη και 26 μικροκινητήρες, καθένας από τους οποίους μπορεί να κινηθεί σε έως και 10 βαθμούς ελευθερίας. Μέσα από χιλιάδες φαινομενικά τυχαίες εκφράσεις και κινήσεις των χειλιών, το ρομπότ έμαθε πώς κάθε εντολή στους κινητήρες του μεταφράζεται σε ορατή κίνηση του προσώπου, αναφέρει το LiveScience.

Σε 10 διαφορετικές γλώσσες

Το EMO χρησιμοποιεί ένα σύστημα τεχνητής νοημοσύνης που ονομάζεται γλωσσικό μοντέλο όρασης προς δράση (vision-to-action language model ή VLA), που σημαίνει ότι μπορεί να μάθει πώς να μεταφράζει αυτό που βλέπει σε συντονισμένες σωματικές κινήσεις χωρίς προκαθορισμένους κανόνες. Στη συνέχεια, οι ερευνητές έβαλαν το EMO να παρακολουθήσει για ώρες βίντεο από το YouTube, όπου άνθρωποι μιλούσαν σε διαφορετικές γλώσσες ή τραγουδούσαν. Χωρίς να κατανοεί το νόημα των λέξεων, το ρομπότ συσχέτισε τους ήχους με τις κινήσεις των χειλιών και κατάφερε τελικά να συγχρονίζει σχεδόν τέλεια το στόμα του με ομιλία σε 10 διαφορετικές γλώσσες.

Σύμφωνα με τον καθηγητή μηχανικής Hod Lipson, διευθυντή του Creative Machines Lab του Πανεπιστημίου Κολούμπια, οι μεγαλύτερες δυσκολίες εντοπίστηκαν σε «σκληρούς» ήχους, όπως το «B», και σε ήχους που απαιτούν στρογγύλεμα των χειλιών, όπως το «W», αλλά εκτιμά ότι οι επιδόσεις θα βελτιωθούν με περαιτέρω εξάσκηση.

Πριν παρουσιαστεί δημόσια, το EMO δοκιμάστηκε σε πείραμα με 1.300 εθελοντές. Οι συμμετέχοντες κλήθηκαν να συγκρίνουν βίντεο του ρομπότ που μιλούσε με τρεις διαφορετικές μεθόδους ελέγχου του στόματος, επιλέγοντας εκείνη που πλησίαζε περισσότερο την «ιδανική» ανθρώπινη κίνηση. Η μέθοδος VLA προτιμήθηκε στο 62,46% των περιπτώσεων, αφήνοντας σημαντικά πίσω τις δύο άλλες προσεγγίσεις.

Το ανθρώπινο πρόσωπο αποτελεί κεντρικό στοιχείο της επικοινωνίας: μελέτες δείχνουν πως κοιτάζουμε το πρόσωπο του συνομιλητή μας σχεδόν το 87% του χρόνου, με σημαντική εστίαση στο στόμα. Καθώς τα ρομπότ καλούνται όλο και περισσότερο να αναλάβουν ρόλους στην εκπαίδευση, την ιατρική και τη φροντίδα ηλικιωμένων, η ικανότητά τους να εκφράζονται με πειστικό τρόπο θεωρείται κρίσιμη.

admin 2 ώρες ago

0 8 1 minute read

Σε 10 διαφορετικές γλώσσες

admin

«Έχω παγώσει την υιοθεσία για προσωπικούς λόγους»

Πώς οι επιστήμονες ετοιμάζουν τον μανδύα του... Χάρι Πότερ που θα σας κάνει αόρατους

Related Articles

Η επαναστατική συσκευή που μετατρέπει τον αέρα και τον ήλιο σε βενζίνη

Εντυπωσιακές φωτογραφίες: Το τηλεσκόπιο Webb ζουμάρει σε νεφέλωμα και αποκαλύπτει το «Μάτι του Θεού»

Η Ευρώπη σχεδιάζει το πρώτο τροχιακό εργαστήριο καρκίνου για έρευνα σε συνθήκες μικροβαρύτητας

Apple: Η πρώτη νέα κυκλοφορία της για το 2026 είναι γεγονός

Αφήστε μια απάντηση Ακύρωση απάντησης