Τεχνολογία

Ρομπότ έμαθε να κινεί τα χείλη του σαν άνθρωπος χάρη σε έναν καθρέφτη και πολύ YouTube

Για πρώτη φορά, επιστήμονες κατάφεραν να κατασκευάσουν ένα ρομπότ που μπορεί να κινεί το στόμα του με τρόπο σχεδόν πανομοιότυπο με τον ανθρώπινο.

Το επίτευγμα ανήκει σε ερευνητές του Πανεπιστημίου Κολούμπια και παρουσιάστηκε σε μελέτη που δημοσιεύθηκε στο επιστημονικό περιοδικό Science Robotics.

Το ανθρωποειδές ρομπότ, με την ονομασία EMO, εκπαιδεύτηκε παρατηρώντας αρχικά τον εαυτό του σε έναν καθρέφτη. Διαθέτει ένα εύκαμπτο πρόσωπο με χείλη από σιλικόνη και 26 μικροκινητήρες, καθένας από τους οποίους μπορεί να κινηθεί σε έως και 10 βαθμούς ελευθερίας. Μέσα από χιλιάδες φαινομενικά τυχαίες εκφράσεις και κινήσεις των χειλιών, το ρομπότ έμαθε πώς κάθε εντολή στους κινητήρες του μεταφράζεται σε ορατή κίνηση του προσώπου, αναφέρει το LiveScience.

Σε 10 διαφορετικές γλώσσες

Το EMO χρησιμοποιεί ένα σύστημα τεχνητής νοημοσύνης που ονομάζεται γλωσσικό μοντέλο όρασης προς δράση (vision-to-action language model ή VLA), που σημαίνει ότι μπορεί να μάθει πώς να μεταφράζει αυτό που βλέπει σε συντονισμένες σωματικές κινήσεις χωρίς προκαθορισμένους κανόνες. Στη συνέχεια, οι ερευνητές έβαλαν το EMO να παρακολουθήσει για ώρες βίντεο από το YouTube, όπου άνθρωποι μιλούσαν σε διαφορετικές γλώσσες ή τραγουδούσαν. Χωρίς να κατανοεί το νόημα των λέξεων, το ρομπότ συσχέτισε τους ήχους με τις κινήσεις των χειλιών και κατάφερε τελικά να συγχρονίζει σχεδόν τέλεια το στόμα του με ομιλία σε 10 διαφορετικές γλώσσες.

Σύμφωνα με τον καθηγητή μηχανικής Hod Lipson, διευθυντή του Creative Machines Lab του Πανεπιστημίου Κολούμπια, οι μεγαλύτερες δυσκολίες εντοπίστηκαν σε «σκληρούς» ήχους, όπως το «B», και σε ήχους που απαιτούν στρογγύλεμα των χειλιών, όπως το «W», αλλά εκτιμά ότι οι επιδόσεις θα βελτιωθούν με περαιτέρω εξάσκηση.

Πριν παρουσιαστεί δημόσια, το EMO δοκιμάστηκε σε πείραμα με 1.300 εθελοντές. Οι συμμετέχοντες κλήθηκαν να συγκρίνουν βίντεο του ρομπότ που μιλούσε με τρεις διαφορετικές μεθόδους ελέγχου του στόματος, επιλέγοντας εκείνη που πλησίαζε περισσότερο την «ιδανική» ανθρώπινη κίνηση. Η μέθοδος VLA προτιμήθηκε στο 62,46% των περιπτώσεων, αφήνοντας σημαντικά πίσω τις δύο άλλες προσεγγίσεις.

Το ανθρώπινο πρόσωπο αποτελεί κεντρικό στοιχείο της επικοινωνίας: μελέτες δείχνουν πως κοιτάζουμε το πρόσωπο του συνομιλητή μας σχεδόν το 87% του χρόνου, με σημαντική εστίαση στο στόμα. Καθώς τα ρομπότ καλούνται όλο και περισσότερο να αναλάβουν ρόλους στην εκπαίδευση, την ιατρική και τη φροντίδα ηλικιωμένων, η ικανότητά τους να εκφράζονται με πειστικό τρόπο θεωρείται κρίσιμη.

Related Articles

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Back to top button