Μια μικρή ομάδα αποφοίτων Λογοτεχνίας και Ιστορίας του DeepSeek «μεταμόρφωσε» τη δημιουργία κειμένου AI στην Κίνα

admin 2 ημέρες ago

0 9 3 minutes read

Σύνταξη – επιμέλεια: Στέλιος Βασιλούδης

Η μαγεία της τεχνητής νοημοσύνης του DeepSeek βρίσκεται στο μοναδικό μείγμα λογοτεχνικής τεχνογνωσίας και προηγμένων αλγορίθμων, λένε πρώην εργαζόμενοι και ειδικοί του κλάδου.

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Η ευγλωττία και η ανθρώπινο προσέγγιση στις απαντήσεις κειμένου που δημιουργούνται από τα μοντέλα τεχνητής νοημοσύνης (AI) της κινεζικής νεοσύστατης εταιρείας DeepSeek, τα οποία έχουν αποκτήσει γρήγορα δημοτικότητα, μπορούν εν μέρει να πιστωθούν σε μια μικρή ομάδα αποφοίτων Λογοτεχνίας και Ιστορίας που επιμελήθηκαν τα δεδομένα εκπαίδευσης, σύμφωνα με πρώην εργαζόμενους και αναλυτές.

Το DeepSeek έχει σοκάρει τη Wall Street και τη Silicon Valley, πυροδοτώντας μια φρενίτιδα υιοθέτησης της τεχνητής νοημοσύνης στην Κίνα. Ενώ η εταιρεία με έδρα το Hangzhou είναι γνωστή για την προσφορά γενναιόδωρων μισθών για την προσέλκυση ταλέντων στους αλγόριθμους και στους υπολογιστές, έχει επίσης συγκεντρώσει μια μικρή ομάδα «παντογνωστών δεδομένων». Οι εργαζόμενοι που κατέχουν τον ρόλο με τον περίεργο τίτλο έχουν επιφορτιστεί με την προμήθεια γνώσης από την ιστορία, τον πολιτισμό, τη λογοτεχνία και την επιστήμη για να δημιουργήσουν μια τεράστια εικονική βιβλιοθήκη.

Ο Wang Zihan, πρώην υπάλληλος του DeepSeek, είπε σε ένα διαδικτυακό σεμινάριο που μεταδόθηκε ζωντανά τον περασμένο μήνα) ότι ο ρόλος ήταν προσαρμοσμένος για άτομα με υπόβαθρο στη λογοτεχνία και τις κοινωνικές επιστήμες. Ο ρόλος τους είναι να παρέχουν πληροφορίες σχετικά με διάφορα σύνολα δεδομένων για εκπαίδευση μοντέλων, εμφυσώντας μια ανθρώπινη πινελιά στα μοντέλα χαμηλού κόστους αλλά υψηλής απόδοσης της εταιρείας. «Συμβάλλουν στην αποτελεσματικότητα και καλλιεργούν ιδέες σε όλες τις ομάδες», είπε ο Wang.

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Σύμφωνα με μια πρόσφατη ανάρτηση στα μέσα κοινωνικής δικτύωσης ενός άλλου πρώην υπαλλήλου του DeepSeek – του Zheng Size – ορισμένοι από τους ρόλους καλύπτονται από πτυχιούχους κινεζικής γλώσσας και φιλολογίας, οι οποίοι έχουν βελτιώσει σημαντικά την ποιότητα του κινεζικού περιεχομένου που δημιουργείται από το DeepSeek μέσω των προσεκτικά επιμελημένων δεδομένων εκπαίδευσης.

Το πρώτο κείμενο το οποίο δημιουργήθηκε από το DeepSeek που έγινε viral στο κινεζικό Διαδίκτυο ήταν μια καλοδουλεμένη ανάρτηση που αποδόθηκε στον ιδρυτή του, Liang Wenfeng, που αναφερόταν στους ισχυρισμούς ότι το DeepSeek είχε αλλάξει την εθνική μοίρα της Κίνας.

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Χρησιμοποιώντας εξελιγμένη και ποιητική κινεζική γλώσσα, η ανάρτηση που δημιουργήθηκε από την τεχνητή νοημοσύνη υποστήριξε ότι: «Το DeepSeek θα προτιμούσε να είναι ένα σπιρτόξυλο στην έρημο του κώδικα και αυτό που πραγματικά πυροδοτεί τη φωτιά της τεχνητής νοημοσύνης είναι η άσβεστη περιέργεια και η επιμονή που υπάρχει στα μάτια σας».

Η ποιότητα του κειμένου που δημιουργείται από τα chatbots γίνεται όλο και πιο σημαντικό σημείο αναφοράς για την αξιολόγηση της χρησιμότητας και της αποδοχής των μοντέλων τεχνητής νοημοσύνης, παράλληλα με τεχνικά μέτρα όπως ο αριθμός των παραμέτρων. Κατά την κυκλοφορία του GPT-4.5, το OpenAI τόνισε τις βελτιωμένες γενικές γνώσεις του μοντέλου για την ενίσχυση των ανθρώπινων αλληλεπιδράσεων. Το DeepSeek έχει ήδη ενσωματώσει γενικές γνώσεις στην ανάπτυξη του μοντέλου του και ενώ τα αποτελέσματα μπορεί να είναι διακριτικά, δεν έχουν περάσει απαρατήρητα από τους χρήστες.

Ο David Holz, ιδρυτής της υπηρεσίας AI Midjourney που δημιουργεί εικόνες, είπε ότι οι δοκιμές του αποκάλυψαν ότι τα μοντέλα του DeepSeek όχι μόνο «συντρίβουν τα δυτικά μοντέλα» στην κατανόηση της αρχαίας κινεζικής λογοτεχνίας και φιλοσοφίας, αλλά έδειξαν επίσης μια ισχυρότερη γνώση των αγγλικών από τις «από-πρώτο-χέρι κινεζικές πηγές του».

«Αισθάνομαι σαν να (επικοινωνώ) με λογοτεχνικές, ιστορικές και φιλοσοφικές γνώσεις πολλών γενεών που δεν είχα προσπελάσει ποτέ πριν», έγραψε στο X τον Ιανουάριο. «Είναι βαθιά συγκινητικό».

Ένα μυστικό πίσω από τα ισχυρά μοντέλα του DeepSeek θα μπορούσε να είναι η ποιότητα των δεδομένων εκπαίδευσης, δήλωσε ο Allen Zhu Xiaohu, διευθύνων σύμβουλος της GSR Ventures China. Τα μοντέλα του DeepSeek υπερτερούν των άλλων δημιουργώντας κομψά δημιουργημένο κείμενο και παρέχοντας βαθιά διορατικές απαντήσεις, ιδιαίτερα σε φιλοσοφικούς τομείς. Η επιτυχία προήλθε σε μεγάλο βαθμό από την υψηλή ποιότητα των δεδομένων προπόνησής του, είπε ο Zhu σε πρόσφατο podcast.

Ο Wang Yonggang, ιδρυτής της start-up αφηγημάτων εικόνας Mootion AI, είπε επίσης ότι στις δοκιμές της ομάδας του, τα μοντέλα του DeepSeek διέπρεψαν στην κινεζική γραφή, ειδικά στην επιλογή λέξεων, τη στιλιστική φινέτσα και την ενσωμάτωση πολιτιστικής γνώσης. «Η ικανότητα γραφής κινεζικής γλώσσας του DeepSeek είναι η καλύτερη μεταξύ όλων των μοντέλων ανοιχτού και κλειστού κώδικα», δήλωσε ο Wang σε συνέντευξή του στην South China Morning Post.