Μιλάει το Siri αραβικά;
Η αραβική γλώσσα μπορεί να είναι η πέμπτη πιο ομιλούμενη γλώσσα στον πλανήτη αλλά ακόμα δεν έχει βρει τη θέση της στις ψηφιακές εφαρμογές
Η Alexa δεν μιλάει αραβικά, ούτε και η Cortana. Το Siri πάλι δείχνει να καταλαβαίνει αλλά μόνο τα στάνταρ αραβικά και δεν πιάνει γρι από τις διαλέκτους.
«Φτωχούς συγγενείς» θυμίζουν οι περίπου 30 διάλεκτοι της αραβικής γλώσσας στην γλωσσική παλέτα των εφαρμογών αυτόματης μετάφρασης και προφορικής στήριξης. Αυτό τουλάχιστον συνέβαινε μέχρι τώρα γιατί πλέον, όπως φαίνεται, οι ψηφιακοί κολοσσοί αρχίζουν να ξυπνάνε.
Η Alexa δεν μιλάει αραβικά, ούτε και η Cortana. Το Siri πάλι δείχνει να καταλαβαίνει αλλά μόνο τα στάνταρ αραβικά και δεν πιάνει γρι από τις διαλέκτους. Το Google Translate κάτι κάνει αλλά σε καμία περίπτωση δεν θεωρείται φερέγγυο στην μετάφραση της πλούσιας αραβικής γλώσσας.
Και όλα αυτά για την έκτη στην σειρά κατάταξης πιο ομιλούμενη γλώσσα στην γη, την γλώσσα που υπολογίζεται ότι μιλούν πάνω από 300 εκατομμύρια άτομα, ενώ αποτελεί την θρησκευτική γλώσσα για 1,5 δισεκατομμύρια πιστούς. Και όμως είναι αυτή που υποεκπροσωπείται εντυπωσιακά στον ψηφιακό κόσμο.
Μία γλώσσα, 30 διάλεκτοι
Μία ομάδα πληροφορικάριων και Πανεπιστημιακών από διάφορες χώρες της Μέσης Ανατολής δουλεύουν με σκοπό την βελτίωση της κατανόησης της γλώσσας τους από τους αλγόριθμους της τεχνητής νοημοσύνης. Και αυτό γιατί, όπως σημειώνει ένας εξ αυτών, ο Moustafa Jarrar από το Πανεπιστήμιο του Birzeit στη Ραμάλα της Παλαιστίνης οι υπολογιστές δεν μαθαίνουν τις γλώσσες όπως οι άνθρωποι, αλλά χρησιμοποιούν μέσους όρους στατιστικών. «Για να μεταφράσει κάτι από μία γλώσσα σε μία άλλη, ο υπολογιστής συλλέγει εκατομμύρια φράσεων που έχουν παρόμοια σημασία σε δύο διαφορετικές γλώσσες και με βάση αυτό καταλήγει στην πιο συνηθισμένη μετάφραση».
Οι ερευνητές προσπαθούν από κοινού να βελτιώσουν το αυτόματο σύστημα μετάφρασης, προσδίδοντας επιπλέον χαρακτηριστικά στις λέξεις ανάλογα με την θέση τους σε κάθε φράση ή την ύπαρξη συνθετικών που θα διευκολύνουν την «ανάγνωση» τους από τους αλγόριθμους και τον εμπλουτισμό των στατιστικών τους. Άλλωστε, όσα περισσότερα δεδομένα διαχειρίζεται ένα σύστημα, τόσο πιο αξιόπιστο γίνεται.
Το πράγμα όμως δυσκολεύει όταν έχουμε να κάνουμε όχι μόνο με μία γλώσσα, αλλά με καμιά 30αριά διαλέκτους. Και μάλιστα διαλέκτους που ναι μεν μπερδεύουν τον ψηφιακό κόσμο αλλά συγχρόνως αναβαθμίστηκαν κατά κάποιον τρόπο και χάρη σε αυτόν.
Γιατί όπως σημειώνει σε συνέντευξή του ο Moustafa Jarrar «πριν από την εποχή των κοινωνικών δικτύων οι διάφοροι διάλεκτοι της αραβικής γλώσσας δεν έμπαιναν σε γραπτά κείμενα αλλά αφορούσαν κυρίως τον προφορικό λόγο». «Έτσι μιλούσες στην οικογένεια και στους φίλους σου», εξηγεί ο Jarrar επισημαίνοντας ότι αυτό συνεπάγεται ότι μεταφέρθηκε όπως ήταν στα κοινωνικά δίκτυα όπου ο κόσμος «γράφει όπως μιλάει».
Ο Jarrar δουλεύοντας για πολύ χρόνο πάνω στην Παλαιστινιακή αραβική διάλεκτο μπορεί πλέον να περηφανεύεται ότι είναι το δεύτερο άτομο στον κόσμο που εκπαίδευσε έναν υπολογιστή και του έμαθε μία αραβική διάλεκτο. Το παράδοξο βέβαια είναι ότι πρώτος στη σειρά, δεν ήταν κάποιος άλλος ερευνητής ή γλωσσολόγος, αλλά ο αμερικανικός στρατός. Αυτός και για λόγους που εύκολα κατανοούμε, επιχείρησε πρώτη φορά να μάθει σε υπολογιστές Αιγυπτιακά αραβικά.
Μία γλώσσα, ένα αίνιγμα
Δεν είναι μόνο η έλλειψη των απαραίτητων δεδομένων που δυσκολεύει την διαδικασία της «εκμάθησης» της αραβικής γλώσσας από τους υπολογιστές. Υπάρχουν και επιπλέον δυσκολίες που σχετίζονται με την ίδια την δομή της γλώσσας. Μίας γλώσσας τόσο διαφορετικής από τις λατινογενείς γνωστές μας γλώσσες που κυρίως στην γραπτή της μορφή, θυμίζει σε πολλούς περισσότερο διαγράμματα παρά φράσεις.
Η αραβική γλώσσα είναι μία άγνωστη έρημος για αρκετούς και οι κανόνες της σχεδόν αδιανόητοι. Όπως για παράδειγμα το γεγονός ότι δεν υπάρχουν κεφαλαία γράμματα και ότι αντίθετα τα γράμματα μπορούν να αλλάζουν μορφή κάθε φορά ανάλογα με την θέση τους σε μία λέξη.
Υπάρχουν λέξεις τόσο μεγάλες που μπορούν άνετα να αναλυθούν σε υποκείμενο, ρήμα ή αντικείμενο. Κάποιες φορές, σύνθετες λέξεις μπορούν να σπάσουν σε τρία ή και ακόμα περισσότερα τμήματα, κάτι που αυξάνει απίστευτα την δυσκολία κατανόησης.
Για να καταλάβει κάποιος πόσο αίνιγμα είναι στα μάτια πολλών η αραβική γλώσσα αρκεί να επιχειρήσει την μετάφραση της απλής φράσης: «Αυτός τους σκότωσε». Στα ελληνικά, στα γαλλικά, στα αγγλικά και σε άλλες «οικείες» μας γλώσσες, για να αποδοθεί το νόημα της φράσης αυτής χρειάζεται υποκείμενο, ρήμα και αντικείμενο. Ε στα αραβικά, αρκεί μία και μόνο (πολύ-σύνθετη) λέξη για να πεις το ίδιο.
Αν θέλει κάποιος να πάρει μία γεύση για τους λόγους που δυσκολεύουν την ψηφιακή ανάγνωση της αραβικής γλώσσας, αρκεί να ρίξει μία ματιά στο συγκεκριμένο άρθρο.
Μία μεγάλη γλώσσα, μικρές χρηματοδοτήσεις
Έρευνα σημαίνει επένδυση και επένδυση σημαίνει χρήμα. Και είναι σίγουρο ότι η ένταξη της αραβικής γλώσσας στον ψηφιακό κόσμο δεν χρηματοδοτείται όσο χρειάζεται. Ήδη από την δεκαετία του ’80, πολλοί επιστήμονες πάσχισαν για να βρουν λύσεις στα διάφορα τεχνικά και δομικά προβλήματα που δυσκολεύουν την εκμάθηση της γλώσσας στους υπολογιστές και γενικότερα στις μηχανές. Όπως προκύπτει όμως η υποχρηματοδότηση δεν επέτρεψε να ολοκληρώσουν το έργο τους.
Και εδώ η αμερικάνικη κυβέρνηση έκανε την έκπληξη. Κυρίως μετά τα γεγονότα της 11ης Σεπτεμβρίου 2001, οι ΗΠΑ αποφάσισαν να ρίξουν πολύ χρήμα σε πανεπιστήμια, δημόσια ή ιδιωτικά ερευνητικά κέντρα για να λύσουν τους γρίφους που δυσκόλευαν τη ζωή των μυστικών υπηρεσιών.
Παρόλα αυτά, έρευνες δείχνουν ότι συνολικά η αραβική γλώσσα και ξεχωριστά οι διάλεκτοί της, απολαμβάνουν τα μικρότερα κομμάτια της οικονομικής πίτας. Όλοι οι μεγάλοι τεχνολογικοί κολοσσοί όπως η Google, η Amazon ή η IBM ξοδεύουν αποδεδειγμένα πολύ περισσότερα χρήματα για τις λατινογενείς γλώσσες και πολύ λιγότερα για τις αραβικές.
Τελικά τι θα γίνει με το Siri;
Προς το παρόν, όταν ο Siri επιχειρεί να μιλήσει αραβικά, προκαλεί περισσότερο γέλιο και δίνει υλικό σε ρεπορτάζ με ευτράπελα.
Το κλειδί για την αυτόματη μετάφραση και την κατανόηση γλωσσών από τους υπολογιστές λέγεται NLP ή αλλιώς Natural Language Processing. Αυτό παλεύουν να βελτιώσουν οι ερευνητές που θεωρούν ότι στα αραβικά ήδη είναι πολύ πιο πλούσιο και ισχυρό σήμερα από ότι ήταν πριν πέντε ή δέκα χρόνια.
Ένας από αυτούς είναι ο Fadi Zaraket, υπεύθυνος της ομάδας εργασίας του Αμερικανικού Πανεπιστημίου της Βηρυτού ο οποίος ελπίζει επόμενος στόχος είναι να μπορούν οι υπολογιστές να κατανοούν πλήρως τη γλώσσα κι όχι να προβλέπουν ή να επινοούν μεταφράσεις βασισμένες σε στατιστικά στοιχεία.
«Εάν πεις σε έναν υπολογιστή ότι πας διακοπές, μπορεί να το μεταφράσει, αλλά εάν τον ρωτήσεις “Πού θα πάω διακοπές;” προφανώς και δεν μπορεί να σου απαντήσει. Μπορεί να διεκπεραίωση μια μεταφραστική εργασία, αλλά δεν μπορεί να κατανοήσει τη σημασία των λέξεων. Επομένως για μας αυτό είναι το επόμενο πράγμα πάνω στο οποίο πρέπει να εργαστούμε».
Και αυτό είναι που χρειάζονται εφαρμογές όπως ο Siri για να λειτουργήσουν σωστά. Κατά τον Zaraket «κάποια μέρα σε μερικά χρόνια θα μπορούμε όλοι να θέσουμε στο Siri οποιαδήποτε ερώτηση στα αραβικά και αυτός να απαντήσει σωστά».
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Το μεγαλύτερο συνέδριο για την Παραγωγική Τεχνητή Νοημοσύνη επιστρέφει στις 18 Νοεμβρίου 2024 στο ΚΠΙΣΝ
Το επόμενο βήμα στη σύγχρονη εκπαίδευση
Το Amazon Haul υπηρετεί ακριβώς το ίδιο μοτίβο με τους ανταγωνιστές του
Βροχή οι 70+ σε κατάστημα τεχνολογίας. Κουνούσαν με απελπισία τις έξυπνες συσκευές που τους έκαναν να νιώθουν βλάκες
Το viral μήνυμα της καμπάνιας της Telekom που μοιράστηκε η COSMOTE με στόχο την ευαισθητοποίηση σχετικά με τις online δημοσιεύσεις παιδικών φωτογραφιών
Το πορτρέτο του μαθηματικού Άλαν Τούρινγκ δημιουργήθηκε από το Ai-Da, ένα από τα πιο προηγμένα ρομπότ στον κόσμο
Για τη Τεχνητή Νοημοσύνη γίνεται λόγος ήδη από το 1950
Το διαστημικό σκάφος απέχει περίπου 24 δισεκατομμύρια χιλιόμετρα από τη Γη
Ευχάριστα τα νέα από την αμερικάνικη διαστημική υπηρεσία
Όλος ο χρόνος του σύμπαντος δεν αρκεί σε έναν χιμπατζή για να γράψει τυχαία έργο του Σαίξπηρ
Μια συζήτηση για τη σημασία του Τηλεσκοπίου Ορίζοντα Γεγονότων και το ποια θα μπορούσε να είναι η μελλοντική κατεύθυνση της Αστρονομίας
Πρωταγωνίστρια και πάλι η Momo
Πώς η τελευταία έκδοση συνέβαλε να χαθούν...όλα τα δεδομένα
Εντυπωσιακά ευρήματα - Πάνω από 6.500 κτίρια θαμμένα κάτω από τη βλάστηση
Ρωγμές και διαρροές συνιστούν κορυφαίο κίνδυνο ασφάλειας
Λίγο πριν λανσάρει το ιδιωτικό cloud τεχνητής νοημοσύνης
Πώς η τεχνητή νοημοσύνη επαναπροσδιορίζει τη συγγραφή βιβλίων;
Πάνω από 2.000 φορείς του δημόσιου και ιδιωτικού τομέα θα κληθούν μέσα στο 2025 να συμμορφωθούν
Μία προσωπική εμπειρία και πολλά ερωτήματα
O Σουηδός πολιτικός επιστήμονας και συγγραφέας εξηγεί τι συμβαίνει με τα ψηφιακά ίχνη κάθε χρήστη του διαδικτύου όταν αυτός φύγει από τη ζωή
Έχετε δει 20 από 200 άρθρα.