Tι είναι η μηχανική όραση και ποιες είναι οι εφαρμογές της
Συστήματα τεχνητής νοημοσύνης βλέπουν και αναγνωρίζουν εικόνες
Μηχανική Όραση: Όταν ρομπότ και ηλκετρονικοί υπολογιστές αποκτούν την αίσθηση της όρασης με την τεχνητή νοημοσύνη
Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα πεδίο της τεχνητής νοημοσύνης όπου επιχειρείται η αλγοριθμική δημιουργία της αίσθησης της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή σε ρομπότ. Η μηχανική όραση προκύπτει από τη θεωρία και την τεχνολογία με την οποία σχεδιάζονται και κατασκευάζονται συστήματα που με το κατάλληλο input πληροφοριών, αναλύουν δεδομένα από ψηφιακές εικόνες. Τα δεδομένα είναι φωτογραφίες, βίντεο, πλάνα από πολλαπλές κάμερες ή πολυδιάστατες εικόνες από σαρωτές. Με λίγα λόγια, η τεχνολογία της μηχανικής όρασης φτιάχνει συστήματα με «όραση»: βιομηχανικά ρομπότ, αυτόνομα οχήματα, κάμερες επιτήρησης. Με τέτοια συστήματα μπορούν να αναλυθούν εικόνες, να γίνουν τοπογραφικές εξομοιώσεις, να οργανωθούν πληροφορίες (π.χ. με ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων) —προπάντων μπορεί να ερευνηθεί η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών.
Η μηχανική όραση χρονολογείται από τη δεκαετία του 1980 ως μια επέκταση του πεδίου της πληροφορικής το οποίο καλείται ψηφιακή επεξεργασία εικόνας σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, αρχικά σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Ως τότε, ο όρος «μηχανική όραση» σχετιζόταν με την ηλεκτρολογία και τη ρομποτική, συνήθως στον τομέα της βιομηχανίας. Στη δεκαετία του 1980, έγινε διακριτός τομέας της τεχνητής νοημοσύνης με εφαρμογές όχι μόνο στη ρομποτική αλλά και σε πολλούς ακόμα κλάδους. Από τη δεκαετία του 1990 η μηχανική όραση σημείωση αλματώδη ανάπτυξη, συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης και έδωσε πολύ συγκεκριμένα αποτελέσματα, με αλγορίθμους όρασης πραγματικού χρόνου να υλοποιούνται ακόμα και σε φτηνά κινητά τηλέφωνα εξοπλισμένα με κάμερα.
Με τη διάδοση του Kinect, ενός καινοτόμου περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική ανάπτυξη του τρισδιάστατου (στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας «Άβαταρ» το 2009, η μηχανική όραση έχει εμβαθύνει στην αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της. Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ανίχνευση συμβάντων και ανίχνευση κίνησης, την αναγνώριση αντικειμένων, την ευρετηριοποίηση, την τρισδιάστατη ανακατασκευή (παραγωγή τρισδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
Σε σχέση με άλλα, παρεμφερή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν output εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται iput συμβολικές περιγραφές οπτικών σκηνών και παράγουν output εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών εικόνων.
- Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται input δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης είναι h εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Στο στόχαστρο ΛΟΑΤΚΙ+ άτομα
Έχει τις περισσότερες λήψεις στο App Store της Apple στις ΗΠΑ - Πώς λειτουργεί
Στόχος οι 30 εμφυτεύσεις σε ανθρώπους μέσα στο 2025
Νέα καθυστέρηση στην απόπειρα να ανταγωνιστεί την SpaceX του Έλον Μασκ
Παρατηρήθηκαν «ανωμαλίες» στη διάρκεια της αντίστροφης μέτρησης
Έκτακτη συνάντηση των Ελεγκτών μετά την ανακοίνωση κατάργησης των ελέγχων
Μια συζήτηση με την Professor Aynne Kokas, κορυφαία ειδικό στις σινοαμερικανικές σχέσεις στα μέσα και την τεχνολογία
Οι Financial Times σχολιάζουν την προσπάθεια του Μαρκ Ζάκερμπεργκ να στήσει γέφυρα επικοινωνίας με τον Τραμπ και το δεξί του χέρι
Το 41% των εταιρειών παγκοσμίως σχεδιάζει να μειώσει το εργατικό δυναμικό μέχρι το 2030
Τι απαντά η Ευρωπαϊκή Επιτροπή στα όσα λέει ο ισχυρός άνδρας της Meta Platforms
Γιατί οι κινήσεις του Ζούκερμπεργκ είναι πιο επικίνδυνες από κάθε άλλου επικεφαλής τεχνολογικού κολοσσού
Γιατί ο Μαρκ Ζάκερμπεργκ «παραδόθηκε» στον Ντόναλντ Τραμπ - Δριμεία κριτική στην απόφαση
Έδειξε τον δρόμο ο Ζούκεμπεργκ με το «κόψιμο» του fact checking
Τι έδειξε έρευνα για τον συνολικό κίνδυνο θνησιμότητας
Από τις 28 Απριλίου 2026, αυτό θα ισχύει και για τους φορητούς υπολογιστές
Η Meta θα ενσωματώσει τις λεγόμενες κοινοτικές σημειώσεις, όπως στην πλατφόρμα X του Ίλον Μασκ.
Aυτό υποστήριξε ο επικεφαλής της OPEN AI Σαμ Άλτμαν
Παρόμοια συστήματα θα μπορούσαν να δοκιμαστούν και σε άλλα ιατρικά περιβάλλοντα
Με αφορμή την κυκλοφορία του βιβλίου «Η Γραφειοκρατικοποίηση του Κόσμου στη Νεοφιλελεύθερη Εποχή» της Beatrice Hibou που κυκλοφορεί σε ελληνική μετάφραση από τις εκδόσεις Πλήθος (2024)
Τα γεγονότα που αναμένουμε με ιδιαίτερο ενδιαφέρον σύμφωνα με το περιοδικό Nature
Έχετε δει 20 από 200 άρθρα.