- CITY GUIDE
- PODCAST
-
12°
Tι είναι η μηχανική όραση και ποιες είναι οι εφαρμογές της
Συστήματα τεχνητής νοημοσύνης βλέπουν και αναγνωρίζουν εικόνες
Μηχανική Όραση: Όταν ρομπότ και ηλκετρονικοί υπολογιστές αποκτούν την αίσθηση της όρασης με την τεχνητή νοημοσύνη
Η μηχανική όραση, υπολογιστική όραση ή τεχνητή όραση είναι ένα πεδίο της τεχνητής νοημοσύνης όπου επιχειρείται η αλγοριθμική δημιουργία της αίσθησης της όρασης, συνήθως σε ηλεκτρονικό υπολογιστή ή σε ρομπότ. Η μηχανική όραση προκύπτει από τη θεωρία και την τεχνολογία με την οποία σχεδιάζονται και κατασκευάζονται συστήματα που με το κατάλληλο input πληροφοριών, αναλύουν δεδομένα από ψηφιακές εικόνες. Τα δεδομένα είναι φωτογραφίες, βίντεο, πλάνα από πολλαπλές κάμερες ή πολυδιάστατες εικόνες από σαρωτές. Με λίγα λόγια, η τεχνολογία της μηχανικής όρασης φτιάχνει συστήματα με «όραση»: βιομηχανικά ρομπότ, αυτόνομα οχήματα, κάμερες επιτήρησης. Με τέτοια συστήματα μπορούν να αναλυθούν εικόνες, να γίνουν τοπογραφικές εξομοιώσεις, να οργανωθούν πληροφορίες (π.χ. με ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων) —προπάντων μπορεί να ερευνηθεί η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών.
Η μηχανική όραση χρονολογείται από τη δεκαετία του 1980 ως μια επέκταση του πεδίου της πληροφορικής το οποίο καλείται ψηφιακή επεξεργασία εικόνας σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, αρχικά σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Ως τότε, ο όρος «μηχανική όραση» σχετιζόταν με την ηλεκτρολογία και τη ρομποτική, συνήθως στον τομέα της βιομηχανίας. Στη δεκαετία του 1980, έγινε διακριτός τομέας της τεχνητής νοημοσύνης με εφαρμογές όχι μόνο στη ρομποτική αλλά και σε πολλούς ακόμα κλάδους. Από τη δεκαετία του 1990 η μηχανική όραση σημείωση αλματώδη ανάπτυξη, συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης και έδωσε πολύ συγκεκριμένα αποτελέσματα, με αλγορίθμους όρασης πραγματικού χρόνου να υλοποιούνται ακόμα και σε φτηνά κινητά τηλέφωνα εξοπλισμένα με κάμερα.
Με τη διάδοση του Kinect, ενός καινοτόμου περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική ανάπτυξη του τρισδιάστατου (στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας «Άβαταρ» το 2009, η μηχανική όραση έχει εμβαθύνει στην αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της. Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ανίχνευση συμβάντων και ανίχνευση κίνησης, την αναγνώριση αντικειμένων, την ευρετηριοποίηση, την τρισδιάστατη ανακατασκευή (παραγωγή τρισδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
Σε σχέση με άλλα, παρεμφερή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν output εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται iput συμβολικές περιγραφές οπτικών σκηνών και παράγουν output εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται input εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών εικόνων.
- Η μηχανική μάθηση εξετάζει αλγορίθμους οι οποίοι δέχονται input δεδομένα κάθε τύπου και τα ταξινομούν ή κατηγοριοποιούν σε ομάδες. Ένα σημαντικό μέρος της μηχανικής όρασης είναι h εφαρμογή της μηχανικής μάθησης σε ψηφιακά οπτικά δεδομένα.
ΠΡΟΣΦΑΤΑ
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Πώς κατάφεραν να το αποτυπώσουν οι αστρονόμοι
«Ένα είδος Google Maps για την κυτταρική βιολογία»
Συνέντευξη με τη Δρ. Ζωή Αικατερινίδη C.E.O. Software Competitiveness International
Επανέρχεται το ζήτημα της δεσπόζουσας θέσης του κολοσσού της τεχνολογίας - Τι σχεδιάζει ο Ντόναλντ Τραμπ
Τι σημασία έχει να αναπτυχθεί η ΤΝ, το διαδίκτυο ή η γενετική μηχανική αν δεν οδηγήσουν στην ευημερία των ανθρώπων και των άλλων έμβιων όντων;
Ο Μαρίνος Σιαπάνης, CEO & Co-Founder της κορυφαίας εταιρείας iGaming, μας εξηγεί τα σχέδια της επόμενης μέρας
Μήπως ήρθε η ώρα να μάθετε βασικά Κλίνγκον, ίσα για να συνεννοείστε στο εστιατόριο;
Πώς μπορεί να χρησιμοποιηθεί η δυνατότητα αυτή από απατεώνες
Το μεγαλύτερο συνέδριο για την Παραγωγική Τεχνητή Νοημοσύνη επιστρέφει στις 18 Νοεμβρίου 2024 στο ΚΠΙΣΝ
Το επόμενο βήμα στη σύγχρονη εκπαίδευση
Το Amazon Haul υπηρετεί ακριβώς το ίδιο μοτίβο με τους ανταγωνιστές του
Βροχή οι 70+ σε κατάστημα τεχνολογίας. Κουνούσαν με απελπισία τις έξυπνες συσκευές που τους έκαναν να νιώθουν βλάκες
Το viral μήνυμα της καμπάνιας της Telekom που μοιράστηκε η COSMOTE με στόχο την ευαισθητοποίηση σχετικά με τις online δημοσιεύσεις παιδικών φωτογραφιών
Το πορτρέτο του μαθηματικού Άλαν Τούρινγκ δημιουργήθηκε από το Ai-Da, ένα από τα πιο προηγμένα ρομπότ στον κόσμο
Για τη Τεχνητή Νοημοσύνη γίνεται λόγος ήδη από το 1950
Το διαστημικό σκάφος απέχει περίπου 24 δισεκατομμύρια χιλιόμετρα από τη Γη
Ευχάριστα τα νέα από την αμερικάνικη διαστημική υπηρεσία
Όλος ο χρόνος του σύμπαντος δεν αρκεί σε έναν χιμπατζή για να γράψει τυχαία έργο του Σαίξπηρ
Μια συζήτηση για τη σημασία του Τηλεσκοπίου Ορίζοντα Γεγονότων και το ποια θα μπορούσε να είναι η μελλοντική κατεύθυνση της Αστρονομίας
Πρωταγωνίστρια και πάλι η Momo
Έχετε δει 20 από 200 άρθρα.