Labkom99 dalam Artikel ini secara singkat memperkenalkan struktur dan konten penelitian Computer Vision. Hubungannya dengan disiplin ilmu di sekitarnya, kesulitan teknis yang dihadapi dalam penelitian Computer Vision, dan sejarah, situasi saat ini dan tren penelitian Computer Vision.
Computer Vision adalah simulasi penglihatan biologis menggunakan komputer dan peralatan terkait. Tugas utamanya adalah mendapatkan informasi tiga dimensi dari pemandangan yang sesuai dengan memproses gambar atau video yang dikumpulkan, seperti yang dilakukan manusia dan banyak jenis makhluk lainnya setiap hari.
Karena computer vision memiliki nilai aplikasi potensial yang besar di bidang produksi industri dan pertanian, geologi, astronomi, meteorologi, kedokteran dan ilmu militer, hal itu telah menarik lebih banyak perhatian di dunia.
Apa Itu Computer Vision? Apa Saja Aplikasi Teknologi Computer Vision?
Computer Vision adalah disiplin baru yang berkembang pesat sejak pertengahan 1960-an. Ini adalah subjek pinggiran. Ini adalah teknologi rekayasa tinggi yang mengumpulkan kekuatan banyak keluarga. Terutama membutuhkan pengetahuan tentang geometri ruang, analisis matriks, teknologi optoelektronik, pemrosesan gambar, matematika terapan, matematika diskrit dan teknologi komputer.
Untuk memandu dengan benar pemodelan dan solusi sistem visi dan solusi masalah teknik aktual. Sistem Computer Vision umumnya terdiri dari sumber cahaya, kamera, kartu pengambilan, dan sistem perangkat lunak PC yang dapat menyelesaikan pengumpulan dan pemrosesan gambar dan pengenalan target. Struktur sistem Computer Vision secara umum dipahami dari perspektif model sistem.
Computer Vision bukan hanya bidang teknik, tetapi juga bidang penelitian yang menantang dan penting dalam bidang keilmuan. Computer Vision adalah disiplin ilmu yang komprehensif, telah menarik peneliti dari berbagai disiplin ilmu untuk berpartisipasi dalam penelitiannya. Termasuk ilmu komputer dan teknik, pemrosesan sinyal, fisika, matematika dan statistik terapan, neurofisiologi dan ilmu kognitif.
Objek penelitian computer vision secara sederhana mempelajari bagaimana membuat komputer mempersepsikan, menganalisis dan memahami lingkungan sekitar melalui sensor gambar atau sensor cahaya lainnya.
Manusia memandang lingkungan luar terutama melalui empat sistem sensorik yaitu penglihatan, pendengaran dan sentuhan. Sistem penglihatan adalah yang paling rumit. Manusia memiliki jumlah sinyal visual terbesar dalam informasi yang diperoleh dari dunia luar.
Meniru sistem visual manusia, pemrosesan dan analisis informasi dalam sistem Computer Vision secara kasar dapat dibagi menjadi dua tahap: tahap pemrosesan gambar juga dikenal sebagai tahap tingkat rendah dan tingkat menengah dalam pemrosesan visual analisis gambar dan Tahap pemahaman juga dikenal sebagai tahap pemrosesan visual Tahap pemrosesan tingkat tinggi.
Pada tahap pengolahan citra, komputer melakukan serangkaian pengolahan terhadap informasi citra, yang utamanya adalah:
- Perbaiki distorsi fotometrik dan geometrik yang diperkenalkan oleh sistem selama proses pencitraan, tekan dan hilangkan noise yang muncul selama proses pencitraan – secara kolektif disebut sebagai pemulihan citra.
- Ekstrak dari informasi citra seperti informasi distribusi kecerahan. Seperti informasi tepi, informasi kedalaman, skala titik citra sepanjang sumbu dan informasi arah kemiringan tiga dimensi permukaan yang mencerminkan karakteristik pemandangan tujuan.
- Berdasarkan informasi fitur yang diekstraksi, berbagai gambar yang mencerminkan objek tiga dimensi, seperti kontur, garis, tekstur, tepi, batas dan berbagai permukaan objek, dipisahkan dari gambar dan hubungan antara berbagai gambar. Hubungan antara topologi dan geometri disebut pembagian primitif dan penentuan hubungan.
Pada tahap analisis dan pemahaman citra, komputer mengenali entitas tertentu di dunia objektif yang diwakili oleh setiap gambar. Atau beberapa kombinasi gambar berdasarkan model pra-pengetahuan yang disimpan dalam database sebelumnya yang disebut pencocokan model. Berdasarkan grafik pra-pengetahuan, hubungan antara gmabar dalam gambar bisa mendapatkan makna dari adegan sebenarnya yang direpresentasikan oleh gambar dan mendapatkan penjelasan atau deskripsi dari gambar tersebut.
Harus ditekankan bahwa pra-pengetahuan memainkan peran yang sangat penting dalam sistem visual. Basis pengetahuan awal menyimpan model pengetahuan dari berbagai objek yang mungkin benar-benar ditemukan. Hubungan batasan antara berbagai objek dalam pemandangan yang sebenarnya.
Fungsi komputer adalah menggunakan pra-pengetahuan sebagai pedoman berdasarkan primitif dan hubungannya dalam gambar yang dianalisis. Akhirnya mendapatkan deskripsi gambar melalui pencocokan, pencarian dan penalaran.
Pra-pengetahuan di seluruh proses memberikan contoh dan bukti untuk diproses setiap saat. Hasil pemrosesan setiap langkah dibandingkan dengan pra-pengetahuan setiap saat. Terkadang, hasil antara dan hasil akhir dari pemrosesan juga dimasukkan ke basis pra-pengetahuan sebagai pembaruan dan akumulasi pengetahuan.
Penelitian Segmentasi Citra Computer Vision
Segmentasi citra merupakan salah satu masalah dasar dalam pemrosesan citra dan visi mesin. Poin utamanya adalah membagi gambar menjadi satu set beberapa wilayah yang tidak tumpang tindih.
Area ini bermakna untuk tugas saat ini atau membantu menjelaskan korespondensi antara mereka dan objek aktual atau bagian objek tertentu. Penerapan segmentasi citra sangat luas, muncul hampir di semua bidang yang berkaitan dengan pengolahan citra dan melibatkan berbagai jenis citra.
Misalnya, dalam penginderaan jauh, segmentasi target dalam citra radar apertur sintetis. Segmentasi sistem awan yang berbeda dan distribusi latar belakang pada citra awan penginderaan jauh dalam analisis citra lalu lintas. Target kendaraan disegmentasikan dari latar belakang.
Dalam aplikasi ini, segmentasi biasanya untuk analisis citra lebih lanjut, pengenalan, pengkodean kompresi dan akurasi segmentasi secara langsung mempengaruhi keefektifan tugas-tugas selanjutnya.
Secara umum, wilayah yang tersegmentasi perlu memenuhi syarat keseragaman dan konektivitas pada saat yang bersamaan. Diantaranya, keseragaman berarti bahwa semua piksel di wilayah tersebut memenuhi kriteria kemiripan tertentu berdasarkan fitur seperti skala abu-abu, tekstur dan warna.
Konektivitas mengacu pada jalur antara dua titik di wilayah tersebut. Walaupun para peneliti di bidang image processing dan machine vision telah melakukan upaya jangka panjang. Namun segmentasi universal yang memenuhi dua poin di atas masih menghadapi kesulitan yang sangat besar. Sebagian besar hasil penelitian ditujukan untuk jenis citra tertentu dan aplikasi tertentu. Segmentasi Itu dapat diringkas sebagai berikut.
Segmentasi Berdasarkan Data
Segmentasi berdasarkan data umum mencakup segmentasi berdasarkan deteksi EDGE, segmentasi berdasarkan wilayah dan segmentasi yang menggabungkan EDGE dan wilayah. Untuk segmentasi berbasis deteksi EDGE, ide dasarnya adalah mendeteksi titik EDGE pada citra terlebih dahulu. Kemudian menghubungkannya ke dalam kontur sesuai dengan strategi tertentu untuk membentuk area segmentasi.
Kesulitannya terletak pada kontradiksi antara kinerja anti-noise dan akurasi deteksi selama deteksi EDGE. Jika akurasi deteksi ditingkatkan, EDGE palsu yang dihasilkan oleh noise akan menyebabkan kontur yang tidak wajar.
Jika performa anti-noise ditingkatkan, deteksi kontur terlewat dan penyimpangan posisi akan terjadi. Untuk alasan ini, orang mengusulkan berbagai metode deteksi EDGE multi-skala. Merancang kombinasi informasi EDGE multi-skala sesuai dengan masalah yang sebenarnya untuk menyeimbangkan kinerja anti-noise dan akurasi pendeteksian dengan lebih baik.
Ide dasar segmentasi berbasis wilayah adalah membagi ruang citra menjadi beberapa kawasan berbeda sesuai dengan karakteristik data citra. Fitur yang umum digunakan antara lain, fitur grayscale atau warna langsung dari gambar asli. Fitur yang diperoleh dari transformasi nilai grayscale atau warna asli.
Metode yang digunakan antara lain metode threshold, metode pertumbuhan wilayah, metode clustering, metode relaksasi dan lain sebagainya.
Deteksi EDGE dapat memperoleh intensitas perubahan lokal nilai abu-abu atau warna, dan segmentasi wilayah dapat mendeteksi kesamaan dan keseragaman fitur. Menggabungkan keduanya, menghindari segmentasi berlebihan pada area melalui pembatasan titik EDGE.
Menggunakan segmentasi area untuk melengkapi tepi yang hilang untuk membuat kontur lebih lengkap. Misalnya, pertama-tama lakukan deteksi EDGE dan koneksi, lalu bandingkan fitur (rata-rata skala abu-abu, varian) dari wilayah yang berdekatan dan gabungkan. Jika serupa lakukan deteksi EDGE dan pertumbuhan wilayah pada gambar asli, dan dapatkan peta tepi dan wilayah tersebut peta fragmen. Kemudian Sesuai dengan kriteria tertentu, hasil segmentasi akhir diperoleh.
Segmentasi Berdasarkan Model
Segmentasi berbasis model yang umum mencakup model kontur dinamis. Model pengoptimalan kombinatorial, geometri target dan model statistik. Model ular digunakan untuk menggambarkan kontur dinamis dari target segmentasi.
Karena fungsi energinya mengadopsi operasi integral, ia memiliki kinerja anti-kebisingan yang baik dan tidak peka terhadap ambiguitas lokal target. Sehingga memiliki jangkauan penerapan yang luas. Tetapi metode segmentasi ini mudah untuk menyatu dengan optimal lokal, sehingga kontur awal harus sedekat mungkin dengan kontur yang sebenarnya.
Dalam beberapa tahun terakhir, penelitian tentang metode segmentasi umum cenderung menganggap segmentasi sebagai masalah optimasi gabungan. Mengadopsi serangkaian strategi optimasi untuk menyelesaikan tugas segmentasi citra.
Ide utamanya adalah mendefinisikan fungsi tujuan pengoptimalan berdasarkan tugas tertentu di samping batasan yang ditentukan oleh segmentasi. Solusi yang akan disegmentasi adalah solusi optimal global dari fungsi tujuan di bawah batasan. Untuk mengatasi masalah segmentasi dari sudut pandang optimasi kombinatorial.
Terutama menggunakan fungsi objektif untuk mengekspresikan berbagai persyaratan dan batasan segmentasi secara komprehensif. Untuk mengubah segmentasi menjadi solusi optimal dari fungsi tujuan. Karena fungsi objektif biasanya berupa fungsi multivariasi, metode optimasi stokastik dapat digunakan.
Segmentasi berdasarkan model geometris dan statistik target merupakan metode yang mengintegrasikan segmentasi dan pengenalan target. Sering disebut deteksi atau ekstraksi target. Ide dasarnya adalah untuk mengekspresikan pengetahuan geometris dan statistik dari target yang relevan sebagai model. Mengubah segmentasi dan pengenalan menjadi klasifikasi yang sesuai atau diawasi.
Model yang umum digunakan termasuk template, model vektor fitur, model berbasis koneksi dan sebagainya. Metode segmentasi ini dapat menyelesaikan sebagian atau semua tugas pengenalan secara bersamaan dan memiliki efisiensi yang tinggi.
Namun, karena perubahan kondisi pencitraan, target dalam gambar sebenarnya seringkali berbeda dari model. Hal ini diperlukan untuk menghadapi kontradiksi antara deteksi palsu dan deteksi terlewat dan langkah pencarian selama pencocokan juga cukup memakan waktu.
Metode Semi-Otomatis Untuk Segmentasi Citra
Dari perspektif partisipasi manual, segmentasi citra dapat dibagi menjadi tiga jenis. Yaitu manual, semi-otomatis dan otomatis. Diantaranya, segmentasi manual digambar sepenuhnya oleh operator dengan menggunakan mouse untuk menguraikan area segmentasi yang memakan waktu dan padat karya. Mudah dipengaruhi oleh faktor subjektif operator dan pengulangannya buruk.
Segmentasi otomatis tidak memerlukan interaksi manusia komputer, tetapi memiliki kemampuan adaptasi yang buruk dan sulit untuk mencapai hasil segmentasi yang memuaskan untuk sekumpulan gambar pada waktu yang sama.
Segmentasi semi-otomatis menggabungkan interaksi manusia komputer dengan segmentasi otomatis yang dapat beradaptasi dengan berbagai gambar dan kebutuhan. Secara efektif mengurangi kompleksitas komputasi.
Saat ini, metode interaksi manusia komputer dalam segmentasi semi-otomatis meliputi: menguraikan garis besar target untuk membentuk inisialisasi segmentasi otomatis, menyesuaikan parameter algoritme sesuai dengan gambar dan tugas tertentu, menambahkan bagian interaktif buatan dalam proses segmentasi.
Singkatnya dari sudut pandang praktis, segmentasi otomatis masih menjadi arah upaya jangka panjang. Saat ini, akan lebih realistis untuk menambahkan segmentasi semi-otomatis dari interaksi manusia komputer sebelum atau selama segmentasi otomatis.
Arah perkembangannya adalah sesedikit dan sesederhana mungkin interaksi manusia komputer. Dapat dilihat bahwa segmentasi citra merupakan bagian penting dari image processing dan machine vision. Serta merupakan salah satu penghambat dalam pengembangan teori citra.
Dengan pesatnya perkembangan kecepatan dan kapasitas komputer, sistem praktis pemrosesan gambar dan visi mesin telah mencapai hasil yang bermanfaat. Misalnya, sistem pengambilan gambar berbasis konten, sistem pengawasan cerdas, sistem transportasi cerdas yang dipandu secara visual, karakter tulisan tangan / wajah / sidik jari / sistem pengenalan iris. Namun, penelitian teoritis yang relevan belum membuat terobosan kemajuan.
Riset Teknologi Vision
Banyak penelitian manusia ditujukan untuk memperluas kemampuan manusia. Pekerjaan awal adalah pada kekuatan fisik. Sejak penemuan komputer, itu telah berkembang menjadi perluasan kekuatan dan persepsi otak manusia. Simulasi komputer dari persepsi visual manusia telah mengarah pada produksi Computer Vision. Computer Vision juga sering disebut pemahaman citra, yang mengacu pada bidang penelitian yang mempelajari informasi visual yang diperlukan untuk menyelesaikan suatu tugas dan cara memperoleh informasi tersebut dari gambar. Ada tiga tujuan dasar:
- Menghitung jarak dari titik pengamatan ke objek sasaran berdasarkan satu atau lebih gambar proyeksi dua dimensi.
- Menghitung parameter gerakan dari titik pengamatan ke objek sasaran berdasarkan satu atau lebih gambar proyeksi dua dimensi.
- Menghitung sifat fisik permukaan dari titik pengamatan ke objek sasaran berdasarkan satu atau lebih gambar proyeksi dua dimensi.
Tujuan akhir yang ingin dicapai adalah untuk mewujudkan pemahaman tentang dunia pemandangan tiga dimensi. Yaitu mewujudkan fungsi-fungsi tertentu dari sistem visual manusia. Dengan menggunakan gambar proyeksi dua dimensi untuk merekonstruksi bagian yang terlihat dari objek tiga dimensi.
Objek Dan Metode Penelitian Computer Vision
Penelitian metode visual dasar dengan dunia model sebagai objek utamanya
Tahap ini ditandai dengan karya rintisan Roberts. Dalam karya Roberts, hubungan antara objek tiga dimensi dan pencitraan dua dimensi diperkenalkan. Beberapa metode ekstraksi fitur EDGE sederhana digunakan dan metode penggabungan segmen garis diperkenalkan. Pekerjaan awal ini mendorong perkembangan penglihatan, tetapi sulit untuk bekerja untuk pemandangan yang sedikit lebih kompleks.
Baginya, analisis hubungan tiga dimensi hanya mengandalkan hubungan kendala segmen garis tepi sederhana, dan tidak sepenuhnya mempertimbangkan cara sistem visual manusia atau hewan lainnya memandang hubungan tiga dimensi tersebut.
Penelitian Model Visual Dengan Teori Komputasi Sebagai Intinya
Mulai tahun 1970-an, penelitian tentang computer vision memasuki tahap yang lebih rasional. Terutama berfokus pada pemulihan berbagai karakteristik intrinsik, termasuk pemulihan bentuk, gerakan dan sumber cahaya tiga dimensi.
Titik awal utama adalah mempelajari pencitraan dan masalah kebalikannya dari metode fisiologi, optik, dan geometri proyektif. Dalam tahap ini, beberapa peneliti yang diwakili oleh Marr mengemukakan model pemrosesan visual umum dengan representasi sebagai inti dan algoritma sebagai proses konversi perantara.
Dalam teorinya menekankan pentingnya representasi dan penelitian tentang masalah pengolahan informasi dari berbagai tingkatan. Juga menekankan pada pentingnya teori perhitungan dalam teori perhitungan dan realisasi algoritma. Dalam persepsi informasi tiga dimensi, serangkaian metode ShapefromX diusulkan menurut perbedaan kedalaman persepsi manusia.
Area Aplikasi Computer Vision
Bidang aplikasi Computer Vision terutama mencakup interpretasi bahan foto dan video seperti foto udara, foto satelit dan klip video. Panduan presisi, navigasi visual robot bergerak, diagnosis dengan bantuan medis, sistem tangan-mata robot industri, pemetaan, dan Analisis bentuk objek tiga dimensi Dan identifikasi dan antarmuka manusia-mesin yang cerdas.
Salah satu tujuan awal pengolahan citra digital adalah untuk meningkatkan kualitas foto melalui pemanfaatan teknologi digital. Membantu dalam pembacaan dan klasifikasi foto udara dan foto satelit.
Dengan banyaknya jumlah foto yang perlu diinterpretasikan, diharapkan akan ada sistem penglihatan otomatis untuk interpretasi dan interpretasi. Dalam konteks ini telah banyak dihasilkan sistem dan metode interpretasi foto udara dan foto satelit.
Penerapan lebih lanjut dari interpretasi otomatis adalah untuk menentukan secara langsung sifat target. Melakukan klasifikasi otomatis waktu nyata dan menggabungkannya dengan sistem panduan.
Saat ini, metode panduan yang umum digunakan meliputi panduan laser, panduan televisi, dan panduan gambar. Dalam sistem rudal, panduan inersia dan panduan gambar sering digabungkan dan gambar digunakan untuk panduan terminal yang tepat.
Sistem mata-tangan robot industri adalah salah satu bidang aplikasi penglihatan komputer yang paling sukses. Karena banyak faktor di bidang industri, seperti kondisi cahaya dan arah pencitraan. Semuanya dapat dikontrol yang sangat menyederhanakan masalah dan memfasilitasi pembentukannya dari sistem praktis.
Berbeda dengan robot industri, untuk robot bergerak, karena kemampuan perilakunya maka perlu dilakukan pemecahan masalah perencanaan perilaku yaitu pemahaman tentang lingkungan.
Dengan perkembangan robot seluler, semakin banyak kemampuan penglihatan yang dibutuhkan, termasuk pelacakan jalan, penghindaran rintangan, pengenalan target khusus, dan sebagainya. Saat ini penelitian sistem mobile robot vision masih dalam tahap eksperimental dan sebagian besar menggunakan metode remote control dan hyperopia.
Teknologi pemrosesan gambar yang digunakan dalam pengobatan umumnya mencakup kompresi, penyimpanan, transmisi, serta klasifikasi dan interpretasi otomatis / berbantuan, dan juga dapat digunakan sebagai metode pelatihan tambahan bagi dokter. Pekerjaan yang berkaitan dengan Computer Vision meliputi klasifikasi, interpretasi, dan rekonstruksi struktur tiga dimensi yang cepat.
Untuk waktu yang lama, pemetaan adalah tugas yang menghabiskan tenaga, sumber daya, dan waktu. Di masa lalu, survei manual digunakan, tetapi sekarang lebih banyak menggambar peta menggunakan survei udara ditambah metode memulihkan bentuk tiga dimensi dalam penglihatan stereo yang sangat meningkatkan efisiensi penggambaran peta.
Analisis bentuk tiga dimensi dan pengenalan objek umum selalu menjadi tujuan penelitian penting dari Computer Vision. Kemajuan tertentu telah dibuat dalam ekstraksi fitur, representasi, penyimpanan pengetahuan, pengambilan dan pengenalan pencocokan pemandangan dengan Sistem analisis pemandangan.
Dalam beberapa tahun terakhir, teknologi identifikasi berbasis biometrik telah mendapat perhatian yang luas. Terutama berfokus pada fitur-fitur seperti wajah, iris mata, sidik jari, dan suara yang sebagian besar terkait dengan informasi visual. Aplikasi penting lainnya yang terkait erat dengan biometrik adalah untuk membentuk antarmuka manusia-mesin yang cerdas.
Saat ini, komunikasi antara komputer dan manusia masih bersifat mekanis. Komputer tidak dapat mengenali identitas pengguna yang sebenarnya. Selain keyboard dan mouse, metode input lainnya masih belum matang.
Dengan menggunakan teknologi computer vision, komputer dapat mendeteksi keberadaan pengguna, mengidentifikasi identitas pengguna dan mengenali postur tubuh pengguna (seperti mengangguk, menggelengkan kepala).
Selain itu, interaksi manusia komputer semacam ini juga dapat diperluas ke semua kesempatan yang memerlukan interaksi manusia komputer. Seperti kontrol keamanan pintu masuk, inspeksi dan pelepasan personel transit.
Memahami Penelitian Computer Vision
Penelitian Computer Vision telah melalui proses hampir 40 tahun dan masih menghadapi banyak masalah. Alasan utamanya adalah bahwa arah ini merupakan perpotongan dan perpaduan dari berbagai disiplin ilmu.
Penglihatan merupakan proses kompleks yang melibatkan fisiologi dan psikologi. Tidak hanya terkait dengan mata, tetapi juga terkait dengan penalaran dan pembelajaran para siswa.
Tujuan mempelajari Computer Vision adalah untuk mewujudkan simulasi dan perluasan visi manusia. Bagi manusia, penglihatan adalah fungsi yang mudah, tetapi berbeda untuk mesin. Proses visual sulit untuk dilambangkan dengan menggunakan metode yang mirip dengan pemecahan masalah.
Dengan penekanan pada penelitian kuantitatif di bidang ilmu komputer, situasi ini akan diperbaiki. Dalam proses penelitian computer vision, kombinasi simulasi fungsional dan simulasi kognitif harus dipertimbangkan. Dalam proses manusia mengembangkan kemampuan lain.
Simulasi fungsional memainkan peran utama, tetapi penglihatan merupakan proses yang melibatkan aspek psikologis dan fisiologis. Oleh karena itu simulasi kognitif harus ditekankan sementara simulasi fungsional.
Kemajuan teori komputasi dan peningkatan metode persepsi berkontribusi pada penelitian Computer Vision. Teori komputasi menempati posisi yang sangat penting dalam Computer Vision. Kemajuan teori komputasi dan pengajuan model komputasi baru dapat menyelesaikan beberapa masalah sulit di masa lalu.
Di sisi lain kemajuan metode persepsi juga dapat memainkan peran yang sama. Penglihatan aktif dapat digunakan untuk mengatasi masalah visual yang dihadapi dari sisi lain. Untuk mewujudkan sistem visi yang lengkap, perolehan, pengelolaan dan pemanfaatan pengetahuan visi sangat penting.
Sistem visual yang relatif lengkap juga merupakan sistem manajemen pengetahuan. Pemahaman tentang citra dalam proses visual membutuhkan sejumlah besar pengetahuan tentang domain tugas. Pengetahuan ini berbeda dengan pengetahuan dalam pemecahan masalah yang dapat diungkapkan dengan jelas.
80% informasi yang diperoleh Manusia melalui penglihatan, sehingga pengetahuan ini melibatkan berbagai bidang dan sulit untuk diprediksi. Oleh karena itu, manajemen pengetahuan dalam sistem visual merupakan masalah yang penting.
Dari penelitian sebelumnya, meskipun beberapa masalah telah dikemukakan dan diselesaikan dalam beberapa dekade terakhir. Masih banyak masalah yang harus dikaji karena kekhususan dan kompleksitas masalah visual. Fokus penelitian meliputi eksplorasi metode baru dan metode baru.
Tentu saja, penggunaan metode deskripsi baru dan solusi untuk masalah asli juga merupakan titik terobosan yang memungkinkan. Dalam bidang visi, permasalahan yang paling banyak muncul bukanlah apakah masalah itu benar atau tidak. Tetapi apakah uraiannya sudah tepat dan apakah solusinya efektif.
Oleh karena itu eksplorasi metode deskripsi dan metode pemecahannya menjadi sangat penting. Singkatnya dengan penekanan pada penelitian kuantitatif, studi tentang metode deskripsi baru, metode penyelesaian dan perbaikan metode persepsi, penelitian computer vision pasti akan mengantarkan era yang lebih sejahtera.