KompyuterlarAxborot texnologiyalari

Zamonaviy kompyuter ko'rish. Vazifalar va kompyuter ko'rish texnologiyasi. Python dasturlash Kompyuter Vision

Qanday rasmda yoki rasmlarda tasvirlangan tushunish uchun, kompyuterni o'rgatish? Bu oddiy ko'rinadi, lekin bir kompyuter uchun bu nol va muhim ma'lumotlarni chiqarib istayotgan bo'lgan iborat faqat bir Matrix hisoblanadi.

kompyuter ko'rish nima? Bu sizning kompyuter "ko'rish" uchun qobiliyatidir

Vision - uni ishlatishdan kishi uchun muhim ma'lumotlar manbai bo'lgan, biz 70 dan barcha ma'lumotlar 90%, turli xil hisob-kitoblarga ko'ra, qo'lga. Biz bir aqlli mashina yaratish bo'lsangiz Va, albatta, biz bir xil ko'nikma va kompyuter amalga oshirish kerak bo'ladi.

kompyuter vahiyda muammosi juda aniq ko'rsatilgan bo'lishi mumkin. Qarang: "" nima? Bu qarab faqat bor qaerda, deb tushuniladi. Bu kompyuter ko'rish va inson ko'rish farqlarni tuzilgan. Biz uchun Vision - bu dunyo haqidagi bilimlar manbai, shuningdek metrik axborot manbaidir - ya'ni, qobiliyati masofalarni registri va tushunish uchun.

Semantik kernel image

Rasmdagi qarab, biz semantik ma'lumot chiqarib olish uchun, shunday gapirish, sifatlari bir qator uni tasvirlab mumkin.

Misol uchun, bu rasmda qarab, biz u ochiq havoda, deb aytish mumkin. shahar transport nima. Bu avtomobillar bor. Biz bu bino va ieroglif konfiguratsiyasiga Janubiy-Sharqiy Osiyo, deb taxmin qilish mumkin. Mao Zedong portreti bu Pekin, deb tushunish va har bir kishi jonli video ko'rdim yoki o'zi bor edi, agar, bu mashhur Tiananmen maydoni deb taxmin qilaman.

Nima, biz uni ko'rib, rasmda haqida ko'proq aytish mumkin? devor - Biz odamlar bu erda yaqin borligini aytish, tasvir moslamalarni aniqlash mumkin. Bu erda soyabon, deb binoning plakatlar. Bu sinflar misollar lahza Izlash shug'ullanuvchi juda muhim ob'ektlar, deb hisoblanadi.

Shunday bo'lsa-da, biz xususiyatlari yoki ob'ektlar sifatlari ba'zi o'rganish mumkin. Misol uchun, bu erda biz bu aynan bir oddiy Xitoy, Mao Zedong bir portret emasligini aniqlash mumkin.

avtomobil ko'ra, u bir harakat ob'ekt ekanligi aniqlandi, va u harakat paytida Quyon emas, deb, qiyin bo'lishi mumkin. bayroqlari moslamalarni, deb aytish mumkin to'g'risida, ular ham harakat, lekin ular qattiq doimo deformatsiyasi emas. Va sahnasida bor bayroqlarni rivojlantirish orqali aniqlanishi mumkin shamol, deb, va hatto shamol yo'nalishini, masalan, u chapdan o'ngga esgan aniqlash mumkin.

kompyuter vahiyda masofalar va uzunliklar

Juda muhim kompyuter ko'rish fan haqida metrik ma'lumot. Bu masofalarga barcha turlari. jamoalar Yerdan taxminan 20 daqiqa va ko'p javob, chunki, masalan, Rover uchun, ayniqsa, muhim ahamiyatga ega. Shunga ko'ra, u erda va orqa bog'laning - 40 daqiqa. Biz Yerning harakati buyruqlar uchun bir reja qilish bo'lsangiz, siz hisobga olish kerak bo'ladi.

Muvaffaqiyatli video o'yinlarda kompyuter ko'rish texnologiyasidan integratsiya. video ko'ra, siz ob'ektlar, odamlar uch o'lchamli modellar qurish mumkin, va foydalanuvchi fotosuratlar shaharlar uch o'lchovli modellarni qayta tiklash mumkin. Va keyin ular ustiga yurish.

kompyuter ko'rish - juda keng. Bu yaqindan turli boshqa fanlar bilan chambarchas bog'liq. kompyuter vahiyda qismi Bu tasvir ishlash maydoni ushlaydi va ba'zan tarixan, kompyuter ko'rish qobiliyatini ajratadi.

Tahlil, namuna aniqlash - ustun aql yaratish uchun yo'l

AQSh alohida bu tushunchalarni ko'rib chiqamiz.

Image Processing - tasvir, va biz uni bir narsa qilish kerak - bu Kirish va chiqish bo'lgan algoritmlar bir joy, deb.

tasvir tahlil - ikki o'lchovli tasvirni bilan ishlash va bu xulosa qilish aratilgan kompyuter vahiyda, maydoni hisoblanadi.

Desang, Ovozni aniqlash - vektor shaklida ma'lumotlarni tan mavhum matematik intizom. Bu kirish, deb - vektor va biz u bilan albatta, bir narsa bor. vektor qaerda, biz bilish juda muhim emas.

Kompyuter ko'rish - bu dastlab ikki o'lchovli tasvirlar tuzilishini qayta tiklash edi. Bugungi kunda ushbu sohada keng ko'lamli aylandi va u tasvir asoslangan, qilish, jismoniy ob'ektlar barcha qabul sifatida talqin qilinishi mumkin. Ya'ni, bu vazifa sun'iy intellekt.

butunlay boshqa sohada kompyuter vahiyda bilan parallel ravishda, geodeziya yilda, fotogrametri aylandi - ob'ektlar orasidagi masofa bir o'lim, ikki o'lchovli tasvirlar ustida.

Robotlar "ga qarang" mumkin

Va nihoyat - bu mashina ko'rish hisoblanadi. mashina vahiyda ostida robotlar tuyulgan anglatadi. Bu ba'zi bir ishlab chiqarish muammolarini qaror. Bir katta fan hisoblanadi - Biz bu kompyuter ko'rish aytish mumkin. Bu boshqa fan qismining ba'zi birlashtiradi. kompyuter ko'rish har qanday alohida ariza oladi Qachonki, u mashina vahiyda aylanadi.

Kompyuter ko'rish viloyati amaliy dasturlar bir massa bor. Bu ishlab chiqarish avtomatlashtirish bilan bog'liq. korxonalarda mashina tomonidan qo'l mehnati o'rnini yanada samarali bo'lib. mashina u og'riqqa, ish jadvalini bor edi, uxlab yotgan yo'q, charchab emas, u bir yilda 365 kun ishlashga tayyor. Shunday qilib, mashina ish foydalanib, biz ma'lum bir vaqtda kafolatlangan natija olishingiz mumkin, va u juda qiziq. Barcha vazifalar kompyuter ko'rish tizimlari uchun ochiq-oydin foydalanish bor. Va faqat hisoblash bosqichida rasmda darhol natijalarini ko'rish uchun nisbatan yaxshiroq narsa yo'q.

sun'iy aql dunyo ostonasida

Plus maydoni - Bu qiyin! vahiyda uchun mas'ul miya katta qismi, va u sizga o'rgatish agar kompyuteringiz deb, to'liq foydalanish, kompyuter ko'rish, u to'liq sun'iy intellekt vazifalaridan biri hisoblanadi, "ko'rish", deb ishoniladi. Biz inson darajasiga muammoni hal mumkin bo'lsa, bir vaqtning o'zida eng ko'p ehtimol, biz AI muammosini hal qiladi. Bu juda yaxshi! Yoki juda yaxshi emas, sizga najotni, "Terminator 2".

Nima uchun ko'rish - bu qiyin? Shu ob'ekt tasvir farq qilishi mumkin, chunki juda tashqi omillarga qarab. kuzatuv punktlari ob'ekti qarab farq qiladi.

Masalan, bitta va bir xil arbobi uchun, har taraflama olingan. Va bir ko'z, ikki ko'z va bir yarim bo'lishi mumkin rasmda eng qiziqarli narsa. Va ma'noda qarab (bo'yalgan ko'zlari bilan bir ko'ylak odamning bu tasvir bo'lsa), ko'z ortiq ikki bo'lishi mumkin.

kompyuter hali tushunmaydi, lekin u "ko'radi"

qiyin qiladi yana bir omil - bu yorug'lik ekan. turli yoritish bilan bir xil manzara boshqacha ko'rinish oladi. ob'ekt hajmi farq qilishi mumkin. har qanday sinf Bundan tashqari, ob'ektlar. 2 metr uning balandligi bir kishi haqida aytish mumkin? Hech narsa. Inson o'sishi va 2,3 m, va 80 sm bo'lishi mumkin. Ob'ektlar boshqa turdagi kabi, biroq, shu sinf ob'ektlari hisoblanadi.

Ayniqsa yashayotgan ob'ektlar shtammlarini turli duchor. Soch odamlar, sportchilar, hayvonlar. ularning o'ram sochga bilan sodir va dum oddiygina mumkin emas nima aniqlash, yugurib otlarni rasmlar qarang. bir tasvir bir birini to'ldiruvchi ob'ektlar? Agar kompyuter tasvirini, hatto eng kuchli mashinasini Turtma bo'lsa, to'g'ri qaror berish uchun qiyinchilik topish.

Keyingi versiya - bu yurish-turishlari bo'ldi. Ba'zi ob'ektlar, hayvonlar juda mohirona muhitda niqobi va. Va shu dog'lar va binoni. Shunday bo'lsa-da, biz har doim emas-da uzoqdan, ularni qarang.

Yana bir muammo - harakati. favqulodda harakatda Objects deformasyon.

ob'ektlarning kupchilik juda o'zgaruvchan bo'ladi. Bu erda, masalan, "kafedrasi" ob'ektlarini quyida ikki fotosuratlarda.

Va bu sizga o'tirib mumkin. Lekin shakli, rangi, materiallar turli narsalar, hamma narsa bir ob'ekt "kafedrasi" deb shunday bir mashinasini, o'rgatish - juda qiyin. Bu vazifadir. kompyuter vahiyda usullarini integratsiya qilish - o'ylamoq, tushunish tahlil qilish, bir mashina o'rgatish.

turli platformalarda kompyuter ko'rish integratsiyasi

kompyuter vahiyda ommaviy u birinchi yuz o'lchoviga yaratgan bo'lsa, 2001 yilda yana kirib boshladi. Viola, Jones: Biz uni ikki mualliflari qildi. Bu mashina ta'lim usullari kuchini namoyish birinchi tez va ishonchli etarli algoritm edi.

Endi kompyuter ko'rish kifoya, yangi amaliy ilovalarni bor - inson yuzi tan.

Lekin filmlar kabi insonni tan - tasodifiy yuritadigan, turli yoritish sharoitida - bu mumkin emas. Ammo, muammo, yoki har xil yoritish bilan yoki pasport fotosuratda kabi bir xil Sayti, turli xalq bir hal qilish, bu ishonch yuqori darajada mumkin.

yuz aniqlash algoritmlari xususiyati tufayli bir pasport foto talablar.

Agar biometrik pasport bo'lishi Misol uchun, agar, ba'zi zamonaviy aeroportlarda, siz avtomatik pasport nazorati tizimini foydalanishingiz mumkin.

kompyuter ko'rish hal qilinmagan muammo - har qanday matnni tanib olish qobiliyati

Balki kimdir OCR tizimi ishlatiladi. Ulardan biri - bir Tasviriy Reader, RuNet tizimida juda mashhur hisoblanadi. Agar ma'lumotlar to'ldiring ko'p shakllar, ular mukammal, skaner qilingan axborot juda yaxshi tizimi tomonidan e'tirof etilgan mavjud. Lekin rasmda har qanday matn bilan vaziyat ancha yomon. Bu muammo hali ham javobsiz qolmoqda.

kompyuter ko'rish qobiliyatini jalb Games, harakat ta'qib

Alohida katta maydoni - uch o'lchamli modellar va (ancha muvaffaqiyatli kompyuter o'yinlari amalga oshirilmoqda) harakat ta'qib yaratish hisoblanadi. kompyuter ko'rish qobiliyatini foydalanadi birinchi dastur, - kompyuter harakatlarni foydalanish bilan o'zaro bir tizim. u yaratilgan bo'lsa, u ochiq bir narsani ko'p edi.

algoritm juda oddiy mo'ljallangan, lekin u bir million suratga olish uchun odamlar sintetik tasvirlar bir generator yaratish oldi modernizatsiya qilish uchun. ular bilan bilan kompyuter u endi yaxshi ishlaydi, buning uchun algoritm, parametrlarini tanlash.

Bu million tasvirlar va iloji hafta sanaladigan superkompyuter vaqt real vaqtda o'rnini sezmagan bir kishi, bir protsessor quvvatini 12% iste'mol va imkon beradi, bir algoritm yaratish uchun. Bu Microsoft Kinect tizimi (2010).

mazmuniga ko'ra tasvirlar qidirish Agar tizimiga rasmlarni upload qilish imkonini beradi, va uning natijalari bir xil tarkib bilan barcha rasmlarni berish va shu burchakdan amalga bo'ladi.

kompyuter vahiyda misollar: uch o'lchamli va ikki o'lchamli xaritalar endi u bilan amalga oshirilmoqda. navigatsiya avtomobillar uchun Maps muntazam DVR ko'ra yangilanadi.

geografik etiketli rasmlar milliardlab bilan ma'lumotlar bazasi mavjud. ma'lumotlar bazasida rasm yuklab, siz uni qilgan, va hatto ba'zi bir nuqtai nazar bilan qaerda aniqlash mumkin. Albatta, joy sayyohlar bir vaqtning o'zida etarli deb mashhur sharti va maydoni fotosuratlar bir qator bor edi qilingan.

robotlar hamma joyda bor

biron-bir tarzda u holda hamma joyda hozir vaqtda Robotics. Endi haydovchi (bu kompyuter dasturi ko'rish uchun bir tarzda, mototsikl yordam beradi) buyruqlar uzatish piyoda va yo'l belgilari tan maxsus kamera bor transport vositalari ham mavjud. Va u erda to'liq avtomatlashtirilgan robot transport vositalari, lekin ular qo'shimcha ma'lumotlarni katta miqdorda foydalanish holda video kamera tizimi faqat ishonmoq mumkin emas.

Zamonaviy kamera - bu analog kamera qorong'u bo'ladi

raqamli tasvir haqida gaplashaylik. Zamonaviy raqamli kameralar kamera OBSCURA tamoyili bo'yicha tashkil etiladi. Faqat o'rniga nur kiradi va mavzu tutashuv palatasi orqa devorga rejalashtirilgan orqali teshik, biz maxsus optik tizimi ob'ektiv chaqirdi. Uning ob'ekti katta nur to'plash va barcha nurlar proeksiyasini olish va kino yoki matritsasi bo'yicha tasvirni hosil qilish uchun bir virtual nuqtasi orqali o'tib, shunday qilib, uni aylantirish uchun.

Zamonaviy raqamli kameralar (Matritsa) individual elementlardan tashkil topgan - piksel. Har bir piksel piksel jami kuni voqea bo'lgan yorug'lik energiyasini o'lchash va bir raqami chiqish chiqarishi mumkin. Shuning uchun, raqamli kamera, biz o'rniga bitta nuktalarda qo'lga tasvir ranglarini sozlash yorug'lik o'lchash, olish - kompyuter nuqtai maydonini. Shuning uchun, biz ko'rib tasvir liniyalari va aniq kontur va turli rangdagi rangli kvadratchalar hidoyat oqib emas bo'lsa - piksel.

Agar dunyoda birinchi raqamli tasvir ko'rish Quyida.

Lekin, bu rasmda emas? Rangli. rang nima?

rangi Psixologik fikr

Rangi - bu biz ko'rib nima. insonlar va Mushuklar uchun bir rang va shu narsa har xil bo'ladi. Biz (insonlar) va hayvon optik tizimi yildan - ko'rish farq qiladi. Shuning uchun, rang - moslamalarni va nur rioya qachon sodir bizning vahiyda psixologik sifat ekan. Va emas ob'ekti va nur bir jismoniy xususiyat. Rangi - yengil komponentlar o'zaro va bizning Visual tizimining sahnasida natijasidir.

Python yordamida kutubxonalarida dasturlash Kompyuter Vision

Agar kompyuter vahiyda o'rganishga jiddiy shug'ullanishga qaror qilgan bo'lsangiz, darhol qiyinchiliklar bir qator tayyorgarlik kerak, bu ilm-fan oson emas va makr bir qator maxfiy qilsangiz. Lekin Yan Erik Solema muallifligi "Python haqida dasturlash Kompyuter Vision" - barcha eng oddiy tilda bayon kitob. Bu yerda siz 3D turli ob'ektlarini tan usullari bilan tanishadilar, stereo, rasm, virtual haqiqiy va kompyuter vahiyda ko'plab boshqa ilovalar bilan ishlashni o'rganadi. kitobida Python etarli misollar mavjud. Lekin tushuntirishlar juda ko'p tadqiqot va qattiq ma'lumotlarni tiklash emas, shuning uchun, shuning uchun, umumiy, gapirish, taqdim etiladi. talabalar, havaskorlar va ixlosmandlarining uchun munosib ish. kompyuter ko'rish (pdf-formatida) haqida, bu kitob va boshqalarni ko'chirib tarmog'ida bo'lishi mumkin.

Ayni paytda, kompyuter ko'rish algoritmlar va tasvir ishlash va raqamli algoritmlarni OpenCV ochiq manba kutubxona bor. Bu eng zamonaviy dasturlash tillarida amalga oshirilmoqda, ochiq manba hisoblanadi. Biz kompyuter vahiyda haqida gapirish bo'lsa, Python, u ham kutubxonasi qo'llab-quvvatlash ega, bir dasturlash tili sifatida foydalanadi, Bundan tashqari, u uzluksiz rivojlanish va buyuk jamoaga ega.

Kompaniya "Microsoft" o'z xizmatlarini Api-ega odamlar tasvirlar bilan ishlash uchun asab tarmog'i o'rgatish beradi. kompyuter ko'rish qobiliyatini qo'llash imkoniyati ham mavjud, Python bir dasturlash tili sifatida foydalanadi.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 uz.delachieve.com. Theme powered by WordPress.