آیا امکان این وجود دارد که کامپیوتر بهتر از انسان ببیند؟
امروزه بحثی با نام بینایی کامپیوتر بر سر زبان هاست که مرا برآن داشت مطلبی در این باره پست نمایم .
بینایی رایانهای (به انگلیسی: Computer vision) یا بینایی ماشینی (به انگلیسی: Machine vision) یکی از شاخههای علوم کامپیوتر است که شامل روشهای مربوط به دستیابی تصاویر، پردازش، آنالیز و درک محتوای آنها است. معمولاً این پردازشها تصاویر تولید شده در دنیای واقعی را به عنوان ورودی دریافت و دادههایی عددی یا سمبلیک را به عنوان خروجی تولید میکنند، مانند در شکلهایی از تصمیمگیری. یکی رویههای توسعهٔ این شاخه بر اساس شبیهسازی توانایی بینایی انسان در رایانه است.
بینایی رایانهای به مسائل مختلفی از جمله استخراج داده از عکس، فیلم، مجموعه چند عکس از زوایای مختلف و پردازش تصاویر پزشکی میپردازد. معمولاً ترکیبی از روشهای مربوط به پردازش تصاویر و ابزارهای یادگیری ماشینی و آمار برای حل مسایل مختلف در این شاخه استفاده میگردد.
کاوش در دادهها
مقالهٔ اصلی: کاوشهای ماشینی در دادهها
بینایی ماشینی را میتوان یکی از مصادیق و نمونههای بارز زمینهٔ مادر و اصلیتر کاوشهای ماشینی دادهها بهحساب آورد که در آن دادهها تصاویر دوبعدی یا سهبعدی هستند، که آنها را با استفاده از هوش مصنوعی آنالیز میکنند.
وظایف اصلی در بینایی رایانهای
تشخیص شیء
تشخیص حضور و/یا حالت شیء در یک تصویر. به عنوان مثال:
- جستجو برای تصاویر دیجیتال بر اساس محتوای آنها (بازیابی محتوامحور تصاویر).
- شناسایی صورت انسانها و موقعیت آنها در عکسها.
- تخمین حالت سهبعدی انسانها و اندامهایشان.
پیگیری
پیگیری اشیاء شناخته شده در میان تعدادی تصویر پشت سر هم. به عنوان مثال:
- پیگیری یک شخص هنگامی که در یک مرکز خرید راه میرود.
تفسیر منظره
ساختن یک مدل از یک تصویر/تصویر متحرک. بهعنوان مثال:
- ساختن یک مدل از ناحیهٔ پیرامونی به کمک تصاویری که از دوربین نصب شده بر روی یک ربات گرفته میشوند.
خودمکانیابی
مشحص کردن مکان و حرکت خود دوربین به عنوان عضو بینایی رایانه. بهعنوان مثال:
- مسیریابی یک ربات درون یک موزه.
سامانههای بینایی رایانهای
یک سامانهٔ نوعی بینایی رایانهای را میتوان به زیرسامانههای زیر تقسیم کرد:
تصویربرداری
تصویر یا دنباله تصاویر با یک سامانه تصویربرداری(دوربین، رادار، لیدار، سامانه توموگرافی) برداشته میشود. معمولاً سامانه تصویربرداری باید پیش از استفاده تنظیم شود.
پیشپردازش
در گام پیشپردازش، تصویر در معرض اَعمال «سطح پایین» قرار میگیرد. هدف این گام کاهش نوفه (کاهش نویز - جدا کردن سیگنال از نویز) و کمکردن مقدار کلی دادهها است. این کار نوعاً با بهکارگیری روشهای گوناگون پردازش تصویر(دیجیتال) انجام میشود. مانند:
- زیرنمونهگیری تصویر.
- اعمال فیلترهای دیجیتال.
- پیچشها.
- همبستگیها یا فیلترهای خطی لغزشنابسته.
- عملگر سوبل.
- محاسبهٔ گرادیان x و y(و احتمالاً گرادیان زمانی).
- تقطیع تصویر.
- آستانهگیری پیکسلی.
- انجام یک ویژهتبدیل بر تصویر.
- تبدیل فوریه.
- انجام تخمین حرکت برای ناحیههای محلی تصویرکه به نام تخمین شارش نوری هم شناخته میشود.
- تخمین ناهمسانی در تصاویر برجستهبینی.
- تحلیل چنددقتی.
استخراج ویژگی
هدف از استخراج ویژگی کاهش دادن بیش تر دادهها به مجموعهای از ویژگیهاست، که باید به اغتشاشاتی چون شرایط نورپردازی، موقعیت دوربین، نویز و اعوجاج ایمن باشند. نمونههایی از استخراج ویژگی عبارتاند از:
- انجام آشکارسازی لبه.
- استخراج ویژگیهای گوشهای.
- استخراج تصاویر چرخش از نقشههای ژرفا.
- بدست آوردن خطوط تراز و احتمالاً گذر از صفرهای خمش.
ثبت
هدف گام ثبت برقراری تناظر میان ویژگیهای مجموعه برداشت شده و ویژگیهای اجسام شناختهشده در یک پایگاه دادههای مدل و/یا ویژگیهای تصویر قبلی است. در گام ثبت باید به یک فرضیه نهایی رسید. چند روش این کار عبارتاند از:
- تخمین کمترین مربعات.
- تبدیل هاگ در انواع گوناگون.
- درهمسازی هندسی.
- پالودن ذرهای.