IS:Image Segmentation

بررسی تکنیک های تقسیم بندی تصویر (Survey on Image Segmentation Techniques)

چکیده:

با توجه به ظهور تکنولوژی های کامپیوتری، تکنیک های پردازش تصویر در بسیاری از برنامه های کاربردی،به طور فزاینده ای اهمیت دارند، تقسیم بندی تصویر یک موضوع کلاسیک در زمینه پردازش تصویر و همچنین نقطه کانونی و تمرکز تکنیک های پردازش تصویر است. چندین الگوریتم و روش کلی برای تقسیم بندی تصویر ایجاد شده و از آنجا که راه حل کلی برای مسئله تقسیم بندی تصویر وجود ندارد، این تکنیک ها اغلب باید با دانش دامنه ترکیب شوند تا به طور موثر برای حل یک مسئله تقسیم بندی تصویر برای اینکه یک دامنه مشکل حل شود. این مقاله ترکیبی از  تکنیک های جداسازی تصویر مبتنی بر بلوک اصلی می باشد.

    مقدمه:

تقسیم شکل زمین به عنوان یک هدف یا پیش زمینه که بخش نامیده می شود، پس زمینه یک مشکل مهم است به عنوان مثال استخراج و جدا کردن آنها برای شناسایی و تجزیه و تحلیل شی در پردازش تصویراست، تقسیم بندی فرایندی است که یک تصویر را به قطعات یا اجزای تشکیل دهنده آن تقسیم می کند و سطحی که این بخش را انجام می دهد بستگی به مشکل حل می شود، به عنوان مثال، زمانی تقسیم بندی باید متوقف شود که اشیاء مورد علاقه در یک برنامه جدا شده اند. مهندسی تصویر میزان سطح تقسیم تصویر را در پردازش تصویر نشان می دهد. مهندسی تصویر را می توان به سه سطح تقسیم کرد همانطور که در شکل 1 نشان داده شده است.


 پردازش تصویر عملیات سطح پایین که آن را در سطح پیکسل اجرا می کند. با یک تصویر شروع و یک نسخه اصلاح شده، تصویر را به یک فرم دیگر، یکسان و یا تبدیل بین تصاویر و بهبود جلوه های بصری تصویر را تولید می کند. پردازش تصویر به دنبال سه مرحله هر کدام به دسته های مختلف تقسیم می شود:

1) بازسازی (اصلاح)

الف) ترمیم: حذف یا به حداقل رساندن تخریب تصاویر. دو نوع: رادیومتریک و هندسی.

ب) بازسازی:  استخراج یک تصویر، دو یا بعدهای بالاتر  نمای داخلی از چندین نمایشگر کوچک بیاورید.

ج) Mosaic: ترکیب دو یا چند پچ از تصویر. لازم است که دید کلی کل منطقه را بدست آورید.

2) تبدیل

الف) کشش کنتراست: تصاویر همگن که تغییرات زیادی در سطح آنها ندارند.

ب) فیلتر کردن نویز: برای فیلتر کردن اطلاعات غیر ضروری. فیلترها مانند گذرگاه پایین، عبور بالا، متوسط، متوسط ​​و غیره ...

ج) اصلاح هیستوگرام: به عنوان مثال، انحراف هیستوگرام.

د) فشرده سازی داده ها: هر پیکسل بیشتر فشرده شده توسطDCT ، JPEG یا Wavelet برای به حداقل رساندن ضرر.

ه) چرخش: در موزاییک برای مطابقت با تصویر دوم، سه برش گذر رایج است.

3) طبقه بندی

الف) تقسیم بندی: تقسیم یک تصویر به اشیاء آن  که بستگی به مشکل دارد.

ب) طبقه بندی: برچسب پیکسل بر اساس مقدار خاکستری آن. انواع "تجزیه و تحلیل طیفی" در تصاویر تصویربرداری از راه دور، عبارتند از: نظارت بر انواع شناخته شده زمین است در حالی که بدون نظارت آن ها ناشناخته هستند

تجزیه و تحلیل تصویر سطح متوسط و روی اندازه گیری تمرکز می کند. تجزیه و تحلیل اجزای اصلی (PCA )یک مجموعه جدید از تصاویر را از یک مجموعه داده تولید می کند. فهم تصویر عملیات سطح بالا که مطالعه بیشتر در مورد ماهیت هر هدف و ارتباط با یکدیگر و نیز توضیح تصویر اصلی است. تقسیم بندی تصویر یک گام کلیدی از پردازش تصویر تا تجزیه و تحلیل تصویر است. این تقسیم بندی بیان هدف است و تأثیر مهمی در اندازه گیری ویژگی ها دارد ، امکان تحلیل و درک تصویر در سطح بالا وجود دارد .

 

2) روش برای جداسازی تصویر (Methods for Image Segmentation)

 تکنیک ها یا روش های تقسیم بندی تصویر به دو دسته اصلی طبقه بندی می شوند: 1) روش های طبقه بندی مبتنی بر لایه ها 2) روش های جداسازی بر اساس بلوک که در شکل 2 نشان داده شده است.




 مدل های لایه ای :

 برای تشخیص شی و تقسیم بندی تصویر که خروجی یک بانکی از آشکارسازهای شی به منظور تعریف شکل ماسک و توضیح ظاهر، دستورالعمل عمق،  هر دو تقسیم بندی کلاس و نمونه را ارزیابی می کنند و   این نوع در مقاله بحث نشده است و روش های متمایز سازی بر اساس بلوک که بر اساس ویژگی های مختلف موجود در تصویر است. این ممکن است اطلاعات رنگی که برای ایجاد هیستوگرام یا اطلاعاتی درباره پیکسل هایی که لبه ها یا مرزها یا اطلاعات بافت را نشان می دهد استفاده  میشود. 


روش های جداسازی تصویر مبتنی بر بلوک براساس دو ویژگی عدم انسجام و شباهت به سه گروه تقسیم می شوند:

1)روش های مبتنی بر منطقه: بر اساس عدم انسجام.

2)  روش های لبه یا مرزی: بر اساس شباهت

3) تکنیک های ترکیبی

 اینها روش هایی است که در این مقاله مورد بحث قرار گرفته است، در حالی که دو روش بلوک بر اساس تقسیم بندی تصاویر  دسته هایی وجود دارد:

 بخشبندی مبتنی بر پیکسل یا Segmentation مبتنی بر نقطه :


مدل سازی مبتنی بر تقسیم بندی:

 سیستم بینایی انسان توانایی تشخیص اشیاء حتی اگر آنها به طور کامل نشان داده نمی شود و می توان آن را اعمال کرد اگر شکل دقیق اشیاء در تصویر شناخته شده باشد.


Segmentation: یک فرآیندی است که یک تصویر را به نواحی یا اشیائی که دارای ویژگی یا ویژگی های مشابه هستند تقسیم می کند.


1. روش های مبتنی بر منطقه: تمام تصویر را به زیر نواحی یا خوشه ها تقسیم کنید، به عنوان مثال تمام پیکسل ها با همان سطح خاکستری در یک منطقه.


1-1 خوشه بندی:K-mean یک تصویر را به گروه ها یا خوشه های K تقسیم می کند با اضافه کردن نقاطp به خوشه ای که تفاوت بین نقطه و میانگین کوچک است، خوشه بندی سخت فرض می کند که مرز بین خوشه هاست. خوشه فازی که الگوریتم تقسیم بندی تصویر مبتنی بر شکلمی باشد.

 کاربردها: تصویربرداری پزشکی و سیستم های امنیتی

مزایا: تقسیم بندی تصویر مبتنی بر شکل.

معایب: برخی از الگوریتم های خوشه بندی مانند خوشه بندی K-means مناطق مستمر را تضمین نمی کند. این نقص با روش Split و Merge غلبه دارد.


1-2 تقسیم و ادغام(دو بخش): در ابتدا کل تصویر که به عنوان یک منطقه تک انتخاب می شود، بارها بارها تقسیم می شود و تا زمانی که  هیچ تقسیمی امکانپذیر نباشد، درخت Quad یک ساختار داده تقسیم است سپس دو منطقه با هم ادغام می شوند و همگرامی شوند، تا زمانی که امکان ادغام بیشتر وجود نداشته باشد. سه گام با استفاده از Improved Quad Tree (IQM)، اولا تقسیم تصویر، دومین لیست اولیه همسایه ها و مرحله سوم ادغام مناطق تقسیم شده است.

مزایا: مناطق متصل تضمین شده و IQM مشکلات طولانی و همسایه را در هنگام ادغام کاهش می دهد.

معایب: موقعیت و جهت گیری تصویر منجر به تقسیم نهایی و تقسیم منظم می شود و  به تقسیم بندی (نواحی بیشتر) با تقسیم، این نقص را می توان با استفاده از برش نرمال شده برطرف کرد.


1-3 برش های نرمال شده

هدفش تقسیم بهینه توسط کاهش تعدادی از ناحیه ها است، این روش بر اساس نظریه گراف. هر پیکسل یک رأس در یک گراف است، لبه به پیکسل های مجاور پیوند دارند. وزن بر روی لبه با توجه به شباهت، فاصله، رنگ، سطح خاکستری یا بافت و غیره بین دو پیکسل مربوطه تعیین می شود. کاربرد: تصاویر پزشکی

 مزایا: نیاز به ادغام مناطق پس از تقسیم بندی ندارد، تعریف بهتری از  لبه ها دارد، معیار جدید بهینه سازی برای پراکندگی یک گراف به خوشه ها و ویژگی های تصویر مختلف مانند شدت، بافت رنگ، تداوم کانتور در یک شبکه واحد مورد بررسی قرار می گیرد.

معایب: محاسبات پیچیده


 1-4رشد ناحیه(Region Growing):

ناحیه رشد یکی از روش های محبوب است که با یک پیکسل شروع می شود و با افزودن پیکسل بر اساس شباهت، به منطقه ادامه می دهد تا زمانی که تمام پیکسل ها به یک منطقه متصل شوند.
کاربردها: تقسیم بخش هایی از بدن انسان .
 مزایا: ناحیه های اتصال تضمین شده اند و چند معیار همزمان زمان و نتایج بسیار خوبی را با کمترین نویز می دهد.
 معایب: بیش از تقسیم زمانی که تصویر، نویز  یا تغییرات شدت دارد نمی تواند سایه از تصاویر واقعی و قدرت و زمان صرفه جویی را داشته باشد.


1-5 آستانه(Threshold):

 پیش زمینه یا شی را از پس زمینه جدا میکند به هیچ مجموعه ای همپوشانی ندارد.


تقسیم آستانه:

تکنیک های طبقه بندی شده در کلاس ها:


1)تکنیک های محلی: بر اساس خواص محلی پیکسل ها و محله های آنها است.


2) تکنیک های جهانی: یک تصویر را بر اساس اطلاعات در سطح جهانی (به عنوان مثال با استفاده از هیستوگرام تصویر، خواص بافت جهانی) به دست می آورند.


3) تکنیک های تقسیم، ادغام و رشد: هر دو مفاهیم همگن و نزدیکی هندسی را برای به دست آوردن نتایج تقسیم بندی خوب استفاده می کنند.


Fuzzy C-means : این الگوریتم روش و استراتژی که می تواند می تواند آستانه تصویر سنجش از دور را با تقسیم بندی، تکرار کمتر و ثبات و استحکام خوب بهبود بخشد. یک مجموعه فازی مجموعه ای از نقاط پیوستگی کلاسی از نمرات عضویت بدون مرز تند است.تصاویر سطح خاکستری توسط انتخاب یک مقدار استانه T  به تصاویر باینری تبدیل می شوند و بنابراین تصویر باینری باید حاوی اطلاعات در مورد موقعیت و شکل اشیاء، پیش زمینه باشد.

در مناطق آستانه بر اساس مقادیر محدوده طبقه بندی شده به مقدار شدت پیکسل تصویر  اعمال شده و پیکسل ها با استفاده از مقادیر محدوده یا مقادیر Threshold  طبقه بندی می شوند:

 1) آستانه جهانی: که در آن یک آستانه واحد در کل تصویر استفاده می شود

 2) مقدار آستانه محلی (سازگار) به هر پیکسل اختصاص داده می شود تا تعیین شود که آیا متعلق به پیش زمینه یا پس زمینه است

 3)مقدار سوم آستانه T با تجزیه و تحلیل هیستوگرام های تصویر که می تواند یکی از دو مدل باشد انتخاب می شود:1) هیستوگرام های چند منظوره اول دو پیک و یک دره اشکار(واضح)، T نقطه دره، 2)هیستوگرام های چندمنظوره پیچیده تر است، با بسیاری از قله ها و دره های اشکار نیست ، بنابراین انتخاب  مقدار Tاستانه اسان نیست. 


 

تکنینک های استانه (Threshold Technique):


الف) تکنیک میانگین: از میانگین مقدار پیکسل ها به عنوان مقدار آستانه استفاده می کند.


ب) P-Tile Techniqu:یکی از اولین روش های آستانه، که از دانش استفاده می کند.اندازه ناحیه شیء و بر اساس هیستوگرام سطح خاکستری، فرض می کند که اشیاء درخشان تر از پس زمینه هستند و یک درصد ثابت، P٪ از منطقه تصویر را اشغال می کنند.

کاربردها: مناسب برای تمام اندازه از اشیاء

مزایا: ساده و دارای قابلیت ضد نویز خوب است.

معایب: در صورتی که نسبت منطقه شیء ناشناخته یا تغییر کند، این قابل اجرا نیست .


ج)تکنیک وابسته هیستوگرام (HDT):وابسته به موفقیتی از  برآورد مقدار آستانه که دو منطقه همگن از شی و پس زمینه را جدا می کند.

کاربردها: برای تصویر با همگن بزرگ و مناطق جداگانه مفید است.

د) تکنیک حداکثر سازی لبه (EMT)

بستگی به حداکثر لبه دارد که تکنیک های شناسایی لبه، آستانه برای شروع اگزتاسیون و عملکرد اتوماتیک آستانه بسیار بهتر می شود .

کاربردها: برای تصویر با بیش از یک منطقه همگن.

مزایا: اجتناب از ادغام بین شی و پس زمینه


 د) روش بصری: راه جدید، به عنوان P-tile

  معایب: زمانی که تکنیک های آستانه به طور کلی برای برنامه های ساده مناسب هستند انرا فعال نکنید .دلیل تصویر باینری  و روش تقسیم بندی به صورت محاسباتی ارزان و سریع، ساده ترین و به طور گسترده ای برای تقسیم بندی تصویر استفاده می شود و آستانه چند سطحی برای جداسازی تصاویر پیچیده است


ه)روش براساس لبه یا مرز:تکنیک های شناسایی لبه ها یا مرزها تصاویر را با استفاده از تغییرات رنگ های خاکستری در تصاویر به لبه های تصاویر تبدیل می کنند، لبه ها نشانه عدم تداوم و پایان دادن است. اشیاء شامل بخش های متعددی از سطوح مختلف رنگ می باشند، Edges تغییرات محلی در شدت تصویر است و Edges در مرز بین دو منطقه رخ می دهند.


آستانه اتوماتیک:  مقدار آستانه انتخاب شده برای هر تصویر توسط سیستم بدون دخالت انسان.


انواع لبه ها :

 همانطور که در شکل 4 نشان داده شده است، لبه گام، شدت تصویر به طور ناگهانی از یک مقدار در یک طرف از عدم قطع به یک مقدار متفاوت در طرف مقابل تغییر می کند. خط لبه، شدت تصویر به طور ناگهانی مقدار را تغییر می دهد، اما سپس به مقدار شروع در فاصله کوتاه بازگشت می کند. با این حال، لبه های گام و خط در تصاویر واقعی نادر هستند، زیرا اختلالات شدید در سیگنال های واقعی به ندرت وجود دارد. لبه های رمپ واقعیت لبه های گام. لبه سقف لبه های خط راست.

 

مراحل تشخیص لبه:


اولین گام فیلتر: فیلتر اطلاعات غیر ضروری که نویز نام دارد که تغییرات تصادفی در مقدار شدت ، در حالی که نتایج فیلتر کردن بیشترین نویزهمراه با صدای شکست در قدرت لبه را دارد.


 دومین گام ارتقاء :تسهیل تشخیص لبه ها با تعیین تغییرات شدت محدوده مختصات نقطه.


 سومین گام تشخیص: تعیین نقاط لبه، در حالی که بسیاری از لبه های نقاط در یک تصویر دارای یک مقدار غیر صفر برای شیب هست.


انواع عدم انطباق:

در سطح خاکستری Point، Line و Edges هستند و ماسک های فضایی برای تشخیص  تمام انواع اختلالات  استفاده می شود.


 روش تشخیص Edge:

اندازه گیری های گرادیان فضایی دو بعدی در یک تصویر  به شرح زیر است:


 2-1 تشخیص رابرتز: اپراتور صلیب ساده برای محاسبه سریع، مقدار پیکسل خروجی نقطه در هر یک از مقادیر شیب فضایی نقطه ورودی راا انجام می دهد.


Detection 2-1-1 Prewitt  :  برآورد شدت و جهت یک لبه با استفاده از محله های 3*3 برای هشت جهت محاسبه می شوند.


2-1-2Sobel Detection : یک هسته، 3*3، 90درجه چرخانده می شود..



رویکرد نرم افزار ی  تشخیص لبه:


2.2.1 رویکرد مبتنی بر منطق فازی


پیکسل ها به مجموعه های فازی تقسیم می شوند، به طور مثال هر پیکسل ممکن است بخشی از مجموعه ها و نقاط مختلف تصویر باشد وشکل زیر قوانین فازی برای تشخیص لبه و محدوده یک پیکسل مرکزی تصویر را نشان می دهد.


 2-2-2روش الگوریتم ژنتیک:


حاصل از نظریه تکامل که شامل سه عملیات عمده انتخاب، تقاطع و جهش است، GA در برنامه های به رسمیت شناختن الگو استفاده می شود.


رویکرد شبکه عصبی:


تفاوت های مهم بین شبکه های عصبی و سایر تکنیک های ایمنی مصنوعی وجود دارد، توانایی های آنها برای یادگیری و تعمیم دادن. شبکه با استفاده از تنظیمات "یاد می گیرد"  اتصال، وزن، بین لایه ها، خروجی مربوط به مجموعه داده های ورودی را تعمیم می دهد.شبکه عصبی مصنوعی (ANN ) برای تشخیص الگو اعمال می شود، خود سازماندهی از   Kohonen  ویژگی نقشه،شبکه یک ابزار برای خوشه بندی است. شبکه عصبی شامل سه لایه است: لایه ورودی، لایه مخفی و لایه خروجی همانطور که در شکل 11 نشان داده شده است. یک نورون بین انها [0-1] به عنوان ورودی و خروجی نرمال شده است. هر لایه دارای (I,j) اندازه تصویر و نورون است و هر نورون با نورون مربوطه در لایه قبلی متصل شده. 6 روش تشخیص لبه برای تصویر وجود دارد و به طور کلی تکنیک های لبه یا مرزی دارای ویژگی های زیر هستند:


کاربردها: پردازش تصویر پزشکی، بیومتریک و غیره


مزایا: در تجزیه و تحلیل تصویر تشخیص لبه مهم است، مهمترین ویژگی ها را می توان از لبه ها (از جمله گوشه ها، خطوط، منحنی ها) استخراج کرد. اینها ویژگی های که توسط الگوریتم های بینایی کامپیوتری با سطح بالا (به عنوان مثال، شناخت) استفاده می شوند.


 نمونه های ارزیابی تقسیم بندی تصویر:


بسیاری از الگوریتم های تقسیم بندی تصویر مورد بحث قرار گرفته اند و واضح است که هیچ روش جهانی پذیرفته شده برای تقسیم بندی تصویر وجود ندارد بنابراین هیچ روش واحدی برای همه نوع تصاویر وجود ندارد و همچنین همه روش ها به همان اندازه برای یک نوع خاصی از تصویر خوب هستند. به همین علت، هیچ روش جهانی پذیرفته برای ارزیابی تقسیم بندی تصویر وجود ندارد، بنابراین تکنیک های ارزیابی که محققان برای ارزیابی تکنیک های تقسیم بندی تصویر بر اساس عوامل مختلف مانند نوع تصویر، کاربرد و غیره متغیر هستند، وجود دارد.

 بنابراین دو مثال از نحوه ارزیابی تکنیک های تقسیم بندی تصویر به شرح زیر ارائه می شود:

 ارزیابی تکنیک های تقسیم بندی تصاویرمبتنی بر PDF و ارزیابی تکنیک های تجزیه و تحلیل تصاویر مبتنی بر کلاس شی

مثال 1: ارزیابی تقسیم بندی تصاویر PDF : مقایسه تکنیک مبتنی بر ضریب AC و تکنیک مبتنی بر هیستوگرام برای استخراج بخش متن از تصاویر PDF  


تکنیک های تقسیم بندی متن :

تقسیم بندی متن جدا کردن پیکسل های متن از پس زمینه است استراتژی ها به رنگ متن، اندازه و فونت و پس زمینه دلخواه حساس هستند زیرا به سادگی با استفاده از روش تقسیم بندی کلی یا برخی از دانش های قبلی، آنها را به 6 سری تقسیم می شوند:

1- براساس تفاوت یا از بالا به پایین، روش هایی مانند مقدار آستانه ثابت، آستانه تطبیقی و آستانه جهانی و محلی.آنها عبارتند از: بر اساس کنتراست پس زمینه پیش زمینه. ساده و سریع و شکست زمانی که پیش زمینه و پس زمینه شبیه هستند.

2- براساس شباهت یا از پایین به بالا روش هایی مانند تقسیم و ادغام، تشخیص لبه، تبدیل واترشید(اب پخشان) و خوشه بندی. آنها عبارتند از: پیکسل های خوشه ای با شدت های مشابه با هم و غیر قابل انعطاف؛ آنها از قوانین شکل متن استفاده می کنند.

3. تبدیل خواص پیکسل متن به برچسب گذاری که مشکل است موثر اما وقت گیر.

4-ترکیبی         

   

تکنیک های مبتنی بر ضریب AC:

ضریب AC که در طول (DCT) انتقال کسینوس مجزا ، به منظور تقسیم تصویر به سه بلوک معرفی شده است.

زمینه: مناطق صاف تصویر، متن

گرافیک: تراکم بالا لبه های تیز

تصویر: قسمت غیر صاف از تصویر PDF


تکنیک مبتنی بر هیستوگرام:

تصویر با استفاده از یک سری قوانین تصمیم گیری از نوع بلوک با بالاترین اولویت به نوع بلوک با کمترین اولویت تقسیم می شود، تصمیم گیری برای بلوک صاف و متن ساده است. هیستوگرام بلوک های صاف یا متن تحت تأثیر یک یا دو مقدار شدت (حالت ها) قرار دارد. مقدار شدت به صورت حالت تعریف می شود اگر فرکانس آن دو شرایط را برآورده کند: این حداکثر محلی است و احتمال تجمعی اطراف آن بالاتر از یک آستانه پیش تعیین شده است.


استخراج متن:

تقسیم تصویر به منطقه صاف (پس زمینه) و منطقه غیر صاف (مناطق متن یا منطقه تصویر).

در تکنیک مبتنی بر ضریب AC در حالی که بخش بندی کردن تصویر PDF، پس زمینه به عنوان بلوک های صاف شناخته می شود وپیش زمینه (بلوک غیر صاف)، با استفاده از الگوریتم K-means که به این ترتیب بخش متن از تصویر PDF استخراج می شود.

در تکنیک مبتنی بر هیستوگرام، تصویر PDF به بلوک  16*16 تقسیم شده و سپس توزیع هیستوگرام برای هر پیکسل محاسبه می شود. گروه بندی پیکسل ها، پیکسل های پائین، متوسط و بالا انجام می شود. مقدار آستانه برای محاسبه مقدار برای شناسایی بلوک متن و بلوک تصویر اختصاص داده شده است .

روش مبتنی بر ضریب AC که در آن زمان مصرف بیشتر است، در حالی که سرعت دقت در تکنیک مبتنی بر هیستوگرام بهتر است .بنابراین کاربر، محقق می تواند زمان را با دقت تعادل کند.


 نتیجه گیری:

روش های تقسیم بندی تصویر بلوک دو دسته اصلی هستند: منطق مبتنی بر لبه یا مرز،  مبتنی بر ناحیه و هر یک از آنها را به چند تکنیک تقسیم می شود. تصویر با استفاده از یک سری تصمیم گیری تقسیم شده و هیچ نوع روش تقسیم بندی جهانی برای انواع تصاویر وجود ندارد و همچنین می توان با استفاده از روش های مختلف تقسیم بندی یک تصویر را تقسیم کرد، تقسیم بندی تصویر یک چالش در پردازش تصویراست.

 

 

 

 

 

 

 





نظرات (0)
امکان ثبت نظر جدید برای این مطلب وجود ندارد.