CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی
CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی

بررسی تکنیک‌های انتخاب ویژگی و استخراج ویژگی در یادگیری ماشین

کاهش ابعاد در پیش پردازش تجزیه و تحلیل دادههای با ابعاد بالا، تجسم[1] و مدلسازی گسترده است. یکی از سادهترین راهها برای کاهش ابعاد توسط انتخاب ویژگی است؛ فقط یکی از آن ابعاد (ویژگی) ورودی را که حاوی اطلاعات مربوطه برای حل مسئله خاص را انتخاب میکند. استخراج ویژگی روش کلیتری است که در آن فرد برای ایجاد تبدیل فضای ورودی به زیرفضای کم بعدی تلاش میکند که بیشتر موارد اطلاعات مربوطه را حفظ میکند [۱]. روشهای استخراج ویژگی و انتخاب ویژگی به صورت ایزوله یا در ترکیب با هدف بهبود عملکردهایی مانند دقت تخمینی[2]، تجسم و قابل درک بودن دانش آموخته شده[3] استفاده میشود [2]. به طور کلی، ویژگیها را میتوان به عنوان: مرتبط، نامربوط یا زائد[4] طبقهبندی کرد. در فرآیند انتخاب ویژگی یک زیر مجموعه از دادههای ویژگیهای موجود برای فرآیند یادگیری الگوریتم انتخاب میشوند. بهترین زیرمجموعهای که دارای کمترین تعداد ابعاد کمک به دقت یادگیری[5] است [3].



[1] Visualization

[2] Estimated Accuracy

[3] Comprehensibility of Learning Knowledge

[4] Relevant, Irrelevant, or Redundant

[5] Learning Accuracy