CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی
CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی

تحلیل شبکه چند متغیره داده ها در علم روانشناسی

 

چکیده

در سالهای اخیر، تحلیل شبکه برای شناسایی و تحلیل الگوها ارتباط آماری در دادههای روانشناختی چند متغیره به کار گرفته شده است. در این رویکردها، گرههای شبکه، متغیرها را در یک مجموعه داده نشان می‌دهند و یال‌ها نشان‌دهنده روابط شرطی زوجی بین متغیرها در دادههاست، در حالی که به متغیرهای باقی مانده شرطی میشوند. این پرایمر یک آناتومی این تکنیک‌ها، وضعیت فعلی را توصیف می‌کند و مسائل باز را مورد بحث قرار می‌دهد. ما ساختارهای داده مربوطه را شناسایی می‌کنیم که تحلیل شبکه ممکن است در آنها اعمال شود: داده‌ها مقطعی، اندازه‌گیری‌های مکرر و داده‌های طولی فشرده. سپس در مورد تخمین ساختارهای شبکه و همچنین تکنیک‌های ارزیابی برای ارزیابی شبکه استحکام و تکرارپذیری در هر یک از این موارد بحث می‌کنیم. کاربردهای موفقیت‌آمیز تکنیک در زمینه‌های مختلف تحقیقاتی برجسته می‌شوند. در نهایت، محدودیت‌ها و چالش‌های تحقیقات آینده را مورد بحث قرار می‌دهیم.

 

 

در بسیاری از زمینههای علمی، پژوهشگران به مطالعه بهترین مشخصه در سطح سیستم پدیدهها میپردازند [۱]. فهمیدن چنین پدیدههایی، اغلب تمرکز بر روی نحوه عملکرد اجزای منفرد یک سیستم کافی نیست. بجای آن، باید سازماندهی اجزایی از سیستم را  که میتوانند در یک شبکه نمایش داده شوند را مطالعه کرد [۲]. ارزش تجزیه و تحلیل ساختار یک سیستم در این است راه با ظهور علم شبکه تاکید شده است، که بینشهای مهمی را ارائه کرده است مجموعه های متنوعی از پدیده های مورد مطالعه در علوم [3 ،4] . این پرایمر روش‌شناسی را برای اعمال این خط استدلال برای تجزیه و تحلیل آماری دادههای چند متغیره را مورد بحث قرار میدهد.

رویکردهای شبکه شامل شناسایی اجزای سیستم (گرههای شبکه) و روابط میان آنها (پیوندهای بین گرهها) است. مثال‌های معروف شامل شبکه‌های معنایی (که مفاهیم در آن از طریق معانی مشترک به هم متصل میشوند [۵])، شبکههای اجتماعی (که در آن افراد از طریق آشنایی با یکدیگر ارتباط دارند [۶]) و شبکههای عصبی (که در آن نورونها از طریق آکسون به هم متصل هستند [۷]). پس از شناسایی گرهها و پیوندها، شبکهای ساخته شده است، که میتوان توپولوژی آن را با استفاده از ابزارهای توصیفی علوم شبکه مطالعه کرد [8]. به عنوان مثال، میتوان توپولوژی جهانی یک شبکه را توصیف کرد (مانند یک شبکه جهان کوچک یا گراف تصادفی [9]) یا موقعیت گرههای جداگانه در شبکه (به عنوان مثال، با ارزیابی مرکزیت گره[1][10]). اینها تجزیه و تحلیل اغلب با هدف ارتباط ویژگیهای ساختاری شبکه به دینامیک سیستم انجام میشود [4 ،11].

بازنماییهای شبکه دارای سابقه طولانی به اندازه ابزارهای تحقیق در آمار است، درحالی که آنها اطلاعات مهم مربوط به توزیع احتمال مشترک مجموعهای از متغیرها را رمزگذاری میکنند [12]. به عنوان مثال، در مدلهای گرافیکی، گرههای غیر متصل به صورت مشروط تمام یا زیر مجموعهای از گرههای دیگر در شبکه مستقل هستند [12]. در مدلهای علی، معیارهای گرافیکی برای تعیین اینکه آیا پارامترها در مدل علّی تخمین زده شده شناسایی میشوند استفاده میشوند. و در مدلهای معادلات ساختاری، قوانین مسیریابی در نمایش شبکه برای تعیین مقدار همبستگیهای تجربی القا شده توسط مدل استفاده میشود [14].

در این آغازگر[2]، ما تحلیل شبکه دادههای چند متغیره را به عنوان روشی که هم آمار چند متغیره و هم علم شبکه را برای بررسی ساختار روابط در داده های چند متغیره ارائه میکنیم. این رویکرد گرههای شبکه را با متغیرها و بین گره‌ها پیوند برقرار می‌کند و آنها را با پارامترهای آماری که این متغیرها را به هم متصل می‌کنند (مثلاً همبستگی‌های جزئی) توصیف می‌کند. از مدلهای آماری در ارزیابی پارامترهایی که پیوندها را در شبکه تعریف میکنند استفاده میشود، در فرآیندی که به عنوان تخمین ساختار شبکه[3] شناخته میشود. سپس، با استفاده از یک فرآیند توصیف شبکه[4]، شبکه‌ای با استفاده از ابزارهای علوم شبکه حاصل میشود [15-17] . در اینجا، ما به این روش ترکیبی تخمین ساختار شبکه و توصیف شبکه به عنوان تحلیل شبکه روانسنجی[5] اشاره میکنیم (شکل 1).

میتوان از رویکردهای شبکه برای دادههای چند متغیره برای پیشبرد چندین هدف مختلف استفاده کرد. اول، میتوانند برای بررسی ساختار دادههای با ابعاد بالا در عدم وجود نظریه قبلی قوی در مورد چگونگی ارتباط متغیرها باشد. در این تحلیل‌ها، تحلیل شبکه روان‌سنجی تکمیل کننده تکنیک‌های موجود برای اکتشاف تجزیه و تحلیل دادههای روانشناختی است، مانند تحلیل عاملی اکتشافی[6] (که هدف آن نشان دادن واریانس مشترک به دلیل تعداد کم متغیرهای پنهان است) و مقیاسبندی چند بعدی (که هدف آن نشان دادن روابط شباهت بین اشیاء در ابعاد کم فضای متریک است). تمرکز منحصر به فرد تحلیل شبکه روانسنجی بر روی الگوهای شرطی زوجی وابستگیهایی که در دادهها وجود دارد است. دومین، از بازنماییهای شبکه میتوان برای برقراری ارتباط الگوهای چند متغیره در وابستگی‌های موثر استفاده کرد، زیرا آنها تجسم قدرتمندی از الگوهای آماری مرتبط[7] ارائه میدهند. سوم، مدلهای شبکه میتواند مورد استفاده فرضیههای علّی ایجاد میکنند قرار گیرد، زیرا آنها بازنمایی ساختارهای آماری هستند که ممکن است سرنخهایی برای پویایی علی ارائه دهند؛ به عنوان مثال، شبکههایی که روابط استقلال شرطی[8] از دروازهای را بازنمایی میکنند که همبستگیها را به روابط علی متصل میکند [13 ،18 ، 19].

در اینجا، این توابع تحلیل شبکه را در زمینه سه نوع کاربرد در علم روانشناسی بررسی میکنیم، آنها را با مثالهایی از تحقیق در مورد شخصیت، نگرش و سلامت روان به تصویر میکشیم.

 

شکل 1 | ساختار تحلیل شبکه روانسنجی. توزیع احتمال مشترک دادههای چند متغیره مشخص شد از نظر انجمنها و استقلالهای مشروط. استقلالهای شرطی به گرههای جدا شده تبدیل میشوند. انجمنهای شرطی به پیوندهایی بین گرهها تبدیل میشوند که معمولاً با قدرت ارتباط وزن میشوند. ساختار حاصل متعاقباً به عنوان یک شبکه توصیف و تحلیل میشود.



[1] Node Centrality

[2] Primer

[3] Network Structure Estimation

[4] Network Description

[5] Psychometric Network Analysis

[6] Exploratory Factor Analysis

[7] Patterns of Statistical Association

[8] Conditional Independence Relations

نظرات 0 + ارسال نظر
ایمیل شما بعد از ثبت نمایش داده نخواهد شد