دیابت یکی از بیماریهای مشترک و رو به رشد در کشورهای مختلف است که محققان دنیا در تلاش هستند تا بتوانند روشی به منظور جلوگیری از این بیماری را ارائه دهند. دیابت یک بیماری مزمن غیر مسری است. رشد این بیماری با افزایش غیر طبیعی سطح گلوکز در خون میباشد که به دو دسته تقسیم میشود که شامل نوع اول دیابت است که با تولید ناکافی انسولین توسط لوزالمعده روی می دهد و دوم، دیابت نوع دو است که شکست سلول ها در پاسخ موثر به تولید انسولین توسط لوزامعده می باشد. این بیماری از جانب سازمان سلامت جهانی و فدراسیون دیابت جهانی از زمان رشد پیوسته دیابت، از نزدیک دنبال و مورد توجه قرار گرفته است. بیان شده است. با توجه به آمار که روزانه نیز بر اساس گزارشات فدراسیون دیابت جهانی در حال رشد است، کنترل، پیش گیری و شناسایی زودهنگام آن می تواند در رشد این بیماری کمک نماید [1].
انفورماتیک پزشکی مدیون ساختارهای پردازش، ذخیره سازی و انتشار اطلاعات برای حوزه های گوناگون در زمینه پزشکی است. هدف اصلی در پشت همه تلاش ها به منظور طبقه بندی، خوشه بندی، و استخراج ویژگی از داده های موجود این است که بتوان سیستم پشتیبان تصمیم گیری ساخت که به انسان در زمینه شناسایی و تشخیص بیماری ها کمک کند[1].
اخیرا روش های داده کاوی به صورت گسترده به منظور تشخیص و توسعه بیماری های پیشرفته به کار گرفته می شوند. تحقیقات اخیر نشان می دهد که سیستم طبقه بند با دقت بالا بر روی داده های مختلف در شرایط یکسان تا به امروز ارائه نشده است. روش های داده کاوی به عنوان ابزاری برجسته در پایگاه داده های پزشکی به کار گرفته می شوند. این روش ها می توانند پنجره ای جدید به سوی شناسایی و تشخیص در بیماری ها را نمایه سازی کنند که به پیشرفت علم و همین طور کاهش بیماری در جوامع مختلف کمک شایانی می نماید[2].
یادگیری عمیق، علیرغم نتایج امیدوارکننده برای برخی موارد خاص، هنوز در عملکردهای عمومی در حوزه بهداشت و درمان انقلابی ایجاد نکرده است. یکی از دلایل تا حدی مریوط به کم بودن داده ها برای آموزش مدل ها می باشد. برای رسیدگی به این مسئله، داده ها از چندین منبع توسط متصدیان بهداشت یا بیماران می تواند ترکیب شود و از ناهمگنی آنها با استفاده از انتقال یادگیری استفاده می کنند.
د - اهمیت و ضرورت انجام تحقیق (شامل اختلاف نظرها و خلاءهای تحقیقاتی موجود، میزان نیاز به موضوع، فواید احتمالی نظری و عملی آن و همچنین مواد، روش و یا فرآیند تحقیقی احتمالاً جدیدی که در این تحقیق مورد استفاده قرار میگیرد:
ﺑﯿﻤﺎری ﻗﻨﺪ ﯾﺎ ﺑﻪ ﻋﺒـﺎرت دﯾﮕـﺮ دﯾﺎﺑـﺖ، ﺑﯿﻤـﺎری ﻣﺰﻣﻨــﯽ اﺳــﺖ ﮐــﻪ در ﻧﺘﯿﺠــﻪ اﺧــﺘﻼل در ﺗﻮﻟﯿــﺪ و ﻋﻤﻠﮑﺮد اﻧﺴﻮﻟﯿﻦ در ﺑﺪن ﺑﻪ وﺟﻮد ﻣﯽ آﯾﺪ. اﻧﺴـﻮﻟﯿﻦ ﻫﻮرﻣﻮﻧﯽ اﺳﺖ ﮐﻪ در ﻟﻮزاﻟﻤﻌﺪه ﺗﻮﻟﯿـﺪ ﻣﯽ ﺷﻮد و ﺳﻠﻮل ﻫﺎ را ﻗﺎدر ﻣﯽ ﺳﺎزد ﺗـﺎ ﮔﻠـﻮﮐﺰ را از ﺧﻮن ﮔﺮﻓﺘﻪ و ﺑـﺮای تولید اﻧـﺮژی اﺳـﺘﻔﺎده ﮐﻨـﺪ. ﻟﻮزاﻟﻤﻌﺪه ﻓﺮد ﻣﺒﺘﻼ ﺑﻪ دﯾﺎﺑﺖ، اﻧﺴـﻮﻟﯿﻦ ﻣـﻮرد ﻧﯿـﺎز ﺑﺪن را ﺗﻮﻟﯿﺪ ﻧﻤﯽﮐﻨﺪ ﮐﻪ ﻣﻮﺟﺐ دﯾﺎﺑـﺖ ﻧـﻮع ﯾـﮏ ﻣﯽ ﺷﻮد و ﯾﺎ اﻧﺴﻮﻟﯿﻦ ﮐﺎراﯾﯽ ﻻزم را در ﺑﺪن اﻓـﺮاد ﻧﺪارد ﮐﻪ ﻣﻮﺟﺐ دﯾﺎﺑﺖ ﻧﻮع دو ﻣﯽ ﺷﻮد. ﻣﻘﺎوﻣﺖ ﺑﻪ اﻧﺴــﻮﻟﯿﻦ و ﻫﻤﭽﻨــﯿﻦ ﺗﺮﺷــﺢ ﻧﺎﮐــﺎﻓﯽ اﻧﺴــﻮﻟﯿﻦ درﭘﯿﺪاﯾﺶ دﯾﺎﺑﺖ ﻧـﻮع دو دﺧﺎﻟـﺖ دارﻧـﺪ. ﺑﻨـﺎﺑﺮاﯾﻦ اﻓﺮاد دﯾﺎﺑﺘﯽ ﻧﺴﺒﺖ ﺑﻪ اﻓﺮاد ﺳﺎﻟﻢ ﻗﺎدر ﻧﺨﻮاﻫﻨﺪ ﺑﻮد ﺑــﻪ ﺧــﻮﺑﯽ از ﮔﻠــﻮﮐﺰ در ﺳــﻮﺧﺖ و ﺳــﺎز ﺑﺪﻧﺸــﺎن اﺳﺘﻔﺎده ﮐﻨﻨﺪ و ﻗﻨﺪ ﺧﻮن در اﯾﻦ اﻓﺮاد ﺑﻪ ﻃﻮر ﻗﺎﺑﻞ ﻣﻼﺣﻈﻪ ای اﻓﺰاﯾﺶ ﺧﻮاﻫﺪ ﯾﺎﻓﺖ. دﯾﺎﺑﺖ ﻋﻮارض ﺑﺴﯿﺎری دارد و ﺷـﺎﯾﻊ ﺗـﺮﯾﻦ ﻋﻠـﺖ ﻗﻄﻊ اﻧﺪام، ﻧﺎﺑﯿﻨﺎﯾﯽ و ﻧﺎرﺳﺎﯾﯽ ﻣﺰﻣﻦ ﮐﻠﯿﻮی و ﯾﮑﯽ از مهمترین ﻋﻮاﻣﻞ ﺧﻄﺮ در اﯾﺠﺎد ﺑﯿﻤﺎری ﻫﺎی ﻗﻠﺒﯽ است. اﮔﺮﭼﻪ ﭘﯿﺸﮕﯿﺮی ﮐﺎﻣـﻞ از ﻋـﻮارض اﯾـﻦ ﺑﯿﻤﺎری اﻣﮑﺎن ﭘﺬﯾﺮ ﻧﯿﺴﺖ، وﻟﯽ ﺑﺎ ﮐﻨﺘﺮل دﻗﯿﻖ ﻗﻨﺪ ﺧﻮن ﻣﯽ ﺗﻮان آن ﻫﺎ را ﺑﻪ ﺗﻌﻮﯾﻖ اﻧﺪاﺧﺖ. ﻫﺪف اوﻟﯿﻪ از درﻣﺎن دﯾﺎﺑﺖ ﻧﯿﺰ ﺣﻔﻆ ﺳﻄﺢ ﻗﻨﺪ ﺧـﻮن ﻧﺰدﯾـﮏ به محدوده نرمال است. از اﯾﻦ رو رﻋﺎﯾﺖ رژﯾـﻢ ﻏﺬاﯾﯽ و اﻧﺠﺎم ﻓﻌﺎﻟﯿﺖ ﻫـﺎی ﺣﺮﮐﺘـﯽ و ورزﺷـﯽ ﺑـﻪ ﻫﻤﺮاه درﻣﺎن داروﯾﯽ ﺳﺒﺐ ﺑﻬﺒﻮد ﮐﻨﺘﺮل ﻗﻨﺪ ﺧـﻮن و ﻣﻘﺎوﻣﺖ اﻧﺴﻮﻟﯿﻨﯽ ﺷـﺪه و ﮐﯿﻔﯿـﺖ زﻧـﺪﮔﯽ ﻓـﺮد ﺑﯿﻤﺎر را اﻓﺰاﯾﺶ داده و اﺑﺘﻼ ﺑﻪ ﻋﻮارض اﯾﻦ ﺑﯿﻤـﺎری را ﺑﻪ ﺗﻌﻮﯾﻖ ﻣﯽ اﻧﺪازد. ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺷﯿﻮع ﻓﺰاﯾﻨﺪه اﯾﻦ ﺑﯿﻤﺎری، ﺑﻪ ﯾﮑـﯽ از ﭼﺎﻟﺶ ﻫﺎی ﻣﻬـﻢ رو در روی ﻣﺴـﺌﻮﻟﯿﻦ ﺑﻬﺪاﺷـﺖ و درﻣﺎن ﮐﺸﻮرﻫﺎی ﻣﺨﺘﻠﻒ دﻧﯿﺎ، ﭼﻪ در ﺣﺎل ﺗﻮﺳـﻌﻪ و ﭼﻪ ﭘﯿﺸﺮﻓﺘﻪ، ﺗﺒـﺪﯾﻞ ﺷـﺪه اﺳـﺖ.
برای بهبود کیفیت انتقال بین چندین منبع از داده ها، ما یک یادگیری انتقال چند منبع را پیشنهاد می دهیم. چارچوبی که یادگیری ویژگی را امکان پذیر می کند که در منابع مشابه است، و بنابراین کلی تر و به راحتی قابل انتقال است. ما این ایده را در پیش بینی گلوکز برای افراد دیابتی به کار می بریم که از یک شبکه عصبی کاملا کانولوشن[1] استفاده می کنند. ارزیابی با بررسی سناریوهای مختلف انتقال انجام می شود با سه مجموعه داده که با ویژگی های داخلی مشخص می شوند.
تنوع در حالی که انتقال دانش به طور کلی مفید است، ما نشان می دهیم که دقت آماری و بالینی می تواند با استفاده از روش یادگیری بهبود یابد. به طور خاص، هنگامی که با استفاده از داده های مجموعه داده های مختلف، و یا هنگامی که تعداد داده ها در یک وضعیت درون مجموعه داده بسیار کم است بهتر عمل می نماید. برای درک رفتار از مدل ها، و نمایش ویژگی های آموخته شده را تجزیه و تحلیل می کنیم و معیار جدیدی را در این زمینه پیشنهاد می دهیم.
ه- مرور ادبیات و سوابق مربوطه (بیان مختصر پیشینه تحقیقات انجام شده در داخل و خارج کشور پیرامون موضوع پزوهش و نتایج آنها و مرور ادبیات و چارچوب نظری پژوهش):
در [3] یک طبقه بندی غیرخطی با استفاده از منطق فازی برپایه الگوریتم ژنتیک بر روی داده های چندگانه از جمله داده های دیابت، فشار خون، سرطان سینه و داده آیریس[2] ارائه شده است که نتایج حاکی از دقت نسبتا بالای این پژوهش نسبت به سایر روش های پیشین از جمله نایو بیزین[3]، رگرسیون[4]، شبکه عصبی تابع پایه شعاعی[5] و چند روش دیگر است. داده های استفاده شده در زمینه دیابت، مجموعه داده PIMA Indian است. در [4] استفاده از روش لونبرگ مارکارد[6] به منظور ارزیابی کارایی در کاهش خطا در زمان طبقه بندی داده های دیابتی انجام گرفته است. این پژوهش از مجموعه داده های PIMA Indian استفاده کرده است. الگوریتم آموزشی به صورت پویا به شبکه عصبی جهت کاهش خطا اعمال شده است و توسط آموزش پیوسته شبکه تا زمان رسیدن به مرحله موثر بهینه، داده شده است. شبکه عصبی به کار گرفته شده در این پژوهش، شبکه عصبی پرسپترون چندلایه[7] است و از حداقل میانگین خطا[8] جهت ارزیابی استفاده شده است.
در [5] یک مقایسه برای طبقه بندی کننده های موجود استفاده شده برای پیش بینی دیابت انجام گرفته است. روش های پیشینی چون درخت تصمیم[9]، شبکه عصبی مصنوعی[10]، رگرسیون منطقی[11] و نایو بیزین مورد بررسی واقع شده اند. سپس روش ارائه شده مقاله به نام بگینگ و بوستینگ[12] برای ارتقای کارایی و پیش بینی مقاوم در داده های دیابت انجام گرفته است. داده های استفاده شده در این پژوهش مربوط به داده های بیماران دیابتی در کشور تایلند است. در [6] روشی برای پیش بینی دیابت با استفاده از روش طبقه بندی در داده کاوی ارائه شده است که تحلیل ارزیابی نیز انجام می دهد. استفاده از روش آدابوست[13] برپایه درخت تصمیم C4.5 به عنوان بخش آموزش دهنده داده ها مورد استفاده واقع شده است. نتایج به دست آمده نشان می دهد که روش ارائه شده نسبت به روش بوستینگ و بگینگ دارای کارایی بیشتری است. داده استفاده شده نیز CPCSSN [14] می باشد.
با انگیزه ایجاد شده توسط موفقیت های اخیر در تشخیص تصویر [7] یا پردازش زبان طبیعی [8]، استفاده از یادگیری عمیق در زمینه پزشکی نتایج امیدوار کننده ای را نشان داده است (به عنوان مثال، تشخیص رتینوپاتی دیابت[15] [9]، طبقه بندی سرطان پوست [10] یا تشخیص سرطان پستان [11]). با این حال، یادگیری عمیق هنوز انقلابی در مراقبت های بهداشتی ایجاد نکرده است شیوه هایی که کاربرد آنها با چالش های مختلفی روبرو است [12]. در حالی که برخی از مدل های عمیق با ماهیت آن ارتباط دارند، به عنوان مثال، با قابلیت تفسیر یا قابلیت همکاری مدل ها، چالش های دیگر مربوط به داده ها است. در واقع، داده ها در مقادیر زیاد برای مدل های مبتنی بر یادگیری عمیق جهت موفقیت در وظیفه مورد نیاز است. در حالی که بیشتر برنامه های موفق، موفقیت خود را به داده هایی که در طول سال ها به دست آمده اند مدیون هستند (به عنوان مثال، تصاویر سرطان)، به طور کلی، به دست آوردن داده های مربوط به سلامت در مقادیر کافی، به دلیل ماهیت حساس آنها، نیاز به دانش تخصصی دارد هزینه برچسب زدن آنها زیاد است، به اشتراک گذاری آنها بین ساختارهای مراقبت های بهداشتی دشوار است، و ناهمگن بودن داده ها (به عنوان مثال، سخت افزارهای مختلف، فنوتیپ ها، استانداردها) استفاده همزمان آنها را پیچیده می کند [13].
برای کاهش کمبود اطلاعات موجود، استراتژی های مختلف می تواند در نظر گرفته شود. اول ، داده های اصلی می توانند مصنوعی با بهره برداری از تحولات اساسی داده ها یا با استفاده از شبیه سازی داده ها باشند [14]. روش دیگر، بهره وری از داده ها را می توان افزایش داد، به عنوان مثال روش های یادگیری چند شات[16] [15]. سرانجام می توان دانش قبلی را به منظور کاهش مقدار داده های مورد نیاز برای آموزش به مدل های عمیق[17] القا کرد. این دانش می تواند دامنه خاص[18] دانش تخصصی[19] باشد [16]، یا می توان ابتدا با آموزش مدل روی سایر داده های نیمه مرتبط و سپس پیاده سازی آن به داده های مورد علاقه آن را به دست آورد، که به عنوان یادگیری انتقالی[20] شناخته می شود [17].
یادگیری انتقالی به ویژه در پزشکی به دلیل تنوع منابع موجود جالب است. به عنوان مثال، ما می توانیم دانش را بین چندین بیمارستان منتقل کنیم یا سوابق الکترونیکی سلامت[21]، بین مجموعه داده های مختلف تنظیمات آزمایشی، یا حتی بین بیماران در مورد داروی شخصی[22] شده. بعلاوه، این وضعیت راهی برای ترکیب چندین منبع برای استخراج دانش، معروف به چند-منبع یادگیری انتقالی[23]، زمینه را باز می کند [18]. این امکان باعث استفاده از داده های بیشتر را فراهم می کند، که ممکن است مقادیر در هر منبع جداگانه کافی نباشد. علاوه بر این، فرصتی برای عمومی شدن دانش ایجاد شده را ارائه می دهد و بنابراین به راحتی قابل انتقال است. با این حال، بهره وری از انتقال به شدت به شباهت بین منبع وظایف و وظیفه هدف بستگی دارد، به عنوان یک عدم تجانس[24] زیاد، نشان داده شده است تا یک عامل اصلی در انتقال منفی[25] باشد [19]. این خطر نیز وجود دارد، مدل یاد می گیرد که چگونه داده ها را با منابع مختلف از هم تفکیک کند، و بنابراین آسیب از تعمیم مدل آموخته شده روی می دهد.
گانین[26] و همکاران این مشکل سازگاری را با پیشنهاد یک روش آموزش دامنه خصمانه[27] در زمینه دامنه حل کرد [20]. انطباق دامنه زیرمجموعه یادگیری انتقال است و با یادگیری انتقال عمومی متفاوت است (و بنابراین از یادگیری انتقال چند منبع هم متفاوت است) با آموزش مدل روی داده های منبع (دارای برچسب) و هدف (بدون برچسب) به طور هم زمان. در این تنظیمات، آموزش خصمان دامنه، یک ماژول دامنه منبع را از دامنه هدف ویژگی های استخراج[28] شده را متمایز می کند، و یک ماژول استخراج کننده ویژگی که بر خلاف آن هدف کار می کند. یادگیری یک ویژگی منحصر به فرد[29] به اشتراک گذاشته شده توسط هر دو منبع و هدف این نتیجه دارد.
ی- فرضیههای پژوهش:
ü یادگیری انتقالی به عنوان یک سیستم مدیریت تصمیم گیری با هدف شناسایی و استخراج دانش جدید در سیستم های تشخیص هوشمند پزشکی توانایی بالایی را ارائه می دهد.
ü پیش بینی به عنوان سیستم های مدیریت تصمیم گیری از یادگیری انتقالی قابلیت به کارگیری در تشخیص دیابت را دارد می باشد.
ü استفاده از رویکرد پیشنهادی، قابلیت تشخیص و پیش بینی دیابت را برای پردازش های آتی فراهم می آورد.
ü تضمین رویکرد پیشنهادی با استفاده از معیارهای ارزیابی و مقایسه آن ها با روش های پیشین انجام می شود.
ک- تعریف واژهها و اصطلاحات فنی و تخصصی (به صورت مفهومی و عملیاتی):
دیابت: ﺑﯿﻤﺎری ﻗﻨﺪ ﯾﺎ ﺑﻪ ﻋﺒـﺎرت دﯾﮕـﺮ دﯾﺎﺑـﺖ، ﺑﯿﻤـﺎری ﻣﺰﻣﻨــﯽ اﺳــﺖ ﮐــﻪ در ﻧﺘﯿﺠــﻪ اﺧــﺘﻼل در ﺗﻮﻟﯿــﺪ و ﻋﻤﻠﮑﺮد اﻧﺴﻮﻟﯿﻦ در ﺑﺪن ﺑﻪ وﺟﻮد ﻣﯽ آﯾﺪ. اﻧﺴـﻮﻟﯿﻦ ﻫﻮرﻣﻮﻧﯽ اﺳﺖ ﮐﻪ در ﻟﻮزاﻟﻤﻌﺪه ﺗﻮﻟﯿـﺪ ﻣﯽ ﺷﻮد و ﺳﻠﻮل ﻫﺎ را ﻗﺎدر ﻣﯽ ﺳﺎزد ﺗـﺎ ﮔﻠـﻮﮐﺰ را از ﺧﻮن ﮔﺮﻓﺘﻪ و ﺑـﺮای تولید اﻧـﺮژی اﺳـﺘﻔﺎده ﮐﻨـﺪ. ﻟﻮزاﻟﻤﻌﺪه ﻓﺮد ﻣﺒﺘﻼ ﺑﻪ دﯾﺎﺑﺖ، اﻧﺴـﻮﻟﯿﻦ ﻣـﻮرد ﻧﯿـﺎز ﺑﺪن را ﺗﻮﻟﯿﺪ ﻧﻤﯽﮐﻨﺪ ﮐﻪ ﻣﻮﺟﺐ دﯾﺎﺑـﺖ ﻧـﻮع ﯾـﮏ ﻣﯽ ﺷﻮد و ﯾﺎ اﻧﺴﻮﻟﯿﻦ ﮐﺎراﯾﯽ ﻻزم را در ﺑﺪن اﻓـﺮاد ﻧﺪارد ﮐﻪ ﻣﻮﺟﺐ دﯾﺎﺑﺖ ﻧﻮع دو ﻣﯽ ﺷﻮد. ﻣﻘﺎوﻣﺖ ﺑﻪ اﻧﺴــﻮﻟﯿﻦ و ﻫﻤﭽﻨــﯿﻦ ﺗﺮﺷــﺢ ﻧﺎﮐــﺎﻓﯽ اﻧﺴــﻮﻟﯿﻦ درﭘﯿﺪاﯾﺶ دﯾﺎﺑﺖ ﻧـﻮع دو دﺧﺎﻟـﺖ دارﻧـﺪ. ﺑﻨـﺎﺑﺮاﯾﻦ اﻓﺮاد دﯾﺎﺑﺘﯽ ﻧﺴﺒﺖ ﺑﻪ اﻓﺮاد ﺳﺎﻟﻢ ﻗﺎدر ﻧﺨﻮاﻫﻨﺪ ﺑﻮد ﺑــﻪ ﺧــﻮﺑﯽ از ﮔﻠــﻮﮐﺰ در ﺳــﻮﺧﺖ و ﺳــﺎز ﺑﺪﻧﺸــﺎن اﺳﺘﻔﺎده ﮐﻨﻨﺪ و ﻗﻨﺪ ﺧﻮن در اﯾﻦ اﻓﺮاد ﺑﻪ ﻃﻮر ﻗﺎﺑﻞ ﻣﻼﺣﻈﻪ ای اﻓﺰاﯾﺶ ﺧﻮاﻫﺪ ﯾﺎﻓﺖ. دﯾﺎﺑﺖ ﻋﻮارض ﺑﺴﯿﺎری دارد و ﺷـﺎﯾﻊ ﺗـﺮﯾﻦ ﻋﻠـﺖ ﻗﻄﻊ اﻧﺪام، ﻧﺎﺑﯿﻨﺎﯾﯽ و ﻧﺎرﺳﺎﯾﯽ ﻣﺰﻣﻦ ﮐﻠﯿﻮی و ﯾﮑﯽ از مهمترین ﻋﻮاﻣﻞ ﺧﻄﺮ در اﯾﺠﺎد ﺑﯿﻤﺎری ﻫﺎی ﻗﻠﺒﯽ است. اﮔﺮﭼﻪ ﭘﯿﺸﮕﯿﺮی ﮐﺎﻣـﻞ از ﻋـﻮارض اﯾـﻦ ﺑﯿﻤﺎری اﻣﮑﺎن ﭘﺬﯾﺮ ﻧﯿﺴﺖ، وﻟﯽ ﺑﺎ ﮐﻨﺘﺮل دﻗﯿﻖ ﻗﻨﺪ ﺧﻮن ﻣﯽ ﺗﻮان آن ﻫﺎ را ﺑﻪ ﺗﻌﻮﯾﻖ اﻧﺪاﺧﺖ. ﻫﺪف اوﻟﯿﻪ از درﻣﺎن دﯾﺎﺑﺖ ﻧﯿﺰ ﺣﻔﻆ ﺳﻄﺢ ﻗﻨﺪ ﺧـﻮن ﻧﺰدﯾـﮏ به محدوده نرمال است. از اﯾﻦ رو رﻋﺎﯾﺖ رژﯾـﻢ ﻏﺬاﯾﯽ و اﻧﺠﺎم ﻓﻌﺎﻟﯿﺖ ﻫـﺎی ﺣﺮﮐﺘـﯽ و ورزﺷـﯽ ﺑـﻪ ﻫﻤﺮاه درﻣﺎن داروﯾﯽ ﺳﺒﺐ ﺑﻬﺒﻮد ﮐﻨﺘﺮل ﻗﻨﺪ ﺧـﻮن و ﻣﻘﺎوﻣﺖ اﻧﺴﻮﻟﯿﻨﯽ ﺷـﺪه و ﮐﯿﻔﯿـﺖ زﻧـﺪﮔﯽ ﻓـﺮد ﺑﯿﻤﺎر را اﻓﺰاﯾﺶ داده و اﺑﺘﻼ ﺑﻪ ﻋﻮارض اﯾﻦ ﺑﯿﻤـﺎری را ﺑﻪ ﺗﻌﻮﯾﻖ ﻣﯽ اﻧﺪازد. ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺷﯿﻮع ﻓﺰاﯾﻨﺪه اﯾﻦ ﺑﯿﻤﺎری، ﺑﻪ ﯾﮑـﯽ از ﭼﺎﻟﺶ ﻫﺎی ﻣﻬـﻢ رو در روی ﻣﺴـﺌﻮﻟﯿﻦ ﺑﻬﺪاﺷـﺖ و درﻣﺎن ﮐﺸﻮرﻫﺎی ﻣﺨﺘﻠﻒ دﻧﯿﺎ، ﭼﻪ در ﺣﺎل ﺗﻮﺳـﻌﻪ و ﭼﻪ ﭘﯿﺸﺮﻓﺘﻪ، ﺗﺒـﺪﯾﻞ ﺷـﺪه اﺳـﺖ.
داده کاوی: داده کاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوش مصنوعی، الگوشناسی و فراگیری ماشین داده می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگوها و مدل ها برای انسان ها قابل درک باشند. داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.
داده بزرگ: داده بزرگ اصطلاحی است برای مجموعه داده های حجیم که بزرگ، متنوع با ساختار پیچیده و با دشواری هایی برای ذخیره سازی، تحلیل و تصویرسازی (نمایش) ، پردازش های بیشتر یا نتایج می باشد. پروسه تحقیق بر روی داده های حجیم جهت آشکارسازی الگوهای مخفی و راز همبستگی ها، تجزیه و تحلیل داده بزرگ نامیده می شود. این اطلاعات مفید برای سازمان ها وشرکت ها در جهت کسب بینش غنی تر و عمیق تر و موفقیت در رقابت کمک می کند. به همین دلیل اجراهای داده بزرگ نیاز دارند تا در صورت امکان، تحلیل شوند و به طور دقیق اجرا شوند.
شبکه عصبی: شبکه عصبی، یک سیستم پردازش اطلاعات است که دارای ویژگی های مشترکی با شبکه های عصبی طبیعی است. شبکه های عصبی مصنوعی تعمیم یافته مدل های ریاضی تشخیص انسان بر اساس زیست شناسی عصبی هستند. نرون ها، تعداد دور تکرار، لایه های ورودی، پنهان و خروجی به عنوان مسئله مهم در شبکه های عصبی برشمرده می شوند.
یادگیری انتقال:
ما بر یادگیری انتقال قیاسی[30] تمرکز خواهیم کرد، که متداول ترین نوع یادگیری انتقالی است. یادگیری انتقال قیاسی با داشتن ارتباط نزدیک وظایف منبع و هدف و با داشتن برخی از داده های برچسب دار در دامنه مورد نظر و داده های دارای برچسب کافی در منبع دامنه مشخص می شود. معمولاً با استفاده از مدل های عمیق، با آموزش یک مدل اول در حوزه منبع و سپس انجام می شود با اجرای دقیق آن (یا بخشی از آن) در دامنه هدف این نوع انتقال انجام می شود.
یادگیری انتقال چند منبع: ماهیت دامنه های منبع می تواند بسیار متفاوت باشد ، و ما به آن نیاز داریم در هنگام انتخاب آنها احتیاط کنید تا از سناریوها جلوگیری کنید انتقال منفی (انتقالی که به یادگیری آن آسیب می رساند وظیفه هدف در دامنه هدف ، به جای کمک به آن). این امر به ویژه در زمینه پزشکی که داده ها وجود دارد ، بیشتر صدق می کند ناهمگن ، دارای توزیع احتمالات مختلف به دلیل منشأ آنها (به عنوان مثال ، بیماران مختلف ، حسگرها ، محیط های جمع آوری) ، قالب های مختلف (به عنوان مثال ، وضوح تصویر ، نمونه فرکانس) ، مقیاس های مختلف (به عنوان مثال ، مقیاس رنگی برای تصاویر ، واحدها برای اندازه گیری های فیزیکی یا فیزیولوژیکی) ، یا به سادگی بودن در مقادیر مختلف [13]. برای امکان انتقال مثبت ، این تفاوت ها وجود دارد باید قبل یا هنگام آموزش به آنها توجه شود از مدلی که می خواهیم منتقل کنیم. تفاوت در مقیاس یا قالب را می توان از طریق تحول به راحتی از بین برد از داده ها قبل از آن (جمع آوری مجدد ، تغییر شکل ، استاندارد سازی). مقادیر ناهموار داده در دامنه ها قابل حل است به همان روش مجموعه داده های نامتعادل در مشکلات طبقه بندی به عنوان مثال ، با استفاده از روش توزین مجدد نمونه یا افزایش داده فنون [22]. از طرف دیگر ، تفاوت در توزیع های احتمال می تواند برای ساخت یک مدل کلی باشد، با بهره گیری از تنوع داده ها. با این وجود ، برای یادگیری این خطر وجود دارد دامنه های منبع مختلف را تبعیض دهید و یک متمایز را یاد بگیرید نمایندگی ویژگی برای هر یک از آنها. این نوع ویژگی ها نمایندگی با خاصیت خاص کمتر عمومی خواهد بود ، بیش از حد ، به این دامنه های فردی ، آسیب رساندن به آینده آن است انتقال به دامنه هدف غیب.
شکل 1: نمایش کلی یک مدل عمیق آموزش دیده با روش آموزش در محیط یادگیری انتقال چند منبع. مدل از سه قسمت مختلف ساخته شده است: یک استخراج کننده ویژگی ، یک پیش بینی کننده خروجی و یک طبقه بندی کننده دامنه.
یادگیری انتقال متخاصم چند منبع: چارچوب یادگیری انتقال خصمانه چندمنظوره در شکل۱ پیشنهاد شده است. شکل1 یک نمایش کلی گرافیکی مدل با استفاده از روش آموزش خصمانه در یک محیط یادگیری انتقال چند منبع را نشان می دهد. ویژگی های محاسبه شده توسط ماژول استخراج کننده ویژگی توسط پیش بینی کننده خروجی استفاده می شود و طبقه بندی دامنه به ترتیب پیش بینی خروجی ، و دامنه ای که داده ها از آن می آیند. پیش بینی کننده خروجی و طبقه بندی دامنه توسط هر دو به طور کلاسیک آموزش داده می شوند.
با توجه به تنوع زیاد تنظیمات آزمایشی، تنوع بالای درون و درون موضوع ، و با توجه به پیچیدگی جمع آوری مقادیر کافی از چنین داده های حساس ، انتقال یادگیری یک رویکرد امیدوار کننده برای کاهش این موضوع است. گفته می شود، در گذشته خیلی بر روی آن تحقیق نشده است. در این زمینه در سال 2010، گالی و همکاران نشان دادند که امکان ساخت مدل های پیش بینی کننده گلوکز جهانی وجود دارد [23]. برای این منظور ، آنها از یک مدل استفاده کردند. آنها تجزیه و تحلیل خود را با استفاده از سه مجموعه داده مختلف انجام دادند. این مطالعه نشان می دهد که مجموعه داده ها به اشتراک گذاشته می شوند. برخی از ویژگی های مشترک است که می تواند به بیماران یا مجموعه داده های جدید منتقل شود. اخیراً ، لو و همکاران روش انتقال مدل گالی را در چندین بیمار آموخته شده است بکار بردند [24]. آنها نتایج خود را با مدت زمان شبیه سازی 6 روز تأیید کردند. آنها نشان دادند که روش آنها با استفاده از داده های کمتر برای بیمار جدید امکان پذیر می کند. با این حال، این نتایج بدست آمده اگرچه امیدوار کننده است، نیاز به تحقیقات بیشتر در مورد داده های دنیای واقعی دارد.
1) آیا می توانیم دانش را بین بیماران دیابتی های واقعی انتقال دهیم؟
2) آیا یادگیری انتقالی برای مدلهای مبتنی بر یادگیری عمیق مفید است؟
3) آیا می توانیم بین بیماران دیابت نوع 1 و دیابت نوع 2 انتقال پیدا کنیم؟
در شکل 2 مدل یادگیری انتقال خصمانه برای پیش بینی گلوکز معرفی گردیده است.
شکل 2: مدل یادگیری انتقال خصمانه برای پیش بینی گلوکز.
5-روش پژوهش:
الف- شرح کامل روش پژوهش بر حسب هدف، نوع داده ها و نحوه اجراء (شامل مواد، تجهیزات و استانداردهای مورد استفاده در قالب مراحل اجرایی تحقیق به تفکیک):
پیشنهاد می شود، یادگیری به منظور بهبود قابلیت تعمیم ویژگی نمایشی که بر روی داده های منبع[31] آموخته شود.
خلاصه مطالب اینگونه می شود:
• ما ابتدا چارچوب یادگیری انتقال خصمانه چند منبع را پیشنهاد می دهیم، که آن را انتقال یادگیری خصمانه[32] (ATL) می نامیم (برای سهولت در خواندن). مدل های عمیقی که به طور سنتی در یادگیری انتقال استفاده می شوند (به عنوان مثال، شبکه های عصبی کانولوشن[33]) به طور کلی دو مدل را پیاده سازی می کند: یک استخراج کننده ویژگی که از ورودی ها و پیش بینی ها دانش استخراج می کند تا از دانش استخراج شده برای پیش بینی استفاده کند. در تنظیم ATL، یک ماژول جدید منبع را بر اساس پایگاه داده ورودی استنباط می کند و آن ویژگی های استخراج شده است.
با ایجاد استخراج کننده ویژگی ها، نمایش ویژگی های آموخته شده در منابع بهتر تعمیم می یابد. فرضیه ما این است که نمایش ویژگی، به طور کلی تر، به یک هدف ناشناخته منتقل خواهد شد. این ایده به طور ویژه برای مراقبت های بهداشتی مناسب است چون ناهمگنی در تولید داده ها با استفاده همزمان از داده ها با منشاءهای مختلف دشوار است. علاوه بر این، در مقایسه با داده هایی که به سختی قابل اشتراک گذاری هستند، حساس بودن و شخصی بودن، یک مدل را می توان به راحتی بین مجریان سلامت تقسیم نمود، زیرا بدون نام بودن[34] داده های منبع را حفظ می کند. سرانجام ، پس از اشتراک گذاری، مدل به راحتی می تواند به داده های مورد نظر محدود می شود زیرا به مقادیر داده های کوچکتر نیاز دارد.
• ما کارآیی روش پیشنهادی را با استفاده از آن برای کار چالش برانگیز پیش بینی گلوکز برای افراد دیابتی استفاده نموده ایم. در پیش بینی گلوکز، زیرا مدل ها به بیمار شخصی می شوند و به همین دلیل داده ها بسیار پرهزینه هستند، ما اغلب داده های کافی برای آموزش مدل های عمیق نداریم. با این حال، داده های دیگر بیماران می توانند برای کمک به یادگیری بهتر مدل پیش بینی شخصی استفاده شوند. تا جایی که اطلاعات در دسترس تا زمان ارایه مقاله حاضر نشان می دهد، ما اولین تیمی هستیم که استفاده از آموزش انتقال از مدل عمیق را در ایران برای پیش بینی گلوکز پیشنهاد می کند.
• قابلیت انتقال[35] مدل ها را بررسی می کنیم وقتی داده های منبع تغییر می کنند. در این مطالعه، ما از سه مجموعه داده های به طور قابل توجه متفاوت استفاده می کنیم، اولین شامل از 6 بیمار دیابتی نوع 2 ، مورد دوم شامل 6 بیمار دیابتی نوع 1 و سومین مورد از 10 بیمار دیابتی نوع 1 در سیلیکو[36] ساخته شده است. قابلیت انتقال مدل ها در تنظیمات درون-مجموعه داده و بین داده و همچنین هنگام استفاده از داده های مصنوعی یا ترکیبی از مجموعه داده های فوق الذکر را برای یادگیری یک ویژگی کشف می کنیم.
• ما ویژگی های آموخته شده و نمایش داده شده را تجزیه و تحلیل می کنیم و برای این منظور، معیار جدیدی را که دامنه محلی سرگشته[37] می نامیم، پیشنهاد می دهیم که هدف آن تعیین کمیت تعمیم ویژگی های استخراج شده در یک محیط چند منبع با مشاهده فاصله بین ویژگیهای استخراج شده از منابع مختلف است.
ساختار پژوهش به شرح زیر است. اول، ما تعریف بیشتر از اینکه یادگیری انتقال چند منبع چیست می دهیم و روش پیشنهادی را معرفی می کنیم. سپس، چالش های مسئله پیش بینی گلوکز را مرور می کنیم و چگونه روش پیشنهادی می تواند به ما کمک کند. ما سپس جزئیات گسترده تجربی از مجموعه داده هایی که استفاده کردیم و پیش پردازش آنها گرفته تا ساخت مدل ها و ارزیابی آنها را در اختیار قرار می دهیم. سرانجام ، ما نتایج حاصل از چند منبع استاندارد و نامطلوب را مقایسه کرده و روش های انتقال را در هر سناریوی انتقال و نتایج را تجزیه و تحلیل شده است. با بهبود قابل توجه نتایج در این زمینه، انتقال خصمانه چند منبع چارچوب یادگیری نشان داده شده است که به طور موثر داده ها مسئله کمبود در زمینه زیست پزشکی را مورد توجه قرار می دهد.
مراحل انجام به صورت کلی به شکل ذیل است:
1) مطالعه مقالات پیشین در زمینه تشخیص دیابت به صورت هوشمند و بررسی نقاط ضعف و قوت آن ها
2) ارائه یک مدل جدید جهت رفع چالش های روش های قبلی در تشخیص دیابت به صورت هوشمند
3) انتخاب یک مجموعه داده با ویژگی های مشخص و شناسایی آن ها
4) مدل سازی و ارائه شبیه سازی جهت تضمین رویکرد پیشنهادی
5) ارزیابی و اعتبارسنجی نتایج به همراه مقایسه با روش های مشابه پیشین در شرایط کیسان (استفاده از داده های مشابه و یکسان)
6) نتیجه گیری و جمع بندی نهایی
مراجع
[1] Tora Grauers Willadsen, Volkert Siersma, Anni Brit Sternhagen Nielsen, Rasmus Køster-Rasmussen, and Niels de Fine Olivarius. “The effect of structured personal care on diabetes symptoms and self-rated health over 14 years after diabetes diagnosis.” Primary Care Diabetes, Vol. 12, Issue 4, pp. 354-363, August 2018.
[2] Juan Salazar, Cristobal Espinoza, Andres Mindiola, and Valmore Bermudez. “Data Mining and Endocrine Diseases: A New Way to Classify?” Archives of Medical Research, in press, corrected proof, Available online 14 August 2018.
[3] Hua Fang, Maria L. Rizzo, Honggang Wang, Kimberly Andrews Espy, and Zhenyuan Wang. “A new nonlinear classifier with a penalized signed fuzzy measure using effective genetic algorithm.” Pattern Recognition, Vol. 43, pp. 1393-1401, 2010.
[4] Nawaz Khan, Dhara Gaurav, and Thomas Kandl. “Performance Evaluation of Levenberg-Marquardt Technique in Error Reduction for Diabetes Condition Classification.” International Conference on Computational Science (ICCS), Procedia Computer Science, Vol. 18, pp. 2629-2637, 2013.
[5] Nongyao Nai-arun, and Rungruttikarn Moungmai. “Comparison of Classifiers for the Risk of Diabetes Prediction.” 7th International Conference on Advances in Information Technology, Procedia Computer Science, Vol. 69, pp. 132-142, 2015.
[6] Sajida Perveen, Muhammad Shahbaz, Aziz Guergachi, and Karim Keshavjee. “Performance Analysis of Data Mining Classification Techniques to Predict Diabetes.” Symposium on Data Mining Applications (SDMA), Riyadh, Saudi Arabia, Procedia Computer Science, Vol. 82, pp. 115-121, 2016.
[7] K. Simonyan and A. Zisserman, “Very deep convolutional networks for large-scale image recognition,” arXiv preprint arXiv:1409.1556, 2014.
[8] J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: Pre-training of deep bidirectional transformers for language understanding,” arXiv preprint arXiv:1810.04805, 2018.
[9] V. Gulshan, L. Peng, M. Coram, M. C. Stumpe, D. Wu, A. Narayanaswamy, S. Venugopalan, K. Widner, T. Madams, J. Cuadros et al., “Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs,” Jama, vol. 316, no. 22, pp. 2402–2410, 2016.
[10] A. Esteva, B. Kuprel, R. A. Novoa, J. Ko, S. M. Swetter, H. M. Blau, and S. Thrun, “Dermatologist-level classification of skin cancer with deep neural networks,” Nature, vol. 542, no. 7639, pp. 115–118, 2017.
[11] D. Wang, A. Khosla, R. Gargeya, H. Irshad, and A. H. Beck, “Deep learning for identifying metastatic breast cancer,” arXiv preprint arXiv:1606.05718, 2016.
[12] T. Ching, D. S. Himmelstein, B. K. Beaulieu-Jones, A. A. Kalinin, B. T. Do, G. P. Way, E. Ferrero, P.-M. Agapow, M. Zietz, M. M. Hoffman et al., “Opportunities and obstacles for deep learning in biology and medicine,” Journal of The Royal Society Interface, vol. 15, no. 141, p.20170387, 2018.
[13] F. Wang, L. P. Casalino, and D. Khullar, “Deep learning in medicinepromise, progress, and challenges,” JAMA internal medicine, vol. 179, no. 3, pp. 293–294, 2019.
[14] N. Dhungel, G. Carneiro, and A. P. Bradley, “A deep learning approach for the analysis of masses in mammograms with minimal user intervention,” Medical image analysis, vol. 37, pp. 114–128, 2017.
[15] H. Altae-Tran, B. Ramsundar, A. S. Pappu, and V. Pande, “Low data drug discovery with one-shot learning,” ACS central science, vol. 3, no. 4, pp. 283–293, 2017.
[16] A. Holzinger, “Interactive machine learning for health informatics: when do we need the human-in-the-loop?” Brain Informatics, vol. 3, no. 2, pp. 119–131, 2016.
[17] Y. Bar, I. Diamant, L. Wolf, and H. Greenspan, “Deep learning with non-medical training used for chest pathology identification,” in Medical Imaging 2015: Computer-Aided Diagnosis, vol. 9414. International Society for Optics and Photonics, 2015, p. 94140V.
[18] S. Christodoulidis, M. Anthimopoulos, L. Ebner, A. Christe, and S. Mougiakakou, “Multisource transfer learning with convolutional neural networks for lung pattern analysis,” IEEE journal of biomedical and health informatics, vol. 21, no. 1, pp. 76–84, 2016.
[19] J. Yosinski, J. Clune, Y. Bengio, and H. Lipson, “How transferable are features in deep neural networks?” in Advances in neural information processing systems, 2014, pp. 3320–3328.
[20] Y. Ganin, E. Ustinova, H. Ajakan, P. Germain, H. Larochelle, F. Laviolette, M. Marchand, and V. Lempitsky, “Domain-adversarial training of neural networks,” The Journal of Machine Learning Research, vol. 17, no. 1, pp. 2096–2030, 2016.
[21] S. J. Pan and Q. Yang, “A survey on transfer learning,” IEEE Transactions on knowledge and data engineering, vol. 22, no. 10, pp. 1345–1359, 2009.
[22] S. Kotsiantis, D. Kanellopoulos, P. Pintelas et al., “Handling imbalanced datasets: A review,” GESTS International Transactions on Computer Science and Engineering, vol. 30, no. 1, pp. 25–36, 2006
[23] A. Gani, A. V. Gribok, Y. Lu, W. K. Ward, R. A. Vigersky, and J. Reifman, “Universal glucose models for predicting subcutaneous glucose concentration in humans,” IEEE Transactions on Information Technology in Biomedicine, vol. 14, no. 1, pp. 157–165, 2009.
[24] S. Luo and C. Zhao, “Transfer and incremental learning method for blood glucose prediction of new subjects with type 1 diabetes,” in 2019 12th Asian Control Conference (ASCC). IEEE, 2019, pp. 73–78.
[25] M. De Bois, M. Ammi, and M. A. El Yacoubi, “Glyfe: Benchmark of personalized glucose predictive models in type-1 diabetes,” in submitted for publication in Artificial Intelligence in Medicine. IEEE, 2020, pp. 1–14.
[1] Fully Convolutional Neural Network
[2] IRIS Dataset
[3] Naïve Bayesian
[4] Regression
[5] Radial Basis Function (RBF)
[6] Levenberg-Marquardt
[7] Multi-Layered Perceptron (MLP)
[8] Mean Squared Error (MSE)
[9] Decision Tree
[10] Artificial Neural Networks (ANN)
[11] Logistic Regression
[12] Bagging and Boosting
[13] Adaboost
[14] Canadian Primary Care Sentinel Surveillance Network
[15] Diabetes Retinopathy
[16] Few-Shot Learning
[17] Deep Models
[18] Domain-Specific
[19] Expert Knowledge
[20] Transfer Learning
[21] Electronic Health Records
[22] Personalized Medicine
[23] Multi-Source Transfer Learning
[24] Dissimilarity
[25] Negative Transfer
[26] Ganin
[27] Domain-Adversarial Training Methodology
[28] Extracted Features
[29] unique Feature
[30] Inductive Transfer Learning
[31] Multi-Source Transfer Learning in Order to Improve the Generalizability of the Feature Representation That is learnt on the Source Data
[32] Adversarial Transfer Learning
[33] Convolutional Neural Networks
[34] Anonymity
[35] Transferability
[36] in-silico type-1
[37] Local Domain Perplexity (LDP)