|
" مقایسه عملکرد روشهای انتخاب ژن در تشخیص بیماری آلزایمر با استفاده از داده های بیان ژنی بدست آمده از ریزآرایهها "
فاطمه سلیمانی
نمامعلی آزادی
لیلا جانانی
عنوان اصلي
|
:
|
مقایسه عملکرد روشهای انتخاب ژن در تشخیص بیماری آلزایمر با استفاده از داده های بیان ژنی بدست آمده از ریزآرایهها
|
عنوان اصلي به زبان ديگر
|
:
|
The Comparison of Feature Selection Methods for Alzheimer Allocation Using Microarray Gene Expression Data
|
نام نخستين پديدآور
|
:
|
فاطمه سلیمانی
|
استاد راهنما
|
:
|
نمامعلی آزادی
|
استاد راهنما
|
:
|
مهدی صادقی
|
استاد مشاور
|
:
|
لیلا جانانی
|
نام مرکز
|
:
|
دانشکده بهداشت
|
نوع مدرک
|
:
|
پایان نامه فارسی
|
شماره رکورد
|
:
|
714187
|
شماره مدرک
|
:
|
۷۱۳۰۰۳۰پ
|
زبان مدرک
|
:
|
فارسی
|
زبان اثر اصلي
|
:
|
فارسی
|
سرشناسه
|
:
|
پایان نامه نویس سلیمانی، فاطمه
|
صفحه شمار
|
:
|
۱۰۶ص.
|
مقطع تحصیلی
|
:
|
کارشناسی ارشد
|
رشته تحصیلی
|
:
|
آمار زیستی
|
تاریخ دفاع
|
:
|
۱۴۰۲
|
دانشگاه/ دانشکده
|
:
|
علوم پزشکی ایران
|
موضوع
|
:
|
بیماری آلزایمر
|
|
:
|
Alzheimer Disease
|
|
:
|
نمایش ژن
|
|
:
|
Gene Expression
|
شناسه افزوده
|
:
|
استاد راهنماآزادی، نمامعلی
|
|
:
|
، استاد راهنماصادقی، مهدی
|
|
:
|
، استاد مشاورجانانی، لیلا
|
چکيده
|
:
|
بیماری آلزایمر (Alzheimer's disease) برای بروز و ظهور در انسان وابسته به متغیرهای بسیاری است. همچنین توسعه و پیشرفت بیماری های زوال عقل نظیر آلزایمر تحت تاثیر انواع متغیرهای ژنتیکی است. متأسفانه مسیرهای مولکولی ایجاد کننده بیماری آلزایمر هنوز به خوبی شناخته نشده است. در تحقیقات بیماری آلزایمر، تعیین یک تشخیص موثر و قابل اعتماد، به ویژه در مراحل اولیه، مشکلات عمده ثانویه را حل می کند. محققان و فنآورانی که در زمینههای یادگیری ماشین و دادهکاوی کار میکنند میتوانند به بهبود وضعیت و تشخیص زودهنگام آلزایمر کمک کنند، اما در پردازش دادههای با ابعاد بالا همواره با موانعی روبروست. با کاهش دادههای نامربوط و اضافی از دادههای بیان ژن ریزآرایه، روش انتخاب ویژگی میتواند در زمان محاسبات صرفهجویی کند، دقت یادگیری را بهبود بخشد و تأثیر عمیقتری بر فرآیند پردازش داده های یادگیری گذارد. روش های انتخاب ویژگی شرح داده شده در این پژوهش شامل FCBF( Fast Correlation Based Filter) ، Relief-F و SVMrfe(SVM-Recursive Feature Elimination ) هستند که قادرند نویز داده ها را به خوبی کاهش دهند. به طور خاص، ضریب همبستگی پیرسون برای ارزیابی افزونگی داده ها استفاده می شود. اثربخشی این ویژگیها با استفاده از روشهای طبقهبندی ماشین بردار پشتیبان (Support Vector Machine)، بیز ساده (Naïve Bayes) و رگرسیون لجستیک (Logistic Regression) ارزیابی می شود. روشهای اجرا شده به طور میانگین 71.1% دقت از خود نشان دادند. در نتیجه، می توان ادعا کرد رویکردهای جدید برای تشخیص زودهنگام بیماری آلزایمر (AD) در حال بهبود است.
|
چکيده
|
:
|
Alzheimer’s disease (AD) is caused by multiple variables. Alzheimer's disease development and progression are influenced by genetic variants. The molecular pathways causing Alzheimer's disease are still poorly understood. In Alzheimer's disease research, determining an effective and reliable diagnosis remains a major difficulty, particularly in the early stages. Researchers and technologists working in the fields of machine learning and data mining can help improve the situation, early AD diagnosis but face a hurdle when it comes to high dimensional data processing. By reducing irrelevant and redundant data from microarray gene expression data, the technique of feature selection can save computing time, improve learning accuracy, and encourage a deeper effect on the learning system or data. The feature selection strategy described in this article reduces data noise well. In particular, Pearson's correlation coefficient is used to assess data redundancy. The efficacy of these features is assessed using the Support Vector Machine (SVM), naïve bayes(NB) and logistic regeresion (LR) classification approaches. The proposed approaches has an accuracy of up to 71.1 %. As a result, newly established approaches for early diagnosis of Alzheimer's disease(AD) are being improved.Keywords: Alzheimer’s Disease, Support vector machine, machine learning, feature selection, Pearson’s correlation coefficient.
|
| |