دوره 32، شماره 292: هفته اول شهریورماه 1393:1028-1035

مقایسه‌ی عملکرد طبقه‌بندی کننده‌های مختلف در پیشگویی متاستاز سرطان سینه با استفاده از میکرو آرایه

زهرا امینی, علیرضا مهری دهنوی

چکیده


مقدمه: هدف از این تحقیق، دستیابی به یک روش قابل اعتماد برای پیشگویی متاستاز در مبتلایان به سرطان سینه بود.

روش‌ها: در این مطالعه از آنالیز میکرو آرایه‌ی DNA مربوط به تومور سینه در 78 بیمار جوان با شرایط یکسان (34 نفر با متاستاز و 44 نفر بدون متاستاز) استفاده و تلاش شد تا با مقایسه‌ی عملکرد چند طبقه‌بندی کننده‌ی مطرح روی بیان ژن‌های آن‌ها، یک سیستم پیشگویی قوی برای متاستاز به دست آید. برای این امر، طبقه‌بندی کننده‌های SWLDA (Stepwise linear discriminate analysis)، ماشین بردار پشتیبان (SVM یا Support vector machine) و K نزدیک‌ترین همسایه (KNN یا K-Nearest Neighbours) با استفاده از روش LOO (Leave one out) بر روی 231 ژن انتخابی به کار برده شد تا این نمونه‌ها را به دو گروه با و بدون متاستاز تفکیک کنند.

یافته‌ها: روش ماشین بردار پشتیبان با کرنل خطی از نظر میزان صحت، Sensitivity و Specificity بهترین روش است. ماشین بردار پشتیبان با استفاده از کرنل خطی توانست با Sensitivity بیش از 84 درصد و Specificity نزدیک به 82 درصد به تفکیک دادگان بپردازد.

نتیجه‌گیری: در مورد روش SWLDA، مزیتی که وجود دارد این است که این طبقه‌بندی کننده قبل از دسته‌بندی از یک مرحله‌ی انتخاب ویژگی بهره می‌برد که این مسأله پیچیدگی تابع تصمیم‌گیری را کمتر و تعمیم پذیری طبقه‌بندی کننده را بیشتر می‌کند.

 


واژگان کلیدی


میکرو آرایه؛ پیشگویی سرطان سینه؛ طبقه‌بندی کننده‌ی Support vector machine؛ K-nearest neighbours؛ Stepwise linear discriminate analysis

تمام متن:

PDF

مراجع


Weigelt B, Peterse JL, van't Veer LJ. Breast cancer metastasis: markers and models. Nature Reviews 2005; 5: 591-602.

Lujambioa A, Calinc GA, Villanuevad A, Roperoa S, Sanchez-Cespedese M, Blancof D, et al. A microRNA DNA methylation signature for human cancer metastasis. PNAS 2008; 105(36): 13556-61.

Mehridehnavi A, Ziaei L. Minimal gene selection for classification and diagnosis prediction based on gene expression profile. Adv Biomed Res 2013; 2: 26.

van't Veer LJ, Dai H, van de Vijver MJ, He YD, Hart AA, Mao M, et al. Gene expression profiling predicts clinical outcome of breast cancer. Nature 2002; 415(6871): 530-6.

Lotte F, Congedo M, Lecuyer A, Lamarche F, Arnaldi B. A review of classification algorithms for EEG-based brain-computer interfaces. J Neural Eng 2007; 4(2): R1-R13.

Huerta EB, Duval B, Hao JK. Selection for microarray data by a LDA-based genetic algorithm. Lecture Notes in Computer Science 2008; 5265: 250-61.

Sharmaa A, Paliwala KK. Cancer classification by gradient LDA technique using microarray gene expression data. Data and Knowledge Engineering 2008; 66(2): 338-47.

Krusienski DJ, Sellers EW, McFarland DJ, Vaughan TM, Wolpaw JR. Toward enhanced P300 speller performance. J Neurosci Methods 2008; 167(1): 15-21.

Nijboer F, Sellers EW, Mellinger J, Jordan MA, Matuz T, Furdea A, et al. A P300-based brain-computer interface for people with amyotrophic lateral sclerosis. Clin Neurophysiol 2008; 119(8): 1909-16.

Furey TS, Cristianini N, Duffy N, Bednarski DW, Schummer M, Haussler D. Support vector machine classification and validation of cancer tissue samples using microarray expression data. Bioinformatics 2000; 16(10): 906-14.

Hernandez JCh, Duval B, Hao JK. SVM-based local search for gene selection and classification of microarray data. Bioinformatics Research and Development Communications in Computer and Information Science 2008; 13: 499-508.

Parry RM, Jones W, Stokes TH, Phan JH, Moffitt RA, Fang H, et al. k-Nearest neighbor models for microarray gene expression analysis and clinical outcome prediction. Pharmacogenomics J 2010; 10(4): 292-309.

Jiangsheng Y. Method of k-nearest neighbors. Beijing, China: Institute of Computational Linguistics Peking University; 2002.

Krusienski DJ, Sellers EW, Cabestaing F, Bayoudh S, McFarland DJ, Vaughan TM, et al. A comparison of classification techniques for the P300 Speller. J Neural Eng 2006; 3(4): 299-305.




Creative Commons Attribution-NonCommercial 4.0

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 Unported License which allows users to read, copy, distribute and make derivative works for non-commercial purposes from the material, as long as the author of the original work is cited properly.