بایکلاسترینگ سری‌های زمانی همبسته در داده‌های میکروآرایه

نوع مقاله : مقاله های پژوهشی

نویسندگان

1 کارشناس ارشد، گروه فیزیک و مهندسی پزشکی، دانشکده‌ی پزشکی، دانشگاه علوم پزشکی اصفهان، اصفهان، ایران

2 دانشیار، گروه فیزیک و مهندسی پزشکی، دانشکده‌ی پزشکی، دانشگاه علوم پزشکی اصفهان، اصفهان، ایران

3 استادیار، گروه مهندسی پزشکی، دانشکده‌ی فنی و مهندسی، دانشگاه اصفهان، اصفهان، ایران

چکیده

مقدمه: با شناخته شدن توالی ژنوم‌های مختلف، گام منطقی بعدی یافتن عملکرد و تنظیم آن‌ها می‌باشد. جهت دسته‌بندی ژن‌ها در آزمایشگاه مواردی همچون توصیف رفتار ژن، عوامل کنترل‌کننده‌ی بیان ژن و تعامل پروتئین بررسی می‌شوند. انتظار می‌رود ژن‌هایی که با مکانیسم مشابهی تنظیم می‌شوند، دارای الگوی بیان یکسانی باشند. روش‌ها: در این مقاله، یک روش خاص خوشه‌بندی به نام بایکلاسترینگ را برای داده‌های میکروآرایه به دست آمده از بیماران مبتلا به MS (Multiple sclerosis) معرفی می‌کنیم. از دیدگاه بیولوژیکی، بایکلاسترهای تنظیم‌کننده‌ی ژنی شامل ژن‌هایی است که در چندین نقطه از زمان تحت چندین شرایط رفتار مشابهی دارند. با شناسایی این بایکلاسترها، پی بردن به مکانیسم‌های تنظیمی که باعث این رفتار مشترک می‌شوند ممکن می‌شود. یافته‌ها: ما از فرمت تغییریافته‌ی الگوریتم ISA (Iterative signature algorithm) برای استخراج پروفایل‌های هم‌بیان ژن از داده‌های میکروآرایه استفاده کردیم. روش KNN (K-nearest neighbor) در ترکیب با ISA، الگوریتمی ارائه کرد که منجر به یک روش مطلوب برای به دست آوردن مجموعه‌ی همبسته‌ای از ژن‌های همسان در داده‌های میکروآرایه شد. نتیجه‌گیری: این الگوریتم بر روی دو نوع داده‌ی سنتز شده و داده‌ی واقعی (اطلاعات بیماران مبتلا به مولتیپل اسکلروز) اعمال شد و نشان داد که تفاوت بارزی بین بایکلاسترهای استخراج شده در مقایسه با ISA وجود دارد؛ هر چند که بهره‌وری این روش بر روی داده‌ی سنتز شده و داده‌ی مبتلایان به مولتیل اسکلروز نشان داده شد، اما برای هر نوع داده‌ی دیگری نیز قابل استفاده خواهد بود. واژگان کلیدی: میکروآرایه، بایکلاستر، سری‌های زمانی، همبستگی

عنوان مقاله [English]

Biclustering of Coherent Time Series in Microarray Data

نویسندگان [English]

  • Hossein Taghizad 1
  • Alireza Mehridehnavi 2
  • Majid Mohammadbeigi 3
1 Department of Medical Physics and Engineering, School of Medicine, Isfahan University of Medical Sciences, Isfahan, Iran
2 Associate Professor, Department of Medical Physics and Engineering, School of Medicine, Isfahan University of Medical Sciences, Isfahan, Iran
3 Assistant Professor, Department of Biomedical Engineering, School of Engineering, University of Isfahan, Isfahan, Iran
چکیده [English]

Background: After recognition of sequences of different genomes, the next logical step is the discovery of their function and regulation. To classify genes in the laboratory, factors such as the behavior of genes, gene expression control and protein interactions have been reviewed. It is expected that genes with similar regulation mechanisms have the same expression patterns. Methods: In this paper, we introduce a special way of clustering, called biclustering, for microarray data obtained from multiple sclerosis (MS) patients. From a biological perspective, gene regulatory modules consist of genes that have similar behaviors at different points of time under several conditions. By identifying these modules, the recognition of the regulatory mechanisms that are the common causes of genes behaviors might be conceivable. Findings: We used a modified format of iterative signature algorithm (ISA) to extract co-expressed gene profiles from microarray data. The combination of K-nearest neighbor (KNN) algorithm and ISA provides a helpful algorithm which results in an outstanding and optimum way to obtain similar genes in microarray data. Conclusion: The algorithm was performed on a synthetic as well as a real database (MS patients’ data), and showed a pronounced difference between the extracted modules in contrast to ISA. Although we showed our method’s efficiency over synthetic and MS data, it will be usable for any other kinds of data. In other words, our method is based on a series of logical and statistical methods rather than data-based methods. Keywords: Microarray, Biclustering, Time series analysis, Correlation of data