دوره 35، شماره 426: هفته دوم خرداد ماه 1396:400-405

طبقه‌بندی و آنالیز شباهتی پایگاه مولکولی Binding-DB: بررسی کاربرد مدل‌های طبقه‌بندی چند منظوره برای استخراج قوانین تجمعی عمومی از پایگاه‌های بزرگ مولکولی

مرضیه مختاری, احمد مانی ورنوسفادرانی

چکیده


مقدمه: در این مطالعه، با استفاده از ترکیبی از روش‌های کاهش بعد داده و طبقه‌بندی، ویژگی‌های مواد دارویی مورد بررسی قرار گرفت. تعریف و آماده‌سازی مولکول‌های «غیر فعال» برای توسعه‌ی مدل‌های تفکیکی دوتایی (Two-class classifier) یکی از مشکلات عمده در مسیر استفاده از مدل‌های تفکیکی بر پایه‌ی لیگاند در روند طراحی سیستماتیک دارو می‌باشد. از این رو، با استفاده از مولکول‌های «فعال» موجود در پایگاه Binding-DB، به توسعه‌ی مدل‌های تفکیکی چند متغیره‌ی چند منظوره پرداخته شد.

روش‌ها: به این منظور، در حدود 160372 ریز مولکول برای 45 هدف دارویی مختلف از پایگاه مولکولی Binding-DB دانلود شد و پس از بهینه‌سازی ساختار، 1497 ویژگی فیزیکی و شیمیایی برای هر مولکول استخراج ‌گردید. با استفاده از الگوریتم Apriori و ترکیب آن با روش طبقه‌بندی تفکیکی خطی (Linear discriminant analysis)، ویژگی‌های مولکولی برای هر هدف دارویی به منظور تفکیک مولکول‌های فعال استخراج شد.

یافته‌ها: در نهایت، با استفاده از غربالگری مجازی در پایگاه داده‌های مولکولی Zinc و Binding-DB و محاسبه‌ی سطح زیر نمودار Receiver operating characteristic (ROC) صحت و حساسیت طبقه‌بندی مورد بررسی قرار گرفت. میزان سطح زیر نمودار ROC برای هر بهینه‌سازی پایگاه Zinc به طور میانگین برابر با 1495/0 ± 8341/0 و در پایگاه Binding-DB به طور میانگین برابر با 1502/0 ± 8615/0 بود.

نتیجه‌گیری: می‌توان با استفاده از الگوریتم ارایه شده، ویژگی‌هایی برای هر دسته از ریز مولکول‌های مرتبط با هر هدف دارویی استخراج کرد و پایگاه‌های مولکولی مختلف را برای هر هدف دارویی بهینه‌سازی کرد. سطح زیر نمودار ROC برای دو پایگاه مولکولی مورد بررسی نشان می‌دهد که روش ارایه شده، روش مفیدی برای طبقه‌بندی پایگاه‎های بزرگ مولکولی بدون استفاده از ریز مولکول‌های غیر فعال می‎باشد.


واژگان کلیدی


غربالگری مجازی؛ طبقه‌بندی چند منظوره؛ بررسی داده؛ طبقه‌بندی پایگاه داده؛ لیگاند

تمام متن:

PDF

مراجع


Palanisam SK. Association rule based classi cation [MSc Thesis]. Worcester, MA: Worcester Polytechnic Institute; 2006.

Vaidya J, Clifton C. Privacy preserving association rule mining in vertically partitioned data. Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining; 2002 Jul 23-25; Edmonton, AB, Canada. New York, NY; ACM; p. 639-44.

Agrawal R, Srikant R. Fast algorithms for mining association rules in large databases. Proceedings of the 20th International Conference on Very Large Data Bases; 1994 Sep 12-15; Santiego, Chile. San Francisco, CA: Morgan Kaufmann Publishers Inc; p. 487-99.

Chen X, Lin Y, Liu M, Gilson MK. The Binding Database: data management and interface design. Bioinformatics 2002; 18(1): 130-9.

Chuprina A, Lukin O, Demoiseaux R, Buzko A, Shivanyuk A. Drug- and lead-likeness, target class, and molecular diversity analysis of 7.9 million commercially available organic compounds provided by 29 suppliers. J Chem Inf Model 2010; 50(4): 470-9.

Li AP. Preclinical in vitro screening assays for drug-

like properties. Drug Discov Today Technol 2005; 2(2): 179-85.

Camp D, Davis RA, Campitelli M, Ebdon J, Quinn RJ. Drug-like properties: guiding principles for the design of natural product libraries. J Nat Prod 2012; 75(1): 72-81.

Hou T, Wang J, Li Y. ADME evaluation in drug discovery. 8. The prediction of human intestinal absorption by a support vector machine. J Chem Inf Model 2007; 47(6): 2408-15.

Ghose AK, Viswanadhan VN, Wendoloski JJ. A knowledge-based approach in designing combinatorial or medicinal chemistry libraries for drug discovery. 1. A qualitative and quantitative characterization of known drug databases. J Comb Chem 1999; 1(1): 55-68.

Lipinski CA, Lombardo F, Dominy BW, Feeney PJ. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv Drug Deliv Rev 2001; 46(1-3): 3-26.

Mani-Varnosfaderani A, Valadkhani A, Jalali-Heravi M. CS-MINER: A tool for association mining in binding-database. Mol Inform 2015; 34(4): 185-96.




Creative Commons Attribution-NonCommercial 4.0

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 Unported License which allows users to read, copy, distribute and make derivative works for non-commercial purposes from the material, as long as the author of the original work is cited properly.