@article { author = {Gashmard, Shahrouz and Mehri Dehnavi, Alireza and Rabbani, Hossein}, title = {Using Principal Component Analysis to Recognize Farsi Alphabetic Characters in Printed Scripts}, journal = {Journal of Isfahan Medical School}, volume = {29}, number = {174 ویژه نامه (مهندسی پزشکی)}, pages = {3211-3220}, year = {2012}, publisher = {Isfahan University of Medical Sciences}, issn = {1027-7595}, eissn = {1735-854X}, doi = {}, abstract = {Background: From the early stages of script writing and reading, there was a big desire for researchers to make an aid device for the blind to read scripts without help of other. This paper introduced a new approach for recognition of Farsi scripts using principal component analysis (PCA).Methods: Materials used for this project were selected from ordinary books, magazines, newspapers, and printed documents. Character samples were selected from four fonts in different positions and three sizes resulted in total number of 20 recognition classes. The five methods used in character recognition were statistical method, Fast Zernike Wavelet Moments (FZWM) method, PCA, PCA with sample averaging, and PCA with eigenvectors averaging.Findings: The accuracy and speed of PCA in recognition of Farsi characters were respectively 1.775% and 7.5 times better than the statistical method. Likewise, it was 2.2% more accurate and 5.12 times faster than FZWM method. Conclusion: Using PCA with combinational averaging in samples and eigenvectors can be a novel method for recognition of Farsi characters.}, keywords = {Farsi character recognition,Image processing,Principal component analysis,Combined algorithm}, title_fa = {استفاده از الگوریتم آنالیز اجزای اصلی جهت تشخیص نرم‌افزاری حروف در متون فارسی}, abstract_fa = {مقدمه: ابداع روش منابع گویای خودکار، همواره یکی از دغدغه‌های فکری پژوهشگران بوده است تا ابزاری کارآمد جهت مطالعه‌ی متون معمولی توسط نابینایان تولید نمایند. در این راه، علاوه بر تلاش در جهت ساخت ابزارها، روش‌های بهینه جهت پردازش، شناخت و تفکیک نوشته‌ها و متون فارسی نیز مورد نیاز می‌باشد.روش‌ها: در این مقاله با استفاده از روش آنالیز اجزای اصلی، روشی جدید جهت تشخیص اتوماتیک حروف در تصاویر تهیه شده از حروف فارسی تایپ شده ارایه می‌گردد که قادر به بهبود روش‌های موجود از لحاظ دقت و سرعت می‌باشد. در این روش، که برگرفته از روش آنالیز اجزای اصلی می‌باشد، در اصل اجزای وابسته به تغییرات کم از داده‌ها حذف می‌شود و بدون از دست رفتن قسمت عمده‌ی اطلاعات تصویر، می‌توان شباهت‌ها و اختلافات بین تصاویر مختلف را با سرعت و دقت بیشتری مورد بررسی قرار داد.یافته‌ها: در این مقاله با انجام آزمایش‌های عملی متعدد، کارآیی بهتر روش اجزای اصلی در مقایسه‌ با روش‌های قبلی مانند روش‌های آماری و زرنیک سریع مورد تأیید قرار گرفته است. برای مثال با آزمایش هر سه این روش‌ها بر یک مجموعه‌ی داده‌ی آموزشی یکسان و چهار مجموعه‌ی داده‌ی آزمونی یکسان، مشخص گردید که دقت این روش در مقایسه با روش آماری 775/1 درصد بهتر و سرعت آن 5/7 برابر شده است و در مقایسه با روش زرنیک سریع دقت 2/2 درصد بهبود داشته و سرعت آن نیز 12/5 برابر بیشتر شده است.نتیجه‌گیری: مقایسه‌ی نتایج نهایی اعمال داده‌ها به الگوریتم‌های مطرح شده در مقاله و مقایسه‌ی دقت و زمان آن‌ها نشان داد که الگوریتم آنالیز اجزای اصلی (PCA) ترکیبی بهترین نتایج از لحاظ سرعت و دقت را به همراه دارد.}, keywords_fa = {الگوریتم ترکیبی و آنالیز اجزای اصلی,پردازش تصویر,شناسایی حروف فارسی}, url = {https://jims.mui.ac.ir/article_13731.html}, eprint = {https://jims.mui.ac.ir/article_13731_4ae93f0d1950a2e93bd17408b682958b.pdf} }