دانلود مقاله isi یک مدل جنگل تصادفی چند کلاسه (MCRF) برای طبقه بندی پپتیدهای گیاهی کوچک
موضوع انگلیسی:A multi class random forest (MCRF) model for classification of small plant peptides
فرمت فایل: pdf
تعداد صفحه:10
چکیده
تحقیق در مورد طبقه بندی دسته های مختلف پپتیدهای کوچک به چالشی برای حوزه بیوانفورماتیک تبدیل شده است. با این حال، مدل های یادگیری ماشین پتانسیل خود را برای مقابله با چنین برنامه هایی نشان داده اند. ما یک طبقهبندی جنگل تصادفی چند کلاسه (MCRF) برای طبقهبندی پپتیدهای کوچک پیشنهاد میکنیم که با طبقهبندیکنندههای پیشرفته از جمله ماشین بردار پشتیبانی با هسته RBF (SVM + RBF)، بیز ساده (NB)، درخت تصمیم (C5) مقایسه میشود. .0)، جنگل تصادفی (RF). توالی پپتیدهای کوچک از مخزن ARA-PEPs انتخاب شده اند (Hazarika, et al., 2017) که در آن 13748 پپتید کوچک با شش دسته (یعنی ترشح شده، sORF، پپتیدهای ناشی از استرس (SIP)، ترشح شده-sORF، sORF-SIP فهرست شده اند. ، SIP ترشح می شود). در مجموع 27 ویژگی برای هر توالی پپتیدهای کوچک برای تهیه داده ها واکشی شده است. مقایسه با استفاده از معیارهایی مانند F-Value، Sensitivity، Specificity، ROC و FP نرخ با برخی اعتبارسنجی آماری مانند آمار کاپا و آزمون رتبهبندی علامت Wilcoxon انجام میشود. نتایج این مطالعه نشان میدهد که طبقهبندیکننده پیشنهادی پتانسیل طبقهبندی دقیق دادههای نامتعادل چند سطحی را دارد.