نوع فایل power point
قابل ویرایش 40 اسلاید
قسمتی از اسلایدها
یک الگوریتم یادگیری با استفاده از دادههای آموزشی فرضیهای را بوجود میآورد. قبل از استفاده از این فرضیه ممکن است که لازم شود تا دقت این فرضیه مورد ارزیابی قرار گیرد.
اینکار از دو جهت اهمیت دارد:
دقت فرضیه را برای مثالهای نادیده حدس بزنیم.
گاهی اوقات ارزیابی فرضیه جزئی از الگوریتم یادگیری است: مثل هرس کردن درخت تصمیم.
در این فصل سعی میشود تا روشهای آماری مناسب برای حدس زدن دقت فرضیهها معرفی گردند .مبنای کار در جهت پاسخگوئی به سه سوال زیر است:
اگر دقت یک فرضیه برای دادههای محدودی معلوم باشد دقت آن برای سایر مثالها چه قدر خواهد بود؟
اگر یک فرضیه برای دادههای محدودی بهتر از فرضیه دیگری عمل کند احتمال اینکه این وضعیت در حالت کلی نیز صادق باشد چقدر است؟
وقتی که داده آموزشی اندکی موجود باشد بهترین راه برای اینکه هم فرضیه را یاد بگیریم و هم دقت آنرا اندازهگیری کنیم چیست؟
وقتی که یادگیری با استفاده از دادههای محدودی انجام میشود دو مشکل ممکن است رخ دهد:
بایاس در تخمین.
دقت یک فرضیه بر روی مثالهای آموزشی تخمین مناسبی برای دقت آن برای مثالهای نادیده نیست. زیرا فرضیه یاد گرفته شده بر اساس این دادهها برای مثالهای آتی به صورت خوشبینانه (optimistic) عمل خواهد نمود. برای رهائی از این امر میتوان از مجموعه دادههای تست استفاده کرد.
انحراف (Variance) در تخمین.
حتی با وجود استفاده از مجموعه تست این امکان وجود دارد که دقت فرضیه اندازهگیری شده با دقت فرضیه واقعی اختلاف داشته باشد. این دقت بستگی به خصوصیات مجموعه تست و تطابق با توزیع کلی دادهها دارد.
فهرست مطالب و اسلایدها
روشهای آماری
کمی دادههای آموزشی
مشکل کمی داده
خطای نمونه و خطای واقعی
خطای واقعی
مقدمهای بر تئوری نمونهبرداری
فواصل یک طرفه و دو طرفه
تخمین خطا
توزیع دوجملهای
مثال
واریانس
بایاس تخمین
انحراف معیار تخمینزننده
فاصله اطمینان
تقریب با توزیع نرمال
حدود یکطرفه و دوطرفه
اختلاف خطای فرضیهها
تخمینزننده
انحراف معیارتخمینزننده
مقایسه الگوریتمهای یادگیری
مقایسه الگوریتمهای یادگیری
مشکل کمی داده
فاصله اطمینان
فاصله اطمینان
Paired Test