الگوریتم امروز

وبلاگ تخصصی الگوریتم

الگوریتم امروز

وبلاگ تخصصی الگوریتم

وبلاگ علمی و مخصوص مباحث الگوریتمی است.
نظر خصوصی نگذارید چون جواب نمی‌دهم نظر عمومی بگذارید بدون نام هم که باشد همانجا جواب می‌دهم.

بایگانی

داده کاوی

دوشنبه, ۹ دی ۱۳۹۲، ۰۵:۳۷ ب.ظ
نمودار ROC
این نمودار برای مقایسه ی دو روش دسته بندی به کار می رود. محور عمودی آن TPR (نسبت مثبت های درست) و محور افقی آن FPR (نسبت مثبت های غلط) است.
TPR = TP/P
FPR = FP/N=1-specificity
این نمودار برای دسته بندی دو کلاسه (yes و no) نشان دهنده ی  trade off بین TPR و FPR است.
برای رسم این نمودار برای احتمال یک threshold در نظر می گیریم و بیشتر از آن را yes و کمتر از آن را no می دهیم. (با فرض اینکه روش دسته بندی ما برای هر نمونه یک احتمال تعلق به یک کلاس را برگرداند.)
مثال: در جدول زیر برچسب واقعی و احتمال برگردانده شده توسط دسته بند داده شده است. مقدار t مناسب را بیابید. (با رسم ROC)
برای این مثال از روی مقادیر دو ستون اول بقیه را محاسبه می کنیم. (نمونه ها بر حسب احتمال yes بودن مرتب شده اند.)
برای t=0.90 نمونه ی 1 را در دسته ی مثبت می گذاریم و از روی داده های اصلی می بینیم که درست دسته بندی کرده ایم. یک نقطه روی ROC در (0,0.2) می گذاریم. بعد t را کم می کنیم تا نمونه ی بعدی را شامل شود و همین کار را ادامه می دهیم تا نمودار کامل رسم شود.
نمودار ROC این مثال:
مقایسه ی دو دسته بند بر اساس نمودار ROC آنها
خط y=x در این نمودار نشان دهنده ی احتمال 1/2 برای تعلق به هر کلاس است. (حدس زدن). هر چه نموداری به این خط نزدیک تر باشد دقت آن کمتر است. در مثال زیر M1 از M2 دقیق تر است.

موافقین ۰ مخالفین ۰ ۹۲/۱۰/۰۹
سپیده آقاملائی

نظرات  (۸)

مچکرم.
این مثالت خیلی کمک نمود!
:)
سلام بر شما
ممنون. راهنمایی خوبی بود.
فقط در شکل 8.18 در ردیف نمونه #9 ، مقدار TN باید برابر با 1 و مقدار FN برابر با صفر باشد. در سایر محاسبات خللی وارد نشده است.
با تشکر
پاسخ:
سلام
شکل مال کتاب داده کاوی است. یادمه اون موقع خودم هم با این مشکل داشتم ولی فکر می‌کردم چون ۰.۵ بوده استثنا است ولی من هم حسم اینه که نباید این طوری می‌شد. (حداقل از روی نمونه‌های قبلی)
سلام
برای رسم roc مثل شکل دوم(مقایسه) چه کاری باید کرد؟
تو متلب میتونید براش کد بزنید؟
من مقادیر 2 تا روش رو دارم ولی نمیتونم رسم انجام بدم
پاسخ:
سلام
http://www.mathworks.com/help/nnet/ref/plotroc.html
در ضمن توی خود متلب راهنمای خیلی خوبی هست که همان جا بنویسی با مثال و ... همه چیز را گفته است.
سلام
اگه ممکنه یه توضیح بدید مقادیر جدول براساس کدام داده ها بدست آمده است؟
پاسخ:
سلام
    "Data Mining: Concepts and Techniques" By Jiawei Han, Micheline Kamber, Jian Pei
سلام 
در رابطه با نمودار ROC من داده هام به شکلی هست که نمودار صعودی نمیشه، بالا و پایین میره
نمودارهایی که در مقاله ها دیدم صعودیه
سوالم اینه که مثل این شکلی که رسم کردید(8.19) آیا نمودارها  با محاط کردن یک خط روی نقاط بدست می آید؟؟؟؟
پاسخ:
سلام
نمودار اصلی اون نقطه‌چین است که برای آن پوسته‌ی محدب رسم شده است.
سپاس 
عالی 
جواب سوالی که خصوصی پرسیده شده بود: اعداد مثال مربوط به دسته‌بندی هستند که روی این داده‌ها ساخته شده است. یعنی ابتدا مثلاً یک درخت تصمیم ساخته شده است بعد مرتب شده است و ما در نمودار داریم احتمالی که برای جدا کردن P و N در نظر می‌گیریم را بر حسب تعداد تاپل‌ها رسم می‌کنیم.
عالی 

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی