کابران گرامی این بسته شامل دانلود پاورپوینت درباره درخت تصمیم می باشد از ویژگی های این بسته میتوان به جامع و کاربردی بودن آن،قابل فهم و روان به صورت حرفه ای و رنگی اشاره کرد این پاورپوینت در حجم ۳۶ و ۴۲ اسلاید می باشد.
دانلود پاورپوینت درباره درخت تصمیم
درخت های تصمیم
درختهای تصمیم ابزار قدرتمند و درعین حال رایجی هم برای دسته بندی و هم برای پیشبینی هستند.
جذابیت روشهای درخت مبنا بیش از هرچیز به این واقعیت برمیگردد که درختهای تصمیم نمایانگر قوانین میباشند. به راحتی میتوان قوانین را به زبان فارسی و یا هر زبان دیگری در آورد تا برای همگان قابل فهم باشند. همچنین میتوان آنها را به زبان قابل دسترسی پایگاه داده ها مانند SQL درآورد و مثلا اطلاعات یک گروه خاص را استخراج نمود.
درخت تصمیم برای بررسی داده ها برای کسب بینش بهتر درباره روابط موجود بین تعداد زیادی از متغیرهای ورودی کاندیدا شده برای یک متغیر هدف نیز مفید میباشد. ازآنجایی که درخت تصمیم بررسی داده و مدلسازی را باهم ترکیب میکند، گام اولیه قدرتمندی در فرآیند مدلسازی به شمار می روند حتی هنگامی دانلود پاورپوینت درباره درخت تصمیم که برای تهیه مدل نهایی از برخی تکنیکهای دیگر استفاده شود.
معمولاً بین صحت مدل و شفافیت مدل توازن وجود دارد. دربرخی کاربردها، صحت دسته بندی یا پیشبینی تنها مسئله مهم است، اگر مثلاً یک شرکت پست مستقیم مدلی را دراختیار داشته باشد که با استفاده از آن بتوان به درستی پیشبینی کرد که کدامیک از مشتریان بالقوه احتمالاً به پیشنهاد عرضه شده پاسخ خواهند داد، آنگاه شاید برای این شرکت اهمیتی نداشته باشد چرا و چگونه مدل پیشبینیکننده عمل میکند.
دانلود پاورپوینت درباره درخت تصمیم ppt
درسایر شرایط، توانایی بیان علت یک تصمیم حیاتی است. برای مثال، در غرامتهای بیمه، برخی ممانعتهای قانونی دربرابر تبعیضها براساس متغیرهای خاصی وجود دارد. شاید یک شرکت بیمه در وضعیتی قرار بگیرد که مجبور شود به دادگاه ثابت کند هیچگونه تبعیض غیرقانونی در دادن یا ندادن خسارت به افراد مرتکب نشده است. همچنین بیشتر این پذیرفته شده است که وام دهنده و وام گیرنده بدانند که بر اساس سیستم رایانهای با اعطای وام موافقت نشده است (مثلاً درمواردی که محاسبات رایانهای نشان دهد درآمد ماهیانه متقاضی کمتر از سطح لازم است یا آنکه ظرفیت وام گیرندگان پرشده است) تا اینکه بفهمند تصمیمگیری درباره عدم اعطای وام توسط یک شبکه عصبی هوشمند بدون هیچگونه توضیحی در مورد عملکردش صورت گرفته است.
درخت تصمیم چیست ؟
درخت تصمیمگیری ساختاری است که برای تقسیم مجموعهای بزرگ از داده های جمعآوری شده به مجموعههای کوچکتر زنجیرهوار داده ها بواسطه یک سری قوانین ساده تصمیمگیری به کار میرود.
در هر تقسیمبندی متوالی، اعضای مجموعه های حاصل بیش از پیش به همدیگر مشابه می شوند. تقسیمبندی موجودات زنده براساس قلمروها، سلسله مراتب پیدایش، دسته ها، نظام تولد، خانواده، جنسیت و گونه ها که در دهه ۱۷۳۰ توسط گیاهشناس سوئدی کارل لینوس ابداع شد نمونه خوبی دراین زمینه است.
در قلمروی حیوانات چنانچه موجود زندهای دارای ستون فقرات باشد جزو دسته مهره داران قرار میگیرد. از دیگر ویژگیهای دانلود پاورپوینت درباره درخت تصمیم مهره داران برای تقسیمبندی آنها به پرندگان، پستانداران، خزندگان و غیره استفاده میشود. این دسته بندی آنقدر ادامه مییابد تا در پایینترین ردهبندی، اعضای یک گونه هم ازنظر شکل شناسی و هم توانایی زاد و ولد و پرورش بچه های خود بهم شبیه باشند.
یک مدل درخت تصمیمگیری از مجموعه ای از قوانین برای تقسیم جمعیت ناهمگن وسیعی به گروههای کوچکتر و همگن تر با توجه به یک متغیر هدف خاص تشکیل شده است. شاید تهیه درخت تصمیمگیری مشابه مدل کارل لینوس که به صورت دستی آماده شده طاقت فرسا باشد و شاید این کار به طور خودکار با اعمال برخی الگوریتمهای درخت تصمیمگیری دریک مجموعه مدل حاوی دادههای از قبل دسته بندی شده انجام شود.
معمولاً متغیر هدف، دسته ای است و از مدل درخت تصمیمگیری استفاده می شود تا احتمال تخصیص داده های موجود به هر کدام از دسته ها محاسبه شود یا برای دسته بندی داده ها با تخصیص آن به محتمل ترین دسته به کاررود. همچنین میتوان از درختهای تصمیمگیری برای برآورد مقدار متغیرهای پیوسته استفاده کرد هرچند که تکنیک های مناسبتری نیز برای انجام این کار وجود دارد.
دسته بندی
آنهایی که با بازی بیست سؤالی آشناهستند خوب میدانند چگونه یک درخت تصمیم، دادهها را دسته بندی میکند. دراین بازی یک بازیکن، مکان ، شخص، یا شیئی خاص را که برای دیگر شرکتکنندگان آشنا است درنظر میگیرد ولی وی سرنخی به دیگران در این رابطه نمیدهد. بقیه بازیکنان سعی میکنند با طرح یک سری سؤالات و گرفتن پاسخ بله یا خیر آن را حدس بزنند. یک بازیکن خوب به ندرت نیاز به پرسیدن همه بیست سوال مجاز در بازی دارد تا از اولین سؤال خود که “درجیب جا میشود؟” به پاسخ اصلی “برج میلاد” برسد.
یک درخت تصمیم نیز یک سری و زنجیره از این سوالات را مطرح می کند. همچون بازی بیست سؤالی، پاسخ به اولین سؤال تعیین کننده سوال بعدی است. سؤالات اولیه به ایجاد گروههای بسیار گسترده ای با اعضای فراوان کمک می کند و سؤالات بعدی این گروههای گسترده را به مجموعههای کوچکتر و کوچکتری محدود میکند. اگر سؤالات به خوبی انتخاب شوند آنگاه با یک سری محدود از سئوالات می توان به دسته بندی صحیح داده های ورودی پرداخت.
بازی بیست سؤالی نشان دهنده فرآیند استفاده از یک درخت برای گنجاندن امتیاز یا دسته ای در داده ها است. یک سابقه دانلود پاورپوینت درباره درخت تصمیم اطلاعاتی در گره ریشه قرار میگیرد. دراینجا برای تعیین اینکه بعداً اطلاعات درج شده به کدام ریشه نونهال پیوند میخورد یک آزمایش صورت میگیرد. الگوریتمهای گوناگونی برای انتخاب آزمایش اولیه وجود دارد اما هدف همه آنها یکی است و آن چیزی نیست جز انتخاب آزمایشی که بتواند بین دسته های هدف بهترین تمایز را قایل شود. این فرآیند آنقدر تکرار میشود تا یک سابقه اطلاعاتی به یک گره برگ برسد. تمام اطلاعاتی که به یک برگ در درخت تبدیل میشوند به طریقی مشابه دسته بندی میشوند و یک مسیرمنحصر به فرد از ریشه به برگ وجود خواهد داشت. چنین مسیری نشانگر یک قانون به کاررفته در دسته بندی سوابق اطلاعاتی است.
شاید برگهای گوناگون دارای دسته بندی های مشابهی باشند هرچند که هر برگ به علت متفاوتی دسته بندی را انجام می دهد. به عنوان مثال دانلود پاورپوینت درخت تصمیم درختی که میوه جات و سبزیجات را براساس رنگ آن میوه یا سبزی دسته بندی می کند، برگ درخت تصمیم سیب و گوجه فرنگی و گیلاس می تواند رنگ قرمز را پیش بینی کند هر چند احتیاطهایی را هم باید در نظر داشت چراکه سیبهای سبز، گوجه فرنگیهای زرد و گیلاسهای سیاه رنگ هم وجود دارد.
دانلود پاورپوینت درخت تصمیم
درخت تصمیمگیری موجود در شکل ۱-۶ فهرست گیرندگان احتمالی یک کاتالوگ خرید کالا را به صورت محتمل (۱) و غیر محتمل (۲) برای سفارش دادن پس از فرستادن کاتالوگ جدید دسته بندی می کند.
این درخت براساس قواعد رایج در چرخه های داده کاوی تنظیم شده است بطوری که ریشهها در بالا و برگها در پایین واقع شده اند. درسمت راست فوقانی هر گره یک شماره قراردارد و دسته پیش بینی شده هرکدام درمرکز درج شده است. قوانین تصمیمگیری برای تقسیم هر گره روی خطوطی که هر گره را به نونهالان خود وصل میکند چاپ شده است. تقسیم در گره ریشهای که “سفارشات مادام العمر” نام دارد صورت گرفته است و شاخه سمت چپ به مشتریانی اختصاص یافته که شش سفارش یا کمتر داشته اند و شاخه سمت راست به مشتریانی با ۷ سفارش و بیشتر تعلق گرفته است.
هر داده ای که به گرهها ی برگی ۱۹ ، ۱۴ ، ۱۶ ، ۱۷ یا ۱۸ برسد با عنوان متحمل به پاسخگویی دسته بندی می شود چرا که دسته پیشبینی شده دراین مورد یک است. مسیرهای منتهی به این گرههای برگی قوانین درخت را بیان می کنند. به عنوان مثال، قانون مربوط به برگ ۱۹ از این قرار است: “اگر مشتری بیش از ۵/۶ سفارش داشته باشد و کمتر از ۷۶۵ روز از آخرین سفارش وی بگذرد، احتمالا به کاتالوگ پاسخ خواهد داد.”
شاید خوانندگان هوشیار متوجه شوند که برخی تقسیمهای درخت تصمیم در ظاهر تغییری نمی کنند. مثلاً گرههای ۱۷ و ۱۸ براساس تعداد سفارشاتی که شامل سفارشاتی از دسته خوراکیها است متمایز شده اند. اما هر دو گره به عنوان پاسخ دهنده تعیین شده اند. علت این مسئله آن است که گذشته از بالاتر بودن احتمال پاسخ در گره ۱۸ نسبت به گره ۱۷، احتمال پاسخ در هر دو مورد بیش از حدی است که برای طبقهبندی یک سابقه اطلاعاتی به عنوان پاسخ دهنده تعیین شده است. این مدل به عنوان یک دسته بندی کننده فقط دو خروجی صفر و یک دارد. این دسته بندی دوگانه، اطلاعات سودمندی را نادیده می گیرد که مبحث جدید ما درباره استفاده از درختهای تصمیم برای تهیه امتیازات و احتمالات است.
امتیازدهی
شکل ۲-۶ تصویری از همان درخت تصمیمگیری شکل ۱-۶ است که از یک آرایه درختی دیگر با وضعیت اصلاح شده استفاده شده است به طوریکه اینک درخت با اطلاعات بیشتر یعنی درصد اطلاعات در دسته یک در هر گره حاشیه نویسی شده است.
حال به وضوح میتوان دید که این درخت یک پایگاه اطلاعاتی حاوی نیمیاز پاسخ دهنده ها و نیمیاز غیر پاسخ دهنده ها را نشان میدهد چرا که گره ریشهای دارای نسبت ۵۰ درصد است. این وضعیت دریک مجموعه آموزشی برای یک مدل پاسخگویی با متغیر هدف دوگانه رایج است. در شکل ۱-۶ هر گره با بیش از ۵۰ درصد پاسخ دهنده ها با عدد یک نشان داده شده است که شامل گرههای ۱۷ و ۱۸ نیز میشود. شکل ۲-۶ تفاوت بین این گرهها را روشن میسازد. در گره ۱۷ به میزان ۸/۵۲ درصد سوابق اطلاعاتی نمایانگر واکنش است حال آنکه در گره ۱۸ این رقم به ۹/۶۶ درصد میرسد. معلوم است که یک سابقه اطلاعاتی در گره ۱۸ بیشتر میتواند نمایانگر یک پاسخ دهنده باشد تا یک سابقه داده در گره ۱۷.
از نسبت اطلاعات در دسته دلخواه میتوان به عنوان یک امتیاز استفاده کرد که اغلب از دسته بندی صرف مفیدتر است. برای یک نتیجه دوگانه، دسته بندی فقط میتواند داده ها را به دو گروه تقسیم کند ولی یک امتیاز به داده ها امکان میدهد تا اطلاعات را از محتمل ترین تا کم احتمال ترین افراد برای عضویت در دسته دلخواه مرتب کرد.
دربسیاری از کاربردها به دست آوردن یک امتیاز که قادر به رتبه بندی یک فهرست باشد کافی خواهد بود. این دستاورد نیز برای انتخاب بالاترین درصد N برای ارسال کاتالوگ پستی و برای محاسبه صعود در ابعاد گوناگون فهرست کفایت خواهد کرد.
دانلود رایگان پاورپوینت درخت تصمیم
اما در برخی کاربردها، علم به اینکه احتمال پاسخگویی A از B بیشتر است کافی نخواهد بود. ما می خواهیم درباره احتمال پاسخ گویی توسط A بیشتر بدانیم. با فرض اینکه احتمالت قبلی یک پاسخ را بدانیم آنگاه با آن میتوانیم احتمال واکنش ناشی از امتیاز به دست آمده از دادههایی را که برای تهیه درخت تصمیمگیری نمونه گیری شده اند محاسبه کنیم. یا اینکه میتوانیم مدل را برای دادههای از پیش دسته بندی شدهای که دارای توزیع پاسخ ها و منعکسکننده آمار واقعی جمعیت است بکار ببریم.
این روش با استفاده از نسبتهای دسته ها، در برگهای درخت امتیازاتی را ایجاد میکند که این احتمال را دانلود پاورپوینت درخت تصمیم نشان می دهد که اطلاعات استخراج شده از یک جمعیت مشابه، عضو دسته مزبور باشد.
تخمین
فرض کنید که یک سؤال مهم تجاری به جای آنکه عبارت: ” چه کسی پاسخ خواهد داد؟” عبارت: “مقدار سفارش بعدی مشتری چقدر خواهد بود؟” باشد. با استفاده از درخت تصمیمگیری میتوان به این سؤال نیز پاسخ داد. فرض کنید مقدار سفارش یکی از متغیرهای موجود در مجموعه مدل از پیش دسته بندی شده باشد آنگاه مقدار میانگین سفارش درهر برگ را میتوان به عنوان مقدار سفارش تخمین زده شده برای هرگونه سابقه اطلاعاتی دسته بندی نشدهای به کار برد که معیارهای آن برگ را رعایت کند. حتی این امکان وجود دارد که از یک متغیر هدفمند عددی برای تهیه درخت استفاده کرد. چنین درختی را درخت تخمین زننده مینامند. به جای افزایش خلوص یک متغیردسته ای، هر تقسیم انجام شده در درخت برای کاهش واریانس ارقام متغیر هدف درهر گره نونهال انتخاب میشود.
این حقیقت که از درختان میتوان برای تخمین مقادیر پیوسته استفاده کرد ایده خوبی نیست. از یک تخمین زننده درخت تصمیم میتوان به تعداد برگهای موجود در درخت برای ایجاد مقادیر ناپیوسته استفاده نمود. بمنظور تخمین یک متغیر پیوسته، استفاده از یک تابع پیوسته ارجحیت دارد. مدلهای رگرسیون و شبکههای عصبی عموماً برای انجام تخمین ها مناسب ترند.
درختان با اشکال متفاوتی وجود دارند
درخت موجود در شکل ۱-۶ از نوع دوگانه با ابعاد غیر یکسان است و به عبارتی هر گره غیربرگی دارای دو نونهال است و برگهای آن درفواصل مساوی از ریشه نیستند. دراین مورد هر گره نمایانگر یک سؤال بله یا خیر است که پاسخ به آن تعیین میکند یک سابقه اطلاعاتی باید کدامیک از دو مسیر را طی کند تا به مرحله بعدی درخت برسد.
از آنجایی که هرگونه تقسیم چند مسیری را میتوان به عنوان یک سری تقسیمات دوگانه بیان نمود نیاز واقعی به درختانی با عوامل شاخه ساز بیشتر نیست. با این حال بسیاری از ابزارهای دادهکاوی قادر به ایجاد درختهایی با بیش از دو شاخهاند. برای مثال، برخی الگوریتمهای درخت تصمیم با ایجاد یک شاخه برای هر دسته، متغیرهای دسته ای را تقسیم میکنند که این منجر به درختانی با تعداد مختلف شاخه ها در گره های گوناگون میشود. شکل ۳-۶ نشاندهنده درختی است که از هردو نوع تقسیمبندی سه مسیری و دو مسیری برای همان مسئله دسته بندی که در درخت موجود در شکلهای ۱-۶ و ۲-۶ به کار رفته استفاده میکند.
لازم به ذکر است که رابطهای بین تعداد شاخههای مجاز برای هر گره و تعداد دسته ها در متغیر هدف وجود ندارد. یک درخت دوگانه (یعنی درختی با تقسیم دوشاخه ای) را میتوان برای دسته بندی اطلاعات به هر تعداد دسته و یک درخت با تقسیم چندگانه را میتوان برای طبقهبندی یک متغیر هدف دوگانه به کار برد.
یک درخت تصمیم چگونه تهیه می شود
با اینکه گونههای زیادی از الگوریتمهای درخت تصمیم وجود دارد ولی همه آنها از روند مشابهی پیروی میکنند که آن عبارت است از تقسیم مکرر دادهها به گروههای کوچک و کوچکتر به نحوی که با توجه به متغیر هدف هر نسل جدید گرهها خالص تر از پیشینیان خود است. در بخش عمده این مبحث ما یک متغیر دسته ای و دوگانه هدف مثل پاسخ دهنده / غیر پاسخ دهنده را مدنظر قرار میدهیم. این مسئله باعث تسهیل توضیحات بدون از بین رفتن محتوا می شود.
یافتن محل تقسیمات
درابتدای فرآیند با یک مجموعه آموزشی شامل داده های از قبل دسته بندی شده سروکار داریم که همان مقدار دانلود پاورپوینت درخت تصمیم متغیر هدف برای تمام موارد است. هدف این فرآیند تهیه درختی است که یک دسته را (یا احتمال عضویت در هر دسته) به زمینه هدف اطلاعات جدید براساس ارقام متغیرهای ورودی اختصاص می دهد.
این درخت با تقسیم داده ها در هرگره براساس یک زمینه ورودی مجزا تهیه می شود. لذا دراولین اقدام باید تصمیم گرفت کدامیک از زمینه های ورودی می تواند بهترین تقسیم را انجام دهد. بهترین تقسیم به بهترین جداکننده داده ها به صورت گروههایی گفته می شود که در آن یک دسته در هر گروه نقش غالب را داشته باشد.
این اندازه گیری برای ارزیابی یک تقسیم بالقوه را خلوص مینامند. در همه این روشهای اندازه گیری خلوص، خلوص کم یعنی اینکه مجموعه، حاوی توزیعی از نماینده دسته هاست (بسته به گره والد) درحالی که خلوص زیاد یعنی اینکه اعضای یک دسته مجزا غالب هستند. بهترین تقسیم تقسیمی است که باعث افزایش میزان خلوص داده ها میشود. در یک تقسیم خوب، گرههای هم اندازه ایجاد میشود یا حداقل گره هایی با تعداد داده های بسیار کم بوجود نمیآید.
پاورپوینت درخت تصمیم
در شکل ۴-۶ به آسانی می توان این مطالب را به صورت عینی مشاهده نمود و برخی از تقسیمات خوب و بد در اینجا ارائه شده است.
اولین تقسیم، نامطلوب است چرا که در خلوص هیچ افزایشی حاصل نشده است. جمعیت اولیه حاوی تعداد مساوی از هردو نوع اشکال است که پس از تقسیمبندی نیز باز همین وضعیت در نونهال دیده میشود. تقسیم دومی نیز نامطلوب است چرا که علیرغم افزایش جزئی خلوص،دانلود پاورپوینت درخت تصمیم گره خالص اعضای کمیدارد و خلوص نونهال بزرگتر نسبت به والد خود افزایش بسیار کمییافته است. اما تقسیمبندی آخر مطلوب است چرا که نونهالهایی تقریباً یک اندازه و با خلوص بسیار بیشتری نسبت به والد خود ایجاد شده اند.
الگوریتمهای درخت سازی طاقت فرسا هستند. در آنها هر متغیر ورودی به نوبت برداشته میشود و افزایش خلوص آنها که از هر تقسیمبندی ایجاد شده توسط آن متغیر اندازه گیری میشود. پس از بررسی تمام متغیرهای ورودی، آن متغیری که بهترین تقسیم را فراهم میسازد برای تقسیم اولیه انتخاب و دو یا چند نونهال ایجاد میشود. اگر امکان هیچگونه تقسیمی نباشد (به دلیل تعداد خیلی کم داده ها) یا اگر با تقسیم ها هیچ بهبودی حاصل نشود آنگاه آن الگوریتم به پایان رسیده است و همین گره تبدیل به گره برگی میشود. در غیر اینصورت الگوریتم تقسیم را انجام می دهد و روی هر نونهال این عمل را تکرار می کند.
- لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
- آیدی تلگرام:
- شماره تماس: 09055863256
هیچ دیدگاهی برای این محصول نوشته نشده است.