Decision Tree: Important things to know

Intuitive Machine Learning
8 Jul 202004:24

Summary

TLDRفي هذا الفيديو، يتم شرح كيفية بناء شجرة قرار لتوقع قيمة الهدف من خلال قواعد القرار المستخلصة من بيانات التدريب. يتم التطرق إلى مصطلحات مهمة مثل الجذر، العقدة، تقسيم العقد، وتقليص العقد. يوضح الفيديو كيفية حساب مكاسب المعلومات باستخدام مقياس نقاء جيني، واختيار أفضل قاعدة قرار لتقسيم العقدة الحالية. كما يذكر الفيديو التحديات مثل الإفراط في التخصيص، وطرق مكافحة ذلك مثل تقليل عمق الشجرة أو استخدام الغابات العشوائية التي تجمع شجرات قرارات متعددة للحصول على نتائج أكثر قوة. يتم التأكيد على أهمية الفهم البسيط والفعالية البصرية لشجرة القرار.

Takeaways

  • 😀 شجرة القرار هي طريقة تعليمية غير معلمّة تستخدم تقسيم البيانات لتوقع النتائج بناءً على القواعد المستخلصة من البيانات.
  • 😀 العقدة الجذرية هي نقطة البداية في شجرة القرار وتمثل مجموعة البيانات الكاملة.
  • 😀 التقسيم هو عملية تقسيم العقدة إلى عقد فرعية بناءً على القيم الخاصة بالميزات.
  • 😀 العقدة القرارية هي العقدة التي يمكن تقسيمها إلى عقد أخرى، بينما العقدة الورقية هي عقدة لا يمكن تقسيمها أكثر.
  • 😀 التصفية هي عملية إزالة العقد الفرعية لتقليل التكيف المفرط للنموذج، مما يساعد في مكافحة التكرار الزائد للبيانات.
  • 😀 الحسابات الأساسية لشجرة القرار تتضمن قياس فائدة المعلومات باستخدام مقياس Gini impurity الذي يقيّم نقاء المجموعات.
  • 😀 كلما كان تقارب مجموعة البيانات نقياً، كانت قيمة Gini impurity أقل (0 عندما تكون المجموعة نقية تمامًا).
  • 😀 يتم حساب فائدة المعلومات من خلال الفرق بين نقاء العقدة الأصلية ونقاء العقد الفرعية الناتجة عن التقسيم.
  • 😀 يتم اختيار القاعدة التي تحقق أكبر فائدة معلوماتية لتقسيم العقدة إلى عقد فرعية جديدة.
  • 😀 في حالة وجود عمق كبير جداً لشجرة القرار، يصبح النموذج عرضة للتكيف المفرط مما يؤثر على دقته. من الأفضل تحديد عمق الشجرة للحد من ذلك.
  • 😀 الغابات العشوائية هي أسلوب يعتمد على تجميع عدة أشجار قرار لتوفير نموذج أكثر دقة وقوة من شجرة القرار الفردية.

Q & A

  • ما هو الشجرة القرار؟

    -الشجرة القرار هي إحدى طرق التعلم الآلي غير المعتمد على المعلمات، وتستخدم في التعلم تحت الإشراف لتنبؤ القيم باستخدام قواعد اتخاذ قرارات تم استنتاجها من البيانات التدريبية.

  • ما هو العقد الجذري في شجرة القرار؟

    -العقدة الجذرية هي العقدة التي تقع في بداية الشجرة و تمثل كافة البيانات التي يتم تحليلها.

  • ماذا يعني مصطلح 'التقسيم' في شجرة القرار؟

    -التقسيم هو عملية تقسيم العقدة إلى عقد فرعية عندما يمكن تقسيم عقدة فرعية إلى عقد أخرى. وتسمى هذه العقدة بالعقدة القرار.

  • ما هي العقد الورقية في شجرة القرار؟

    -العقد الورقية هي العقد في الشجرة التي لا تحتوي على عقد فرعية أخرى.

  • ما هو 'التقليم' في شجرة القرار؟

    -التقليم هو عملية إزالة العقد الفرعية من عقدة قرار. وهي عملية معاكسة للتقسيم وتستخدم لمنع الإفراط في التوفيق مع البيانات (Overfitting).

  • كيف يتم إنشاء شجرة القرار باستخدام البيانات؟

    -يتم إنشاء شجرة القرار من خلال فحص مجموعة من القواعد البسيطة مثل حجم العنصر أو لونه. بعد ذلك، يتم اختيار أفضل قاعدة تقسيم بناءً على حسابات معينة مثل المكسب المعلوماتي.

  • ما هو المكسب المعلوماتي؟

    -المكسب المعلوماتي هو مقياس يستخدم لاختيار أفضل قاعدة تقسيم في شجرة القرار. يتم حسابه بناءً على تقليل التلوث أو 'الملوثة' بين مجموعات البيانات بعد التقسيم.

  • كيف يتم حساب المكسب المعلوماتي؟

    -يتم حساب المكسب المعلوماتي من خلال طرح التلوث (الملوثة) في العقدة الأصلية من المتوسط المرجح للتلوث في العقد الفرعية الناتجة عن التقسيم.

  • ما هي مشكلة الإفراط في التوفيق وكيف يمكن تجنبها؟

    -الإفراط في التوفيق يحدث عندما تكون شجرة القرار عميقة جدًا وتعتمد على تفاصيل دقيقة جدًا من البيانات. يمكن تجنب ذلك من خلال تقليم الشجرة أو تحديد عمق أقصى لها.

  • ما هو الغابة العشوائية ولماذا تُستخدم؟

    -الغابة العشوائية هي مجموعة من أشجار القرار، حيث يتم دمج نتائجها للحصول على نتيجة واحدة نهائية. هي تقنية نموذجية قوية تحارب مشكلة الإفراط في التوفيق دون التضحية بالتحيز.

Outlines

plate

هذا القسم متوفر فقط للمشتركين. يرجى الترقية للوصول إلى هذه الميزة.

قم بالترقية الآن

Mindmap

plate

هذا القسم متوفر فقط للمشتركين. يرجى الترقية للوصول إلى هذه الميزة.

قم بالترقية الآن

Keywords

plate

هذا القسم متوفر فقط للمشتركين. يرجى الترقية للوصول إلى هذه الميزة.

قم بالترقية الآن

Highlights

plate

هذا القسم متوفر فقط للمشتركين. يرجى الترقية للوصول إلى هذه الميزة.

قم بالترقية الآن

Transcripts

plate

هذا القسم متوفر فقط للمشتركين. يرجى الترقية للوصول إلى هذه الميزة.

قم بالترقية الآن
Rate This

5.0 / 5 (0 votes)

الوسوم ذات الصلة
شجرة قرارتعلم مشرفGini Impurityإفراط التخصيصالتعلم الآليمقدمة للشجرةتقنيات النمذجةالقواعد القرارتحليل البياناتالغابات العشوائية