Training Data Vs Test Data Vs Validation Data| Krish Naik

Krish Naik Hindi
25 Jun 202214:41

Summary

TLDRThis YouTube video script discusses the critical concepts of training, validation, and test data in machine learning. It aims to clarify the confusion around these terms and their applications. The video uses examples, such as regression and classification problems, to explain the process of data preprocessing, feature engineering, and model training. It also covers hyperparameter tuning and the importance of using validation data to optimize model performance before testing with unseen data.

Takeaways

  • 😀 The video is aimed at discussing the differences between training, validation, and test data sets in machine learning.
  • 🔍 The script emphasizes the confusion many people face regarding when to use training, test, and validation data.
  • 📈 It explains that training data is used to fit the model, test data is used to evaluate the model's performance on unseen data, and validation data is used for tuning hyperparameters.
  • 🎯 The importance of preprocessing and feature engineering before model training is highlighted.
  • 🔧 The script introduces the concept of splitting data into training and test sets, with a focus on the remaining data being used for validation.
  • 📝 The video mentions that validation data helps in hyperparameter tuning and is crucial for avoiding overfitting.
  • 🔄 Cross-validation is introduced as a method for model evaluation, which involves dividing the training data into 'k' folds for validation.
  • 📊 The script explains that the performance of a model is assessed using various metrics, such as accuracy and confusion matrices.
  • 🌐 The video also touches on the importance of feature selection and how it can impact model training and performance.
  • 🔗 Lastly, the script encourages viewers to subscribe to the YouTube channel for more informative content on machine learning and data science.

Q & A

  • What is the primary focus of this video?

    -The video focuses on explaining the difference between training, validation, and test datasets in machine learning, and how to use them effectively during model development.

  • What are the key types of problems in machine learning mentioned in the video?

    -The video mentions two primary types of problems in machine learning: regression and classification, both of which are used in supervised learning.

  • What is the purpose of the training dataset?

    -The training dataset is used to train the machine learning model. It helps the model learn patterns in the data by fitting the model to the provided features and outcomes.

  • When should the test dataset be used?

    -The test dataset should be used after the model has been trained to evaluate its performance on unseen data. This helps assess the model's accuracy and generalization capability.

  • How does the validation dataset help in model development?

    -The validation dataset is used during the hyperparameter tuning process. It helps optimize the model by allowing adjustments to be made before final testing, ensuring better performance.

  • What is cross-validation, and why is it important?

    -Cross-validation is a technique where the training data is split into multiple subsets to train and validate the model on different portions of the data. It helps improve model reliability by ensuring the model's performance is consistent across different data samples.

  • What is the key difference between training, validation, and test datasets?

    -The training dataset is used for learning patterns, the validation dataset is for tuning hyperparameters, and the test dataset is for evaluating the final model performance.

  • How is overfitting detected in machine learning models?

    -Overfitting is detected when the model performs well on the training data but poorly on the test data. This indicates that the model has memorized the training data instead of generalizing well.

  • What is the significance of performance metrics like confusion matrix and recall?

    -Performance metrics like the confusion matrix and recall are used to evaluate the accuracy, precision, and robustness of a model's predictions, especially in classification tasks.

  • What is hyperparameter tuning, and how does it affect the model?

    -Hyperparameter tuning involves adjusting the model's settings (like learning rate, number of layers, etc.) to improve its performance. Proper tuning helps the model achieve better accuracy and generalization.

Outlines

00:00

📚 Introduction to Machine Learning Training, Validation, and Testing

The speaker begins by greeting the audience and introducing the topic of the video, which revolves around machine learning. They mention that they will discuss the differences between training, validation, and testing datasets, which are often confusing for many. The speaker aims to clarify these concepts using examples and explanations. They encourage viewers to subscribe to the channel and watch the video until the end to understand these crucial aspects of machine learning.

05:02

🔍 Understanding the Role of Training, Validation, and Testing Data

In this paragraph, the speaker delves into the specifics of training, validation, and testing datasets. They explain that the training data is used to teach the model, the testing data is used to evaluate the model's performance on new, unseen data, and the validation data is used to fine-tune the model's hyperparameters. The speaker uses examples to illustrate how these datasets are divided and used in the machine learning process. They also touch upon the importance of preprocessing and feature engineering in preparing the data for the model.

10:09

🎯 Applying Cross-Validation for Model Tuning

The speaker discusses the concept of cross-validation, a technique used to assess the performance of a machine learning model. They explain how to divide the training data into smaller sets to perform cross-validation, which helps in tuning the model's hyperparameters effectively. The speaker provides a detailed example of how to implement cross-validation, emphasizing its importance in ensuring that the model generalizes well to new data. They also mention that they will cover different types of pollution in the next video, providing a preview of upcoming content.

Mindmap

Keywords

💡Machine Learning

Machine Learning is a subset of artificial intelligence that provides systems the ability to automatically learn and improve from experience without being explicitly programmed. In the context of the video, Machine Learning is the central theme, as the speaker discusses various aspects of training models, which is a key process in machine learning.

💡Training Data

Training Data refers to the set of data used to 'teach' a machine learning model. The video script mentions that initially, models are trained using specific training datasets. This is a fundamental step in machine learning where the model learns to make predictions or decisions based on the patterns it detects in the training data.

💡Validation Data

Validation Data is used to tune the parameters of a machine learning model. The script explains that after a model is trained, validation data is used to fine-tune the model's hyperparameters. This helps in improving the model's performance on unseen data by avoiding overfitting, which is a scenario where the model performs well on training data but poorly on new data.

💡Test Data

Test Data is used to evaluate the final performance of a machine learning model. The video script highlights that once a model is trained and tuned, the test data is used to check the model's performance. This is crucial as it gives an unbiased evaluation of how well the model is likely to perform in real-world scenarios.

💡Hyperparameters

Hyperparameters are configuration settings in a machine learning model that cannot be learned from the data; they must be set before the training process begins. The script mentions tuning hyperparameters as a critical step in the model development process. Examples include the number of layers in a neural network or the depth of a decision tree.

💡Cross-Validation

Cross-Validation is a technique used to assess the performance of a machine learning model. The video script discusses using cross-validation to divide the training data into subsets, which are used to train and validate the model iteratively. This helps in ensuring that the model is robust and generalizes well to new, unseen data.

💡Feature Engineering

Feature Engineering is the process of using domain knowledge to select or construct features from the raw data to improve the performance of a machine learning model. The script refers to feature engineering as an important concept where the speaker discusses how to select the most important features for training a model.

💡Model Performance

Model Performance refers to how well a machine learning model accomplishes its task. In the video, the speaker talks about evaluating model performance using test data and various performance metrics, such as accuracy or precision. This is essential to understand how effective the model is at making predictions.

💡Regression

Regression is a type of predictive modeling technique that estimates the relationship between variables. The script mentions regression as one of the problem statements in machine learning where the model predicts a continuous outcome based on the input features.

💡Classification

Classification is another type of predictive modeling technique used to predict the category or class of an entity. The video script discusses classification as a common problem statement where the model learns to categorize input data into predefined classes or labels.

💡Data Preprocessing

Data Preprocessing involves transforming raw data into a format that can be used by a machine learning model. The script touches upon data preprocessing as an initial step before training a model, which can include cleaning data, handling missing values, and normalizing data.

Highlights

Introduction to the YouTube channel and the topic of discussion: machine learning playlist curation.

Emphasis on the importance of understanding the differences between training, validation, and test datasets.

Explanation of when to use training, validation, and test data in machine learning projects.

The role of data preprocessing in machine learning and how it sets the stage for model training.

The concept of feature engineering and its significance in transforming raw data into a usable format for machine learning models.

Discussion on feature selection and its impact on model training and performance.

The process of model training and the importance of using a specific dataset for this purpose.

The function of test data in evaluating a model's performance on new, unseen data.

Introduction to the concept of validation data and its role in hyperparameter tuning.

Explanation of cross-validation as a method for effectively using data for both training and validation.

The practical demonstration of dividing a dataset into training, validation, and test sets.

The importance of using validation data to fine-tune hyperparameters for optimal model performance.

The concept of using different subsets of data for training, validation, and testing within a machine learning workflow.

The potential confusion that arises from the use of different terms like training data, validation data, and test data.

The idea that training data is used to fit the model, while test data is used to evaluate its performance.

The role of performance metrics in assessing how well a model is likely to perform on real-world data.

The caution against overfitting and the importance of using validation data to prevent it.

The strategy for using a portion of the training data as validation data to monitor model performance during training.

The concept of k-fold cross-validation and its application in machine learning for robust model evaluation.

The practical example of how to implement cross-validation with a specific dataset to optimize model performance.

Encouragement for viewers to subscribe to the channel for more informative content on machine learning.

Transcripts

play00:00

हेलो हेलो वन माय नेम इस कृष्णा एंड वेलकम

play00:02

टू माय YouTube चैनल सो गाइस हम लोग मशीन

play00:04

लर्निंग प्ले लिस्ट कटिंग करेंगे और आज के

play00:07

वीडियो में बहुत इंपोर्टेंट टॉपिक डिस्कशन

play00:09

करने वाले हैं जिसको हम लोग बोलते

play00:10

ट्रेनिंग ले रहा है ट्यूसडे कर सेट ऑफ

play00:13

वैलिडेशन डिफरेंट अब यह तीनों में क्या

play00:16

डिफरेंस है और बहुत सारे लोगों को इसके

play00:19

रिलेटिड बहुत ही कंफ्यूजन है कि ट्रेनिंग

play00:21

देगा क्या होता है टेस्ट डेटा क्या होता

play00:23

है वेलेडिक्शन डाटा कब होता है क्या होता

play00:24

है हमको ट्रेन और टेस्ट डेटा कब यूज करना

play00:27

चाहिए वैलिडेशन डाटा कब यूज करना चाहिए तो

play00:30

इस चीजों को लेकर है ना जब भी कोई

play00:32

प्रॉब्लम स्टेटमेंट ऑफ सॉल्व करते हैं

play00:33

बहुत सारे लोगों को कंफ्यूजन होता है हम

play00:36

कोशिश करेंगे इस वीडियो में जो मैं आपको

play00:38

एक्सप्लेनेशन दे रहा हूं उससे आपको

play00:40

क्लीयरली आइडिया मिल जाए कि ट्रेन टेस्ट

play00:43

एंड वैलिडेशन के बीच में क्या डिफरेंस है

play00:45

अगर आप मेरे चैनल पर नए हैं प्लीज मिक्सचर

play00:48

यह subscribe The Channel press The Bell

play00:50

नोटिफिकेशन आयुक्त और वीडियो पूरा एंड तक

play00:53

देखिएगा इस क्योंकि यह सारे क्वेश्चंस

play00:55

आपको इंटरव्यू में आ सकता है तो विदाउट

play00:58

वेस्टिंग एनी टाइम में अपना स्क्रीन शेयर

play00:59

कर युक्त अब यहां हम लोग डिस्कशन करने

play01:02

वाले हैं ट्रेन टेस्ट एंड वैलिडेशन

play01:04

डैंड्रफ चाहिए हमें एग्जांपल लेते हैं

play01:06

आपको पता है कि हम लोग कैसे टाइप की

play01:09

प्रॉब्लम स्टेटमेंट सवाल करते हैं सूखा

play01:11

वाली मशीन लर्निंग में एक प्रॉब्लम

play01:12

स्टेटमेंट हो सकता है रिग्रेशन ठीक है

play01:15

दूसरा प्रॉब्लम स्टेटमेंट जो सकता है उसका

play01:18

हम लोग बोलते हैं क्लासिफिकेशन अब यह

play01:21

दोनों प्रॉब्लम स्टेटमेंट हम लोग यूज कर

play01:23

सकते हैं इन सुपरवाइजर मशीन अब यह दोनों

play01:27

में क्या होता है

play01:29

ठीक है डाटा से

play01:32

यह डिसाइड

play01:35

10000 से कुछ रिकॉर्ड और यह मीटिंग है

play01:40

यहां पर

play01:45

सब्सक्राइब करे और

play01:48

सब्सक्राइब इंडिपेंडेंस और इनपुट फीचर्स

play01:52

और

play01:54

कोट

play01:56

तो यह फीचर को लेकर मैं बेसिकली को ट्रेन

play02:00

गौतम बुद्ध के डिब्बे बिट्टू कड़कना

play02:01

आउटपुट तो यह फोकस होता है मां कोई भी

play02:04

प्रॉब्लम स्टेट में प्रदर्शन है

play02:05

क्लासिफिकेशन कैसे हो

play02:07

कि अब जब भी हम लोग फर्स्ट मॉडल ट्रेन

play02:10

करने करते हैं अगर हम लाइफ साइकिल ऑफ डाटा

play02:13

साइंस प्रोजेक्ट समझें फर्स्ट क्या होता

play02:15

है हमारा स्टेज पर स्टेज हमेशा आपको याद

play02:17

रहना चाहिए उन्हें बेसिकली डाटा

play02:20

प्रीप्रॉसेसिंग करते हैं डाटा प्रोसेसिंग

play02:22

में बहुत सारे चीज होते हैं जैसे हो गया

play02:24

हमारा मीडिया एक क्लीनिंग डॉल अभी डाटा

play02:28

फीड चेंजेस डाटा प्रोसेसिंग में हम लोग एक

play02:30

ही एक अच्छा कांसेप्ट जो अप्लाई करते हैं

play02:32

इसको बोलते फीचर इंजीनियरिंग मैं ही लिख

play02:34

देता हूं ठीक है अमेठी से इंजीनियरिंग कर

play02:37

दिया आपने फीचर्स सेलेक्शन कर दिया उसका

play02:40

मतलब आप एक स्टेप आगे बढ़ गए इसके बाद

play02:42

फीचर सेलेक्शन में क्या हम लोग दे बिजली

play02:44

देखते हैं कि हम कौन से सबसे इंपोर्टेंट

play02:46

फीचर जो यूज करना है मॉडल ट्रेनिंग के लिए

play02:48

और फाइनली हम लोग जाते हैं मॉडल ट्रेनिंग

play02:50

है ठीक है

play02:52

ए मॉडल ट्रेनिंग

play02:54

उसके बाद आपको पता है नेक्स्ट स्टेप होगा

play02:56

का मॉडल डिपार्मेंट बट इससे बाद भी एक और

play02:59

बहुत इंपोर्टेंट इंपोर्टेंट है जिसको हम

play03:01

लोग बोलते हैं तो पैरों ट्यूनी ठीक है

play03:04

हाइपर पैरामीटर

play03:08

कि मैं आपसे से लिख देता हूं

play03:11

के नक्शे दे तो यह मेरा पूरा का पूरा

play03:13

स्क्वायर हो

play03:15

गया और यह रहा मेरा

play03:19

हेलो हाय पैरामीटर चीनी

play03:22

अच्छा ठीक है और फाइनली हमारा मॉडल क्लास

play03:25

हो जाता है लेकिन यहां पर कॉर्ड में हम

play03:27

लोग रिप्लाई करने वाले थे तो यह यूजुअली

play03:30

स्टेप्स होता है अब यह फीचर इंजीनियरिंग

play03:33

प्रॉसेस आफ्टर सिलेक्शन प्रॉसेस किस चीज

play03:36

के लिए करना चाहिए और आपको क्या टेक्निक

play03:38

लिए करना चाहिए वह सारा चीज तो हम लोग

play03:41

ऑफिस लिए दूसरे वाले प्ले लिस्ट में

play03:42

देखेंगे कि चेंजिंग आप कैसे करते हैं फीचर

play03:44

सलेक्शन कैसे करते हैं बटर का भी मैं बात

play03:47

करूं अगर आपके पास कोई डाटा सेट है ठीक है

play03:50

डाटा सेट है इस डाटा सेट को हम लोग यूज ली

play03:54

दो मेन केटेगरी में डिवाइड करते हैं ठीक

play03:56

है धो भी नहीं बोलूंगा 3 मिनट के लिए

play03:58

फर्स्ट कैटेगिरी हम लोग बोलेंगे इसको

play04:00

ट्रेन डाटा तो बेसिकली मैं क्या कर सकता

play04:03

हूं यहां पर मेरा यह ट्रेंड एसेट होगा

play04:07

और दूसरा कैटेगिरी जो मैं पिछली बोलता हूं

play04:09

और मैं इसको यहां पर लिख दूंगा इस कैटेगरी

play04:12

को हम लोग बोलेंगे टेस्ट डेटा है

play04:16

अच्छा ठीक है टेस्ट और एक और कैटेगिरी

play04:20

होता है जो काफी इंपोर्टेंट कैटेगिरी और

play04:22

इसका पर पंचमी में बताऊंगा आपको इसको हम

play04:25

लोग बोलते हैं वैलिडेशन डाटा ठीक है तो यह

play04:28

बालों का आइडिया मिल गया होगा ट्रेन डाटा

play04:30

वैलिडेशन डेटा टेस्ट डेटा अब आपको समझना

play04:33

है कि ट्रेन डाटा ट्रेनिंग डाटा किस चीज

play04:35

के लिए यूज होता है लेकिन जब हम को

play04:38

स्टार्टिंग में डेसर्ट मिलता है राइट और

play04:39

हमको यह डाटा सेट्स ए स्पेसिफिक ली मॉडल

play04:42

बनाना है इनिशियली आपका जो भी मॉडल ट्रेन

play04:45

होता है तो उस मॉडल को प्रेम करने के लिए

play04:48

हम लोग पैसे पिछली ट्रेनिंग डेटासेट लेते

play04:50

हैं ठीक है स्पेसिफिकली यह मॉडल को प्रेम

play04:54

करने के लिए मैं आपको दिखा देता हूं ट्रेन

play04:56

फॉर ट्रेंनिंग इस मॉडल विद स्पेसिफिकली थे

play04:59

डिस्टिक प्लैनिंग डिसाइड ठीक है और यह

play05:02

कंप्लीट डाटा सेट में लिख 72825 सेंटर

play05:05

जॉब्स डाटा यहीं पर जाता है ठीक है लक्ष्य

play05:08

कि अगर मैं पास से जहर समय रंग से ज़

play05:11

पॉइंट्स बेसिकली ट्रेनिंग लेटेस्ट में जा

play05:13

सकता है ठीक है और अगर आप यह पॉइंट से एप

play05:16

तो सकते हैं लेकिन यह प्रॉब्लम तो अगर मैं

play05:20

यहां पर आ जाओ यह ट्रेनिंग सेट में वे

play05:22

स्पेसिफिकली आ जाओ और दूसरा जो रिमेनिंग

play05:25

20% होता है 20% बेटा लेट से यहां पर जा

play05:28

रहा है जो टेस्ट डेटा यह टेस्ट डेटा जो

play05:31

रहता है यह मॉडल का परफॉर्मेंस चेक करने

play05:35

के लिए यूज होता है ठीक है बहुत ही क्लियर

play05:38

तरीके से मैं बोल रहा हूं मॉडल का

play05:39

परफॉर्मेंस इसका मतलब क्या हम यह डाटा को

play05:41

लेकर यह डाटा को लेकर बेसिकली यह मॉडल से

play05:44

प्रिडिक करवाते हैं प्रिडिक करवाते हैं और

play05:48

कंफ्यूजन मैट्रिक्स कंफेशन मैट्रिक्स

play05:51

मुख्य अतिथि समय तक नहीं बोलूंगा

play05:53

परफॉर्मेंस मैट्रिक्स हम लोग यहां पर

play05:56

स्पेसिफिकली चेक करते हैं ठीक है

play05:58

परफॉर्मेंस मैट्रिक प्रॉमिनेंट इसमें कुछ

play06:01

भी आ सकता है आपके जिसको ऋषि जैन रीकॉल है

play06:04

ना और बहुत सारे डिफरेंट डिफरेंट टीचर्स

play06:06

और पेरेंट्स आ सकते हैं

play06:08

रॉबर्ट इसलिए आप यहां पर थोड़े हाइब्रिड

play06:10

यूज कर सकते हैं जैसे कि आप इसको हो गया

play06:12

क्लासिफिकेशन रिपोर्ट हो गया और यह सारा

play06:15

चीज में ऑफ इसलिए मैं मशीन लर्निंग एप मैं

play06:16

आपको बता रहा हूं तो आप यह जान लिया कि

play06:20

ठीक है भाई ट्रेनिंग डाटा हम लोग बेसिकली

play06:22

रहते हैं मॉडल को फिट करने का ट्रेंड करने

play06:24

के लिए उसे टेस्ट डेटा बेसिकली हमारा कुछ

play06:27

नया टाइप का डेटा हो जिसे हम लोग मॉडल

play06:28

प्रॉमिस चेक करते हैं हमेशा के लिए

play06:30

प्रेरित करेंगे इसमें से और इसके रियल

play06:32

आउटपुट से कंपेयर करेंगे ना यह लास्ट

play06:35

पॉइंट और यह प्रिडिक्शन आउटपुट इन दोनों

play06:38

से हम लोग बेसिकली कंपेयर करें और बेस्ट

play06:40

ऑल परफारमेंस मैट्रिक हम लोग डिसाइड

play06:41

करेंगे कि मॉडल का परफॉर्मेंस कैसा है इस

play06:44

बेसिस में हम लोग बेसिकली बाय ठेर वैरीयस

play06:46

के बारे में भी समझें कि बाय फोर व्हील

play06:48

ड्राइव हो सकता है और यह वाला टॉपिक भी

play06:50

मैंने बर्थडे ली है यहां पर प्राइस भी

play06:53

रेस्टोरेंट ऑफ बोल सकते हैं कब और फिटिंग

play06:55

हो रहा है कब अंदर फिटिंग ओर है यह सारा

play06:56

चीज ठीक है जैसे अगर मैं एग्जांपल अगर

play06:59

मेरे ट्रेनिंग देता है कि ऋषि हाई है

play07:02

ठीक है और टेस्ट डेटा कांग्रेसी लो है तो

play07:06

बेसिकली हमारा यह वाला सिनेरियो क्या होगा

play07:08

और फिटिंग कंडीशन होगा अगर समझ ना यह

play07:10

हमारा ट्रेन है कि ऋषि लो है और यह वाला

play07:13

को रेसिपी लो है तो वह कंडीशन होगा एंटर

play07:15

सेटिंग शो जिससे हाइट 22 लो बाय फेब 22 लो

play07:19

वेरियन स्लो बाय थे वैरीयस म्यूजिक हमको

play07:22

क्या होना चाहिए अगर ऐसी ट्रेनिंग

play07:23

क्रिस्पी ही आना चाहिए और टेस्टी रेसिपी

play07:26

है जाना चाहिए यह बेसिकली मॉडल का मेन

play07:28

होता है

play07:29

अब यह तो आपको समझना है कि वैलिडेशन बेटा

play07:32

कहां आता है देखिए

play07:35

वैलिडेशन डाटा हम लोग इसलिए यूज करते हैं

play07:38

क्योंकि हम लोग मॉडल का हाइपर पैरामीटर

play07:41

ट्यूनिंग कर पाए हैं

play07:43

और हाइपर पैरामीटर ट्यूनिंग कर पाए ठीक है

play07:47

यह वाले डाटा यूज करके बेसिकली ट्यूनिंग

play07:51

करते हैं बट आप बोलेंगे कुछ हवाई अड्डा का

play07:54

है उन 28 इसलिए ट्रेनिंग में डिवाइड कर

play07:56

दिया टेस्ट में डिवाइड कर दिया ठीक है

play07:58

ट्रेन में डिवाइड कर दिया टेस्ट में

play08:00

डिवाइड के लिए बैठे वैलिडेशन लौटाएगा कहां

play08:02

से कि हमारे WhatsApp Twitter ही नहीं बचा

play08:04

तो इसीलिए हम लोग यह जब ही 5 मिनट इवनिंग

play08:08

करते हैं तो हम लोग बेसिकली क्या करते हैं

play08:10

यह ट्रेनिंग डाटा सेट में से थोड़ा-थोड़ा

play08:13

डाटा वैलिडेशन डाटा में भी डालते रहते हैं

play08:16

प्लेट करते रहते हैं वैलिडेशन डाटा में भी

play08:18

बेचते रहते हैं शोल्डर हम लोग मॉडल है पर

play08:21

ट्यूनिंग कर पाए तो अब आपका क्वेश्चन होगा

play08:24

कि यह कैसे पॉसिबल है एक बहुत ही अमेजिंग

play08:27

कांसेप्ट है जिसको हम लोग बोलता है रस

play08:28

वैलिडेशन

play08:30

यह क्रॉस वैलिडेशन बहुत डिफरेंट टाइप्स ऑफ

play08:32

पोलूशन है जो हम लोग डिस्कशन करेंगे

play08:35

प्रॉब्लम नेक्स्ट वीडियो में बट एक Idea

play08:37

दिखाना चाहता हूं क्लोज रिलेशन वर्क ऐसा

play08:39

करता है लेट से मेरे ट्रेनिंग डाटा पॉइंट

play08:42

में मैंने प्लेट के बाद यहां पर मैंने डाल

play08:44

दिया 8000 रिकॉर्ड्स और मैं रिक्वेस्ट में

play08:47

मैंने डाल दिया 2012 ठीक है तो ट्रेनिंग

play08:52

के डाटा से हम लोग वीकली ट्रेन करेंगे

play08:53

मोडल को ठीक है और टेस्ट एक बार मॉडल

play08:57

ट्रेन हो जाएगा इससे हम लोग प्रिडिक्शन

play08:58

फॉर ऑल करेगा और सेमेस्टर की देखते हैं और

play09:01

लेट कंसीडर कैमरा प्रेमी डाटा यहां पर

play09:03

लेते हैं अब आप रोज मेडिकल कैसे करिएगा कि

play09:06

हमको इसी डाटा से वैलिडेशन डाटा भी क्रिएट

play09:09

करना है तो यह लिप्स है कि मेरा 80

play09:11

रिकॉर्ड है ठीक है अब क्रॉच वैलिडेशन यह

play09:14

बोलता है अगर मैं क्रॉस वैलिडेशन इन 125

play09:16

लू या इज इक्वल टू टेन लाइफ से रिलेट से

play09:19

कि मैं क्रॉस वैलिडेशन में परफॉर्म करने

play09:21

वाला हूं स्पेसिफिक लिए हाथ-पैर मिनट

play09:24

यूनियन के लिए उसका मतलब क्या हो गया मैं

play09:27

यह ट्रेनिंग डाटा से वैलिडेशन क्विक

play09:30

क्रिएट करूंगा और यहां पर मैं स्पेसिफिकली

play09:33

थे तंत्रास लेडीस 225 आप वैलिडेशन इन 125

play09:36

मतलब मैं क्या करने वाला हूं यह हेरोल्ड

play09:39

को डिवाइड फाइव करने वाला हूं अब हमे

play09:42

डिवाइड f5 करता हूं तो यहां पर आएगा मेरा

play09:44

फाइव बांधा फांसी की सजा और

play09:47

06 अंधेरो पर क्रॉस वैलिडेशन में फॉर एवरी

play09:52

क्रॉस

play09:54

वैलिडेशन एवरी क्रॉस

play09:56

वैलिडेशन ठीक है मिनट ट्रेनिंग डाइड इन थे

play10:02

मिड साइज होना चाहिए - 6 हो गया 2008

play10:08

डेटा का होना चाहिए 6

play10:12

यहां पर यह होना चाहिए 3500

play10:14

कि मैंने करके लिखा हो तो यह मेरा ट्रेंड

play10:17

सैटर होना चाहिए से 1000 मेरा वैलिडेशन और

play10:20

मैं टेस्ट बोलूंगा यह वैलिडेशन बोल सकता

play10:22

हूं यहां वैलिडेशन जो मेरा डाटा होगा का

play10:25

युद्ध होगा 1604 यह ड्राई यह जो वैलिडेशन

play10:29

डाटा जो मैं यूज करें यह स्पेसिफिक हमको

play10:31

है परमिट कि उनके लिए हेल्प करेगा बट आप

play10:35

सोच रहे क्रिस ऐसे करने से अब म्हारा मॉडल

play10:37

के साथ ट्रेनों का लेट से कि यहां पर

play10:39

मैंने क्लास ग्रैंड एडिशन 12505

play10:41

एक्सपेरिमेंट हो गए फाइव एक्सपेरिमेंट

play10:44

करने वाला हूं मैं ठीक है फाइव

play10:47

एक्सपेरिमेंट करने वाला फर्स्ट

play10:48

एक्सपेरिमेंट में लेट्स चेक यह मेरा पूरा

play10:51

8000 डाटा पॉइंट ठीक है स्टार्टिंग का 60

play10:56

डाटा पॉइंट यह मेरा से ज़ जो वैलिडेशन

play11:00

बेटा है अब यह सीबीसी 121 में मतलब फर्स्ट

play11:03

experiment में मैं टाइपिंग कास्टिक

play11:06

जिन्हें जरा वैलिडेशन डाटा लूंगा और

play11:08

रीमेनिंग जो हमारा से 2008 डेटा पॉइंट्स

play11:12

है कि यह मेरा ट्रेन लेट आऊंगा

play11:15

अच्छा ठीक है फिर निकाल लूंगा अब

play11:17

स्पेसिफिक यह डाटा सेट में मॉडल ट्रेन

play11:19

करूंगा और हम को मिलेगा कुछ एक ब्रेसलेट

play11:21

से तो मेरा यह रिसीव हो गया अब हम लोग 5

play11:26

एक्सपेरिमेंट करना है कि प्रोफेशनल एडिशन

play11:27

फाइव है तो सेकंड वाले experiment में

play11:30

क्या होगा जब मेरा वॉइस मेल एडिशन इज

play11:32

इक्वल टू होगा नुमाइश विट्टू नेक्स्ट 70

play11:37

60 रिकॉर्ड यहां से यह हो जाएगा मेरा

play11:41

वैलिडेशन लेटेस्ट है

play11:43

है और यह हो जाएगा मेरा ट्रेंड डाटा यह

play11:46

जाएगा मेरा ट्रेंड डाटा ठीक है रीमेनिंग

play11:49

जो से

play11:51

022 हो गया अब ऐसे करते जाऊंगा तो यहां भी

play11:54

मैं आपको कुछ क्वेश्चन मिलेगा तो यह मेरा

play11:56

एक जैसी टू हो गया ठीक है अब सिमिलरली

play12:00

मिर्जा गालिब को दूसरी में जो मेरा

play12:03

नेक्स्ट से 1000 पॉइंट होगा यह मेरा होगा

play12:06

टेस्ट डेटा और यह मेरा होगा ट्रेन डाटा

play12:09

ठीक है और यह मेरा हो गया है क्रेज़ी 123

play12:14

में बिछेगा हम लोग यह मत डिफरेंट डिफरेंट

play12:18

प्रेस नोट ऐसे क्यों कर रहे हैं ठीक है और

play12:20

यह टेस्ट भी नहीं बोलूंगा इस हम लोग

play12:22

वैलिडेशन ही बोलते हैं बट यूजुअली हम लोग

play12:24

ज्यादा टाइम है क्या करते हैं कि

play12:26

तेज बोलने का आदत हो गया बट यह है मेरा

play12:29

वैलिडेशन डाटा सर ठीक है अब यह हमारा आग न

play12:32

लग सके और इसी उसके बाद ऐसे करके इसी बीच

play12:35

एक दूसरी है ऐसी मैजिकल टू फॉर आएगा और

play12:39

ऐसे सीन विजिबल टो फाइव आएगा ठीक है

play12:43

अब मैं नेक्स्ट वाले पेशंट यह हो गया

play12:46

फाइनल में यह चैनल

play12:50

सब्सक्राइब का यहां

play12:56

सब्सक्राइब करें

play13:00

चैनल को

play13:03

सब्सक्राइब करें लाइक करें और यह सारे अगर

play13:08

हम करते हैं इसका लेते हैं कि नींद लेते

play13:13

हैं लेकिन मैंने इसका सप्ताह मीन ले लिया

play13:16

ठीक है मीन और

play13:19

यह हमारा

play13:22

जो भी आप यूज करते हैं ठीक है तो इसका

play13:27

मतलब है कि मैंने बहुत सारे अलार्म्स

play13:29

मैंने बहुत सारे ट्यूनिंग यह बहुत सारे

play13:32

मॉडल के साथ मैंने एक चीज भी स्ट्रेन और

play13:36

चेंज हो

play13:39

तो इस तरीके से आप बेसिकली वैलिडेशन डाटा

play13:43

यूज करके अपना हक में ट्यूनिंग कर सकते हो

play13:47

तो इन शॉर्ट अगर मैं बात करूं ट्रेनिंग और

play13:50

वैलिडेशन डाटा आपको हेल्प करता है

play13:53

ट्रेनिंग के लिए टेस्ट डेटा आपको हेल्प

play13:58

करता है आप मॉडल एक्यूरेसी चेक करने के

play14:01

लिए उस पर ठीक है यह काफी सिंपल डिफरेंस

play14:05

बिटवीन ट्रेन वैलिडेशन टेस्ट डेटा तो

play14:08

इसीलिए कभी भी आपके पास कोई डाटा फर्स्ट

play14:11

टेस्ट कराइए आपके पास सिर्फ ट्रेनिंग डाटा

play14:14

को लेकर उसमें ही वैलिडेशन आफ प्लेट

play14:16

करवाकर पुलिस वैलिडेशन अप्लाई करवा के अ

play14:18

बहुत सारे आलू घृत उसके साथ ही पावर

play14:21

स्टेयरिंग करके उससे एक्यूरेसी निकाल सकते

play14:23

हैं ठीक है तो आई हॉप आप लोगों को यह

play14:25

वीडियो काफी अच्छा लगा हो आप लोगों को यह

play14:27

क्लीयरली समझ में आया हो बहुत सारे लोगों

play14:30

का एक रीजन होता है इसलिए मैंने सोचा

play14:32

वीडियो बना दूं इस प्लेटफॉर्म आफ साइड

play14:34

प्लीज सब्सक्राइब चैनल से मितौली फ्रेंड्स

play14:38

काले नेक्स्ट वीडियो बाय-बाय टेक केयर है

Rate This

5.0 / 5 (0 votes)

Etiquetas Relacionadas
Machine LearningData ScienceModel TrainingData SetsValidation DataTest DataHyperparameter TuningFeature EngineeringModel PerformanceCross-Validation
¿Necesitas un resumen en inglés?