Must know Visualization in Statistics | Descriptive Statistics | Ultimate Guide !! | Part 10

Tech Classes
13 Dec 202317:45

Summary

TLDRThe script discusses the significance of graphical representation in descriptive statistics, emphasizing its ability to visually convey data distribution, spread, and central tendency. It covers three main plots used in statistics: histograms, box plots, and scatter plots, along with bar and line charts. The explanation delves into how histograms display data distribution through bins, box plots represent the IQR range, and scatter plots illustrate the relationship between two variables. The script also touches on identifying outliers and the types of skewness in histograms, as well as the concept of modes in relation to histogram types.

Takeaways

  • 📊 Graphical representation is crucial in descriptive statistics as it allows for visual data analysis, showing distribution, dispersion, and trends.
  • 📈 Histograms are a primary tool in graphical representation, displaying the distribution of data through bins, which can be adjusted to show different distributions.
  • 📉 Box plots are useful for showing the spread of data, identifying outliers, and providing a quick summary of key statistics like median, quartiles, and range.
  • 🔍 Scatter plots are essential for visualizing relationships between two variables, helping to identify patterns, trends, and correlations.
  • 📊 Histograms can reveal the shape of data distribution, such as whether it's skewed left or right, and can identify outliers and the central tendency of the data.
  • 📊 Types of histograms include symmetric, right-skewed, and left-skewed, each indicating different characteristics of the data distribution.
  • 📊 Based on the number of modes, histograms can be classified into unimodal, bimodal, and multimodal, each revealing different aspects of the data set.
  • 📊 Box plots not only show the IQR range but also help in identifying outliers by calculating values beyond 1.5 times the IQR from the quartiles.
  • 📊 Scatter plots are enhanced by adding a regression line, which can indicate the strength and direction of the relationship between variables.
  • 🚫 Outliers can significantly affect data analysis processes, and understanding how to identify and handle them is crucial for accurate statistical analysis.

Q & A

  • What is the importance of graphical representation in descriptive statistics?

    -Graphical representation is crucial in descriptive statistics as it allows for visual interpretation of data, making it easier to understand the spread, dispersion, distribution, frequency, and central tendency of the data.

  • What are the three main types of plots used in graphical representation for statistics?

    -The three main types of plots used in graphical representation for statistics are histograms, box plots, and scatter plots.

  • How does a histogram help in understanding the distribution of data?

    -A histogram divides data into intervals (bins) and shows the frequency of data points within these intervals. It helps visualize the distribution, spread, and shape of the data.

  • What do the bins in a histogram represent?

    -Bins in a histogram represent the intervals into which the data is divided. They indicate the range of values within the data set.

  • What is the difference between a bar chart and a histogram?

    -A bar chart represents categorical data, showing the count or quantity of data within categories, while a histogram displays the distribution of continuous data by dividing it into bins.

  • How can you identify outliers using a histogram?

    -Outliers in a histogram are represented by bars that are significantly separated from the rest of the data. They indicate values that are unusually high or low compared to the rest of the data.

  • What is the significance of the shape of a histogram?

    -The shape of a histogram can indicate the type of distribution the data follows, such as normal, right-skewed, or left-skewed distributions.

  • What are the three types of skewed histograms?

    -The three types of skewed histograms are symmetric, right-skewed, and left-skewed. Symmetric histograms have a balanced distribution around the center, while right-skewed histograms have a longer tail on the right side, and left-skewed histograms have a longer tail on the left side.

  • How can you determine the center of a distribution using a histogram?

    -The center of a distribution in a histogram can be determined by looking at the mean, median, and mode. These values are typically located around the center of the distribution.

  • What is a box plot and what does it represent?

    -A box plot is a graphical representation that displays the interquartile range (IQR) of a data set. It shows the median, first quartile (Q1), and third quartile (Q3), as well as any outliers beyond the IQR.

  • How are the upper and lower whiskers of a box plot calculated?

    -The upper whisker is calculated by subtracting 1.5 times the IQR from the third quartile (Q3), and the lower whisker is calculated by subtracting 1.5 times the IQR from the first quartile (Q1).

  • What is the purpose of a scatter plot in statistical analysis?

    -A scatter plot is used to visualize the relationship between two variables. It helps identify patterns, trends, and the direction of the relationship, such as positive, negative, or no correlation.

Outlines

00:00

📊 Understanding Graphical Representation in Statistics

The paragraph discusses the importance of graphical representation in descriptive statistics. It highlights how graphical representation allows for visual analysis of data distribution, spread, and central tendency. The speaker introduces three main plots used in statistics: histograms, box plots, and scatter plots, along with bar charts and line charts. Histograms are explained as a way to display the distribution of data through bins, with the x-axis showing intervals and the y-axis showing frequency. The concept of dividing continuous data into intervals and bins is explained, and the idea of frequency within these bins is discussed. The paragraph also touches on how histograms can help identify outliers and the types of skewness in data distribution, such as symmetric, right-skewed, and left-skewed distributions.

05:01

📈 Histograms and Data Distribution

This section delves deeper into histograms, explaining how they can represent different types of data distributions, including normal and skewed distributions. The speaker clarifies what a normal distribution is and how it appears symmetrically around the center. The paragraph also discusses the concept of median, mode, and mean in the context of a symmetric histogram. It then contrasts this with right-skewed and left-skewed histograms, explaining how the mean is always larger than the median in a right-skewed distribution and vice versa for left-skewed distributions. The speaker also introduces the idea of dividing histograms based on the number of modes, categorizing them into unimodal, bimodal, and multimodal histograms.

10:04

📉 Box Plots and Their Significance

The paragraph explains box plots, which are used to show the IQR range of data. It describes how the box plot is constructed with a box representing the Q3 and Q1 values, and the length of the box (Q3 - Q1) representing the IQR. The concept of whiskers, which extend from the box to the lowest and highest values within 1.5 times the IQR, is introduced. Any data point beyond the whiskers is considered an outlier. The speaker also mentions that box plots can be referred to as 'whisker plots' and are useful for identifying outliers and understanding the spread of data. Additionally, box plots can be called 'five summary statistics' as they provide minimum and maximum values, in addition to the median, Q1, and Q3.

15:08

🔍 Scatter Plots for Identifying Relationships

This section focuses on scatter plots, which are used to visualize the relationship between two variables. The speaker explains how scatter plots can help identify patterns, trends, and correlations. The concept of positive, negative, and no correlation is introduced, with examples of how to interpret the direction and strength of relationships between variables. The paragraph also discusses how to enhance scatter plots with regression lines to better understand trends. Additionally, the speaker touches on the identification of outliers in scatter plots and how they can affect the analysis process.

Mindmap

Keywords

💡Graphical Representation

Graphical Representation is a method of displaying data in a visual format. It is crucial in descriptive statistics because it allows for the visualization of data distribution, spread, and central tendency. In the video, graphical representation is discussed as a way to understand data through plots, which can reveal the shape of the data's distribution, central trends, and outliers.

💡Histogram

A Histogram is a type of graphical representation that displays the distribution of data. It shows the frequency of data points within different ranges or 'bins'. The video explains how histograms are plotted and how they can reveal the shape of the data's distribution. For example, the script mentions that a histogram can show different bins, and as the bins get farther apart, they form a bar chart.

💡Box Plot

A Box Plot, also known as a Box and Whisker plot, is a way to graphically display groups of numerical data through their quartiles. The video describes box plots as useful for showing the spread of data and identifying outliers. It explains how the plot includes a box that represents the interquartile range (IQR) and whiskers that extend to the minimum and maximum values.

💡Scatter Plot

A Scatter Plot is a type of plot that shows the relationship between two variables. The video mentions scatter plots as a way to visually represent the relationship and trends between two variables plotted on the x and y axes. It helps in identifying patterns, trends, and the direction of the relationship.

💡Distribution

Distribution in statistics refers to the way values are spread throughout the data set. The video script discusses how graphical representations like histograms can reveal the distribution of data, which can be normal or skewed. Understanding distribution is key to analyzing data patterns.

💡Skewness

Skewness is a term used to describe the asymmetry of a distribution. The video explains different types of skewness, such as right-skewed and left-skewed distributions. Right-skewed indicates that the tail on the right side of the distribution is longer or fatter, while left-skewed means the opposite. Skewness affects how data is interpreted.

💡Outliers

Outliers are data points that are significantly different from other observations. The video discusses how graphical representations can help identify outliers in a data set. For example, in a histogram, outliers might be represented by bars that are significantly separated from the rest of the data.

💡Central Tendency

Central Tendency refers to a central or 'average' value in a data set. The video mentions that graphical representations can help identify the central tendency of data. Measures of central tendency include the mean, median, and mode, which can be visualized and compared using plots.

💡Quartiles

Quartiles divide the data into four equal parts. The video explains how quartiles are used in box plots to show the spread of the data. Q1 and Q3 represent the lower and upper quartiles, respectively, and the IQR (the range between Q1 and Q3) is a measure of data dispersion.

💡Mode

Mode is the value that appears most frequently in a data set. The video discusses how histograms can be categorized based on the number of modes, such as unimodal, bimodal, and multimodal. This classification helps in understanding the shape of the data's distribution.

💡Regression Line

A Regression Line is a line that best fits the data on a scatter plot, showing the trend or relationship between two variables. The video mentions that scatter plots can be enhanced by adding a regression line, which can indicate an upward or downward trend, helping to quantify the relationship between variables.

Highlights

Graphical representation is crucial in descriptive statistics as it allows visual analysis of data distribution, spread, and central tendency.

Three main plots used in graphical representation are histogram, box plot, and scatter plot.

Histograms display the distribution of data through different bins.

Bins in histograms represent intervals on the x-axis and their frequency on the y-axis.

Histograms help in identifying the shape of data distribution, such as normal or skewed.

Outliers can be identified through the distribution shown in histograms.

Box plots represent the interquartile range and help in understanding data spread and identifying outliers.

Scatter plots are used to visualize relationships between two variables.

The direction and strength of relationships between variables can be identified through scatter plots.

Histograms can be divided based on the presence of skewness: symmetric, right-skewed, and left-skewed.

Symmetric histograms indicate a normal distribution of data.

Right-skewed histograms show a longer tail on the right side, indicating the presence of outliers on the right.

Left-skewed histograms show a longer tail on the left side, indicating the presence of outliers on the left.

Box plots can also be referred to as whisker plots due to the presence of the upper and lower whiskers.

Five summary statistics can be derived from box plots: minimum, first quartile, median, third quartile, and maximum.

Scatter plots help in identifying patterns, trends, and the nature of relationships between variables.

Regression lines can be added to scatter plots to enhance the understanding of relationships.

Outliers in scatter plots can significantly affect data analysis.

Transcripts

play00:00

[संगीत]

play00:04

सो ग्राफिकल रिप्रेजेंटेशन ग्राफिकल

play00:06

रिप्रेजेंटेशन इज वेरी इंपॉर्टेंट इन

play00:08

डिस्क्रिप्टिव स्टेटिस्टिक्स क्योंकि इसके

play00:10

थ्रू आप विजुअली देख सकते हो कि डेटा का

play00:12

स्प्रेड क्या है डिस्पर्स क्या है डाटा का

play00:14

क्या डिस्ट्रीब्यूशन है क्या फ्रीक्वेंसी

play00:16

है डाटा की या फिर सेंट्रल टेंडेंसी कहां

play00:19

पे आती है डटा की तो यह सारी चीजें आप

play00:21

प्लॉट करके देख सकते हो अब ग्राफिकल

play00:23

रिप्रेजेंटेशन में तीन मेन प्लॉट आते हैं

play00:25

स्टेटिस्टिक्स में जो कि है

play00:28

हिस्टोग्राम

play00:31

बॉक्स

play00:33

प्लॉट और स्कैटर प्लॉट्स

play00:38

इसके अलावा आपको बार चार्ट भी मिल जाते

play00:40

लाइन चार्ट मिल जाते पाई चार्ट मिल जाते

play00:42

है बट य स्टेटस्ट कल पॉइंट ऑफ व्यू से

play00:44

डिस्ट्रीब्यूशन दिखाने के लिए सेंटेंस

play00:46

दिखाने के लिए या फिर रिलेशन दिखाने के

play00:49

लिए यह सारे प्लॉट यूज में आते हैं सबसे

play00:51

पहले हम स्टार्ट करेंगे हिस्टोग्राम से सो

play00:55

हिस्टोग्राम इट

play00:58

डिस्पले डिस्ट्रीब्यूशन ऑफ द

play01:06

डटा सो हिस्टोग्राम जब आप प्लॉट करते हो

play01:09

तो आपको डिफरेंट बिनस दिख जाते हैं

play01:11

हिस्टोग्राम अगर आपने नहीं देखा हो तो इस

play01:12

टाइप का हिस्टोग्राम होता है सो दिस इ द

play01:16

एक्स एक्सिस दिस इ द वा एक्सिस और यहां पर

play01:19

आपको डिफरेंट बिनस मिल जाते हैं इनको

play01:23

हिस्टोग्राम के लैंग्वेज में बिनस कहते

play01:25

हैं और यही जब दूर दूर होते हैं तो यह

play01:27

बर्स हो जाते हैं बार चार्ट में सो दिस

play01:30

इज़ टू रिप्रेजेंट द कंटीन्यूअस डाटा जैसे

play01:32

कि अगर हमें डाटा मिला है कुछ डटा हमारे

play01:35

पास है जिसमें जो डाटा है वह ज़ीरो से वन

play01:38

के बीच में है वन से टू के बीच में है 3 4

play01:41

5 एंड 6 सो हिस्टोग्राम क्या करता है

play01:42

हिस्टोग्राम डाटा को डिवाइड करता है

play01:44

इंटरवल्स में बिंस में यहां पे आप x

play01:46

एक्सिस पे देख सकते हो इंटरवल्स को और y

play01:49

एक्सिस पे शो करता है फ्रीक्वेंसी सो यहां

play01:51

पे आपको y एक्सिस पे मिल जाता है

play01:54

फ्रीक्वेंसी

play01:55

सो फॉर एग्जांपल यहां पे आपका डाटा आ जाता

play01:59

है 10 20 30 एंड 40 सो ये क्या रिप्रेजेंट

play02:03

कर रहा है 0 से वन के बीच में जितना डाटा

play02:05

है वो है 20 वन से टू के बीच में जितना

play02:07

डेटा है वो है 30 तो ये क्या है काउंट है

play02:09

ये फ्रीक्वेंसी है जो कि हमने पिछले

play02:11

वीडियो में देखा था डिटेल में फ्रीक्वेंसी

play02:13

क्या होती है तो अगर आपके डेटा सेट में

play02:16

जैसे इस तरीके की वैल्यू हैं

play02:21

ओके सो सपोज इसी तरीके से आपके डाटा में

play02:24

वैल्यूज हैं जो जीरो से बड़े हैं और वन से

play02:28

छोटे हैं ठीक है तो उनका काउंट जो है वो

play02:31

है 20 सो यहां पे बिन बना है रो से वन के

play02:34

बीच में 20 उसी तरीके से वन से टू वन से

play02:38

टू के बीच में जितने आपके कंटीन्यूअस डाटा

play02:39

है वो है 30 काउंट पे टू से थ्री के बीच

play02:42

में जितने डाटा है उसकी फ्रीक्वेंसी है 40

play02:44

इसी तरीके से आगे इंटरवल्स की भी तो

play02:47

फ्रीक्वेंसी और डाटा वैल्यूज के इंटरवल को

play02:50

मिला के ही आपका ये हिस्टोग्राम बनता है

play02:53

यहां पे आपको बिन मिल जाते हैं 1 2 3 4 5

play02:56

एंड सिक्स तो यहां पे सिक्स बिन है अब बिन

play02:59

के काउंट कुछ चेंज भी कर सकते हो जब आप

play03:01

प्लॉट करते हो हिस्टोग्राम जब हम ये पाइथन

play03:03

इंप्लीमेंटेशन में देखेंगे तो हम देखेंगे

play03:05

किस तरीके से हम हिस्टोग्राम का जब बन के

play03:07

काउंट चेंज करते हैं तो अपीयरेंस भी इसकी

play03:08

चेंज हो जाती है मेन जो डेंसिटी ग्राफ

play03:11

रहेगा वो इसी तरीके का रहेगा आप यहां पे

play03:13

स्मॉल बिंस में भी इसको डिवाइड कर सकते हो

play03:15

फॉर एग्जांपल मैंने रो से वन की इंटरवल

play03:17

लिया है तो मैं 0 से 0.5 और 0.5 से वन का

play03:21

भी इंटरवल ले सकती हूं ठीक है तो वहां पे

play03:23

बिन का जो काउंट होगा वो इंक्रीज हो जाएगा

play03:26

हिस्टोग्राम की हेल्प से आप डाटा का शेप

play03:28

देख सकते हो सेंट्रल टेंडेंसी देख सकते हो

play03:30

और स्प्रेड देख सकते हो सो सपोज कीजिए

play03:32

आपके पास इस डाटा में अचानक से कोई वैल्यू

play03:34

आ जाती है अराउंड 50 ओके सो 50 टू 60 आपकी

play03:39

कोई वैल्यू आ जाती है तो यहां पे आपको जो

play03:40

डाटा है अब वो यहां पे इस तरीके का

play03:43

डिस्ट्रीब्यूशन आपको देखने को मिल जाएगा

play03:45

यह क्या होता है आउटलायर होता है सो

play03:47

हिस्टोग्राम इज आल्सो यूजफुल फॉर

play03:58

आइडेंटिफिकेशन अभी हम देखते हैं कितने

play04:01

टाइप से स्क्यूनेस के बेसिस पर

play04:03

हिस्टोग्राम को डिवाइड किया गया है ठीक है

play04:05

तो यहां पर भी यह जो डाटा आपको मिल रहा है

play04:07

जो डिस्ट्रीब्यूशन मिल रहा है ये एक

play04:09

स्क्यूड डिस्ट्रीब्यूशन है क्योंकि यहां

play04:11

पे एक आउटलायर तो जब भी आपके डाटा में

play04:13

आउटलायर प्रेजेंट होगा तो जो आपको

play04:15

डिस्ट्रीब्यूशन मिलेगा वो स्क्यू

play04:17

डिस्ट्रीब्यूशन मिलता है सो टाइप्स ऑफ

play04:19

स्क्यूड हिस्टोग्राम स्क्यूनेस के बेसिस

play04:21

पे हिस्टोग्राम को डिवाइड किया गया है

play04:23

थ्री टाइप्स में सबसे पहले है

play04:28

सिमेट्री सेकंड इज

play04:32

राइट

play04:34

स्क्यूड एंड थर्ड इज लेफ्ट स्क्यूड

play04:40

हिस्टोग्राम जो सिमेटिक हिस्टोग्राम है वो

play04:42

आपको नॉर्मल डिस्ट्रीब्यूशन डाटा में मिल

play04:45

जाता है ठीक है तो जब हम प्रोबेबिलिटी

play04:47

शुरू करेंगे उसमें हम देखेंगे नॉर्मल

play04:49

डिस्ट्रीब्यूशन क्या होते हैं सो चलिए इन

play04:51

तीनों हिस्टोग्राम को देखते हैं किय किस

play04:53

टाइप से विजुअली दिखते हैं और इनमें

play04:56

क्या-क्या प्रॉपर्टीज होती है सो दिस इज द

play04:59

िक हिस्टोग्राम दिस इज द राइट स्क्यूड

play05:01

हिस्टोग्राम एंड दिस इज द लेफ्ट स्क्यूड

play05:03

हिस्टोग्राम तो जब भी आप डाटा को

play05:04

रिप्रेजेंट करोगे हिस्टोग्राम के फॉर्म

play05:06

में तो आपको जो डिस्ट्रीब्यूशन मिलेगा वो

play05:08

इन्हीं तीनों टाइप का मिल सकता है ठीक है

play05:10

या तो आपको नॉर्मल डिस्ट्रीब्यूशन मिलेगा

play05:12

या तो आपको स्क्यू डिस्ट्रीब्यूशन मिलेगा

play05:13

जो कि राइट में होगा या तो फिर लेफ्ट में

play05:15

होगा सो यहां पे नॉर्मल डिस्ट्रीब्यूशन का

play05:17

क्या मतलब है कि जो डाटा है वो नॉर्मली

play05:19

डिस्ट्रीब्यूटर है अगर इसका हम डेंसिटी

play05:22

प्लॉट बनाएं तो वो कुछ इस टाइप का होगा सो

play05:25

नाम से ही क्लियर है सिमेटिक हिस्टोग्राम

play05:27

इसका मतलब जो डिस्ट्रीब्यूशन है वो

play05:28

सिमेट्री

play05:30

अराउंड द सेंटर अगर हम य लाइन खीच दे और

play05:32

यहां पर देखें लेफ्ट का जो डिस्ट्रीब्यूशन

play05:34

है और राइट का डिस्ट्रीब्यूशन ये दोनों

play05:37

इक्वली सेम है ओके सो दिस इ द सिमेटिक

play05:40

हिस्टोग्राम अब यहां पर अगर हम मीन मीडियन

play05:43

मोड की बात

play05:44

करें

play05:46

सो मीन

play05:50

मीडियन

play05:52

मोड यह सारे क्या होते

play05:55

हैं सेंटर ऑफ द डिस्ट्रीब्यूशन

play06:05

सो मीन मीडियन मोड आपको सेंटर में आपको इस

play06:08

यहां पर आपको मीन भी मिल जाता है मीडियन

play06:12

भी मिल जाएगा और मोड भी मिल जाता है ठीक

play06:14

है तो यहां पे मीन मीडियन मोड आपका सेंटर

play06:16

ऑफ द डिस्ट्रीब्यूशन में प्रेजेंट होता है

play06:18

मतलब इन तीनों वैल्यू में बहुत ज्यादा

play06:20

डिफरेंस नहीं होता ये अराउंड अप्रॉक्स सेम

play06:23

वैल्यू होते हैं फॉर नॉर्मल

play06:25

डिस्ट्रीब्यूशन सो डाटा जो है वो दोनों

play06:27

साइड प इवनली डिस्ट्रीब्यूटर है और यहां

play06:30

पर आपको एक बेल शेप का कर्व मिलता है ठीक

play06:32

है तो जब भी आपको इस टाइप का बेल शेप का

play06:34

कर्व मिले डिस्ट्रीब्यूशन के लिए तो वो हो

play06:36

जाता है नॉर्मल डिस्ट्रीब्यूशन और

play06:38

हिस्टोग्राम जो बनेगा वो हो जाता है

play06:40

सिमेटिक हिस्टोग्राम सो राइट स्क्यूड

play06:42

हिस्टोग्राम की बात की जाए तो यहां पे आप

play06:44

देख सकते हो कि टेल जो गया है वो राइट

play06:46

साइड में गया है इसका मतलब आउटलायर जो

play06:48

प्रेजेंट है वो राइट साइड ऑफ द

play06:50

हिस्टोग्राम के प्रेजेंट है यहां पे आपको

play06:52

जो जितना वैल्यूज मिल रहा है ये क्या है

play06:54

आउटलायर

play06:56

ओके तो जितना आपका मेन डाटा होता है है वो

play06:59

होता है आपका लेफ्ट साइड में तो यहां पे

play07:01

आपका ओवरऑल मेन डाटा है और यहां पे आपके

play07:04

आउट लायर्स आ जाते हैं इसलिए इसे कहते हैं

play07:07

राइट स्क्यूड हिस्टोग्राम ओके सो अगर हम

play07:09

इस डिस्ट्रीब्यूशन के मीन की बात करें तो

play07:11

आपको यहां पे मीन अराउंड 2.05 मिल जाता है

play07:15

जो कि आपको यहां पे मिलेगा ओके सो दिस इज

play07:19

द मीन 2.05 और मीडियन की बात करें हम तो

play07:23

मीडियन आपको यहां प मिल जाता है 1.7 के

play07:26

अराउंड जो कि आपका यहां पे होगा

play07:30

ओके सो दिस इज द

play07:34

मीडियन एंड दिस इज द

play07:37

मीन तो राइट स्क्यूड हिस्टोग्राम के केस

play07:39

में आपका मीन होता है हमेशा वो मीडियन से

play07:43

बड़ा ही होता है ओके सो दिस इज द केस फॉर

play07:46

द राइट स्क्यूड हिस्टोग्राम राइट स्क्यूड

play07:48

हिस्टोग्राम को आप पॉजिटिव स्क्यूड भी कह

play07:51

सकते हैं पॉजिटिव

play07:54

स्क्यूड हिस्टोग्राम ओके सो नेक्स्ट है

play07:57

लेफ्ट स्क्यूड हिस्टोग्राम राइट स्क्यूड

play07:59

हिस्टोग्राम का जस्ट अपोजिट होता है लेफ्ट

play08:01

स्क्यूड हिस्टोग्राम यहां पे आपको जो टेल

play08:04

मिल जाता

play08:05

है यहां पे आपको जो टेल मिल जाता है वो

play08:07

आपको लेफ्ट साइड में मिल जाता है इसका

play08:09

मतलब आउटलायर जो प्रेजेंट है वो आपको

play08:12

लेफ्ट में मिलते हैं यहां पे जितने भी आउट

play08:14

लायर्स होते हैं वो होते हैं लेफ्ट साइड

play08:16

में और जो डाटा कंसंट्रेटेड होता है वो

play08:19

होता है आपका राइट साइड में ओके सो मोस्ट

play08:22

ऑफ द डेटा इज प्रेजेंट ऑन द राइट साइड इस

play08:25

केस की बात की जाए तो यहां पे आपको

play08:27

मीन मीडियन से छोटा मिल जाता है ओके सो

play08:32

यहां पे जस्ट अपोजिट होता है इसका यहां पे

play08:34

राइट स्क्यूड में मीन बड़ा था मीडियन से

play08:37

उसी तरीके से लेफ्ट स्क्यूड में क्या होता

play08:39

है मीडियन बड़ा होता है मीन से तो ये तो

play08:41

रहा टाइप्स ऑफ स्क्यूड हिस्टोग्राम

play08:43

नेक्स्ट हम देखेंगे टाइप्स ऑफ हिस्टोग्राम

play08:46

बेस्ड ऑन द नंबर ऑफ मोड्स सो नंबर ऑफ

play08:49

मोड्स के बेसिस पे हिस्टोग्राम तीन टाइप

play08:52

से डिवाइडेड है फर्स्ट यूनि

play08:56

मॉडल सेकंड बाय मॉडल

play09:01

एंड थर्ड इ मल्टीमॉडल

play09:05

हिस्टोग्राम सो अगर मैं यहां पर एक

play09:08

डेंसिटी प्लॉट

play09:09

बनाऊ तो आप देख सकते हो इसका जो पीक है वो

play09:13

एक सिंगल पीक है ओके यहां पर आपको सिर्फ

play09:16

एक ही पीक मिलता है बाय मॉडल केस में आप

play09:18

देख सकते हो अगर हम यहां पर डेंसिटी प्लॉट

play09:20

बनाते

play09:23

हैं तो हमें यहां पर दो पीक मिल जाते हैं

play09:27

ठीक है इसलिए इसको कहा जाता है है बाय

play09:29

मॉडल मल्टी मॉडल केस में आपको कोई पीक

play09:32

एसेस दिखता नहीं यहां पे आपको बहुत सारे

play09:34

पीक्स मिल जाते हैं ओके तो अगर हम यहां पे

play09:37

एक ऐसी डेंसिटी प्लॉट बनाए तो आप देख सकते

play09:39

हो यहां पे बहुत सारी पीक वैल्यूज है राइट

play09:42

तो एज सच हम कह नहीं सकते कि यहां पे

play09:44

सिंगल पीक वैल्यू है ओके तो ये है

play09:46

मल्टीमॉडल तो ये सिंपल हिस्टोग्राम है

play09:49

यूनि मॉडल बाय मॉडल एंड मल्टीमॉडल सो

play09:52

बॉक्स प्लॉट इस टाइप के जो प्लॉट्स होते

play09:54

हैं जो चार्ट्स होते हैं उन्हें बॉक्स

play09:55

प्लॉट कहते हैं यहां पे आपको एक बॉक्स मिल

play09:57

जाता है जो कि आई क्यूआर रेंज को

play09:59

रिप्रेजेंट करता है यहां पर आप देख सकते

play10:00

हो q3 वैल्यू है और q1 वैल्यू है ठीक है

play10:03

सो जो बॉक्स होता

play10:05

है वो होता है आ क आ जो कि होता है q3 -

play10:10

q1 सो अगर हम इसकी लेंथ देखें तो आपको आई

play10:13

क आर मिल जाता है ओके सो बॉक्स प्लॉट इज

play10:17

यूजफुल टू

play10:19

शो द स्प्रेड ऑफ द

play10:22

डेटा द स्प्रेड ऑफ डाटा एंड आईडेंटिफाइंग

play10:27

आउटलायर

play10:29

आइडेंटिफिकेशन

play10:59

की

play11:00

लाइन ठीक है अब अपर विस्कर होता है और

play11:03

यहां पर आपको एक लोअर विस्कर मिल जाता है

play11:05

तो विस्कर की वजह से य बॉक्स प्लॉट को आप

play11:08

विस्कर प्लॉट भी कह सकते हो

play11:11

विस्कर

play11:17

प्लॉट सो यहां पर आपको यह अपर विस्कर मिल

play11:20

जाता है यह लोअर विस्कर मिल जाता है अब

play11:22

इसकी जो हाइट होती है वो कैसे कैलकुलेट

play11:25

होती है तो अपर विक कैलकुलेट होती है इस

play11:27

तरीके से q - 1.5 इनटू इंटर क्वार्टा रेंज

play11:33

उसी तरीके से जो लोअर विस्कर की हाइट होती

play11:35

है वो q1 - 1.5 इनू इंटर क्वार्इ रेंज

play11:39

होती

play11:40

है ओके सो इसके बियोंड जो भी वैल्यूज आती

play11:44

है जो भी अपर विस्कर और लोअर विस्कर के

play11:46

बियोंड जो भी वैल्यूज आती है वो एज अ

play11:49

आउटलायर ट्रीट होती है ओके स डाटा में जब

play11:52

हम अपर विस्कर और लोअर विस्कर कैलकुलेट कर

play11:55

लेते हैं तो उसके अलावा जितनी वैल्यूज

play11:56

बचती है वो होती है आउटलायर तो तो बॉक्स

play11:59

प्लॉट बहुत ही अच्छा वे है आउट लायर्स को

play12:01

आईडेंटिफाई करने का कि कोई भी डटा में

play12:04

कितने आउट लायर्स प्रेजेंट है तो यहां पे

play12:06

आपका % ऑफ द डाटा जो होता है वो आपका

play12:08

बॉक्स में लाई करता है ठीक है सो बॉक्स

play12:11

प्लॉट को आप फाइव

play12:14

समरी स्टेटिस्टिक्स भी कह सकते हो क्योंकि

play12:18

यहां पे आपको फाइव स्टेटिस्टिक्स

play12:29

और उसके अलावा आपको मिनिमम एंड मैक्सिमम

play12:31

वैल्यू मिल जाती है बॉक्स प्लॉट से सो

play12:53

दैट्ची अस वेरिएबल है और आपको उनके बीच का

play12:57

रिलेशनशिप देखना है कि एक वेरिएबल के चेंज

play12:59

होने प सेकंड वेरिएबल चेंज होता है या

play13:01

नहीं और किस तरीके से चेंज होता है तो इस

play13:04

टाइप के जो रिलेशनशिप होते हैं इस टाइप के

play13:06

जो इंफॉर्मेशन होती है वो कौन प्रोवाइड

play13:08

करता है स्कैटर प्लॉट प्रोवाइड करता है

play13:11

विजुअली सो स्कैटर प्लॉट कुछ इस तरीके का

play13:13

होता

play13:15

है यहां पर आपको पॉइंट्स मिल जाते हैं जो

play13:19

कि स्कैटर्ड होते हैं ऑल ओवर द एक्स एंड

play13:21

वा एक्सिस यहां पर आपको वेरिएबल वन मिल

play13:24

जाता है और वा एक्सिस प आप वेरिएबल टू को

play13:26

प्लॉट करते हैं तो जो सिंगल पॉइंट होता है

play13:29

वो क्या होता है एक जॉइंट डिस्ट्रीब्यूशन

play13:31

होता है वेरिएबल वन और वेरिएबल टू का सपोज

play13:34

मेरा जो वेरिएबल वन है वो है 10 और

play13:38

वेरिएबल टू है वो है 20 तो अगर मैं यहां

play13:41

पे सपोज यहां प मैंने 10 लिया है और यहां

play13:43

प मैंने 20 लिया है तो जो वेरिएबल वन और

play13:46

वेरिएबल टू का उस टाइम का जॉइंट

play13:47

डिस्ट्रीब्यूशन होगा वो कुछ यहां पे होगा

play13:50

ओके सो इसी तरीके से स्कैटर प्लॉट को

play13:52

प्लॉट किया जाता है वेरिएबल वन और वेरिएबल

play13:54

टू को देखते हुए सो स्कैटर प्लॉट हेल्प्स

play13:57

इन आइडेंटिफिकेशन

play14:00

पैटर्न

play14:03

ट्रेंड्स एंड को

play14:06

रिलेशन ठीक है यहां पे रिलेशन का मतलब है

play14:09

को रिलेशन बिटवीन द वेरिएबल सो इट इज

play14:12

आल्सो यूजफुल फॉर

play14:27

आइडेंटिफिकेशन

play14:29

एंड डायरेक्शन ऑफ

play14:33

play14:36

रिलेशन अब यहां पे स्ट्रेंथ और डायरेक्शन

play14:38

से क्या मतलब है डायरेक्शन मतलब पॉजिटिव

play14:41

को रिलेशन है नेगेटिव को रिलेशन है या फिर

play14:44

कोई को रिलेशन नहीं है ठीक है तो ये हम

play14:47

स्कैटर प्लॉट से देख सकते हैं को रिलेशन

play14:49

को आगे हम और डिटेल में देखेंगे किस तरीके

play14:50

से कैलकुलेट करते हैं क्या फार्मूला होता

play14:52

है क्या डिफरेंस होता है कोवेरिएट से अभी

play14:55

के लिए हम कैसे को रिलेशन पॉजिटिव नेगेटिव

play14:58

और नो को रिलेशन को स्कैटर प्लॉट के थ्रू

play15:01

प्लॉट करते हैं देखते हैं यह समझते हैं सो

play15:08

रिलेशनशिप कैन

play15:10

बी पॉजिटिव नेगेटिव एंड नो

play15:18

रिलेशन ओके पॉजिटिव को रिलेशन नेगेटिव को

play15:21

रिलेशन एंड थर्ड वन इज नो को रिलेशन अब

play15:24

यहां पे कैसे पता चलेगा कि ये पॉजिटिव को

play15:26

रिलेशन है जब भी आप स्कैटर प्लॉट को प्लॉट

play15:28

कर करते हो किसी डेटा के लिए और डटा आपका

play15:30

इस वे में है इंक्रीजिंग ऑर्डर में है ठीक

play15:33

है पॉजिटिवली इंक्रीज हो रहा है फर्स्ट

play15:35

वेरिएबल सेकंड वेरिएबल तो वहां पे हो जाता

play15:38

है पॉजिटिव कोरिले अगर कोई वेरिएबल

play15:41

डिक्रीज हो रहा है विद द इंक्रीजिंग ऑफ द

play15:43

फर्स्ट वेरिएबल तब आपका वहां पे नेगेटिव

play15:46

कोरिले हो जाता है और यहां पे ना कोई

play15:49

वैल्यू इंक्रीज हो रही है ना कोई वैल्यू

play15:51

डिक्रीज हो रही है ठीक है यहां पे आपको

play15:53

कोई ट्रेंड नहीं देखने को मिल रहा कोई

play15:54

पैटर्न देखने को नहीं मिल रहा है तो यहां

play15:56

पे नो को रिलेशन होता है सो पॉजिटिव

play15:59

कोरिले के केस में क्या होता है सो सपोज

play16:01

वेरिएबल वन आपने x एक्सिस पे शो किया है

play16:03

और वेरिएबल टू आपका है y एक्सिस पे तो

play16:05

वेरिएबल वन अगर इंक्रीज हो रहा है तो

play16:08

वेरिएबल टू भी इंक्रीज होगा नेगेटिव को

play16:11

रिलेशन क्या मतलब है अगर वेरिएबल वन

play16:14

इंक्रीज हो रहा है तो वेरिएबल टू डिक्रीज

play16:17

होगा ओके और नो को रिलेशन में वेरिएबल वन

play16:21

का इफेक्ट वेरिएबल टू पे कुछ भी नहीं

play16:24

पड़ता ठीक है तो यहां पे इफेक्ट देखने को

play16:27

मिल रहा है कि वेरिएबल वन अगर इंक्रीज हो

play16:29

रहा है तो वेरिएबल टू भी इंक्रीज हो रहा

play16:31

है वेरिएबल वन इंक्रीज हो रहा है तो

play16:32

वेरिएबल टू डिक्रीज हो रहा है और लास्ट

play16:35

में वेरिएबल वन और वेरिएबल टू कोई भी

play16:39

रिलेशन शो नहीं कर रहे कि वेरिएबल वन अगर

play16:41

इंक्रीज हो रहा है तो वेरिएबल टू डिक्रीज

play16:44

हो रहा है ठीक है सो स्कैटर प्लॉट को और

play16:46

एनहांस किया जा सकता है रिग्रेशन लाइन अगर

play16:48

हम फिट कर दें यहां पे तो दिस इज द

play16:50

रिग्रेशन लाइन ठीक है और यहां पे इस तरीके

play16:53

से तो यहां पे ये अपवर्ड ट्रेंड देखने को

play16:55

मिल जाता है और यहां पे आपको डाउन वर्ड

play16:57

ट्रेंड देखने को मिल जाता है सो दिस इज द

play16:59

पॉजिटिव नेगेटिव एंड नो को रिलेशन अब यहां

play17:01

पे आप देख सकते हो स्कैटर प्लॉट विथ आउट

play17:04

लायर्स अब कभी-कभी क्या होता है कि आपके

play17:06

डेटा सेट में कुछ आउट लायर्स प्रेजेंट

play17:08

होते हैं तो यहां पे अगर आप स्कैटर प्लॉट

play17:09

प्लॉट करोगे उनका तो आपको आउट लायर्स कुछ

play17:12

इस टाइप से देखने को मिल जाएंगे जो कि

play17:14

नॉर्मल ट्रेंड से बहुत ही ज्यादा डिफरेंट

play17:17

होंगे ठीक है तब वहां पे आप आइडेंटिफिकेशन

play17:28

है वेरिएबल वन की वेरिएबल टू की यहां प

play17:30

इंक्रीज हो रही है तो यहां पे हो जाता है

play17:32

पॉजिटिव रिलेशन सो नेक्स्ट हम देखेंगे

play17:34

आउटलायर और वो किस तरीके से अफेक्ट करता

play17:36

है डेटा एनालिसिस प्रोसेस

play17:43

को

Rate This

5.0 / 5 (0 votes)

Etiquetas Relacionadas
Data VisualizationGraphical RepresentationHistogramBox PlotScatter PlotStatistical AnalysisData DistributionCentral TendencyData ScienceDescriptive StatisticsData Spread
¿Necesitas un resumen en inglés?