Tutorial for Lecture 3
Summary
TLDRThe video script is an educational tutorial aimed at computer science students, focusing on data processing and analysis. It demonstrates the process of filtering and counting variables in a dataset, such as the number of long adjectives in market data. The tutorial also covers calculating specific customer expenditures in different stores and introduces the concept of comparing the average length of prepositions and pronouns in a text. The script guides viewers through practical examples, including analyzing the number of children born in the first half of the year, and concludes with a comparison of the average lengths of different parts of speech.
Takeaways
- 😀 The tutorial is aimed at computer science students and discusses a process similar to what was covered in Lecture 3.
- 🔍 In Lecture 3, the students were shown a process involving filtering of variables based on gender and city using market data.
- 📝 The tutorial introduces an exercise to count the number of adjectives with more than four letters from a given data set.
- 🔢 The process involves initializing a variable 'Large Adjectives Count' to zero and incrementing it each time an adjective with five or more letters is encountered.
- 📈 The script demonstrates the use of cards to represent and count the occurrences of adjectives with varying lengths.
- 📚 It explains how to calculate the average length of adjectives by dividing the 'Total Adjective Length' by the 'Adjective Count'.
- 🛒 The tutorial also covers an analysis of shopping bill data, focusing on the expenditure of a specific customer across different stores.
- 💰 The script details how to calculate the total spending of a customer named Srivatsan in different stores like 'Sv', 'BB', and 'Sun'.
- 📊 The process of calculating the average length of prepositions and pronouns in a sentence is explained, using counts and total lengths.
- ✂️ The final part of the script discusses comparing the average lengths of prepositions and pronouns to understand their relative lengths in sentences.
- 📉 The tutorial concludes by highlighting that the average length of prepositions is slightly more than that of pronouns in the given data.
Q & A
What is the main topic discussed in the tutorial?
-The main topic discussed in the tutorial is the process of filtering and analyzing data, specifically focusing on the count of adjectives with a certain number of letters in a dataset.
What is the purpose of the 'Large Adjectives Count' variable in the script?
-The 'Large Adjectives Count' variable is used to keep track of the number of adjectives that have more than a certain number of letters, starting from 4 letters and increasing as the tutorial progresses.
How does the script handle the counting of adjectives with exactly 4 letters?
-The script does not increase the 'Large Adjectives Count' variable when an adjective has exactly 4 letters, as the condition specified is for adjectives with more than 4 letters.
What is the significance of the 'Total Preposition Length' and 'Total Pronoun Length' in the script?
-The 'Total Preposition Length' and 'Total Pronoun Length' are used to calculate the average length of prepositions and pronouns in the text by dividing the total length by the count of prepositions and pronouns respectively.
How does the script differentiate between the counting of prepositions and pronouns?
-The script uses separate variables, 'Preposition Count' and 'Pronoun Count', to differentiate and count prepositions and pronouns individually, and then calculates their average lengths.
What is the script's approach to analyzing customer spending data?
-The script analyzes customer spending data by creating variables for each store a specific customer has spent money in, starting with an initial count of 0, and then incrementing the count based on the amount spent.
Can the script's method be applied to compare the lengths of other parts of speech?
-Yes, the script's method of counting and calculating average lengths can be applied to other parts of speech by following the same process of setting up variables and incrementing them as needed.
What is the final outcome of the script's analysis of the spending data for the customer named Srivatsan?
-The final outcome shows the total amount spent by Srivatsan in different stores, with specific amounts for each store and a cumulative total for all stores.
How does the script handle the absence of spending in a particular store?
-The script maintains the count for that store at 0, indicating no spending has occurred, as seen with the variable for Big Bazaar where Srivatsan has not made any purchases.
What is the script's conclusion about the average length of prepositions compared to pronouns?
-The script concludes that the average length of prepositions is slightly more than that of pronouns, with prepositions having an average length of 2.7 and pronouns having an average length of approximately 2.43.
Outlines
📈 Data Filtering and Variable Counting Process
The first paragraph introduces a tutorial on how to process data with specific filters. It discusses a scenario where data from Chennai is filtered based on two variables: one representing a gender and the other a city. The tutorial then moves on to counting the number of adjectives with more than four letters in a dataset, using a variable called 'Large Adjectives Count' which starts at zero and increments with each adjective that meets the criteria. The process involves revisiting the data to ensure accuracy and ends with an example of a card that contains an adjective with more than four letters, thus increasing the variable count.
🛍️ Analyzing Customer Spending Patterns
The second paragraph delves into analyzing shopping bill data to understand customer spending habits. It uses the example of a customer named Srivatsan to demonstrate how to calculate the total amount spent at different stores. The process involves setting up variables for each store and incrementing the values as the customer's spending is recorded. The paragraph explains how to track the spending at 'Sv', 'BB', and 'SUN' stores, and how to sum up the amounts to get the total expenditure. The tutorial also touches on comparing the data with a lecture example that calculated statistical averages using a variable in a loop.
📚 Calculating Average Lengths of Words in Sentences
The third paragraph focuses on calculating the average length of words in sentences, specifically looking at prepositions and pronouns. It outlines a method to establish variables for counting these parts of speech and their total lengths. The paragraph explains how to sum the lengths of individual prepositions and pronouns and then divide by their respective counts to find the average length. The process involves iterating through sentences, identifying and counting the specified words, and using the results to compare with the average length of other sentence components. The summary concludes with an appreciation for the insights gained from this analysis.
Mindmap
Keywords
💡Processors
💡Variables
💡Filters
💡Adjectives
💡Data Processing
💡Cardinality
💡Data Analysis
💡Shopping Bill Data
💡Propositions
💡Pronouns
💡Average Length
Highlights
Introduction to the tutorial on data processing with large adjectives count.
Explanation of filtering variables on market data with two variables: gender and city.
Demonstration of counting adjectives with more than four letters in the data set.
The process of revisiting and refining the data set with new parameters.
Utilization of cards to represent and count specific variables in the data.
Incrementing the variable 'Large Adjectives Count' when an adjective exceeds four letters.
Illustration of filtering out adjectives that do not meet the length criteria.
Introduction of the concept of 'Total Preposition Length' and its calculation.
Explanation of how to calculate the average length of prepositions and pronouns in a sentence.
Analysis of customer spending data in different stores.
Case study of a specific customer's spending pattern across various stores.
Methodology for calculating the total expenditure of a customer in a particular store.
Comparison of the spending patterns between the first half and the second half of the year.
Application of filters to analyze the number of children born in the first half of the year.
Discussion on the practical applications of the data analysis techniques taught in the tutorial.
Conclusion summarizing the key learnings from the tutorial on data processing and analysis.
Transcripts
नमस्कार.
संगणकीय विचार करणारे विद्यार्थी.
या ट्युटोरियलमध्ये आम्ही प्रोसेसर्सने
लेक्चर 3 मध्ये काय केले आहे यासारखीच
प्रक्रिया पाहू.
लेक्चर 3 मध्ये, तुम्ही ती प्रक्रिया पाहिली
असेल जिथे त्यांनी चेन्नईतील मुलींची
संख्या उचलली जी दोन व्हेरिएबल्सवर
फिल्टर करत आहे जी एक लिंग आहे आणि दुसरी
शहर आहे.
आणि हे मार्कशीट डेटामध्ये केले गेले.
आम्ही परिच्छेद शब्द डेटामध्ये आता असेच
काहीतरी करू.
4 पेक्षा जास्त अक्षरे असलेल्या विशेषणांची
(adjectives) संख्या निवडण्याचा प्रयत्न करूया.
तर, 5 किंवा वरील.
तर, आपण पुन्हा पुनरावृत्ती करूया.
आम्हाला कार्डने कार्ड जाऊ द्या.
हे आमचे पहिले कार्ड आहे आणि आम्ही सुरू
करण्यापूर्वी आम्ही आमचे व्हेरिएबल घोषित
केले पाहिजे जे Large Adjectives Count आहे आणि हे
Large Adjectives Count हे 0 पर्यंत आरंभिक आहे.
आम्ही प्रत्येक वेळी जेव्हा एखादे विशेषण
येईल ज्याच्या अक्षराची संख्या 4 पेक्षा जास्त
म्हणजे 5 किंवा त्यापेक्षा जास्त असेल तेव्हा
आम्ही ती वाढवू.
तर, कार्ड क्रमांक एक, विशेषण (adjectives) नाही,
विशेषण (adjectives) नाही, हे एक विशेषण (adjectives)
आहे, परंतु 'लांब' (‘long’) हा 4 अक्षरांचा
शब्द आहे.
तर, आम्ही आमचे व्हेरिएबल (variable) वाढवणार नाही.
'पातळ' (Thin’) हे 4 अक्षरांचे विशेषण आहे, म्हणून
आम्ही आमचे व्हेरिएबल (variable) वाढवत नाही.
विशेषण नाही, विशेषण नाही, विशेषण नाही,
विशेषण नाही, विशेषण नाही आणि हे सर्वनाम,
(pronoun) नाम (noun,) विशेषण (adjective) नाही.
आणि हे 8 अक्षरे आहेत.
तर, शेवटी आम्ही एक कार्ड भेटतो ज्यात
4 अक्षरांपेक्षा मोठे विशेषण आहे,
म्हणून आम्ही आमचे व्हेरिएबल 1 ने वाढवतो.
पुढे जाणे, उपपदे (article) , नाम (noun) , विशेषण
(adjective) 6 अक्षरे.
तर, आम्ही पुन्हा वाढ करतो ज्यामुळे
संख्या 2 वाढते.
पुढे जाणे, आणखी एक 6 अक्षरे विशेषण, म्हणून
पुन्हा वाढ करणे, आपल्याकडे गणना 3
आहे.
असणे आवश्यक आहे लेख, संज्ञा, पूर्वकल्पना,
संज्ञा, क्रियाविशेषण, उपपदे, शब्दयोगी
अव्यये (preposition), क्रियापद सर्वनाम, नाम, उभायन्वयी
अव्यये (conjunction), शब्दयोगी अव्यये, नाम, उपपदे,
नाम, क्रियापद, शब्दयोगी अव्यये, उपपदे, शब्दयोगी
अव्यये, विशेषण, 9 अक्षरे आहेत.
तर, आता आम्ही पुन्हा वाढ करतो आमच्याकडे
4 मोठे विशेषण आहेत, म्हणून आता गणना
4 आहे.
पुढे जाणे (Moving on), preposition, verb, preposition, adjective आणि 9 अक्षर
पुन्हा आहेत.
तर, आम्ही आणखी एक वेळ वाढवतो आणि आता
आमचे व्हेरिएबल 5 च्या बरोबरीचे आहे.
पुढे जाणे.
क्रियापद, सर्वनाम, संज्ञा, उभायान्वयी
अव्येय, नाम, शब्दयोगी अव्यये, नाम, नाम,
लेख, शब्दयोगी अव्यये, विशेषण आणि 10 अक्षरे.
म्हणून, आम्ही पुन्हा वाढ करतो आम्ही आता
6 वर आहोत.
आम्ही 7.
वर आहोत आम्ही आमच्या शेवटच्या कार्डावर
आहोत.
तर, आम्हाला आढळले आहे की तेथे 7 मोठे
विशेषण आहेत, ज्यांची संख्या 4 पेक्षा जास्त
आहे, आता, लेक्चर 3 मध्ये, आणखी एक मनोरंजक
समस्या जी अनेक फिल्टरसाठी घेतली जात आहे ती
होती वर्षाच्या पहिल्या सहामाहीत जन्मलेल्या
मुला -मुलींची संख्या होय.
तर, वर्षाच्या पहिल्या सहामाहीत जन्मलेल्या
मुलांची संख्या आणि वर्षाच्या पहिल्या
सहामाहीत जन्मलेल्या मुलींची संख्या.
तर, आम्ही आता शॉपिंग बिल डेटासह असेच
काहीतरी करू.
आम्ही काय करू, आम्ही प्रत्येक विशिष्ट
स्टोअरमध्ये एका विशिष्ट ग्राहकाने
खर्च केलेल्या रकमेची गणना करू.
तर, आपण श्रीवत्सन (Srivatsan) नावाच्या ग्राहकाकडे
पाहू.
तर, श्रीवत्सनने जनरल मध्ये किती
एसव्ही स्टोअर्स, बिग बाजार आणि सनखर्च
केला?
हे आम्ही शोधण्याचा प्रयत्न करू.
तर, पहिल्या कार्डापासून पुन्हा सुरुवात करूया.
आम्ही आता 3 व्हेरिएबल्स सुरू करतो.
तर, ते श्रीवत्सनSV, श्रीवत्सनBB, श्रीवत्सनSUN
असेल.
तर, हे 3 व्हेरिएबल्स दर्शवतात की श्रीवत्सनातर्फे
त्या विशिष्ट स्टोअरमध्ये रक्कम का खर्च केली
जाते.
आम्ही 0 मध्ये प्रारंभ करतो.
हे पहिले कार्ड अक्षय आहे, ते श्रीवत्सन
नाही, म्हणून आम्ही फक्त अभिनव, अहमद,
अहमद, पुन्हा श्रीवत्सन वर जाऊ.
तर, एसव्ही स्टोअर्समधील श्रीवत्सन 567 रुपये
खर्च करतात.
तर, आपण त्या विशिष्ट व्हेरिएबलला 567 सह
वाढवूया.
आणि मग आम्ही पुढे जा तर, सुदीप, सुरेश,
अक्षय, Vignesh, Vignesh, मोहित, व्ही स्टोअर्स मध्ये
राधा आणि Srivatsan पुन्हा करू.तर, आम्ही 276 ते
567 जोडतो आणि आमच्याकडे श्रीवत्सनने एसव्ही
स्टोअर्सवर आतापर्यंत 843 रुपये खर्च केले
आहेत.
पुढे जात आहे.
अडवाइथ, ज्युलिया, अहमद, राजेश, नीरजा,
श्रीवत्सन पुन्हा पण आता सन जनरल मध्ये.
सन जनरल मध्ये, श्रीवत्सन 340 खर्च करतात.
म्हणून, आता आपण हे व्हेरिएबल 0 वरून
340 पर्यंत वाढवू.
आणि मग आम्ही पुढे जाऊ आणि अजून एक सन
जनरल आहे, आणि आमच्याकडे आधी 340 होते, आता आम्ही
या व्हेरिएबलमध्ये 354 जोडतो, त्यामुळे
सन जनरलमध्ये श्रीवत्सनातर्फे आम्ही 694 रुपये खर्च
करू.
हा अद्वैत, अपर्णा, जॉर्ज, अभिनव, अहमद,
अक्षय, पुन्हा अद्वैत, अभिनव, अखिल, नीरजा
आणि म्हणून श्रीवत्सनने बिग बाजारात कोणतीही
खरेदी केलेली नाही.
तर, बिग बाजार मोजणी राहते, बेरीज 0 राहते.
सन जनरलमध्ये, तो 694 रुपये खर्च करतो
आणि एसव्ही स्टोअरमध्ये तो 843 रुपये खर्च करतो.
या ट्यूटोरियलमधील आमच्या शेवटच्या
कार्यासाठी, आपण व्याख्यानात जे पाहिले
आहे त्यासारखे काहीतरी करू.
व्याख्यानात तुम्ही असे प्रकरण पाहिले
आहे जिथे मुलांच्या आणि मुलींच्या सरासरी
गणिती गुणांची गणना एका व्हेरिएबलचा
वापर करून एका पुनरावृत्तीमध्ये केली गेली.
तर, येथे डेटा या शब्दासह असेच काहीतरी करूया.
तर, या कार्यात किंवा या डेटासह आपण काय
करू ते म्हणजे आपण सरासरी सर्वनामासह
सरासरी पूर्वपदाच्या आकाराची तुलना करू
शकतो.
शब्दयोगी अव्यये (prepositions) आणि सर्वनाम
( pronouns) हे दोन्ही छोटे शब्द असतात.
तर, या परिच्छेदामध्ये, आपण शब्दयोगी अव्ययेची
सरासरी लांबी आणि सर्वनामांची सरासरी
लांबी शोधण्याचा प्रयत्न करूया.
तर, आपण त्याची तुलना करू शकतो.
हे करण्यासाठी आम्ही जे करतो ते म्हणजे,
आम्ही प्रथम 4 व्हेरिएबल्स स्थापित करतो, एक
Preposition Count असेल, दुसरे Pronoun Count असेल, आणि नंतर
आम्ही दोन व्हेरिएबल्स देखील सेट केले जे
Total Preposition Length आहे जेथे आपण फक्त प्रत्येक
पूर्वसंख्येची लांबी जोडतो.
आणि त्याचप्रमाणे आपल्याकडे Total Pronoun
Length आहे जे आम्हाला त्या सर्वानापर्यंत
येणाऱ्या सर्वनामांच्या सर्व अक्षरांची बेरीज
देईल.
आणि पुनरावृत्तीच्या शेवटी, आम्ही काय
करतो, आम्ही Total Preposition Length ला Preposition Count ने विभाजित
करतो आणि Total Pronoun Length ला Pronoun Count ने विभाजित
करतो.
अशा प्रकारे आम्ही शोधत असलेल्या सरासरी
मिळवतो.
तर, आपण आपल्या पहिल्या कार्डसह प्रारंभ
करूया.
येथे, हे एक नाम आहे, म्हणून आम्हाला स्वारस्य
नाही आणि हे पुन्हा एक संज्ञा आहे, स्वारस्य
नाही.
विशेषण, विशेषण आणि आपल्याकडे एक सर्वनाम
आहे.
म्हणून, आम्ही 1 सर्वनाम वाढ आणि आम्ही 0 त्यामुळे
3 बेरीज, Total Pronoun Length आतापर्यंत 3आहे
आता आपल्याकडे एक प्रीपोझिशन आहे,
आम्ही प्रीपॉझिशन 1 ने वाढवतो आणि एकूण
Preposition Length मध्ये 4 जोडतो आणि ते 4 बनवतो.
आणि आता आपल्याकडे संज्ञा, उभायान्वी
अव्येय, नाम पुन्हा, नाम आहे आणि आमच्याकडे
लांबी 3 चे सर्वनाम आहे.
म्हणून, आमच्याकडे 2 सर्वनाम आहेत एकूण
6.
लांबीसह तर, आम्ही आमच्या प्रीपोजिशन
लांबीमध्ये 2 जोडतो आणि आम्ही प्रीपॉजिशन
1 ने वाढवतो.
आणि मग आपण पुढे जाऊ, संज्ञा, क्रियाविशेषण,
लेख, शब्द योगी अव्येय, पुन्हा प्रीपोझिशन
लांबीमध्ये 2 जोडा, Total Preposition Length आणि वाढीव
preposition 1 ने वाढवा.
क्रियापद, सर्वनाम, म्हणून आता आपण सर्वनाम
1 ने वाढवत आहोत आणि Total Pronoun Length मध्ये 2 जोडत
आहोत.
आणि आता आपल्याकडे पुन्हा संज्ञा आहे,
संयोग, पुन्हा 2 ची पूर्वकल्पना, द्वारे
वाढीव प्रीपोझिशन, 1 द्वारे प्रीपॉझिशन
संख्या आणि टोटल प्रीपोझिशन लांबी
2 ने वाढली आहे.
Noun, article, noun, verb, preposition , हे आणखी दोन आहेत.
त्यामुळे, आपल्याकडे आत्ता 5 prepositions आहेत
आणि एकूण लांबी 12 आहे.
पुढे जाणारा उपपदे, preposition, म्हणून आपल्याकडे
17 च्या एकूण लांबीसह 6 prepositions आहेत.
Adjective, preposition, त्यामुळे एकूण 21 लांबीच्या
7 prepositions आहेत.
क्रियापद, पुन्हा preposition, तर, 23 च्या एकूण
लांबीसह 8 उभायन्वी अव्येये आहेत.
विशेषण, क्रियापद, सर्वनाम तर, आम्ही
आता सर्वनाम 1 ने वाढवतो, सर्वनाम संख्या 1
ने वाढवतो आणि आम्ही 2 टोटल प्रोनाऊन लांबीमध्ये
जोडतो.
आणि नाम, उभायान्वी अव्येय, नाम, शब्दयोगी
अव्यये पुन्हा आहे.
तर, आमच्याकडे आणखी एक शब्दयोगी अव्यये
आहे आणि आम्ही पूर्वस्थितीची लांबी 2 ने वाढवत आहोत.
आणि नाम आणि नाम, लेख, शब्दयोगी अव्यये,
म्हणून, आता आपल्याकडे 27 च्या एकूण लांबीसह
10 उपशब्द आहेत.
विशेषण, क्रियाविशेषण, संज्ञा, क्रियापद,
सर्वनाम.
तर, आता आपल्याकडे a आहे, आपल्याकडे आता
5 सर्वनाम आहेत ज्यात एकूण 12 अक्षरे आहेत.
नाम, सर्वनाम जेणेकरून ते 15 सर्व लांबीसह
6 सर्वनाम असेल.
विशेषण, क्रियापद, संज्ञा, संज्ञा, क्रियापद,
संज्ञा, सर्वनाम जे आहे , 17 च्या एकूण
लांबीसह 7 सर्वनाम आणि हे शेवटचे कार्ड
देखील आहे.
तर, आपण पाहतो की सरासरी शब्दयोगी अव्ययेची
लांबी 27 बाय 10 आहे जी 2.7 देते.
ही सरासरी शब्दयोगी अव्ययेची 17 बाय 7 आहे
जी आपल्याला अंदाजे 2.43 देते.
तर, या परिच्छेदात, सरासरी पूर्वनिर्धारण
लांबी सरासरी सर्वनाम लांबीपेक्षा किंचित
जास्त आहे.
धन्यवाद.
5.0 / 5 (0 votes)