PSD - Data Visualization Part.01/02
Summary
TLDRThis lecture introduces data visualization in the context of data science, emphasizing its importance for interpretation and communication. It outlines the basics of visualization, types of data, and visualization techniques. The focus is on data exploration through visualization, which is crucial for identifying trends and patterns. The lecture also touches on the relationship between visualization and statistics, highlighting how visual representation can enhance data interpretation. It categorizes data into nominal, ordinal, interval, and ratio types, and discusses the suitability of different visualizations for each. The session is part of a data science course at the University of Indonesia, supported by academic development funds.
Takeaways
- 📊 The lecture introduces data visualization as a critical component in the field of data science, emphasizing its role in providing clear interpretations of data.
- 🎯 The purpose of the lecture is to explore various forms of data processing, with a focus on the importance of visualizing data for better understanding and analysis.
- 📈 The lecture outlines two types of visualization: exploratory data visualization, aimed at accurately representing what is depicted, and presentation data visualization, aimed at convincing viewers of the accuracy of the representation.
- 🔍 A significant focus in academic and educational settings is on exploratory data visualization, which is crucial for initial analysis before building machine learning systems.
- 📋 The lecture highlights the importance of visualizing data to identify trends, which is more effective than analyzing data in tabular form alone.
- 📊 The necessity of visualization is underscored by its ability to reveal patterns and assist in making predictions, a critical aspect of data analysis.
- 🧠 The lecture connects data visualization with artificial intelligence and machine learning, suggesting that visual insights can inform and improve these technologies.
- 📊 The role of statistics in data visualization is discussed, with an emphasis on using statistical terms like standard deviation and correlation to enhance data interpretation.
- 📚 The lecture categorizes data into four types: nominal, ordinal, interval, and ratio, each with distinct characteristics and visualization requirements.
- 📈 The differences between nominal and ordinal data are clarified, with nominal data lacking order and ordinal data having a ranked sequence.
- 📊 The lecture concludes with a discussion on the types of visualization based on data dimensions, ranging from one-dimensional to three-dimensional, setting the stage for further exploration in subsequent videos.
Q & A
What is the main purpose of data visualization in the context of data science?
-The main purpose of data visualization is to provide a good interpretation of data. When data is visualized effectively, it can be better understood and analyzed.
What are the two types of data visualization discussed in the script?
-The two types of data visualization discussed are 'exploration' and 'presentation'. Exploration focuses on understanding the data, while presentation aims to convince others of the accuracy of the data visualization.
Why is data visualization important before conducting machine learning analysis?
-Data visualization is important before machine learning analysis because it helps to understand the characteristics of the data. It can reveal trends and patterns that are not easily discernible from raw data, which is crucial for building effective machine learning models.
How can visualizing data help in identifying trends?
-Visualizing data can help in identifying trends by representing data in graphical formats such as bar charts, line graphs, or scatter plots. These visual representations make it easier to spot patterns, changes, and correlations within the data.
What is the relationship between data visualization and artificial intelligence or machine learning?
-Data visualization is related to artificial intelligence and machine learning as it provides a way to explore and understand data, which is a fundamental step before applying AI or machine learning techniques. Visual insights can guide the development and tuning of these intelligent systems.
What are the four types of data mentioned in the script?
-The four types of data mentioned are nominal, ordinal, interval, and ratio. These categories help in understanding how data should be visualized and analyzed.
How does nominal data differ from ordinal data?
-Nominal data represents categories without any inherent order, such as gender or types of pets. Ordinal data also represents categories but with a specific order, like ranking or ratings.
What are interval and ratio data types, and how do they differ?
-Interval data types are numeric and have equal intervals between values but no true zero point, such as temperature in Celsius. Ratio data types also have numeric values with equal intervals and a true zero point, indicating a ratio, such as weight or speed.
Why is it important to consider the type of data when creating visualizations?
-Considering the type of data when creating visualizations is important because different data types have different characteristics and require specific types of visualizations to accurately represent the information and insights they contain.
What are the different dimensions of data visualization mentioned in the script?
-The script mentions one-dimensional, two-dimensional, and three-dimensional data visualizations. These dimensions refer to the complexity and depth of the data representation in the visual format.
Who produced the module discussed in the script?
-The module was produced by the Department of Statistics, Faculty of Mathematics and Science, University of Indonesia, with support from the Directorate of Academic Development and Learning Resources (DP ASDP).
Outlines
📊 Introduction to Data Visualization
This paragraph introduces the topic of data visualization within the context of data science. The speaker emphasizes the importance of visualizing data to provide clear interpretations and insights. The lecture aims to cover the basics of data visualization, types of data, and types of visualizations. It distinguishes between two types of visualizations: data exploration (which focuses on accurately representing the data) and data presentation (which aims to convince the audience of the accuracy of the presented information). The speaker highlights the significance of visualization in identifying trends and patterns, and its utility in performance evaluation within machine learning and intelligent systems.
🔢 Data Types and Statistical Visualization
The second paragraph delves into the relationship between data visualization and statistics. It mentions the frequent use of statistical terms in visualization, such as standard deviation and correlation. The paragraph explains how visualizing data can lead to better interpretation compared to mere numerical representation. It also touches upon the categorization of data types into nominal, ordinal, interval, and ratio, providing examples for each. The speaker discusses the characteristics of these data types, such as whether they have an inherent order or can be subjected to mathematical operations like division, which is typical for ratio data types.
📈 Types of Data Visualization
The final paragraph discusses the various types of data visualization, categorized based on dimensions (one-dimensional, two-dimensional, and three-dimensional). It suggests that the choice of visualization technique depends on the nature and dimensions of the data. The speaker indicates that further details about these types of visualizations will be covered in subsequent videos. The paragraph concludes with acknowledgments to the University of Indonesia's Statistics program and the Directorate for Academic Development and Learning Resources for their support in producing the educational module.
Mindmap
Keywords
💡Data Visualization
💡Data Exploration
💡Data Presentation
💡Statistical Terms
💡Data Types
💡Trend Analysis
💡Machine Learning
💡Data Interpretation
💡Data Distribution
💡Visual Representations
💡Dimensionality
Highlights
The lecture introduces data visualization as a crucial part of data science.
The purpose of data visualization is to provide good interpretation of data.
Two types of visualization are discussed: exploratory and presentational.
Exploratory visualization focuses on accurately representing what is depicted.
Presentational visualization aims to convince viewers of the accuracy of the depicted data.
The importance of visualization in data analysis is emphasized.
Data visualization is essential for identifying trends and patterns.
The lecture connects visualization with techniques in machine learning.
The necessity of visualization before running machine learning models is highlighted.
Visualization helps in understanding data distribution and patterns.
The role of visualization in performance evaluation within machine learning is discussed.
The relationship between visualization and statistics is explored.
Data types are categorized into nominal, ordinal, interval, and ratio.
Nominal data types are explained as categorical without order.
Ordinal data types are categorical with an inherent order.
Interval and ratio data types are both numeric but differ in their properties.
Examples are given to differentiate between nominal, ordinal, interval, and ratio data types.
The lecture concludes with gratitude to the University of Indonesia and the supporting bodies.
The importance of understanding data types for effective visualization is emphasized.
Transcripts
MP3
Hai assalamualaikum warahmatullahi
wabarakatuh sama datang di perkuliahan
pengantar sains data pada topik sesi
modul hari ini kita akan membahas
mengenai visualisasi data Adapun tujuan
dari perkuliahan ini ataupun dari model
ini adalah salah satunya di dalam
pengantar sains data banyak sekali
bentuk-bentuk pengolahan data yang bisa
kita lakukan visualisasi nah gunanya
visualisasi data ini salah satunya
adalah supaya kita bisa memberikan
interpretasi dengan baik jika data bisa
divisualisasikan dengan baik juga nah
untuk visualisasi data
Hai ada beberapa hal yang akan dibahas
untuk modul kali ini yaitu mengenai
salah satunya adalah sebagai berikut nah
Adapun outline yang kita akan kita bahas
yaitu mengenai yang pertama adalah
dasar-dasar dari visualisasi kemudian
jenis data dan juga tipe visualisasi Nah
ada dua jenis visualisasi yang pertama
yaitu mengenai eksploitasi data dari
visualisasi
Hai kemudian kemudian ada juga mengenai
presentasi data Nah untuk visualisasi
ekspor Reza Sidharta ini yaitu kita
lebih membahas mengenai gambaran apa
yang digambarkan itu adalah benar
Sedangkan visualisasi dari presentasi
data itu adalah meyakinkan bahwa apa
yang digambarkan oleh yang dilihat oleh
orang-orang itu dia benar Nah biasanya
dalam akademik atau sisi pengajaran itu
paling banyak fokusnya adalah movie
sensasi eksploitasi data atau data
exploration visualisasi kemudian yang
selanjutnya baru kita akan melanjutkan
mengenai visualisasi tentang presentasi
dari suatu data nah biasanya untuk
visualisasi maaf untuk revitalisasi
model data eksplorasi ini biasanya
mengaitkan
ini app visualisasi yang lebih
memulaikan terhadap teknik-teknik Nah
jadi seperti apa kita bisa memfitkan
dari suatu data tersebut dia lebih cocok
kepada model yang mana Nah penting
Mengapa kita penting office lisasi data
Jadi sebenarnya sebelum kita melakukan
atau menjalankan suatu analisis yang
kita bangun di dalam bentuk sistem
machine-learning tersebut yaitu salah
satunya adalah kita bisa mau visualisasi
adat yang kita punya nah Biasanya kalau
misalnya kita punya data yang contohnya
saja saya kita punya data yang modelnya
adalah numerik ya Misalnya adalah suatu
bentuk tabel nah pagi model datanya Ting
sangat banyak Nah mungkin kita misalnya
hanya mencari misalnya menentukan
tingkat persentase Nah mungkin dengan
memfiksasi teh data seperti kita bisa
menggambarkan diagram batang kemudi
ndak bisa menggambarkan visualisasi
bentuk Linenya atau skater Cloud
kemudian misalnya kita bisa membuat
dalam bentuk grafiknya itu sebaiknya itu
lebih baik ketika kita bisa
menginterpretasikan kalau Bentuknya itu
adalah secara visualisasi dibandingkan
kalau misalkan kita membentuknya itu
dilihat hanya berdasarkan tabel saja nah
jika kita tidak bisa mengidentifikasikan
suatu trend atau misalnya mempeng n
membuat suatu prediksi nah ini juga
biasanya sangat penting dilakukan dengan
visualisasi jadi juga sebenarnya Kenapa
butuh visualisasi itu salah satunya kita
bisa melihat trennya misalnya di dalam
berbagai ilmu saya saya misalkan saya
contohkan disini misalkan di kimia best
alkana Saya pengen lihat ngetren
kira-kira suatu senyawa kimia terhadap
nilai apa konsentrasinya itu
lima makin meningkat atau tidak Nah itu
kan sebaiknya dilihat secara visualisasi
data dibandingkan kalau kita melihatnya
di dalam tabel ya jadi salah satunya itu
adalah bisa kita lihat dalam bentuk
trend nah kemudian ini secara khusus
biasanya penting ketika kita bisa
melakukan performance yaitu salah
satunya menggunakan metode di dalam
mesin learning yaitu tentang aktivitas
intelijen nah pada pembahasan Yang
pertama mengenai sense data itu salah
satu datang sayur situ paling banyak
mati berkaitan dengan artificial
intelegent pendekatan artificial
intelegent ini salah satunya itu bisa
kita kaitkan dengan ameto dari
artificial intelegent ataupun
machine-learning Nah apa kaitanya
visualisasi dengan statistik nah
biasanya di dalam melakukan visualisasi
ini banyak
Hai istilah-istilah statistik juga yang
kita sering gunakan misalkan kita ingin
menghitung nilai nilai standar deviasi
korelasi nah ini biasanya di dalam
visualisasi data juga akan dilihat
al-hasby berikut Nah jadi sebenarnya di
dalam ilmu statistik juga memvisualisasi
data itu menginterpretasikan data itu
lebih baik dibandingkan kalau dibentuk
dalam kabel saja Oke misalkan yang kita
lihat ya kalau misal kita punya data
dalam bentuk tabel Ternyata kau kita
visualisasikan bentuknya seperti ini ya
kalau kita buat dalam bentuk apa namanya
grafik Ya ataupun skater Cloud Nah bisa
kita lihat bahwa bentuknya seperti ini
nah jadi dari data ini nanti bisa kita
interpretasikan akhir-akhir adata ini
sempat penyebarannya Seperti apa kalau
misalnya dalam statistik Apakah dia bisa
mengikuti distribusi Normal atau tidak
misalnya ya kemudian nah jenis-jenis
namun kini topik sebelumnya tadi modul
sebelumnya kita sudah membahas juga
mengenai jenis-jenis data nah disini
sebenarnya lebih terkait tentang
tipe-tipe data salah satunya itu bisa
kita bagi dalam empat jadi tipe-tipe
data terutama di dalam bidang Ilmu
Statistik juga ada empat model data itu
tipenya nominal tipenya ordinal tipenya
interval dan tipenya rasio Nah untuk
yang tipenya nominal biasanya ini a
model yang termasuk data kategori dan
biasanya tidak terurut Contohnya apa
contohnya misalkan hewan peliharaan ada
anjing ada kucing ada kelinci ada burung
Nah jadi mereka termasuk model data
kategori tapi mereka tidak tidak ada
rankingnya gitu misalkan apalagi
misalkan gender ya jenis kelamin
laki-laki perempuan itu kategori tapi
kita tidak tidak punya urutan disitu
artinya
Hai Ah gitu nomor satu perempuan nomor 2
enggak ya Jadi tidak ada urutannya Nah
kemudian ada tipe data yang jenisnya
ordinal Nah untuk tipe data yang
jenisnya ordina app Ini ada-ada
kategori-kategori contohnya itu adalah
nah 12345 misalkan kemudian nilai Amin
bbpress Nah itu juga berupa data
kategori tapi dia punya urutan jadi itu
adalah data ordinal kemudian ada data
interval Nah jadi kalau data interval
ini adalah jenis data numerik ya jenis
data numerik yang nilainya itu bisa
dibentuk ke dalam suatu bentuk interval
misalkan apa misalkan temperatur yang
sangat temperatur kemudian operasinya
itu bisa dibuat ke dalam bentuk kecil
semua dengan besar pemandangan dan
sebagainya kemudian rasio naon
yo yo ini ada terdiri atas data numerik
kemudian contohnya juga seperti interval
ya Tapi biasanya kalau berbicara tentang
rasio biasanya kitab membahas tentang
proporsi jadi ada-ada operasi pembagian
disitu nah kemudian untuk nilai nominal
ordinal sendiri jadi letaknya itu
sebenarnya kalau letak antara ordinal
dan nominal kita ketahui sama-sama
mereka itu adalah tipe jenis data
kategori tipe jenis data kategorik
tetapi ada perbedaannya Yang satu
nominal itu tidak memperhatikan urutan
sedangkan original itu dia memperhatikan
urutan Nah iya jadi kalau misalnya bisa
dilihat ya kalau bisa biasa kira-kira
gender
lu pertama gender gender itu lebih masuk
ke mana Yang kedua apa pendapatan
tahunan menggunakan tahunan Jadi mungkin
yang pertanyaan di sini nanti bisa saya
ajukan di forum lain bisa menentukan
kira-kira gender kemudian pendapatan
tahunan kemudian reaksi orang pada
pertanyaan Apakah dia disagree panah
Netral apa tidak setuju kemudian Apakah
pengen menambahkan lisdin email atau
enggak gitu Nah itu kira-kira masuk yang
nominal atau ordinal nanti mungkin saya
bisa tanyakan di forum diskusi ya nanti
bisa kalian jawab dan kalian pikirkan
kira-kira Diantara empat contoh Ini yang
mana nomina yang mana ordinal nah
kemudian Sedangkan untuk interval dan
ratio jadi kedua-duanya ini juga
sama-sama
akan am jenis data yang numerik ya jenis
data numerik tapi ada perbedaannya nah
kalian tolong nanti coba dipikirkan juga
kira-kira Diantara empat contoh ini mana
yang termasuk rasio termasuk interval
pertama kalau panjang dalam meter yang
kedua Kau panjang dalam Fit yang ketiga
kalau kecepatan meter per sekon yang
keempat itu misalnya skor IQ kira-kira
coba mencari nilai kira-kira dia
merupakan rasio Jadi kalau tidak kalau
dia nilainya interval ya berarti di and
check itu ya tidak nah kemudian kita
masuk kepada jenis-jenis visualisasi Nah
untuk jenis-jenis disorientasi data ini
ada beberapa macam yang pertama itu
adalah berdasar dari satu dimensi jadi
ada yang satu dimensi ada yang 2 dimensi
dan 3 dimensi
gitu Nah untuk yang satu dimensi ini
nanti modelnya berbagai jenis yang
biasanya ini fokus kepada jenis dan
dimensi dari letak data tersebut nah ini
jenis-jenis dari visualisasi data baik
untuk di video selanjutnya kita akan
membahas mengenai masing-masing jenis
dari Hafidz oishi data tersebut mulai
dari satu dimensi sampai kepada tiga
dimensi saya sebagai mentor untuk modul
ini ucapan terima kasih dan saya juga
ingin berterima kasih bahwa pada
pembuatan modul ini itu diproduksi oleh
program studi statistik Fakultas
Matematika dan ilmu pengetahuan
Universitas Indonesia yang didukung dari
bantuan dana Direktorat pengembangan
akademik dan sumber daya pembelajaran
atau DP ASDP
Oh begitu terima kasih dan saya akhiri
dengan salamualaikum warahmatullahi
wabarakatuh
Посмотреть больше похожих видео
Introduction to Python
Variables and Types of Variables | Statistics Tutorial | MarinStatsLectures
ENGINEERING DATA ANALYSIS LESSON 1 TYPES OF DATA
Practical Intro to NLP 26: Theory - Data Visualization and Dimensionality Reduction
Nominal, Ordinal, Interval & Ratio Data: Simple Explanation With Examples
What is Data Science?
5.0 / 5 (0 votes)