【ひろゆき】今まで知らなかったデータサイエンティスト※まるで落穂拾い…【切り抜き】
Summary
TLDRこのビデオスクリプトでは、データサイエンティストになるための3つの主要な要素、すなわちデータサイエンスのスキル(数学や統計学)、ビジネススキル、そして時代とともに変化する技術力について語られています。さらに、ビジネススキルの重要性が議論され、一部の人々はそれが必要不可欠だと考えている一方で、他の人々は技術力だけがあれば十分だと考えています。また、データサイエンスの現実についても触れられており、実際にはデータの前処理やエラーの修正など、予想外の課題が多いことが語られています。このスクリプトは、データサイエンティストとしてのキャリアに興味がある人々に向けた、実践的なアドバイスと洞察を提供します。
Takeaways
- 😊 データの正規化とクレンジングはデータサイエンティストにとって非常に重要
- 😞 実際のデータは思った通りの形ではないことが多い
- 🤔 データのエラーや不整合性を手動で修正する必要がある
- 😮 ビジネススキルは自分で会社を立ち上げる場合に最も必要
- 😀 営業とエンジニアの良好な連携があれば、データサイエンティストはビジネススキルを必要としない
- 🤨 データ分析だけでなく、データ前処理が大変な仕事
- 🧐 データをコンピュータで読み取りやすい形にする作業が肉体労働のようだ
- 😓 データの問題を見つけて修正することが、データサイエンティストの大切な仕事
- 😊 データを適切な形に整えるスキルが必要
- 💪 データ前処理の仕事に頑張ることが、データサイエンティストになる第一歩だ
Q & A
データサイエンティストに求められる3つの要素とは何ですか?
-データサイエンス力(数学や統計)、ビジネス力、時代力の3つが重要だとされています。
ビジネス力を鍛えることはなぜ難しいと思われているのでしょうか?
-データサイエンティスト自身がビジネスを立ち上げ提案書を作成することは稀で、ほとんどの場合は営業部門と協力して業務を行うため、自らビジネス力を鍛えることは難しいと考えられているからです。
データの正規化とは何のことを指しますか?
-コンピュータがデータを読み込みやすい形に整形する作業のことを指します。文字コードの統一や、データの形式の揃える作業などが含まれます。
実際のデータサイエンティストの仕事では、予想外のデータの問題が多い理由は何でしょうか?
-元データに様々なミスが含まれていることが多く、名前・住所・性別などの情報が不正確だったり、符号や文字化けなどの問題が多発するためです。
データのクレンジングで発生する典型的な問題の例を教えてください。
-住所と電話番号が入れ替わっている、名前の表記揺れ、性別が逆にされている、文字コードが混在しているなどの問題が発生します。
なぜデータサイエンティストの仕事は大変とされるのでしょうか?
-プログラムを組む作業以上に、元データのクレンジングやエラー修正に多くの手間がかかるため、思い通りには仕事が進まないことが多いからです。
データを解析する以前の段階で、データサイエンティストに求められる作業とは何でしょうか?
-元データの精査と、コンピュータが読み取れるよう適切に整形する作業(クレンジング、正規化など)が重要なステップです。
データ分析で失敗する代表的な原因は何でしょうか?
-元データ自体に様々な問題が内在していたり、前処理が不十分だったために、適切な分析ができないことが多いです。
データサイエンティストに求められる資質やスキルを教えてください。
-統計分析力やプログラミング力に加え、データ理解力、論理的思考力、根気強さと忍耐力が必要とされます。ビジネス感覚もある程度求められます。
データ分析で成功するポイントを教えてください。
-適切な元データの選定と前処理、的確な分析手法の選択、結果の考察と解釈が重要です。過度に複雑な分析を行うのではなく、ビジネス目的に照らし合わせ最適な手法を選ぶことが肝心です。
Outlines
😊データサイエンティストに必要な3つの要素とは
データサイエンティストに必要な3つの要素はデータサイエンス力、ビジネス力、時代力であるとされる。データサイエンス力は統計や数学などのスキルで、ビジネス力を身につけるのは難しい。会社によっては営業とエンジニアの2つのチームに分かれており、営業力のある人がいればエンジニアはビジネス力がなくても良い。データ整形といった肉体労働的な作業も多く、思い通りにはいかないが頑張れば高給取りになれる。
Mindmap
Keywords
💡データサイエンティスト
💡データサイエンス力
💡ビジネス力
💡資格
💡営業力
💡エンジニア
💡提案書
💡正規化
💡文字化け
💡エラー
Highlights
データサイエンティストの資格を持っている人も、ビジネス力を鍛えるのは難しいと思っている
営業力のある人がいれば、データサイエンティストはビジネス力がいらない
データサイエンスの実際の作業は、データの清掃と正規化が大変な肉体労働的な部分だと感じる
思い通りの美しいデータはめったにない。予想外の文字化けや形式のデータが解析を困難にすることがある
データの細かい清掃とエラー修正こそが、データサイエンティストの大事な仕事である
Transcripts
国立大学が価格家引率からデータ
サイエンティストにキャリア時にしたも
ですデータサイエンティストの3つの構成
要素はデータサイエンス力カッコ数学や
統計にゃくビジネス力であると言われます
がデータサイエンティストの資格を持っ
てる行くさんもこの考え方は正しいと思い
ますがまたこの考え方でビジネス力を
鍛えるのはなかなか難しいなと思ってるん
ですがどの行きたいと言うでしょうかまた
他に大事な要素がありますか別にビジネス
力なんかいらねぇんじゃねって思います
けどあのまあ普通の会社ってその営業して
くれる人とそのエンジニアっている2
チームに分かれているので
なのであのちゃんとその営業力のある人が
いれば別にビジネス力いらないと思うよの
自分自身で会社をつくってそのうちじゃあ
こういうあの数字いじってこんな系片瀬
ますよーみたいな提案書をつくって提案
するとかであればビジネス力はいると思う
けど
もう素直に
園児に歩くさえあればなんとかなるんじゃ
ないかなと思ってますけどまぁそのデータ
サイエンス力と揃える時代力が何で別れ
てるのかわかんですけど
ただあの結局その中の騎乗のデータ
サイエンスで言われるような作業って
そんなにそのあの様はのデータがあります
これをうまくなんかあのをいじってみて
いい結果を出す形の中の結論を出しが咲い
ていうんっていうのがまあのその騎乗では
やるんですけど実際問題あの使わなきゃ
いけないデータっていうのがそのきれいに
機械が読み込めるような状態になってない
ことが多いですよねなので結局その正規化
といわれるその中データをキレイにして
コンピューターが読みやすくする詐欺よっ
ていう割とその中の肉体労働と言うかその
中おちボビロイに近いような
そのままのといえば本提案まあ出版する
ときにその後誤字脱字いう一生懸命探す
構成さんという仕事があるんだけどって
いう感じでそのデータサイエンティスト
ですなんかもういろいろな南土塁跡を買っ
てそのエンジニアとしてすごい頑張り
マースダメ着衣でもらえますみたいな話な
んですけど実際問題やってみるとってその
必要なデータの中でやこのデータ使えねー
だろっていうのを弾くみたいな作業だった
んですよ
例えばその全部英語だと思ってたらその中
に一人だけ中国人が混じってたせいでその
文字コードを中国語で認識しまってその
文字化け大量に起こるとかだったら全部
英語だと思ってたら実はその中に何か
ドイツ人が混じっててなんか変な希望が
入っちゃってその記号のせいでその中の
カンマが読み込めなくなっちゃってなんか
データが壊れちゃうみたいななんかの予想
しないことって結構あったりそうですよね
いやあの普通にじゃあの住所名前電話番号
って書いてあると思ったらその住所の欄と
でアン番号を間違えて書いちゃった人がい
てその中住所としてこう取り扱っていたら
なぜか数字だけど謎の住所が出てきて
いやいやこれレイヤー1号だったみたいな
来てで入れ替えるみたいなでその名前の
フリガナだがないとか名前と苗字客にし
てるとかなんか男女の性別逆にしてるとか
その中だか最近のオシャレ整備済みたので
なんか男女答えたくないみたいなことに
なってそのそもそもデータとして生物に
応えたくないは男として扱うのか女として
扱ったが決まってなくてなんか不思議な
結果になっちゃったみたいなっていうのが
やったらいっぱいあるせよどんな勝手なの
であの結局の中あのプログラムを組んで
物事をうまく行くよねっていうのだと思っ
たらその前のデータをひたすら見て声
エラーが出たからこのエラーが出てこの
データが間違ってるから子データを治す
みたいなっていうあの細かい作業が多いの
でなかなかの思い通りにこう簡単な感じに
はならないんで高級もらえると思います
けど頑張ってください
[音楽]
Browse More Related Video
【2024年上半期ベストセラー1位】部下にナメられる上司の特徴/「褒める」と「おだてる」の違い/「怒る」を「叱る」に好転させる技/人へのアドバイスが”悪手”となる理由【安達裕哉・梅田悟司】
【日本の未来予測】40代以上の今後の生き方を決める【本要約まとめ/作業用/フェルミ】
Mary Evelyn Tucker 0101 - To See The Universe Not Just As A Place, But As A Story
【斎藤一人】健康寿命は延びる…ゼロ円で今すぐできる奇跡の体験。身体機能が改善し、免疫力が高まる
Will AI kill us? Or Save us?
Docker知らないとWeb開発を任せられない?Dockerは初学者に必須?
5.0 / 5 (0 votes)