数字のカラクリ ビッグデータ時代 巷にあふれる洪水のような数字に振り回されないために

目の前のデータを正しく判断できるのか

誤差が書いていないデータは科学データではない

統計学ブーム
数字のカラクリ
注目の統計学

巷にあふれる洪水のような数字に振り回されないために
ビッグデータ時代

カラクリの例
データのもとになる対象に偏りがある

合格率○○%
ダイエット成功率○○%
就職力○○倍

比較が大事

アンケートのだまし
少なくとも1000人にアンケートをとらないと正しい傾向は見えない

あのプロ野球統一球問題
統計学で見抜ける
カイ二乗検定で確かめるとホームランの増加は偶然ではないことがわかる

当局が真実を隠してもデータはウソをつかない

数字の裏にひそむ真実を見抜け

数字には幅と分布がある
誤差がどれくらいなのか
全体像のどの位置なのか

平均値が実態を表していない場合がある
ごく一部のデータが全体値を引き上げている場合
平均値と中央値

誤差が書いていないデータは科学データではない

データサイエンティスト

ビッグデータとの戦い方
ビッグXを見つけ出す

隠れマルコフモデル

データに欠損が多いと使えない
類推・補完
地道な作業の繰り返し

専門チームを作った企業

ほか

クローズアップ現代 NHK

関連記事
数字のカラクリ ビッグデータ時代 巷にあふれる洪水のような数字に振り回されないために
大規模災害時にビッグデータ活用へ
ビッグデータでかぜの広がりがわかる – インフルくん カゼミル

ビッグX(1) (手塚治虫漫画全集 (243))

スポンサーリンク

サブコンテンツ

このページの先頭へ