エラーが発生しました。
本書は、ビッグデータ時代にますます必要となる、データの組み合わせあるいは仮説の組み合わせによって新たな仮説を構築する方法を具体例とともに解説する。
通信システムの向上によって、これまで以上に大容量のデータが高速(リアルタイム)で生成されるようになっている。さらにIoTデバイスなどの普及によって、実世界データ、ソーシャルデータ、オープンデータを含む多種多様なデータが得られるようになり、それらを同時に取り扱う必要性がますます大きくなってきている。しかしながら異なるデータをどう組み合わせれば有用な仮説が得られるかは必ずしも自明ではない。ましてビッグデータに人工知能などの最新技術を適用しても、自動的に仮説が作られるという保証はない。
本書では具体的な事例とともに、ビッグデータを活用する応用システムのための基盤的技術となる統合的な仮説生成の方法を、データ分析(人工知能、データマイニング)とデータ管理(データベース)の技術を調和的に利用したアプローチに基づいて説明している。また科学史において、天文学・物理学の分野ではケプラー、ガリレオ、ニュートン、集団遺伝学の分野ではダーウィン、ゴルトン、ピアソン、メンデル、フィッシャーらの仮説生成の方法を辿りながら、その基本となる演繹、帰納、もっともらしい推論、類推、問題解決について学ぶことができる。さらにビッグデータを用いた仮説生成の方式として、複数の仮説間の差分、重ね合わせ、和分、結合の各方法についての具体例も詳述している。
データサイエンティストやデータエンジニアを含め、広くデータ応用に関わる人や将来それらの職業を目指す学生に手にとっていただきたい一書である。