機械学習のためのカーネル100問 with Python(機械学習の数理100問シリーズ 8)

鈴木 讓 著

3,300円(税込)

共立出版

カーネルの技術は、主成分分析、回帰分析、関数データ解析などのデータ分析、サポートベクトルマシン、ガウス過程といった機械学習で、頻繁に用いられている。有限次線形空間におかれた特徴量を関数に対応させることによって非線形の情報処理が実現できる、というメリットがある。その関数の線形空間を完備なものとしたとき、カーネルが再生性を満足していれば、線形空間を再生核Hilbert空間(RKHS)という。

カーネルは、機械学習の必須の技術であると言われながらも、大多数のデータサイエンティスト、機械学習エンジニアが「使い方」以上の理解をしていないのが現状である。本質がわからないため、新製品の開発や学術研究のために論文を読もうとしても、表面的な理解にとどまる。著者は、そのような苦手意識の克服には、数学の基礎、とりわけ関数解析の入門的な事柄を身につけることが先決であると主張する。

著者は2020年4月から8月に大阪大学大学院基礎工学研究科で講義を行い、その経験を通してカーネルの本質を伝えることの難しさを実感し、その反省をふまえて本書が完成した。

本書は「機械学習の数理100問シリーズ」の他の書籍と同様、ソースプログラムと実行例を提示して理解を促している。数式だけであれば、特にカーネルの場合、読者が最後まで理解することは容易ではない。また、関数解析の基本を理解してから、それ以降の章での応用を検討していて、数学の予備知識を前提としていない。さらに、RKHSのカーネルと、ガウス過程・関数データ解析のカーネルの両方を検討し、両者の扱いを明確に区別している。そうしたユニークさが、本書の特徴といえる。

本書によって確実な基礎が身につき、難しそうに思えていたカーネルの論文がスムーズに読め、一段高いところからカーネルの全体が見えてくる。カーネルを克服してステップアップしたいと願う、データサイエンティスト、機械学習エンジニア、研究者にとってうってつけの書である。