2. 事前準備¶
深層学習を始めるには、いくつかの基本的なスキルを身につける必要があります。すべての機械学習はデータから情報を抽出することに関係しています。そこで、データの保存・操作・前処理に関するスキルを学ぶことから始めます。
さらに機械学習では通常、大きなデータセットを扱う必要があります。データセットは、行がデータ例に対応し、列が属性に対応する表と考えることができます。線形代数は、表形式のデータを扱うための強力な手法を提供します。細かい部分にあまり深く入り込まずに、むしろ行列演算の基本とそれらの実装に着目します。
そして、深層学習は最適化そのものです。いくつかのパラメータをもつモデルに対して、データに最も良く合うものを見つけたいのです。アルゴリズムの各ステップで、パラメータをどのように動かせばよいか決めるためには、少し微積分が必要です。幸いなことに、autograd
パッケージが自動で微分を計算することができるので、それについて後に説明します。
次に、機械学習は予測を行うことと関係しています。つまり、観測した情報にもとづいて、未知のいくつかの属性に関する尤もらしい値を考えることです。不確実性のもとで、厳密な推論を行うためには、確率に関する用語を用いる必要があるでしょう。
最後に、公式のドキュメントはこの書籍以上に豊富な説明と例を提供しています。この章の締めくくる際は、必要な情報を探すためのドキュメントの調べ方をお伝えします。
この本は深層学習に関する適切な理解を得るために、数学的な内容は最小限にとどめています。だからといって、この本が数学と無関係であるということを言っているわけではありません。この章では、だれもがこの書籍の数学的内容のほとんどを最低限理解できるように、基礎とよく使われる数学について駆け足で紹介します。もし、数学の内容をすべて理解したい場合は、 :numref:chap_appendix_math
をさらに読むと十分でしょう。
:maxdepth: 2
ndarray
pandas
linear-algebra
calculus
autograd
probability
lookup-api