sonoshouのまじめなブログ

情報系大学生からのウェブ見習い人生の記録

機械学習

サポートベクターマシンを勾配法で解く。

最も代表的な教師あり分類手法の一つであるサポートベクターマシン。 訓練サンプルから、各データ点との距離が最大となるマージン最大化超平面を求めるという明確な分類基準がある、かつ、一見求めづらそうなこの超平面を一意に求められるということから 数…

非負値行列因子分解

このエントリーは、集合知プログラミング第8章を参照にしています。非負値行列因子分解は、データマイニングの手法の一つである。 データの重要な特徴を抽出するために用いられる。 非負値行列因子分解は、non-negative matrix factorizationの日本語訳であ…

減衰関数

機会学習(データマイニング)をしていると、 各要素の距離に応じた重み付けを行うことがある。 今回は、この時に使われる減衰関数に焦点当てる。このエントリーは、集合知プログラミング第8章を参照しています。 反比例関数 減法(引算)関数 ガウス関数 …

文章のカテゴリ分け

集合知プログラミング第6章を参考にしています。 集合知プログラミングのソースコードはこちらで公開されています。 http://examples.oreilly.com/9780596529321/本エントリーでは、文章の内容に応じて文章をカテゴライズ(分類する)方法についてです。 自…

最適化アルゴリズム

集合知プログラミングの第5章最適化の一部を自分なりにまとめます。ヒルクライム法(傾斜上り法) ヒルクライム法は、ある地点から少し値を変更し、 変更後の値が変更前の値より低ければ採用する。 これを繰り返して行けば、最小値へ近づくことが出来る。ヒ…

Scipyのインストール

SciPyのダウンロードNumpyよりもさらに高水準の数学関数ライブラリが欲しい! そんなあなたには、Scipyのインストールをおすすめします。SciPy Wikipedia:SciPy前提: 筆者の環境はWindows (MacやLinuxでも導入可能だが、手順が若干異なる可能性があります。…

python 機械学習 環境構築まとめ

pythonを使った機械学習の環境構築まとめです。 python (プログラミング言語) pydev (eclipseのpython環境構築プラグイン) numpy (数学関数ライブラリ) scipy (数値解析ライブラリ) matplotlib (グラフ描画ライブラリ) cvxopt (最適化計算ライブ…

第3回機械学習勉強会

今回が最後、備忘録。 機械学習面白いなー。 数学をもっとしっかり勉強すべきだ。 今しか数学は勉強できないだろうから、学生のうちに習得できるだけ習得したい。非線形SVM概要データとクラスタ数を入力として、データをクラスタに分類する。 今までの線形SV…

第2回機械学習勉強会

またまた備忘録。ナイーブベイズ概要ベイズの定理を使って、結果から原因を予測する。例:概要 ある文章がどのカテゴリに属する確率が最も高いかという観点から未分類の文章のカテゴリを決定する。例:入力・学習データ:カテゴリに分けられた文章 (教師デ…

第1回目機械学習勉強会

機械学習の勉強会が研究室でありました。 その備忘録として、記事を書こうと思います。2クラス分類で多クラスを分類する方法 one vs one one vs all one vs oneA or B → A A or C → A B or C → B ⇒結論「A」one vs allA or BC → A B or AC → AC C or AB → AB…

機械学習のオススメの本

機械に学習させるってワクワクするよね! 先輩から聞いたオススメのウェブや本です。 WEB ・機会学習 はじめよう gihyo.jp本 ・入門 -道具としてのベイズ統計 -入門ベイズ統計 -意思決定の理論と発展- -わかりやすいパターン認識 -プログラムのための確率統…