meideru blog

meideruが書いているブログです。主に電子工作・プログラミング・ガジェット類などを中心に記事を書いています。

自然言語処理を勉強しよう!

   

最近は「機械学習」と「日本のエレクトロニクス産業の歴史について」の勉強に力を入れています( ´ ▽ ` )

 

人工知能

今日は前者の機械学習に関して記事を書きます。

これまでは主に画像処理を中心に勉強してきました。これに関しては、ある程度の目処がついたので、次なるテーマを勉強しようと思っています。

それは「自然言語処理」です。

これまで勉強した機械学習について

前述の通り、これまでは主に画像処理を中心に勉強してきました。

例えば、画像認識や画像検出などです。ディープラーニングやHOG+SVMを用いた手法などを試してみました。候補領域の抽出に関してもSelective Searchやスライドウィンドウを用いた手法などを試してみました。

これらについてブログに書いたことは少ないですが、それは忙しくて書けていないだけで、実際にはもっとやっています(-。-; (時間ができたら書こうと思っている。)

画像処理に関しては、ある程度理解できたと思う

良い精度が出せるかどうかは別問題として、機械学習の画像処理に関する勉強は、ある程度の目処がついたように思います。

少なくとも、大まかな全体図は把握できました。良い精度を出すには、実験に費やす時間と豊富なリソース(CPUやGPU)が必要なだけだと思います。

そこで、画像処理も勉強しつつ、同時に新しいテーマに取り組もうと思っています。

それは「自然言語処理」についてです!

なぜ、自然言語処理を勉強しようと思うのか

理由は主に2つです。

  1. Webに落ちてるデータを拾って世の中の傾向を知ることができることに魅力を感じたから
  2. Twitter APIを用いてのWebアプリケーションを思いついたから

 

Web上にはたくさんの情報が言語化されて存在します。自然言語処理の勉強をすれば、これらの情報から世の中の傾向を知ることができるのではないかと思います。

また、Twitterは多くのユーザーが使用しているので貴重なビッグデータとなっています。それらの情報はTwitter APIを使えば自由に使用することができるようです(一部有料)。それを活用した面白いWebアプリケーションを思いついたので、それを作ってみたいと思っています。

とりあえず本を購入した

自然言語処理に関しては完全に無知なので、本を購入しました。

 

書店で立ち読みしたところ、自然言語処理という学問についての概要が、詳しく書かれていたので、Amazonで購入しました。

とりあえず、しばらくはこれを読みます(・∀・)

まとめ

何か進展があり次第、記事を書きます( ^∀^)

 

 - 機械学習