英語のオンラインクラスで学ぶコンピュータビジョン

こんにちは,Computer Vision Advent Calendar 2012の12/15の記事を担当する@progranateです。ネタや実装系*1ではなく,コンピュータビジョンに関する英語のオンラインクラスの紹介をします。

なお,この記事で対象とするのは,コンピュータビジョン(CV)に関する基礎的な知識を身につけたいけど何から手をつければ良いのかわからない,あとついでにと言っちゃなんだが英語の勉強もしたい!という方々です。なので,自分で勉強できるし,英語もある程度使えるよ!という方はどんどん文献を読んで研究を進めるなり,お仕事で使うなり,趣味で没頭するなりしてこの記事は聞き流して頂ければと思います。

そもそもオンラインクラスって?

この記事で扱うオンラインクラスとは,インターネットを利用して学習コンテンツを提供する授業のことを指します。
かつてのオンラインクラスはMIT OPEN COURSEWAREYoutube EDUなどのように,毎週または講義期間毎ににアップロードされる動画,スライド,時にはスキャンされた手書きのノート等を参照して自習する形でした。
しかし,現在はCourseraedX,Udacityのような,動画やスライドはさることながら,

  • 小テストやコーディング,はたまた小論文などの課題が課せられ,点数が付けられる(授業期間中は締切有)
  • 掲示板を通じて,講義や課題で分からない部分の議論を他の受講者と行える
  • 無事,授業期間中に修了した場合には修了証がもらえる

などなど,学習を促すコンテンツを持つサービスが登場しています。もはや大学で講義を受けているのと同じ感覚ですね!また,ここで挙げているサービスでは世界有名大学*2の講師陣によるクラスが扱われており,レベルもある程度高いものです。もちろん,講義は全て英語で行われるので,英語も身につけられますよ*3。まさに一石二鳥ですね!

現在提供されているコンピュータビジョン関連のオンラインクラス

ここでは,Couseraにて提供されているコンピュータビジョンに関連すると思われるクラスをいくつか紹介します。*4

すでに開講されたもの

ここで紹介するのは私が実際に受講したものになります。

  1. Computer Vision: The Fundamental
    • 講師: Jitendra Malik (UC Berkeley)
      • CVPRでのLonguet-Higgins Prize*5を2回も受賞している研究者で,この方の研究室からはnormalized cutやshape context,anisotropic diffusionなど現在は当たり前に使われるアルゴリズムが提案されています。google scholarによるとcitationは1000を超えるとか…
    • 講義レベル: 大学学部生くらい
    • その他コメント
      • 内容としては3次元のシーンがカメラを通じてどのように撮像されるかの話に始まり,カメラ・シーンの座標系の話,ステレオ視,画像処理,物体認識など,大学の講義でCV扱うならこうなるよねーという流れになっています。CVの勉強をすでにしている方は知っている話が大半ですが,ざっと復習するには良いコンテンツなのでは。あと,今はもう無いようですが,4月から講義が始まったのに,途中から2ヶ月近く更新がなされなかった挙げ句「実際の業務が忙しくて更新できなかった。この講義ボランティアでやってるし,オンラインクラスって難しいよね。」という趣旨の謝罪文が掲載されるというエピソードがありました。大学の先生は忙しいですよね…
  2. Machine Learning
    • 講師: Andrew Ng (Stanford University)
      • CourseraのCo-CEOかつCo-founderの一人。2008年にStanford大学初となるFree online classを始めた方で,教育に力を注いでいるのがよくわかります。もちろん機械学習の研究分野においても数々の成果を残しており,最近話題のDeep Learningについても研究されています。記憶に新しいのはGoogleの猫認識の話ですね。
    • 講義レベル: 大学学部生くらい
    • その他コメント
      • 線形回帰,ロジスティック回帰,ニューラルネットワーク(今みたいに深い階層ではなく,せいぜい3階層)など,機械学習の基本中の基本が学べます。アルゴリズムだけではなく,パラメータをチューニングするための指針とか,学習させる特徴ベクトルをどのように構成すれば良いのかの指針も講義で触れてくれます。こちらは,毎週小テストに加えてプログラミング課題がありました。使う言語(?)はOctaveまたはMatlabという親切設計です。(Cとかで書けと言われてたらどうなってただろうか…) 機械学習に関して右も左もわからない状態の人に特にお勧めします。
  3. Probabilistic Graphical Models
    • 講師: Daphne Koller (Stanford University)
      • グラフモデルの勉強したいなーとつぶやくと大体おすすめされるProbabilistic Graphical Modelsの著者の一人。 有名な国際会議でkeynote talkをすること10回以上という恐ろしい世界にいる方です。
    • 講義レベル: 大学院生くらい
    • その他コメント
      • 前提知識無しで受講するのはなかなか無謀です。著書を読むのと並行して講義を受けないと,右も左もわからない人は置いていかれます*6。それくらいのパワーを要する内容。でも,身につくものは多いはず。こちらも毎週の小テストに加えてプログラミング課題があります。言語はOctaveまたはMatlab。あとSAMIAMというグラフをeditするソフトウェアも使います。毎週これに力を注ぐのは難しいので,サインインだけしておいて,自分の学習ペースに合わせてコンテンツを活用すれば良いのでは。
今後開講するもの

今後は以下の講義が開講される予定になっています。それぞれ著名な方が講師陣として君臨しています。詳細は各タイトルからのリンク先を参照ください。 他にも純粋な数学の統計の話とか,アルゴリズムの話とか様々な講義があるので気になる方はチェックしてみてはいかがでしょうか。

  1. Image and video processing: From Mars to Hollywood with a stop at the hospital
    • 講師: Guillermo Sapiro (Duke University)
  2. Computer Vision: From 3D Reconstruction to Visual Recognition
    • 講師その1: Silvio Savarese (University of Michigan)
    • 講師その2: Fei-Fei Li (Stanford University)
  3. Computational Photography
    • 講師: Irfan Essa (Georgia Institute of Technology)
  4. Machine Learning
    • 講師: Pedro Domingos (University of Wasington)

最後に

今回はコンピュータビジョンの勉強x英語の勉強と思いまして,オンラインクラスの紹介をしました。英語を聞くのに慣れてきたら,次はCVPR/ICCV/ECCVのオーラルセッションのビデオだったり,TEDのプレゼンなどなど,自らいろんなネタにアクセスして,どんどん高みを目指していけたら良いなーと思う次第です。ではでは,ここまで読んで頂きありがとうございました。

*1:一応,イケメン識別器とか,インスタントなアハ体験などを考えていました。実装はいつになることやら…

*2:スタンフォード大学トロント大学,カリフォルニア工科大,MITとか…

*3:大体のクラスで英語のスクリプトを表示する機能があるので,聞き取れないのでは…と心配する必要はありません

*4:edX, Udacityにおいては今のところコンピュータ・グラフィックスのクラスしか開講されていません…

*5:2005年から始まった,開催年毎に10年前に発表された文献から,現在の研究分野に貢献してきたものを称える賞のこと

*6:本来はそれが大学における講義というものなんでしょうけど