No Code, No Life

データサイエンティストを目指すしがないエンジニアのブログ

Day 53 巨人の肩に座る

1. 画像認識の応用分野

  • 講義のコードを理解しながら再現する過程で、referenceを見る癖がだいぶついた。そして、英語のreferenceを読むことに抵抗感がほぼなくなった。
  • DeepLabV3によるsegmentation実装。

    • 1秒ほどの短時間で、縦横1312ピクセルほどの画像のsegmentationが完了。
    • 出力された画像は、結構粗があって画像合成できるほどの精度にはなっていないが、どうすればもっと高精度になるんだろ。
    • 試しにresizeせずにぶちこんだ。ただ、一部馬や鳥にクラス分けされるピクセルもあり、うまくいかず。= 単に画素を上げて打ち込めばいいというわけではない。
      • 馬/鳥に分類されたのは、犬の毛のところ。ここは「ピクセル」だけ与えられても、たしかに判別は難しい。
      • というか、どういうふうに推論しているんだ??
  • CNNにおける「パラメタ」数とはそもそもなんぞや。をもう一度確認。

  • 計算コスト削減の歴史

    • 面白い手法はたくさんあるが、「なぜそうしたのか?」「それで十分か?」という必要十分性が全く満たされていないようにみえるのが、ちょっと歯がゆい。
    • それこそ、Convolution層 = 特徴抽出できている、という点がまだ実感として湧いていないのかもしれない。
  • segmentation labeling tool (labelme)のインストール

    • Githubのreadmeに記載されているコードの通りにインストールしてもエラー。少し苦戦。
    • issues見ると、python=3ではなくpython=3.8でインストールすればうまくいったとの記載。(ちょうど3週間ほど前のissue)
    • うまくいかないときは素直にissueを見よう。

思ったこと

  • Inputは、outputしない分、楽で楽しい。これだけしてても仕方はないのだが。。。