No Code, No Life

データサイエンティストを目指すしがないエンジニアのブログ

Day 54 class、やはり分かってなかった

1. 画像処理 Segmentation

  • dataset作成等にクラスが多用されるが、まだclassについて曖昧な点があるなあ

    • __XX__っていう関数はデフォルトで実行されるの?とか。
    • 調べた所、特殊メソッドといって、クラスに特定の文字列の関数を定義してあげると、特定の動作を行えるらしい。
  • segmentationでcudaに関するruntime error発生

    • 調べた所、data loaderで一度numpyに変換したりしているのがおかしかった模様。データの型とか調べた後は、きちんと整理して再度実行するのがいい。
    • 色々とGPUを回した結果、すぐにcolabの制限にひっかかった。-> KaggleのGPUへシフト。kaggleのkernelも使えるあたり、便利。
  • 論文通りの構造の実装
    • 講義資料内でのDecoder classが非常にややこしい書き方をしていたので、論文通りの動きとなるよう、自分なりに修正。

2. 自然言語処理 前処理編

. 全体感

  • 講義の内容をざーっと改めて確認。
  • 自然言語処理では、文章生成およびTransformer、BERTまで取り扱ってくれている…!大変ありがたい。
  • 探索的データ解析 (EDA)についても講義があった!自分が探していたのはまさにこれだ…!ありがたい。
  • WEB開発のあたりでは、Nuxt.jsにまで言及があった。ただ、あくまで機械学習をメインとしたWEBページを作るのであれば、pythonをベースとしたフレームワークを使うのがベストなのだろう。あくまで、フロントエンドのjsを書くためのUIフレームワークとして、vue.jsと、認証関係のfirebase authを触っておく、くらいがベストか。
  • とにかく、フロントエンドは優先度下げて (いつでも取得できるため)、今は統計処理/画像解析/自然言語処理の基礎を叩き込もう。

思ったこと

  • 迷う時間があるなら、動いたほうがいい。
  • 「この人になら、仕事を任せたい」と思われる人材にならないと。

次やること

  • 講義資料の構造との比較