meowの覚え書き

meowの覚え書き

write to think, create to understand

Vision系タスク

【VSCode】Pythonコードのデバッグ中に画像の入った変数を可視化できる拡張機能を試した

はじめに 拡張機能の使用方法 各ライブラリのオブジェクトの可視化結果結果 Pillow・・・○ NumPy(, Scipy)・・・○ opencv-python・・・△ imageio・・・○ Matplotlib・・・○ PyTorch・・・○ TensorFlow・・・✕ おわりに はじめに この記事では、Visual Studio…

PyTorchのnn.ConvTranspose2dに与えるパラメータは畳み込みから逆算して考える

(畳み込みの画像はこちらのもの) この記事では、転置畳み込み層のPyTorch実装であるnn.ConvTranspose2dの出力サイズを自分が狙った通りに生成できるように、パラメータを与える知見を共有する。 画像を生成するDNNモデルにおいてアップサンプリングは不可欠…

GANベースの画像変換手法『ACL-GAN』を顔写真→アニメ顔変換タスクを中心に理解する

またSelfie2Animeデータセットを扱ったunpairedな画像変換手法が出てきたので「顔写真 → アニメ顔変換」タスクを中心に手法を理解する。おまけで、コードの簡単な実行方法も説明する。 念の為断っておくが、名にACLと冠しているが自然言語処理のトップカンフ…

【Council GAN】Im2Im論文『Breaking the cycle - Colleagues are all you need』 を 顔写真 → アニメ顔変換タスクを中心に理解する

2ドメイン間で画像の対応が不要(unpaired)な GAN ベースの画像変換(Image to Image translation; im2im)手法である Council GAN について見ていく。手法の試し方も一応載せておく。 なお、私の関心は顔写真 → アニメ顔変換タスク(selfie2anime)のみなので、…