meowの覚え書き

meowの覚え書き

write to think, create to understand

機械学習

音声認識エンジン『Julius』を使って韻を踏んだフレーズペアを探す

こちらは『創作+機械学習 Advent Calendar 2021』2枚目の2日目の記事です。 adventar.org 先に記事の要旨を説明すると、音声認識器の認識結果を敢えて複数個出力することで韻の近い単語1列(以下フレーズと呼ぶ)を検索するツールとして使えないか検証したとい…

『PyData.Tokyo Meetup #23 MLOps〜AIを社会に届ける技術』 聴講メモ

目次 1人目『CyberAgent AI Labを支えるCloud実験環境』 本題 データ選択: ailab-datasets モデリング部分でのサポート: ailab-model-zoo 実験管理部分でのサポート: ailab-mlflow おわりに 質疑 個人メモ 2人目 『サイバーエージェントにおけるMLOpsに関す…

PyTorchのnn.ConvTranspose2dに与えるパラメータは畳み込みから逆算して考える

(畳み込みの画像はこちらのもの) この記事では、転置畳み込み層のPyTorch実装であるnn.ConvTranspose2dの出力サイズを自分が狙った通りに生成できるように、パラメータを与える知見を共有する。 画像を生成するDNNモデルにおいてアップサンプリングは不可欠…

機械学習のTrainerのクラス図を写経して高解像度にした

最近、mediumでWriting a Production-Level Machine Learning Framework: Lessons Learnedという記事を読んだ。 こちらは(PyTorchを使った)機械学習を本番適用する上で心がけるべき6つのポイントを説明した記事である。 その中の1つ"1. Do not reinvent the …

GANベースの画像変換手法『ACL-GAN』を顔写真→アニメ顔変換タスクを中心に理解する

またSelfie2Animeデータセットを扱ったunpairedな画像変換手法が出てきたので「顔写真 → アニメ顔変換」タスクを中心に手法を理解する。おまけで、コードの簡単な実行方法も説明する。 念の為断っておくが、名にACLと冠しているが自然言語処理のトップカンフ…

【Council GAN】Im2Im論文『Breaking the cycle - Colleagues are all you need』 を 顔写真 → アニメ顔変換タスクを中心に理解する

2ドメイン間で画像の対応が不要(unpaired)な GAN ベースの画像変換(Image to Image translation; im2im)手法である Council GAN について見ていく。手法の試し方も一応載せておく。 なお、私の関心は顔写真 → アニメ顔変換タスク(selfie2anime)のみなので、…

"Full Stack Deep Learning - Setting up Machine Learning Projects"のメモ

資料URL https://full-stack-deep-learning.aerobaticapp.com/e372_eb327323-811b-4de9-8894-76ec4cfd6458/assets/slides/fsdl_2_projects.pdf What Does it Mean to Deploy a Machine Learning Model? (Deployment Series: Guide 01) - ML in Productionを…

MLCT#12 聴講メモ(特に質疑パート)

Machine Learning Casual Talks(MLCT)は、機械学習技術をプロダクションで動かす際のプラクティスや苦労話を議論する場です。 今回はオンライン開催だったため、動画のアーカイブが残っています↓。 発表もそうなのですが、発表者へ寄せられる質問も実務課題…