音声認識エンジン『Julius』を使って韻を踏んだフレーズペアを探す

創作ML 音声認識機械学習

こちらは『創作+機械学習 Advent Calendar 2021』2枚目の2日目の記事です。 adventar.org 先に記事の要旨を説明すると、音声認識器の認識結果を敢えて複数個出力することで韻の近い単語1列(以下フレーズと呼ぶ)を検索するツールとして使えないか検証したとい…

2021-07-08

『PyData.Tokyo Meetup #23 MLOps〜AIを社会に届ける技術』聴講メモ

MLOps 機械学習

目次 1人目『CyberAgent AI Labを支えるCloud実験環境』本題データ選択: ailab-datasets モデリング部分でのサポート: ailab-model-zoo 実験管理部分でのサポート: ailab-mlflow おわりに質疑個人メモ 2人目『サイバーエージェントにおけるMLOpsに関す…

2020-12-29

PyTorchのnn.ConvTranspose2dに与えるパラメータは畳み込みから逆算して考える

機械学習 Vision系タスク

(畳み込みの画像はこちらのもの) この記事では、転置畳み込み層のPyTorch実装であるnn.ConvTranspose2dの出力サイズを自分が狙った通りに生成できるように、パラメータを与える知見を共有する。画像を生成するDNNモデルにおいてアップサンプリングは不可欠…

2020-10-10

機械学習のTrainerのクラス図を写経して高解像度にした

機械学習

最近、mediumでWriting a Production-Level Machine Learning Framework: Lessons Learnedという記事を読んだ。こちらは(PyTorchを使った)機械学習を本番適用する上で心がけるべき6つのポイントを説明した記事である。その中の1つ"1. Do not reinvent the …

2020-10-06

GANベースの画像変換手法『ACL-GAN』を顔写真→アニメ顔変換タスクを中心に理解する

機械学習 Vision系タスク im2im

またSelfie2Animeデータセットを扱ったunpairedな画像変換手法が出てきたので「顔写真 → アニメ顔変換」タスクを中心に手法を理解する。おまけで、コードの簡単な実行方法も説明する。念の為断っておくが、名にACLと冠しているが自然言語処理のトップカンフ…

2020-07-09

【Council GAN】Im2Im論文『Breaking the cycle - Colleagues are all you need』を顔写真 → アニメ顔変換タスクを中心に理解する

機械学習 Vision系タスク im2im

2ドメイン間で画像の対応が不要(unpaired)な GAN ベースの画像変換(Image to Image translation; im2im)手法である Council GAN について見ていく。手法の試し方も一応載せておく。なお、私の関心は顔写真 → アニメ顔変換タスク(selfie2anime)のみなので、…

2020-06-21

"Full Stack Deep Learning - Setting up Machine Learning Projects"のメモ

機械学習 MLOps

資料URL https://full-stack-deep-learning.aerobaticapp.com/e372_eb327323-811b-4de9-8894-76ec4cfd6458/assets/slides/fsdl_2_projects.pdf What Does it Mean to Deploy a Machine Learning Model? (Deployment Series: Guide 01) - ML in Productionを…