2023-02-02から1日間の記事一覧

深層学習_自然言語処理

Word2vec(2013年) 次元の呪いを回避する目的や単語ベクトルの空間に意味を与えるため、単語を分散表現に変換する方法の1つとして、Word2vecである。 埋め込み行列を獲得するため方法として、CBOW(Continuous Bag-of-words)とSkip-gramが用意される. ・CBOW…

深層学習_生成モデル

識別モデルと生成モデル オートエンコーダ VAE(2013年) Variational AutoEncoder 変分自己符号化器:生成モデルの一つ p(z):平均ゼロベクトル、分散共分散行列が単位行列であるような多変量標準正規分布の対角成分を出力するNN[VAEの変分下界] 対数尤度logp…

強化学習

動的計画法(DP法) 1. 方策勾配法 2. 価値反復法 報酬のサンプリング 1. TD法 Sarsa Q学習 A3C 2. モンテカルロ法(MC法) 強化学習アルゴリズム Q学習 DQN Deep Q-Networks(2013年) ①体験再生 ②目標Q-networksの固定 更新式 特徴 SARSA サルサ 更新式 特徴 マ…