๐ ์คํฐ๋/CS224N
CS224N 2๋ฒ์งธ ๊ฐ์๋ฅผ ์๊ฐํ๊ณ ์ ๋ฆฌ ๋ฐ ์ง์ ๊ณต์ ๋ฅผ ์ํด ๋ธ๋ก๊ทธ๋ฅผ ์ด๋ค. ์ฐธ๊ณ ๋ก ๋ณธ์ธ์ 2021 Winter ๋ฒ์ ์ ์๊ฐํ๋ค. Review: Main idea of Word2Vec & Negative Sampling ์ง๋๋ฒ ๋ธ๋ก๊ทธ์์ Word2Vec์ ๊ดํด ์ ๋ฆฌํ๋ค. ๊ฐ๋จํ๊ฒ ๋ณต๊ธฐํด ๋ณด์. ์ฐ์ Word2Vec์๋ CBOW, Skip-gram์ด๋ผ๋ ๋ ๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ์ด ์ฐ์ธ๋ค. 1. CBOW ๋งฅ๋ฝ ๋ฒกํฐ๊ฐ ์
๋ ฅ, ์ค์ฌ ๋ฒกํฐ๊ฐ ์ถ๋ ฅ์ธ ๊ฒฝ์ฐ๋ฅผ CBOW ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ํ๋ค. CBOW์ ์ ์ฒด์ ์ธ ๊ตฌ์กฐ๋ ๋ค์๊ณผ ๊ฐ๋ค: ๊ณผ์ ์ ์์ฝํ์๋ฉด, 1. ์ง์ ํ ์๋์ฐ ํฌ๊ธฐ์ 2๋ฐฐ ํฌ๊ธฐ์ ๋ฒกํฐ๊ฐ one-hot encoding์ผ๋ก ํํ๋์ด input์ผ๋ก ๋ค์ด๊ฐ๋ค. 2. ๊ฐ๊ฐ์ input๋ง๋ค ์ฒซ ๋ฒ์งธ ๊ฐ์ค์น W์ ๊ณฑํด์ง๊ณ , ๊ทธ..
๐ ์คํฐ๋/NLP
์ง๋ CS224N ๊ฐ์๋ฅผ ์๊ฐํ๊ณ , Word2Vec์ ๊ดํด ์กฐ๊ธ ๋ ๊ฐ๋
์ ํ๋ฆฝํ๊ณ ์ ๊ณต๋ถํ๊ฒ ๋์๋ค. ์ด๋ฒ ๋ธ๋ก๊ทธ๋ ์ํค๋
์ค ๋ฅผ ์ฐธ๊ณ ํ์ฌ ๋ง๋ค์๋ค. Word2Vec word2vec์ word vector๋ค์ ํ์ต์ ์ํด ๋ง๋ค์ด์ง ํ๋ ์์ํฌ์ด๋ค. ํด๋น ํ๋ ์์ํฌ์ ํต์ฌ์ text๋ฅผ ์ปดํจํฐ๊ฐ ์ธ์ํ ์ ์๋๋ก ์ซ์ ํํ์ vector ๋๋ ํ๋ ฌ๋ก ๋ณํํ๋ ๊ฒ์ด๋ค. ์ด๋ ๋๋ถ๋ถ ๋ํ์ ์ผ๋ก ๋ค์ ๋ ๊ฐ์ง ๊ณผ์ ์ผ๋ก ์ด๋ฃจ์ด์ง๋ค: One Hot Encoding (Sparse representation) Word Embedding (Dense representation) One Hot Encoding์ ๋จ์ด ๋ฒกํฐ๊ฐ 0 ๋๋ 1์ ๊ฐ์ผ๋ก ๊ตฌ์ฑ๋์ด ๊ณผ์ ์ด ๋จ์ํ๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ํฐ ์ฐจ์์ด ํ์ํ๋ค๋ ์ ๊ณผ, ๋จ์ด ๊ด๊ณ..
๐ ์คํฐ๋/CS224N
์ด๋ฒ ๋ฐฉํ ๋ NLP ๊ด๋ จ ๊ฐ๋
์ ํ์คํ๊ฒ ์ก๊ณ ์ CS224N ๊ฐ์๋ฅผ ์๊ฐํด์ผ๊ฒ ๋ค๊ณ ์๊ฐํ๋ค. CS~N ๊ฐ์๋ ์คํ ํฌ๋์์ ๊ฐ๋ฅด์น๋ CS ๊ฐ์ ์ข
๋ฅ์ธ ๊ฒ ๊ฐ์๋ฐ, ๋ํ์ ์ผ๋ก๋ ๋จธ์ /๋ฅ๋ฌ๋ ๊ธฐ์ด ๊ฐ์์ธ CS231N์ด ์๊ณ , ๋๋ ๋ฃ๋ค๊ฐ ๋ง์์๋ค..(๋๋ฌด ๊ธธ์ด) ์ด ๊ฐ์๋ 2๋
์ ํ๋ฒ์ฉ ์
๋ฐ์ดํธ๋๋ ๊ฒ ๊ฐ์๋ฐ, ๋๋ 2021 Winter ๊ฐ์๋ฅผ ์๊ฐํ๋ค. [์ ํ๋ธ ํ๋ ์ด๋ฆฌ์คํธ] ์ฒซ ๊ฐ์์ ์ฃผ์ ๋ ์ฌ๋์ ์ธ์ด์ ๋จ์ด ์๋ฏธ์ ๊ดํ ๋ด์ฉ์ด๋ค. ํํ, ์ฐ๋ฆฌ๊ฐ ์ฌ์ฉํ๋ ๋จ์ด๋ค์ ์ปดํจํฐ๊ฐ ์ง๊ด์ ์ผ๋ก ์์๋ฃ๊ธฐ๋ ์ด๋ ต๋ค. ์ด๋ฅผ ์ํด ๋จ์ด๋ค์ ์ซ์๋ก ์ด๋ฃจ์ด์ง ๋ฒกํฐ๋ค๋ก ๋ณํ์์ผ์ฃผ์ด์ผ ํ๋ค. How to represent the meaning of the word? ๊ทธ๋ ๋ค๋ฉด ๋จ์ด์ ์๋ฏธ๋ฅผ ์ด๋ป๊ฒ ๋ํ๋ผ ์ ์์๊น? 1. Wor..
๐ ์คํฐ๋/NLP
์์ฆ NLP์ ์ ๋ฐ์ ์ธ ๋ฅ๋ฌ๋์ ๋ํ ๊ณต๋ถ๋ฅผ ํ๋ ์ค์ด๋ค. Transformer ๋ชจ๋ธ์ด ๋๋ฌด ์ ๋ช
ํด์, ์ด์ฉ๋ค ๋ณด๋ Transformer์ attention ๋ฉ์ปค๋์ฆ์ด ์ฌ์ฉ๋ ๋ชจ๋ธ๋ค๋ถํฐ ๊ณต๋ถํ๊ฒ ๋๋๋ฐ, ๋
ผ๋ฌธ์์ ์ด์ ๋ชจ๋ธ๋ค์ ๋ํ ์ง์์ด ๋ง์ด ์ฐ์ด๋ ๊ฒ์ ๋ณด๊ณ ์์ ์ค๋์ ๋ชจ๋ธ๋ถํฐ ๊ณต๋ถํด๋ณด๊ณ ์ ํ๋ค. (์ฌ์ค hidden state๊ณผ back propagation ๋ฑ์ ๊ดํ ์ ํํ ์ง์์ด ์์ด์, ์ด ๋ถ๋ถ์ ๋ํ ๊ฐ๋
์ ์ก๊ณ ๊ฐ์ผ๊ฒ ๋ค๊ณ ์๊ฐํ๋ค.) ๊ทธ๋ฆฌํ์ฌ ์ด๋ฒ์๋ RNN์ ๊ฐ๋
์ ์ง์คํด์ ๋ค๋ค๋ณด๊ณ ์ ํ๋ค. ์ฌ์ค LSTM ๋
ผ๋ฌธ์ ๋ดค๋๋ฐ ์ ๋ง ๋ง๋ ์๋๋ ์์๋ค์ด ๋ง์๊ณ , ์ดํดํ๊ธฐ๊ฐ ๋์ด๋ฌด ์ด๋ ค์์ ๊ณต๋ถํด์ผ ๊ฒ ๋ค๊ณ ์๊ฐํ๋ค... ์ฐธ๊ณ : [๋ฐ๋๋์ด/๋ฅ๋ฌ๋] RNN(Recurrent Neural Networ..