GPT-1: Improving Language Understanding by Generative Pre-Training
AbstractNatural language์๋ unlabeled text์ ๋ฐ์ดํฐ ์๊ฐ labeled text์ ๋ฐ์ดํฐ ์๋ณด๋ค ํจ์ฌ ๋ง๋ค. ํด๋น ์ฌ์ค์ ๊ทผ๊ฑฐํ์ฌ OpenAI์์๋ ๋ค์ํ unlabeled text๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ generative ํ๊ฒ pre-train ์ํจ GPT ๋ชจ๋ธ์ ์ ์ํ๋ค. ํด๋น ๋ชจ๋ธ์ ์ด์ ๋ชจ๋ธ๋ค๋ณด๋ค ํจ์ฌ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ฆ๋ช ํ๋ค.Introductionunlabeled data๋ก๋ถํฐ word-level ์ด์์ ์ ๋ณด๋ฅผ ๋์ด๋ด๋ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ ๋ ๊ฐ์ง์ ์ด์ ๋ก ์ด๋ ต๋ค:transfer์ ์ ์ฉํ text ํํ์ ๋ฐฐ์ฐ๋ ๊ฒ์ ์ด๋คํ ํํ์ ์ต์ ํ ๋ชฉ์ (optimation objectives)๊ฐ ์ข์์ง ๋ชจ๋ฅธ๋ค.ํ์ต๋ ํํ์ target task์ ์ ๋ฌํ ๊ฐ์ฅ ์ข์..