Abstract
dialogue agents์ ๋ํ ์ฐ๊ตฌ๊ฐ ์ด์ด์ง๋ ๊ฐ์ด๋ฐ, ์์ ์ฐ๊ตฌ๋ค์ ํ๋ฅด์๋ (persona)์ ์ง์ (knowledge)์ ๋ด์ฅ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ฐ์ ธ์ ๋ต๋ณํ๋ค. ๊ทธ๋ฌ๋ ์ค์ ์ธ๊ณ์์ ์ฌ๋๋ค์ด ๋ํํ ๋, ์ฌ๋๋ค์ ์ค๋น๋ ํ๋ณด ๋ฌธ์ฅ๋ค์ ๊ฐ์ง๊ณ ๋ต๋ณํ๊ธฐ๋ณด๋ค๋, ๋ํ์ ๋ง๋ ์๋ฏธ์ concept์ ๋ง์์ ๊ฐ์ง๊ณ ๋ํํ๋ค. ์ด๋ฐ ๋ํ ์์์ ์ฐฉ์ํ์ฌ, ๋ณธ ๋ ผ๋ฌธ์์๋ ๋ฌธ์ฅ ํ๋ณด๋ค์ด ์ฃผ์ด์ง์ง ์์ ์ํฉ์์์ ์ ์์ ๋ํ ์์คํ ์ ์ ์ํ๋ค.
๋ ผ๋ฌธ์์ ์ ์ํ ๋ชจ๋ธ์ ๋จํธ์ ์ธ ์ ๋ณด๋ง์ ๊ฐ์ง๊ณ ์ผ๊ด์ ์ด๊ณ ๊ด๋ จ ์๋ persona ์ค๋ช ์ ์์ฑํ๋ฉฐ, ๋ ผ๋ฆฌ์ ์ธ ๋ต๋ณ์ ์ํด ๊ด๋ จ๋ ์ง์์ ํ์ธํ๋ค.
Introduction
์ผ๋ฐ์ ์ธ ๋ํ์์๋ ๋ํ ์ฃผ์ ์ ๋ํ์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ํ์ ์๋ฏธ๋ก ์ ๊ฐ๋ ์ ๋ง์์ ํ๊ณ ๋ํํ๋ค. ์ฌ๋๋ค์ ๋ ผ๋ฆฌ์ ์ด๊ณ ๊ณต๊ฐ์ ์ธ ๋ต๋ณ์ ์ ๋ฌํ๊ธฐ ์ํด ๋ํ์ ๋ฑ์ฅํ๋ concept๋ฅผ ์ข ํฉํ์ฌ ๋ฐ์๋ค์ด๋ ๊ฒ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ๊ณผ์ ์ pre-defined ์์์ ์์กดํ๋ ๊ฒ์ด ์๋, ์ง์๊ณผ ํ๋ฅด์๋ ๊ฐ์ ์ถ๊ฐ์ ์ ๋ณด๋ค์ ์ ์์ ์ผ๋ก ์ป๊ณ ์ฌํธ์ฑํจ์ผ๋ก์จ ๋ํ๋ฅผ ํ๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆฌํ์ฌ, ๋ํ์ ์์ด์ persona์ knowledge๋ฅผ ์ฐธ์กฐํ๋ ๋ฐฉ์์ ๋ํ ์ฐ๊ตฌ๊ฐ ์งํ๋์ด ์๋๋ฐ, ์ด์ ์ฐ๊ตฌ๋ค์ ๋ชจ๋ ์ฌ์ ์ ์๋ ํ๋ณด๋ค์ด ์์๋ค. ์ด๋ฌํ ์ฐ๊ตฌ๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์ด๋ ๊ฒ, Persona candidate๊ณผ Knowledge candidate์ด ์ฌ์ ์ ์๋ผ ์๋ค.
๋ณดํต ๋ํ์์๋ ์์ ๋ฌ๋ฆฌ persona์ knowledge๊ฐ ์ฃผ์ด์ง์ง ์์ผ๋ฏ๋ก, ํ๋ณด์ ๋ํ ์์กด์ ์์ ์ผ ํ๊ณ , ๋ค์๊ณผ ๊ฐ์ ์ํฉ์ด ๋ง๋ค์ด์ ธ์ผ ํ๋ค.
์ด๋ฐ Candidate-Agnostic ์ํฉ์์ dialogue system์ ๋ง๋ค๊ธฐ ์ํด, ๋ค์ ์ฌํญ๋ค์ด ๊ณ ๋ ค๋์๋ค.
1. Knowledge๊ฐ ์๋ ๊ฒฝ์ฐ, ํ๋ผ๋ฏธํฐ๊ฐ ์๋ ๊ธฐ์ต ์ค์ ์ retrieval์ ํตํด candidate-agnostic ์ํฉ ๊ทน๋ณต
2. Persona๊ฐ ์๋ ๊ฒฝ์ฐ, ๋ช ๊ฐ์ persona concept์์ persona sentences๋ฅผ ํ์ฅํ๋ ๋ฐฉ๋ฒ์ ํตํด out-of-persona ์ํฉ์ ๋๋น
๊ทธ๋ฌ๋ Persona์ Knowledge ํ๋ณด๋ค์ด ๋ชจ๋ ์๋ ์ํฉ์ ์์๋ค.
๊ทธ๋์ ๋ณธ ๋ ผ๋ฌธ์์๋ ๋ ํ๋ณด๋ค์ด ๋ชจ๋ ์๋ ์ํฉ์์ dialogue system์ ๊ตฌ์ถํ๊ณ ์ ํ๋ค. ์ด๋ 1. knowledge-retriever, 2. concept-based persona generator, 3. dialogue-persona generator, 4. response generator์ 4๊ฐ์ง ๊ตฌ์ฑ ์์๋ก ์ด๋ฃจ์ด์ง๋๋ฐ, ๊ฐ๊ฐ์ ๊ตฌ์ฑ ์์๋ฅผ ํ์ฉํ ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
- Knowledge concept์ด ์ฃผ์ด์ง (Query ๋ฑ์ผ๋ก๋ถํฐ)
- knowledge base๋ก๋ถํฐ ๋น์ทํ knowledge๋ฅผ ์ฐพ์
- Concept-based persona generator๊ฐ ๋จํธ์ ์ธ persona concept์ ๊ฐ์ง๊ณ ๋ฌธ์ฅ์ ์์ฑ์ํด
- ์์ฑ๋ persona ์ค๋ช ์ด consistency, relevency๋ฅผ ๊ณ ๋ คํ persona aligner๋ฅผ ํตํด ์ ์ฆ๋จ
- ์ ์ฆ๋ persona ์ค๋ช ์ด ๋ต๋ณ ์์ฑ๊ธฐ์ input์ผ๋ก ์ฃผ์ด์ง
Method
4๊ฐ์ง ๊ตฌ์ฑ์์๋ฅผ ํ์ฉํ์ฌ Adaptive dialogue system์ ๊ตฌ์ถํ ๋ฐฉ๋ฒ์ ๋ํด ํ๋์ฉ ์์๋ณด์.
๋จผ์ dialogue D = {(u1hm, u1mc), ..., (unhm, unmc)}๋ผ๊ณ ํ์. n์ ๋ํ round์ ๊ฐ์์ด๊ณ , hm์ human, mc๋ machine์ ์ฝ์์ด๋ค. Dialogue history H = {(u(n-w)hm, u(n-w)mc),..., (u(n-1)hm, u(n-1)mc), (unhm)} ์ธ๋ฐ, ์ฌ๊ธฐ์ w๋ window size์ด๋ค.
์ฃผ์ด์ง persona sentences P = {p1, p2, ..., p|P|}์ด๊ณ , CP = {c1p, c2p, ..., c|P|p}๋ persona concept๋ฅผ ๋ํ๋ธ๋ค.
1. Knowledge Retriever
๋ชจ๋ธ์๊ฒ Knowledge Candidate๊ฐ ์๋ ์ํฉ์ ์ ์์ํค๊ธฐ ์ํด non-parametric memory-based retrieval์ ์ฌ์ฉํ๋ค. ์ด๋ query encoder์ dense vector matrix๋ฅผ ์๋ ๊ฒ์ธ๋ฐ, ์ด๋ค์ ํฅ์๋ semantic search๋ฅผ ์ํ pre-trained dense passage retriever (DPR)๋ก๋ถํฐ ์ป์ด์ก๋ค๊ณ ํ๋ค. (์ฐธ๊ณ ๋ก ์ฐพ์๋ณด๋ DPR์ Open-domain QA์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ธ ๋ชจ๋ธ์ด๋ค.)
๋ณธ ๋ชจ๋ธ์ FAISS ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก knowledge concept C^K์ ๋ํด MIPS๋ฅผ ์ด์ฉํด์ ์ ์ฌํ knowledge๋ฅผ retrieve ํด์จ๋ค. ์ด๋ ๊ฒ retrieve๋ knowledge ์ค top-K relevant paragraph๋ค์ด input์ผ๋ก ์ฌ์ฉ๋๋ฉฐ, K^์ด๋ผ๊ณ ๋ถ๋ฆฐ๋ค.
์ ์์์์ e๋ context encoder๋ก๋ถํฐ์ embedding, q๋ query encoder๋ก๋ถํฐ์ representation์ด๊ณ , ๋ ๋ค BERT๋ก implement ๋์๋ค.
2. Concept-based Persona Generator
๋ณธ ๋ ผ๋ฌธ์์๋ Candidate-free ์ํฉ์์์ ์๋ฏธ์ concept์ ์ฌ์ฉํ๋๋ก ํ๊ธฐ ์ํด, concept-based persona generator๋ฅผ ์ฌ์ฉํ์ฌ persona๋ฅผ ์์ฑํ๋ค. ์ด๋ persona concept๋ง์ ๊ฐ์ง๊ณ ์์ ํ persona description์ ์ ๊ณตํ๊ฒ ํ๊ธฐ ์ํ ๊ฒ์ธ๋ฐ, ์ด persona generator๋ retrieve-and-generate manner๋ก ๊ฐ์ ธ์จ persona concept๋ง์ ๊ฐ์ง๊ณ ํ๋นํ full persona description์ ์์ฑํ๋๋ก pre-trained ๋์๋ค.
Pre-training ๊ณผ์ ์ ์ํด์๋
1. ๋จผ์ FoCus์ Persona ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ persona pool์ ๋ง๋ค๊ณ
2. DPR๋ฅผ ์ฌ์ฉํด์ persona retriever๋ฅผ pre-train ํ๋ค.
3. ์ดํ, BM25๋ก ๋๊ฒ rank๋ persona ๋ฌธ์ฅ์ negative sample๋ก,
4. BART๋ก ํ๋ ค๋ generator๋ฅผ ์ด์ฉํ์ฌ ์ป์ด์ง top k relevant persona ๋ฌธ์ฅ์ positive sample๋ก ์ค์ ํ๋ค.
์ ๊ณผ์ ์ ๊ฑฐ์ณ Concept-based persona generator๋ ์์ ํ persona sentences G^P๋ฅผ ๋ง๋ ๋ค.
3. Persona Aligner
Persona Aligner๋ PC์ PR์ ๋ ๊ฐ์ง ๋ชจ๋๋ก ๊ตฌ์ฑ๋๋ค.
Persona Consistency (PC)
generated persona sentence๊ฐ ์ป์ด์ง๋ฉด, PC๋ ์ด์ ์ ๋ํ ํ์คํ ๋ฆฌ H๋ฅผ ๋ถ์ ํ๋์ง๋ฅผ ๊ฒ์ฌํ๋ค. ๊ทธ๋ฌ๋ ์์ฑ๋ persona์ consistency์ ๋ชจ๋ lavel์ ์ป๋ ๊ฒ์ ๋๋ฌด ๋นํจ์จ์ ์ด๊ธฐ ๋๋ฌธ์, ChatGPT์๊ฒ consistency ํ์ธ์ ๋งก๊ธด๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ChatGPT์๊ฒ ์์ฑ๋ persona๊ฐ ์ด์ ์ ๋ํ๋ฅผ ๋ถ์ ํ๋์ง ์ ํ๋์ง ๊ฒ์ฌํ๊ฒ ํ๋ค. ์ดํ, PC๋ ํด๋น label๋ก ํ์ต๋๋ค. ์ด PC ๋ชจ๋์ frozen ๋๋ฉฐ, ์ถ๋ก ๋จ๊ณ์์ ๋ฌธ์ฅ์ด dialogue history์ ์ผ๊ด๋๋์ง ์์ธกํ๋ค.
Persona Relevancy (PR)
PC์ ๋ค๋ฅด๊ฒ PR์ ๋ํ์ ์ฐ๊ด๋ ์ ์ ํ persona ๋ฌธ์ฅ์ ๊ณ ๋ฅด๋ ์ญํ ์ ํ๋ค. PC๋ฅผ ํตํด dialogue history์ ๋ฐํ๋ persona์ธ์ง์ ๊ดํด ๊ฒ์ฌ๋ฅผ ํ์ด๋, ์ฐ๊ด์ด ๋ฎ์ ์ ์๋ค๋ ๊ฒ์์ ๋์ ๋ ๋ชจ๋์ด๋ค. ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค
- ๋จผ์ DPR๋ก dialogue์ ์์ฑ๋ persona๋ฅผ ๊ฐ๊ฐ encodingํ๊ณ hidden state๋ฅผ ์ป๋๋ค.
- concatenate ํด์ 2๊ฐ์ linear layer์ ๋ฃ์ด ์ฐ๊ด์ฑ์ ๊ณ์ฐํ๋๋ก ํ๋ค.
๋ ๊ฐ์ ๋ชจ๋์ ํตํด ์์ธก๋ persona๊ฐ ์ต์ข persona๋ก ๊ฐ์ฃผ๋๋ค.
Loss๋ ๋ค์๊ณผ ๊ฐ๋ค.
4. Response Generator
์์ธก๋ relevant knowledge passages์ persona description์ผ๋ก, ์ด๋ค์ concatenate ํ์ฌ ํ๋์ sequence๋ก ๋ง๋ค์ด I๋ผ๊ณ ์นญํ๋ค.
์ต์ข loss๋ L_P์ L_LM์ ๊ฒฐํฉํ ๊ฒ์ด ๋๋ค.
Evaluation
Metric์ผ๋ก๋ FoCus dataset์ ํฌํจ๋๋ ๋ค์ metric ๋ค์ ์ฌ์ฉํ๋ค.
- BLEU
- chrF++
- ROUGE-1
- ROUGE-2
- ROUGE-L
์ด metric๋ค์ ํ์ฉํ ๊ฒฐ๊ณผ๋ ๋ค์๊ณผ ๊ฐ๋ค.
ํ๋ณด๊ฐ ์๋ ์ํฉ ์ค์์ ๋ณธ ์ฐ๊ตฌ์ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข๊ณ , ๊ทธ์ค RAG๋ฅผ ์ฌ์ฉํ์ ๋๋ณด๋ค BERT-large๋ฅผ ์ฌ์ฉํ์ ๋๊ฐ ๋ ์ฑ๋ฅ์ด ์ข์์ ์ ์ ์์๋ค.
๋ณธ ๋ ผ๋ฌธ์์๋ human evaluation๋ ์งํํ๋๋ฐ, ๋ค์ ํญ๋ชฉ๋ค์ ํ๊ฐํ์ฌ 1~3์ ์ฌ์ด์ ์ ์๋ฅผ ๋งค๊ธธ ์ ์๋๋ก ํ์๋ค.
- Informativeness
- Knowledge hallucination
- Persona hallucination
- Persona relevancy
- Persona consistency
- Fluency
๋ค๋ฅธ Ablation Study๋ ๋ ผ๋ฌธ์ ์ฐธ๊ณ ํ๊ณ , ์ค์ ๋ก ์์ฑ๋ ๋ต๋ณ์ ๋ณด๋ฉด, ๋ค์๊ณผ ๊ฐ๋ค.
์ด๋ฅผ ์ ์ฌํ ์ดํด๋ณด๋ฉด, vanilla BART์ RAG ๋ชจ๋ธ์ ์์ response๋ฅผ ๋ณด์ฌ์ฃผ๋ ๋ฐ๋ฉด, ๋ณธ ๋ ผ๋ฌธ์์ ๊ฐ๋ฐํ ๋ชจ๋ธ์ knowledge concpet์ ์ด์ฉํ์ฌ ์ข ๋ ๊น์ response๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ ์ ์ ์๋ค. (๋ต๋ณ ์ค ์์น ๋ ๋ถ๋ถ)
์ด๋ ๊ฒ, ๋ณธ ๋ ผ๋ฌธ์์ ๊ฐ๋ฐํ ๋ชจ๋ธ์ด knowledge concept์ ๊ฒฐํฉํ external information๋ฅผ ์ด์ฉํ์ฌ ์ ํํ๊ณ ๊ณต๊ฐ์ ์ธ ๋ต๋ณ์ ์ด๋๋ฉฐ, ์๊ณก ๋ํ ์์์ ์ ์ ์๋ค.
'๐ ๋ ผ๋ฌธ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
IDAS: Intent Discovery with Abstractive Summarization (2) | 2023.10.10 |
---|---|
New Intent Discovery with Pre-training and Contrastive Learning (0) | 2023.09.30 |
Two Birds One Stone: Dynamic Ensemble for OOD Intent Classification (0) | 2023.08.28 |
Discovering New Intents with Deep Aligned Clustering (0) | 2023.08.16 |
A Probabilistic Framework for Discovering New Intents (0) | 2023.07.27 |