논문 요약: Deep Contextualized Word Representations
ICLR 2018
동일 단어 동일 벡터 OUT! deep-BiLM의 layer마다 state를 꺼내서 합치기.
논문 요약: A Discourse-Aware Attention Model for Abstractive Summarization of Long Documents
NAACL 2018
Word -> “Section” -> Document 순서로 계층에 따른 Attention Network
논문 요약: Hierarchical Attention Networks for Document Classification
NAACL 2016
Word -> Sentence -> Document 순서로 계층에 따른 Attention Network
총 48 글, 10 페이지