2022. 8. 20. 18:24ㆍ디지털 인문학이란
1. Link
https://academic.oup.com/dsh/article-abstract/36/3/698/6098012?redirectedFrom=fulltext
Knowledge graph-based metaphor representation for literature understanding
Abstract. Metaphor understanding is one of the most important and challenging tasks in language processing. In this study, we propose a knowledge graph-based me
academic.oup.com
2. Introduction
은유적 단어(예: 은유적 명사 쌍) 간의 은유적 관계를 확립하는 연구는 없기에 지식그래프 기반 은유 임베딩을 제안
은유 임베딩에 대한 두 가지 프로세스
- part of speech (POS) tagging based metaphorical relations extraction
- metaphors representation based on knowledge graph.
은유적 의미 해석의 목적은 두 개념의 유사성을 추출하는 것이고 이 두 명사의 유사한 개념이 몇 가지 일반적인 형용사에 의해 표현될 수 있음 ⇒ 하나의 은유적 명사 쌍의 은유적 관계는 공통 형용사의 집합으로 구성될 수 있다.
Metaphorical Triples
ex.'시간은 돈이다'에서 추출한 은유명사 쌍(시간, 돈)에서 머리명사(h)는 '시간'이고, 꼬리명사(t)는 '돈'이다. 은유 관계는 그들의 공통 형용사(m) '귀중하다'이다.
수학적으로 h + m = t이 되도록 임베딩
3. Metaphor Embedding
3.1 Extracting metaphor relations based on POS tagging
아래 데이터셋을 통해 각 명사를 수식하는 형용사들을 얻을 수 있으므로 이들을 활용하여 두 명사의 은유관계를 추출함
- Adjective Noun Pairs (ANPs) (Borth et al., 2013; Jou et al., 2015) from Visual Sentiment Ontology (VSO) dataset
- Multilingual Visual Sentiment Concept Ontology (MVSO) dataset.
하나의 은유적 명사 쌍에 대해 하나의 공통 형용사만이 있을 수 없다는 것을 주목하는 것이 중요하다. 그래서 우리는 하나의 은유적 명사 쌍의 은유적 관계로서 공통의 형용사 집합을 얻을 수 있다.
- Definition1 (Metaphor Relation)
: 두 명사를 각각 수식하는 형용사들 집합의 교집합 (ANPs)
- Definition2 (Metaphor Graph)
: Definition1에서의 형용사를 활용하여 연결. edge가 곧 형용사
- Definition 3(Metaphor Embedding)
벡터 표현에서도 수학적으로 만족할 수 있게끔 임베딩한다.
- TransE
- same vector space
- TransH
- hyperplane(초평면)에 있는 m의 벡터(dm)
- hyperplane의 크기가 1인 normal vector(법선벡터) wm을 활용하여 h, t의 정사영.
- TransR
- nouns와 adjectives(relations)의 embedding space가 다른 상태.
- nouns matrix의 relations space에 대한 정사영.
- TransD
- nouns와 adjectives(relations)의 embedding space가 다른 상태.
- nouns matrix의 relations space에 대한 정사영인데, h와 t의 mapping matric가 다름.
- RotatE
- Hadamard product(아다마르곱) : 동일한 위치의 원소끼리 곱하는 것.
Loss Function : golden triple들이 있는 D+에서 head나 tail을 손상시켜서 D-를 구성.
⇒ D+ : reward, D- : penalty
4. Representing Metaphors in Shakespeare’s Sonnets
(+) Sonnets: 정형시. 각운을 엄격히 맞춤. 보통 14줄 / 전통적인 방식의 운율과 은유
- 4Lines x 3 + 2Lines
- 8Lines + 6Lines
metaphor relations(형용사)
VS normal relations(술어) : 모든 명사를 추출하고 이것들중 두 개의 관계를 Wordnet에서 얻음. 역시 triples형태.
Node: Yellow(in sonnets), Blue(not in sonnets)
Edge : Yellow(metaphor), Red(normal)
5 Experimental Analysis
5.2 Evaluation of metaphor embedding
5.2.1 Relation prediction
은유 관계를 잘 예측했는지를 통해 평가한다.
- 각 모델은 점수함수 fm을 통해 각 test triple들에 대해 예상 순위를 정한다.
- 실제 triple의 순위와 예상 순위를 비교하는 것.
: 맞춘 것들의 예상순위의 평균 → 작은 값일수록 좋은 것.
: k보다 작은 숫자의 등수 안에 맞춘 것들이 몇개 있는지 → 큰 값일수록 좋은 것.
두 평가지표 모두에서 TransH
5.2.2 Triple classification
- 기존 트리플의 head나 tail을 손상시켜서 negative triple을 만들기
ex. time, precious, money → time, precious, death
- delta라는 임계값 설정
- fm으로 불일치 점수 계산 후 delta와 비교하여 분류
불일치점수 < delta : positive triple
불일치점수 > delta : negative triple
⇒ 이번에도 TransH
5.2.3 Metaphorical emotions analysis
특정 단어가 포함된 triple을 모두 나열하고 이것들과 연결된 단어들 중 감정단어 탐색
6. Limitations and Future Works
- 대규모 데이터셋에서의 검증 필요
- 명사형 은유만 확인했음
- 영어만 다루고 있음
+) 소네트와 같은 전통적, 정형적 시에서만 활용이 가능할수도.