[논문 리딩] Knowledge graph-based metaphor representation for literature understanding

2022. 8. 20. 18:24디지털 인문학이란

1. Link

https://academic.oup.com/dsh/article-abstract/36/3/698/6098012?redirectedFrom=fulltext 

 

Knowledge graph-based metaphor representation for literature understanding

Abstract. Metaphor understanding is one of the most important and challenging tasks in language processing. In this study, we propose a knowledge graph-based me

academic.oup.com

 

2. Introduction

은유적 단어(예: 은유적 명사 쌍) 간의 은유적 관계를 확립하는 연구는 없기에 지식그래프 기반 은유 임베딩을 제안

은유 임베딩에 대한 두 가지 프로세스

  1. part of speech (POS) tagging based metaphorical relations extraction
  2. metaphors representation based on knowledge graph.

 은유적 의미 해석의 목적은 두 개념의 유사성을 추출하는 것이고 이 두 명사의 유사한 개념이 몇 가지 일반적인 형용사에 의해 표현될 수 있음 ⇒ 하나의 은유적 명사 쌍의 은유적 관계는 공통 형용사의 집합으로 구성될 수 있다.

 

Metaphorical Triples

ex.'시간은 돈이다'에서 추출한 은유명사 쌍(시간, 돈)에서 머리명사(h)는 '시간'이고, 꼬리명사(t)는 '돈'이다. 은유 관계는 그들의 공통 형용사(m) '귀중하다'이다.

수학적으로 h + m = t이 되도록 임베딩

 

 

3. Metaphor Embedding

3.1 Extracting metaphor relations based on POS tagging

아래 데이터셋을 통해 각 명사를 수식하는 형용사들을 얻을 수 있으므로 이들을 활용하여 두 명사의 은유관계를 추출함

  1. Adjective Noun Pairs (ANPs) (Borth et al., 2013; Jou et al., 2015) from Visual Sentiment Ontology (VSO) dataset
  2. Multilingual Visual Sentiment Concept Ontology (MVSO) dataset.

하나의 은유적 명사 쌍에 대해 하나의 공통 형용사만이 있을 수 없다는 것을 주목하는 것이 중요하다. 그래서 우리는 하나의 은유적 명사 쌍의 은유적 관계로서 공통의 형용사 집합을 얻을 수 있다.

 

  • Definition1 (Metaphor Relation)

: 두 명사를 각각 수식하는 형용사들 집합의 교집합 (ANPs)

 

 

  • Definition2 (Metaphor Graph)

: Definition1에서의 형용사를 활용하여 연결. edge가 곧 형용사

 

 

  • Definition 3(Metaphor Embedding)

벡터 표현에서도 수학적으로 만족할 수 있게끔 임베딩한다.

  • TransE
    • same vector space
  • TransH
    • hyperplane(초평면)에 있는 m의 벡터(dm)
    • hyperplane의 크기가 1인 normal vector(법선벡터) wm을 활용하여 h, t의 정사영.
  • TransR
    • nouns와 adjectives(relations)의 embedding space가 다른 상태.
    • nouns matrix의 relations space에 대한 정사영.
  • TransD
    • nouns와 adjectives(relations)의 embedding space가 다른 상태.
    • nouns matrix의 relations space에 대한 정사영인데, h와 t의 mapping matric가 다름.
  • RotatE
    • Hadamard product(아다마르곱) : 동일한 위치의 원소끼리 곱하는 것.

Loss Function : golden triple들이 있는 D+에서 head나 tail을 손상시켜서 D-를 구성.

⇒ D+ : reward, D- : penalty

 

 

4. Representing Metaphors in Shakespeare’s Sonnets

(+) Sonnets: 정형시. 각운을 엄격히 맞춤. 보통 14줄 / 전통적인 방식의 운율과 은유

  1. 4Lines x 3 + 2Lines
  2. 8Lines + 6Lines

metaphor relations(형용사)

VS normal relations(술어) : 모든 명사를 추출하고 이것들중 두 개의 관계를 Wordnet에서 얻음. 역시 triples형태.

Node: Yellow(in sonnets), Blue(not in sonnets)

Edge : Yellow(metaphor), Red(normal)

 

 

5 Experimental Analysis

5.2 Evaluation of metaphor embedding

5.2.1 Relation prediction

은유 관계를 잘 예측했는지를 통해 평가한다.

  1. 각 모델은 점수함수 fm을 통해 각 test triple들에 대해 예상 순위를 정한다.
  2. 실제 triple의 순위와 예상 순위를 비교하는 것.

: 맞춘 것들의 예상순위의 평균 → 작은 값일수록 좋은 것.

 

: k보다 작은 숫자의 등수 안에 맞춘 것들이 몇개 있는지 → 큰 값일수록 좋은 것.

두 평가지표 모두에서 TransH

 

5.2.2 Triple classification

  1. 기존 트리플의 head나 tail을 손상시켜서 negative triple을 만들기

ex. time, precious, money → time, precious, death

  1. delta라는 임계값 설정
  2. fm으로 불일치 점수 계산 후 delta와 비교하여 분류

불일치점수 < delta : positive triple

불일치점수 > delta : negative triple

⇒ 이번에도 TransH

5.2.3 Metaphorical emotions analysis

특정 단어가 포함된 triple을 모두 나열하고 이것들과 연결된 단어들 중 감정단어 탐색

 

 

6. Limitations and Future Works

  1. 대규모 데이터셋에서의 검증 필요
  2. 명사형 은유만 확인했음
  3. 영어만 다루고 있음

+) 소네트와 같은 전통적, 정형적 시에서만 활용이 가능할수도.