Relevance Feedback(RF)란 보다 더 나은 검색 결과를 얻기 위해서 초기에 얻은 검색 결과에서 연관된 결과를 다시 새롭게 입력으로 넣는 방법들을 의미하며 크게 Explicit Relevance Feedback(ERF), Implicit Relevance Feedback(IRF), Pseudo Relevance Feedback(PRF)이 있으며 PRF는 Blind Relevance Feedback(BRF)이라고도 한다 [1].

 

RF는 검색엔진이 내놓은 결과에서 관련성이 있는 결과를 피드백 해주어야 하는데 PRF는 RF와 다르게 유저와 추가적인 상호작용 없이 효과적인 검색결과를 얻는 방법을 의미한다 [2, 3].

 

이러한 PRF는 유저의 추가적인 개입이 필요가 없기 때문에 검색관련 논문들에서 많이 사용된다. PRF는 아래와 같은 과정을 거친다 [4].

 

1. 유저가 쿼리를 보낸다.

 

2. 검색엔진이 유저가 보낸 쿼리에 맞는 초기 검색 결과를 내놓는다.

 

3. 검색결과의 top-k는 연관성이 있는 결과로 간주하고 나머지는 관련성이 없다고 간주한다.

 

4. 이렇게 나온 top-k의 결과를 다시 유저 쿼리로 간주하여(Query Expansion) 다시 검색엔진에 넣고 새로운 검색 결과를 가져온다.

 

[4] 그림 1. PRF의 과정을 나타낸 그림으로 (1)에서 검색엔진이 최초로 결과를 내놓고 (2)에서 top-k결과를 가져와 관련있는 내용과 관련 없는 내용으로 나눈다. 그리고 (3)에서 관련이 있는 top-k결과를 유저쿼리로 간주하여 다시 검색엔진에 넣는다.

 

참고로 이러한 기법들은 반드시 문서(text, document)에만 적용된다는 법은 없다.(쉽지는 않지만 상상을 펼치면 곧 논문이 된다 ㅇㅅㅇ;)

 

참고문헌

1. Relevance Feedback, Available Online: en.wikipedia.org/wiki/Relevance_feedback 18 Feb 2021.

2. Relevance feedback and pseudo relevance feedback, Available Online: nlp.stanford.edu/IR-book/html/htmledition/relevance-feedback-and-pseudo-relevance-feedback-1.html 18 Feb 2021.

3. Pseudo relevance feedback, Available Online: nlp.stanford.edu/IR-book/html/htmledition/pseudo-relevance-feedback-1.html 18 Feb 2021.

4. EE448 project2: Query Expansion In class project for EE448(2020) in SJTU, Available Online: www.kaggle.com/c/ee448-project2-query-expansion/overview/description 18 Feb 2021.

+ Recent posts