ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Selective Generation for Controllable Language Models
    논문 리뷰/NeurIPS 2024 2024. 11. 12. 14:43
    반응형

    NotebookLM 요약

     

    이 논문은 생성 언어 모델(GLM)의 신뢰성을 높이기 위해 제안된 선택적 생성(selective generation) 방법에 대해 설명합니다. GLM은 종종 환각(hallucination) 문제, 즉 사실이 아닌 정보를 생성하는 문제를 겪는데, 선택적 생성은 이러한 문제를 해결하기 위해 모델이 확신하지 못하는 경우 답변을 거부하는 기능을 도입합니다. 논문에서는 텍스트적 의미 포함(textual entailment) 개념을 활용하여 생성된 답변의 정확성을 평가하고, 이를 통해 오류 발생률을 제어하는 두 가지 알고리즘 SGenSup과 SGenSemi를 제안합니다. SGenSup은 지도 학습 방식으로, 인간이 텍스트적 의미 포함을 라벨링한 데이터를 사용합니다. 반면에 SGenSemi는 반지도 학습 방식으로, 라벨링되지 않은 데이터를 의사 라벨링(pseudo-labeling)하여 활용합니다. SGenSemi는 또한 신경 선택 함수(neuro-selection functions)를 사용하여 다양한 선택 함수 중 최적의 함수를 선택할 수 있도록 합니다. 실험 결과, SGenSemi는 기존 방법들에 비해 오류 발생률을 효과적으로 제어하고 선택 효율성을 높이는 것으로 나타났습니다.

    반응형
Designed by Tistory.