-
A Survey of Mathematical Reasoning in the Era of Multimodal Large Language Model: Benchmark, Method & Challenges논문 리뷰/Multimodal 2025. 1. 3. 16:24반응형
논문 초록(Abstract)
인간 인지의 핵심 요소인 수학적 추론은 교육적 문제 해결부터 과학적 발전에 이르기까지 다양한 영역에서 필수적인 요소입니다. 인공 일반 지능(AGI)이 발전함에 따라 대규모 언어 모델(LLM)을 수학적 추론 작업과 통합하는 것이 점점 더 중요해지고 있습니다. 이 설문조사는 다중 모드 대규모 언어 모델(MLLM) 시대의 수학적 추론에 대한 최초의 종합적인 분석을 제공합니다. 2021년 이후 발표된 200개 이상의 연구를 검토하고, 멀티모달 환경에 초점을 맞춰 수학-LLM의 최신 발전 상황을 살펴봅니다. 이 분야를 벤치마크, 방법론, 과제의 세 가지 차원으로 분류합니다. 특히, 멀티모달 수학적 추론 파이프라인과 (M)LLM의 역할 및 관련 방법론에 대해 살펴봅니다. 마지막으로, 이 분야에서 AGI의 실현을 방해하는 5가지 주요 과제를 파악하여 향후 멀티모달 추론 능력 향상을 위한 방향에 대한 인사이트를 제공합니다. 이 설문조사는 연구 커뮤니티가 복잡한 복합 추론 작업을 처리하기 위해 LLM의 역량을 발전시키는 데 중요한 자료로 활용될 것입니다.
https://discuss.pytorch.kr/t/2024-12-16-12-22-ml-top-ml-papers-of-the-week/5733
반응형'논문 리뷰 > Multimodal' 카테고리의 다른 글
Chart to Code (0) 2025.04.02 LLaVA / LLaVA-NeXT (0) 2025.01.15 Beagle: Automated Extraction and Interpretation of Visualizations from the Web (1) 2025.01.03 A Survey on Multimodal Large Language Models (1) 2024.11.13 A Comprehensive Review of Multimodal LargeLanguage Models: Performance and ChallengesAcross Different Tasks (0) 2024.11.13