A Survey of Mathematical Reasoning in the Era of Multimodal Large Language Model: Benchmark, Method & Challenges

논문 리뷰/Multimodal 2025. 1. 3. 16:24

논문 초록(Abstract)

인간 인지의 핵심 요소인 수학적 추론은 교육적 문제 해결부터 과학적 발전에 이르기까지 다양한 영역에서 필수적인 요소입니다. 인공 일반 지능(AGI)이 발전함에 따라 대규모 언어 모델(LLM)을 수학적 추론 작업과 통합하는 것이 점점 더 중요해지고 있습니다. 이 설문조사는 다중 모드 대규모 언어 모델(MLLM) 시대의 수학적 추론에 대한 최초의 종합적인 분석을 제공합니다. 2021년 이후 발표된 200개 이상의 연구를 검토하고, 멀티모달 환경에 초점을 맞춰 수학-LLM의 최신 발전 상황을 살펴봅니다. 이 분야를 벤치마크, 방법론, 과제의 세 가지 차원으로 분류합니다. 특히, 멀티모달 수학적 추론 파이프라인과 (M)LLM의 역할 및 관련 방법론에 대해 살펴봅니다. 마지막으로, 이 분야에서 AGI의 실현을 방해하는 5가지 주요 과제를 파악하여 향후 멀티모달 추론 능력 향상을 위한 방향에 대한 인사이트를 제공합니다. 이 설문조사는 연구 커뮤니티가 복잡한 복합 추론 작업을 처리하기 위해 LLM의 역량을 발전시키는 데 중요한 자료로 활용될 것입니다.

https://discuss.pytorch.kr/t/2024-12-16-12-22-ml-top-ml-papers-of-the-week/5733

'논문 리뷰 > Multimodal' 카테고리의 다른 글

Chart to Code (0)	2025.04.02
LLaVA / LLaVA-NeXT (0)	2025.01.15
Beagle: Automated Extraction and Interpretation of Visualizations from the Web (1)	2025.01.03
A Survey on Multimodal Large Language Models (1)	2024.11.13
A Comprehensive Review of Multimodal LargeLanguage Models: Performance and ChallengesAcross Different Tasks (0)	2024.11.13

ABOUT ME

just do it just do it

논문 초록(Abstract)

'논문 리뷰 > Multimodal' 카테고리의 다른 글

티스토리툴바

ABOUT ME

논문 초록(Abstract)

'논문 리뷰 > Multimodal' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바