SurgVidLM: Towards Multi-grained Surgical Video Understanding with Large Language Model

Published in arXiv preprint, 2025

Recommended citation: Guankun Wang, Wenjin Mo, Junyi Wang, Long Bai, Kun Yuan, Ming Hu, Jinlin Wu, Junjun He, Yiming Huang, Nicolas Padoy, Zhen Lei, Hongbin Liu, Nassir Navab, Hongliang Ren. "SurgVidLM: Towards Multi-grained Surgical Video Understanding with Large Language Model." arXiv:2506.17873, 2025.
Download Paper