Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images & Videos (Paper Walkthru)

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images & Videos (Paper Walkthru)

52 Просмотров

Ссылки и html тэги не поддерживаются


Комментарии: