Pritam Sarkar

pritamqu

pritam94
pritamqu
sarkarpritam

AI & ML interests

multimodal learning with vision, language, and audio; generative modeling; large multimodal models (LMMs); multimodal LLMs (MLLMs); AI agents; alignments; representation learning; self-supervised and unsupervised learning; vision-language models; audio-visual models; foundation models; computer vision

Organizations

None yet

upvoted a paper 4 months ago

Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization

Paper • 2504.12083 • Published Apr 16 • 4

Pritam Sarkar

AI & ML interests

Organizations

pritamqu's activity