12 110 7

Li-Wei Chen

txya900619

txya900619

AI & ML interests

None yet

Recent Activity

updated a dataset about 1 hour ago

txya900619/audiocaps-16k

published a dataset about 1 hour ago

txya900619/audiocaps-16k

upvoted a paper about 5 hours ago

Audio Flamingo 2: An Audio-Language Model with Long-Audio Understanding and Expert Reasoning Abilities

View all activity

Organizations

txya900619's activity

updated a dataset about 1 hour ago

txya900619/audiocaps-16k

Viewer • Updated about 1 hour ago • 39.5k

published a dataset about 1 hour ago

txya900619/audiocaps-16k

Viewer • Updated about 1 hour ago • 39.5k

upvoted 4 papers about 5 hours ago

Audio Flamingo 2: An Audio-Language Model with Long-Audio Understanding and Expert Reasoning Abilities

Paper • 2503.03983 • Published 4 days ago • 21

LLMVoX: Autoregressive Streaming Text-to-Speech Model for Any LLM

Paper • 2503.04724 • Published 4 days ago • 53

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published 4 days ago • 78

Benchmarking Large Language Models for Multi-Language Software Vulnerability Detection

Paper • 2503.01449 • Published 7 days ago • 4

updated a Space about 16 hours ago

Asr Demo

👁

Transcribe audio to text

updated a model about 16 hours ago

kenkone/kenkone-whisper-large-v3

Updated about 16 hours ago

published a model about 17 hours ago

kenkone/kenkone-whisper-large-v3

Updated about 16 hours ago

updated a model 2 days ago

kenkone/kenkone-whisper-large-v3-ct2

Updated 2 days ago • 26

published a model 2 days ago

kenkone/kenkone-whisper-large-v3-ct2

Updated 2 days ago • 26

updated a dataset 3 days ago

txya900619/vggsound-16k

Viewer • Updated 3 days ago • 199k • 52

published a dataset 3 days ago

txya900619/vggsound-16k

Viewer • Updated 3 days ago • 199k • 52

upvoted 7 papers 3 days ago

DiffRhythm: Blazingly Fast and Embarrassingly Simple End-to-End Full-Length Song Generation with Latent Diffusion

Paper • 2503.01183 • Published 7 days ago • 26

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 7 days ago • 66

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 18 days ago • 160