Hieu Ngo's picture

Hieu Ngo

hiieu

·

AI & ML interests

Applied, Post-Training LLM

Recent Activity

liked a model 15 days ago

SulphurAI/Sulphur-2-base

liked a dataset 18 days ago

open-thoughts/AgentTrove

liked a model 6 months ago

tencent/HunyuanOCR

View all activity

Organizations

upvoted a collection over 1 year ago

Reasoning Datasets

Distilled synthetic Reasoning datasets • 7 items • Updated Feb 2, 2025 • 61

upvoted a paper over 1 year ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9, 2025 • 104

upvoted a collection over 1 year ago

HuatuoGPT-o1

4 items • Updated Dec 30, 2024 • 21

upvoted a paper over 1 year ago

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published Jan 13, 2025 • 101

upvoted a collection over 1 year ago

Reasoning Datasets

Reasoning datasets that are trending 🔥 • 10 items • Updated Jan 3, 2025 • 26

upvoted 5 papers over 1 year ago

Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

Paper • 2411.14405 • Published Nov 21, 2024 • 61

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 58

SelfCodeAlign: Self-Alignment for Code Generation

Paper • 2410.24198 • Published Oct 31, 2024 • 25

GPT-4o System Card

Paper • 2410.21276 • Published Oct 25, 2024 • 87

Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering

Paper • 2410.15999 • Published Oct 21, 2024 • 20

upvoted 2 articles over 1 year ago

Article

MedEmbed: Fine-Tuned Embedding Models for Medical / Clinical IR

abhinand

•

Oct 20, 2024

• 54

Article

Model2Vec: Distill a Small Fast Model from any Sentence Transformer

Pringled

•

Oct 14, 2024

• 104

upvoted a paper over 1 year ago

MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct

Paper • 2409.05840 • Published Sep 9, 2024 • 49

upvoted a collection over 1 year ago

Gemma 2 ChatQA RAG finetuned

1 item • Updated Sep 2, 2024 • 1

upvoted an article over 1 year ago

Article

Improving Hugging Face Training Efficiency Through Packing with Flash Attention 2

+4

RQlee, ArthurZ, achikundu, lwtr, rganti, mayank-mishra

•

Aug 21, 2024

• 41

upvoted 2 papers almost 2 years ago

Synthesizing Text-to-SQL Data from Weak and Strong LLMs

Paper • 2408.03256 • Published Aug 6, 2024 • 10

Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning

Paper • 2408.00690 • Published Aug 1, 2024 • 25

upvoted a collection almost 2 years ago

ShieldGemma Release

A series of safety classifiers, trained on top of Gemma 2, for developers to filter inputs and outputs of their applications. • 3 items • Updated Mar 12 • 16

upvoted a paper almost 2 years ago

Compact Language Models via Pruning and Knowledge Distillation

Paper • 2407.14679 • Published Jul 19, 2024 • 40

upvoted a collection almost 2 years ago

Minitron

A family of compressed models obtained via pruning and knowledge distillation • 12 items • Updated 1 day ago • 64