Taewhoo Lee's picture

4 11

Taewhoo Lee

Taewhoo

Taewhoo

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Outlier-Safe Pre-Training for Robust 4-Bit Quantization of Large Language Models

upvoted a collection about 1 month ago

Outlier-Safe Pre-Training (OSP)

liked a model about 1 month ago

dmis-lab/OSP-1.4B-100B-Shampoo-SSNorm-EmbProj

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

Outlier-Safe Pre-Training for Robust 4-Bit Quantization of Large Language Models

Paper • 2506.19697 • Published Jun 24 • 44

upvoted a collection about 1 month ago

Outlier-Safe Pre-Training (OSP)

A collection of ablation and final models trained on the Outlier-Safe Pre-Training (OSP) framework. • 11 items • Updated Jun 26 • 3

liked 10 models about 1 month ago

dmis-lab/OSP-1.4B-100B-Shampoo-SSNorm-EmbProj

1B • Updated Jun 25 • 1 • 3

dmis-lab/OSP-1.4B-100B-Shampoo-SSNorm

1B • Updated Jun 25 • 4 • 3

dmis-lab/OSP-1.4B-100B-Muon-SSNorm-EmbProj

1B • Updated Jun 25 • 7 • 3

dmis-lab/OSP-1.4B-100B-Muon-EmbProj

1B • Updated Jun 25 • 2 • 3

dmis-lab/OSP-1.4B-100B-Muon-SSNorm

1B • Updated Jun 25 • 2 • 3

dmis-lab/OSP-1.4B-100B-Muon-Only

1B • Updated Jun 25 • 5 • 3

dmis-lab/OSP-1.4B-100B-Muon

1B • Updated Jun 25 • 5 • 3

dmis-lab/OSP-1.4B-100B-Adam

1B • Updated Jun 25 • 9 • 3

dmis-lab/OSP-1.4B-1T-Muon-SSNorm-EmbProj

1B • Updated Jun 25 • 4 • 3

dmis-lab/OSP-1.4B-1T-Adam

1B • Updated Jun 25 • 124 • 3

upvoted a paper 5 months ago

Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information

Paper • 2502.14258 • Published Feb 20 • 26

upvoted a paper 10 months ago

ChroKnowledge: Unveiling Chronological Knowledge of Language Models in Multiple Domains

Paper • 2410.09870 • Published Oct 13, 2024 • 8

liked a dataset over 1 year ago

ccdv/arxiv-summarization

Viewer • Updated Aug 8, 2024 • 432k • 2.52k • 102

updated a collection over 1 year ago

Papers

1 item • Updated Dec 6, 2023

updated 3 models almost 2 years ago

Taewhoo/llama2-databricks

Text Generation • Updated Sep 26, 2023 • 3

Taewhoo/llama2-databricks-peft

Updated Sep 26, 2023

Taewhoo/biobert-finetuned-factoid

Question Answering • Updated Sep 6, 2023 • 8