DAEHEEKIM's picture

DAEHEEKIM

andreaKIM

·

daehuikim

AI & ML interests

LLM interactive chatbot

Recent Activity

upvoted a paper 15 days ago

Agentic Reinforced Policy Optimization

commented on a paper 15 days ago

Agentic Reinforced Policy Optimization

liked a dataset 5 months ago

lbox/kbl

View all activity

Organizations

None yet

commented a paper 15 days ago

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published 19 days ago • 138 •

New activity in google/gemma-7b-it over 1 year ago

Instruct Training Dataset languages

#12 opened over 1 year ago by

New activity in upstage/SOLAR-10.7B-Instruct-v1.0 over 1 year ago

This model ranked 1st place in open llm leader board, However this model has lower performance in supervised fine tuning.

#8 opened over 1 year ago by

New activity in berkeley-nest/Starling-LM-7B-alpha over 1 year ago

What could be instruction fine tuning prompt for this model?

#22 opened over 1 year ago by

New activity in mistralai/Mistral-7B-v0.1 almost 2 years ago

Why adaptor_model.bin becomes much larger than llama familes?

#34 opened almost 2 years ago by

New activity in hyunseoki/ko-en-llama2-13b almost 2 years ago

Occured problem at long context

#3 opened almost 2 years ago by