Pietro Lesci

pietrolesci

https://pietrolesci.github.io/

AI & ML interests

I like developing and applying causal methods to study the effect of training choices on models’ behaviour, including memorisation, shortcut learning, and tokenisation.

Organizations

Collections 11

View 11 collections

Papers 6

models 27

datasets 56

pietrolesci/unimixlm

Viewer • Updated Jul 25, 2025 • 81.9M • 140

pietrolesci/me-minipile-evals

Viewer • Updated Jun 3, 2025 • 1.22M • 47

pietrolesci/pile-deduped

Viewer • Updated May 5, 2025 • 748M • 6

pietrolesci/pythia-deduped-memorisation-profiles

Viewer • Updated Apr 9, 2025 • 2.13M • 104

pietrolesci/pile-validation

Viewer • Updated Apr 9, 2025 • 429k • 74

pietrolesci/pile-deduped-subset

Viewer • Updated Apr 9, 2025 • 16.3k • 36

pietrolesci/pythia-deduped-stats

Viewer • Updated Apr 9, 2025 • 16.3M • 70

pietrolesci/pythia-deduped-stats-raw

Viewer • Updated Apr 9, 2025 • 14.9M • 1.26k

pietrolesci/agnews

Viewer • Updated Apr 9, 2025 • 510k • 113

pietrolesci/amazoncat-13k

Viewer • Updated Apr 9, 2025 • 5.99M • 234 • 2

View 56 datasets

Pietro Lesci

AI & ML interests

Organizations

Collections 11

Papers 6

models 27 Sort: Recently updated

datasets 56 Sort: Recently updated

models 27

datasets 56