Language Modeling with Phonemes

https://github.com/codebyzeb/PhonemeTransformers

tweetbyzeb

codebyzeb

Activity Feed Request to join this org

AI & ML interests

tokenization, CHILDES, word segmentation, phonemes, BabyLM

Recent Activity

codebyzeb updated a dataset 23 days ago

phonemetransformers/IPA-BabyLM

codebyzeb updated a model 23 days ago

phonemetransformers/ipa-childes-models-tiny

codebyzeb updated a model 23 days ago

phonemetransformers/ipa-childes-models-small

View all activity

Organization Card

Community About org cards

Edit this README.md markdown file to author your organization card.

Collections 3

spaces 1

Runtime error

segmentation_scores

🚀

models 36

datasets 3

phonemetransformers/IPA-BabyLM

Viewer • Updated 23 days ago • 12.5M • 281

phonemetransformers/IPA-CHILDES

Viewer • Updated 23 days ago • 12.5M • 1.43k • 2

phonemetransformers/IPA-BabyLM-evaluation

Preview • Updated 29 days ago • 429

Language Modeling with Phonemes

AI & ML interests

Recent Activity

Collections 3

BabyLM's First Words: Word Segmentation as a Phonological Probing Task

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models-large

IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models

spaces 1

segmentation_scores

models 36

phonemetransformers/ipa-childes-models-tiny

phonemetransformers/ipa-childes-models-small

phonemetransformers/ipa-childes-models-medium

phonemetransformers/ipa-childes-models-large

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-english-size-comparison

phonemetransformers/ipa-childes-models

phonemetransformers/babble-tokenizers

phonemetransformers/childes-phoneme-tokenizers

phonemetransformers/GPT2-85M-BPE-TXT

datasets 3

phonemetransformers/IPA-BabyLM

phonemetransformers/IPA-CHILDES

phonemetransformers/IPA-BabyLM-evaluation

AI & ML interests

Recent Activity

Team members 1

Collections 3

spaces 1

segmentation_scores

models 36 Sort: Recently updated

datasets 3 Sort: Recently updated

models 36

datasets 3