by-lemonade/gender-classifier2

Шаги того, как дообучал

За основу взял DeepPavlov/rubert-base-cased
Заморозил все веса, будем обучать только классификатор
Обернул датасет в torch Dataset и DataLoader - предварительно отфитровал все токены, которые не являются словами. + Добавил Label's
hidden_size = self.bert.config.hidden_size self.classifier = nn.Linear(hidden_size, num_labels) - Вытаскиваю скрытый слой трансформера и в решающий
Проверка через TestDataset, по ConfusionMatrix

Ответы на вопросы викторины):

C
C
B
C
C
B
B
C
C
B
B
B C A
B D H K F G E J C I A
E (BPE - поддерживаем мультиязычность)
Польскольку это всего лишь абстракция которая решает проблемы подгрузки датасета 15.1. Т.е Если датасет большой можно разбить на батчи

15.2. Можно паралельно загружать

15.3. Абстракция что бы агрегировать информацию служебную для датасета, востановить токены, или лейблы

15.4. Можно гибко использовать остальные функции torch, переиспользовать уже написанные функции

15.5. По идеи можно из сериализовать

15.4. Из минусов оверхед
Схожий пайплайн, в котором указываем оптимизатор, модель. 16.1. Но. в TF - модель компилируется, и на момент компиляции необходимо указать все параметры обучения.

16.2. Torch последовательный питоновский скрипт с возможностью call вызовов низкоуровневых библиотек

16.3. В Torch бывают другие нахвания функций) Но кому это важно.

16.4. в TF все функции и модули находятся почти в одном месте и имеют более гибкую и удобную адаптацию

16.5. В Торче же, каждый чих свой модуль, и будет ли он поддерживать стиль кто его знает

16.6. В Торче можно намного более глубоко залазить в детали реализации конкретного механизма и писать собственные, на TF я таким не занимался

by-lemonade
/

gender-classifier2