Spaces:
Running
Looking for a Norwegian sentiment model for my Master’s project
I want to analyze the emotional tone (positive/negative valence) of Norwegian free-text responses. Any recommandations?
Kan noen anbefale en modell som klarer å skille mellom emosjonell tone i fritekstsvar på norsk? (positiv/negativ/nøytral)
Hei Gine. Det du beskriver er vel sentimentanalyse? Euroeval har tall på hvilke modeller som gjør det best på denne typen oppgave, f.eks. på LTG sitt Norec datasett for sentimentanalyse.
Av disse modellene, ser det ut til at google's gemma2/3 modeller presterer best. Men disse har ikke en helt åpen lisens.
Har du planer om å videretrene modellene? Phi4 14b presterer også bra og er under MIT lisens.
Ellers så kan man også bruke ikke-generative modeller som
https://huggingface.co/intfloat/multilingual-e5-large
https://euroeval.com/leaderboards/Monolingual/norwegian/#__tabbed_1_2
Hva man velger er jo typisk avhengig av flere faktorer, som hva av gpuer minne man har tilgjengelig. Det skal være mulig å kjøre disse modellene quantized med 16gb RAM for eksempel.
Jeg vil også nevne at vi trener en norsk språkmodell nå som er god på slike oppgaver. Den lanseres i desember.
Tusen takk for svar, Markus! Kan jeg plage deg med en epost på jobb?
