AI Sweden har nyligen lanserat GPT-SW3, en språkmodell dedikerad till de nordiska språken, och gjort den tillgänglig för användning inom företag och olika organisationer.
Denna språkmodell, framtagen i samarbete med WASP och RISE, är avsedd att stärka Sveriges position inom Artificiell Intelligens, konkurrens och välfärd. GPT-SW3 är anpassad för svenska och andra nordiska språk och erbjuder en rad applikationer inklusive textanalys, klassificering, generering, bearbetning och moderering.
Denna modell adresserar tidigare utmaningar som företag och offentlig sektor har mött med storskaliga språkmodeller, såsom oklarheter kring träningsdata och licensvillkor. GPT-SW3 uppfyller behovet av en svensk-språklig modell med klara licensvillkor, anpassningsbarhet och möjligheten att köras på egen utrustning för specifika juridiska eller konkurrensmässiga krav.
Magnus Sahlgren, Head of Research NLU på AI Sweden och ledare för GPT-SW3-projektet, betonar det stora intresset för att använda avancerade språkmodeller i svenska organisationer. Enligt en rapport från DIGG beräknas AI bidra med ett värde på 140 miljarder kronor årligen till den offentliga sektorn. Med GPT-SW3 öppnas nya dörrar för produktivitetsökningar och kvalitetsförbättringar inom flera arbetsområden.
Region Halland har redan börjat utforska användningen av språkmodeller för olika sjukvårdsrelaterade uppgifter. Markus Lingman, överläkare och strateg i sjukhusledningen för Hallands sjukhus, ser stor potential i att använda GPT-SW3 för kliniska tillämpningar.
GPT-SW3 är en generativ, förtränad modell som har analyserat stora mängder text för att identifiera mönster i det svenska språket. Denna modell, som inte är en färdig produkt, kräver att utvecklare bygger egna applikationer för att dra full nytta av dess kapacitet.
Modellen finns i olika storlekar, från 126 miljoner till 40 miljarder parametrar, och har visat sig överträffa andra modeller i svenska språktester. Utvecklare kan hitta GPT-SW3 på HuggingFace, där även licensinformation och användarvillkor finns tillgängliga.
Fakta: GPT-SW3
- Tillgång till modellen (från kl 07.00 torsdag 16 nov 2023): https://www.ai.se/en/project/gpt-sw3
- GPT-SW3 är en så kallad generativ, förtränad modell. På engelska heter detta generative pre-trained models, och därifrån kommer förkortningen GPT.
- Genom att ha analyserat stora mängder text har språkmodellen hittat mönster i det svenska språket. De mönstren kan sedan användas för att komplettera text: När man skickar in en kortare eller längre text till en GPT-modell kommer den att komplettera texten på ett statistiskt rimligt sätt.
- GPT-SW3 är inte en färdig produkt eller tjänst. För att kunna använda GPT-SW3 måste utvecklare bygga en produkt eller tillämpning med hjälp av GPT-SW3.
- GPT-SW3 släpps i sex olika storlekar, från 126 miljoner parametrar upp till 40 miljarder.
- I AI Swedens egna tester för språkmodellering presterar GPT-SW3 modellerna bättre på svenska än andra fritt tillgängliga modeller som testats.
- Utvecklare kan hitta de olika varianterna av GPT-SW3 på HuggingFace, där även licensen och användarvillkoren finns.
- GPT-SW3 är ett resultat av ett samarbete mellan AI Sweden, WASP och RISE.