Skip to content

OpenAI lanserar GPT-OSS: Två kraftfulla öppna AI-språkmodeller

Bildkälla: Redigerad
Bildkälla: Redigerad

OpenAI har presenterat två nya språkmodeller med öppna vikter, GPT-OSS-120B och GPT-OSS-20B, vilket markerar ett stort steg tillbaka till företagets öppna rötter. Modellerna är licensierade under Apache 2.0, vilket gör dem fria att använda, modifiera och integrera kommersiellt. Samtidigt matchar de, eller överträffar, många slutna modeller i faktabaserad resonemangsförmåga, verktygsanvändning och effektivitet.

Nyckelfakta kring GPT-OSS

  • Modeller: gpt-oss-20b och gpt-oss-120b
  • Prestanda: Nära GPT-4o på flera tester, överträffar GPT-4o och o1 på HealthBench
  • Krav:
    – gpt-oss-20b: körs lokalt med 16 GB minne
    – gpt-oss-120b: körs på en 80 GB GPU
  • Licens: Apache 2.0 (fri användning och modifiering)
  • Träning: Mixture-of-Experts (MoE), RLHF, post-träning inspirerad av frontier-modeller som o3
  • Säkerhet: Testad enligt OpenAI:s Preparedness Framework
GPT-OSS modellerna presterar i par med 4o- och 3o modellerna
GPT-OSS modellerna presterar i par med 4o- och 3o modellerna

GPT-OSS-120B och GPT-OSS-20B är optimerade för olika behov

GPT-OSS-120B presterar på nivå med OpenAI:s o4-mini och kräver ett grafikkort (80 GB GPU). Den mindre modellen, GPT-OSS-20B, klarar sig på en vanlig dator med 16 GB RAM och når nästan samma nivå som o3-mini. Båda modellerna hanterar kedjeresonemang (CoT), funktionella API-anrop, strukturutdata och verktygsintegration (exempelvis kodkörning eller webbsökning).

GPT-OSS modellerna presterar riktigt bra på matematikproblem
GPT-OSS modellerna presterar riktigt bra på matematikproblem
GPT-OSS modellernas prestation inom frågor som rör hälsa (OpenAI poängterar att AI-modell inte skall ersätta doktorer och andra professionella inom hälsa och sjukvård)
GPT-OSS modellernas prestation inom frågor som rör hälsa (OpenAI poängterar att AI-modell inte skall ersätta doktorer och andra professionella inom hälsa och sjukvård)

Körs lokalt på datorn, öppnar nya möjligheter för utvecklare och företag

Till skillnad från många tidigare modeller kräver GPT-OSS inte uppkoppling till OpenAI:s servrar. Den fungerar lokalt, kan anpassas, och ger utvecklare full kontroll över dataflöde och säkerhet – något särskilt viktigt för myndigheter, sjukvård och känsliga branscher. OpenAI samarbetar redan med aktörer som AI Sweden, Orange och Snowflake för att testa tillämpningar inom just dessa miljöer.

Byggd med säkerhet och tillförlitlighet i fokus

OpenAI har använt sina mest avancerade förtränings- och efterträningsmetoder, inklusive teknik hämtad från deras mest kraftfulla system (som o3), för att forma GPT-OSS. Modellerna har testats enligt OpenAIs Preparedness Framework, inklusive attacker med “fientlig finjustering”, som visade likvärdig säkerhet som företagets egna kommersiella modeller. Dessutom har externa experter granskat metodiken.

GPT-OSS prestation på vetenskapsfrågor och tvärvetenskapliga akademiska frågor
GPT-OSS prestation på vetenskapsfrågor och tvärvetenskapliga akademiska frågor
GPT-OSS prestation inom kodning
GPT-OSS prestation inom kodning

Tekniken bakom GPT-OSS

Modellerna bygger på Transformer-arkitektur och använder mixture-of-experts (MoE) för att minimera beräkningskostnader. GPT-OSS-120B har 117 miljarder parametrar men aktiverar bara 5,1 miljarder per token, vilket ger hög prestanda till låg kostnad. Den mindre modellen, 20B, har totalt 21 miljarder parametrar och aktiverar endast 3,6 miljarder per token. Båda modellerna stödjer kontekstlängder på upp till 128k, och använder tekniker som RoPE, locally banded attention, och grupperad multi-query attention.

Reflektion: Ett demokratiskt steg mot AI för alla

Med lanseringen av GPT-OSS återgår OpenAI till sin ursprungliga vision: att göra kraftfull AI tillgänglig och öppen för alla. I en tid där AI-utveckling ofta förknippas med stängda molnplattformar och höga trösklar för tillgång, är detta ett medvetet steg i motsatt riktning. Genom att erbjuda modeller som går att köra lokalt, under fri licens, skapas förutsättningar för att fler aktörer, från universitet och kommuner till startups och enskilda utvecklare, kan utveckla AI-lösningar på egna villkor.

Samtidigt markerar GPT-OSS ett strategiskt skifte. För företag och organisationer som kräver datasuveränitet och lägre driftskostnader innebär det en ny frihet: att utveckla med toppmodern AI utan att behöva dela känslig information med externa molnleverantörer.

Det är ett steg mot en mer decentraliserad AI-användning, där kraften att använda avancerad AI inte är förbehållen de största aktörerna, utan också tillhör den som själv vill köra och forma AI:n på egna villkor, med full kontroll över data, säkerhet och riktning.

De öppna AI-modellerna finns på Huggingface:
https://huggingface.co/openai/gpt-oss-120b
https://huggingface.co/openai/gpt-oss-20b

Missa inte senaste AI nyheter. Avregistrera när du vill.

Tipsa vän eller kollega om artikeln

Hur bra är du på att upptäcka AI-bilder?

kontakt@aiutbildning.se

Publicerat av: Marko Tosic