OpenAI GPT‑OSS: Új korszak a nyílt mesterséges intelligenciában

2025. 08. 06.

Az OpenAI 2025. augusztus 5-én új mérföldkőhöz érkezett: bemutatta első, „open-weight”, vagyis nyílt súlyú nyelvi modelljeit a GPT‑2 óta – több mint 6 év kihagyás után. A két új modell, a gpt‑oss‑20b és a gpt‑oss‑120b, nemcsak a mesterséges intelligencia közösség számára jelent óriási előrelépést, hanem a fejlesztők, kutatók, vállalkozások és szabályozó szervek számára is.

A nyílt súly fogalma

Mit jelent az, hogy „nyílt súlyú” AI-modell?

Valószínűleg sokan találkoztak már a „nyílt forráskód” (angolul: open source) kifejezéssel – ez az, amikor egy szoftver „beleseje”, vagyis a programkódja bárki számára elérhető, szabadon átnézhető, módosítható és újrahasznosítható. Ilyen például a WordPress, a Linux, vagy sok okostelefonos alkalmazás alapja.

A „nyílt súly” (open-weight) kifejezés hasonló elven működik, csak a mesterséges intelligencia (AI) világában. Ahelyett, hogy a programkódot tennék közzé, itt a mesterséges intelligencia megtanult „tudása” – vagyis az úgynevezett „súlyai” – válik nyilvánosan elérhetővé.

De mit is jelent ez pontosan?

Amikor egy AI modellt „tanítanak”, az olyan, mintha rengeteg példán keresztül „iskolába járna”: szövegeket olvas, kérdésekre válaszol, és közben fokozatosan megtanulja, hogyan reagáljon a különböző helyzetekre. Ez a tanulási folyamat egy matematikai hálózatban rögzíti a tapasztalatait – ezeket nevezzük súlyoknak. A GPT‑OSS esetében ezek a tanulás során kialakult beállítások most szabadon letölthetők.

Fontos megjegyezni: ez nem azt jelenti, hogy a modell minden titkát megosztják. Nem kapjuk meg például azokat a konkrét adatokat, amin tanították, vagy az egész tanítási infrastruktúrát. De azt igen, amit végül „megtanult” – és ezt használni is tudjuk.

Miért jelent ez hatalmas előrelépést?

Független működés: AI internet nélkül

A legtöbb modern, nagy nyelvi modell csak felhőalapú API-n keresztül érhető el. Ez azt jelenti, hogy minden kérés egy távoli szerveren történik, ami adatvédelmi, biztonsági és rendelkezésre állási szempontból is kihívást jelent.

A GPT‑OSS modellek viszont lokálisan futtathatók – tehát ha van egy megfelelően felszerelt gépünk (különösen GPU-val), akkor teljes offline élményt biztosíthatunk, internetes lekérések nélkül. Ez különösen fontos például:

Egészségügyi adatokkal dolgozó intézmények számára.
Szigorú adatvédelmi szabályozás alatt működő európai cégeknek (pl. GDPR).
Katonai, kormányzati vagy kutatói környezetben.

Teljesítmény: nem csak játékszer

A GPT‑OSS modellek valós teljesítménye meglepően erős. A benchmarkok szerint a kisebbik modell, a gpt‑oss‑20b teljesítménye vetekszik az OpenAI o3-mini modellel, míg a nagyobb, gpt‑oss‑120b modell már közelíti a legmodernebb zárt modellek kapacitását.

Felhasználási példák:

Ügyfélszolgálati chatbotok.
Tudásbázisokra épülő kérdés-válasz rendszerek.
Szövegírás, marketing tartalomgenerálás.

A két modell technikai összehasonlítása

Tulajdonság	gpt‑oss‑20b	gpt‑oss‑120b
Paraméterek száma	~21 milliárd	~117 milliárd (MoE: mixture of experts)
Memóriaigény	min. 16–24 GB GPU VRAM	80–100 GB RAM, 4×GPU vagy AI chip ajánlott
Elérhetőség	Letölthető, Windows AI Foundry és AWS támogatás	Ugyanaz, de erősebb gépet igényel
Finomhangolás	Lehetséges kisebb adatbázison	Nagyvállalati szintű finomhangolás
Ajánlott használat	Lokális AI-asszisztens, chatbot, offline generátor	Komplex, domain-specifikus rendszerek

A gpt‑oss‑120b különlegessége, hogy ún. Mixture of Experts (MoE) architektúrát alkalmaz – ez azt jelenti, hogy nem minden paraméter aktiválódik minden kérdésnél, csak egy részük. Ez jelentősen csökkenti a számítási költséget, miközben megőrzi a nagy teljesítményt.

Kockázatok és kihívások

Bár a GPT‑OSS óriási lehetőséget kínál, nem szabad figyelmen kívül hagyni a veszélyeket sem:

Visszaélés lehetősége

Kártékony chatbotok fejlesztése (pl. phishing, csalás).
Felnőtt vagy erőszakos tartalmak generálása.
Prompt injection típusú támadások.

Technikai belépési küszöb

Egy 20–120 milliárd paraméteres modell futtatása nem egyszerű feladat. Szükség van:

Erős grafikus kártyára (pl. Nvidia RTX 3090 vagy újabb).
AI-specifikus könyvtárak ismeretére (pl. Hugging Face, PyTorch).
GPU-szerverekre vagy edge AI-eszközökre, ha nincs saját hardver.

És ez miért számít igazán?

Most először tényleg a tiéd lehet az AI

Eddig, ha mesterséges intelligenciát akartál használni, mindig csatlakoznod kellett valamilyen szolgáltatáshoz – általában külföldi nagyvállalat szervereihez. Kérdést küldtél, és választ kaptál, de minden az ő rendszerükben zajlott.

A GPT‑OSS modellek viszont letölthetők és futtathatók saját gépen, akár internetkapcsolat nélkül is. Ez nemcsak kényelmi, hanem adatvédelmi szempontból is hatalmas előrelépés: ha érzékeny adatokról van szó – legyen az jogi, egészségügyi vagy céges információ – ezek most végre a számítógépen belül maradhatnak. Az AI nem küldi el őket sehova, hanem helyben dolgozik velük.

Nem vagy többé kiszolgáltatva

Ez a modell arra is lehetőséget ad, hogy függetlenedj a nagy szolgáltatóktól. Korábban egy saját AI-megoldás fejlesztéséhez vagy egy drága API-t kellett használni, vagy olyan nyílt modelleket, amelyek messze nem voltak olyan jók, mint a zártak.

Most viszont letöltheted a GPT‑OSS egyik modelljét, és:

beillesztheted egy saját alkalmazásba,
működtetheted lokálisan, a saját szabályaid szerint,
és akár testre is szabhatod.

Ez különösen értékes lehet például kisvállalkozásoknak, startupoknak vagy ügynökségeknek, akik AI-ra építenék a terméküket, de eddig korlátozta őket az ár vagy a technikai hozzáférés.

Testre szabható – úgy, ahogy neked kell

A GPT‑OSS nem egy készre gyártott, megváltoztathatatlan „okosdoboz”. Inkább egy okos, nyitott szemléletű asszisztens, aki már sok mindent tud, de készen áll arra, hogy megtaníts neki új dolgokat.

Ez a tanítás – vagy ahogy a szakma mondja: finomhangolás – lehetővé teszi, hogy a modell a te világodra szabott válaszokat adjon. Néhány példa:

Egy biztosító megtaníthatja a modelljét a saját termékeire, feltételeire, gyakori kérdéseire.
Egy iskolai rendszer AI-ja beszélhet oktatási nyelven, az adott tantárgyhoz igazodva.
Egy jogi iroda megtaníthatja a modellnek, hogyan válaszoljon például peres vagy szerződéses kérdésekre.

Ezzel az AI nem általános lesz, hanem kontextusérzékeny, célspecifikus – ami óriási különbség, ha valódi értéket akarunk belőle kihozni.

Bele is nézhetsz, nem csak használod

A legtöbb mesterséges intelligencia olyan, mint egy titokzatos fekete doboz: beírsz valamit, kijön egy válasz, de fogalmad sincs, hogyan jutott oda.

A nyílt súlyú modelleknél viszont a modell működése is átlátható. Elemezheted, mit és hogyan tanult, finomíthatod a viselkedését, sőt akár módosíthatod is a működési elveit. Ez különösen értékes kutatók, adatbiztonsági szakértők, de akár pedagógusok számára is, akik jobban szeretnék érteni, hogyan „gondolkodik” az AI.

A mesterséges intelligencia eddig zárt falak mögött élt: csak a nagyok fértek hozzá az igazán komoly technológiához. Most viszont bárki leülhet egy erősebb gép elé, és kipróbálhatja, hogyan tudna az AI-val együttműködni, tanulni, dolgozni.

És bár igaz, hogy a működtetéshez szükség lehet komolyabb erőforrásokra (főleg a nagyobb modell esetén), a lehetőség már nyitva áll. A döntés már nem csak a tech óriások kezében van – hanem a tiédben is.

< Vissza