Az OpenAI 2025. augusztus 5-én új mérföldkőhöz érkezett: bemutatta első, „open-weight”, vagyis nyílt súlyú nyelvi modelljeit a GPT‑2 óta – több mint 6 év kihagyás után. A két új modell, a gpt‑oss‑20b és a gpt‑oss‑120b, nemcsak a mesterséges intelligencia közösség számára jelent óriási előrelépést, hanem a fejlesztők, kutatók, vállalkozások és szabályozó szervek számára is.

A nyílt súly fogalma
Mit jelent az, hogy „nyílt súlyú” AI-modell?
Valószínűleg sokan találkoztak már a „nyílt forráskód” (angolul: open source) kifejezéssel – ez az, amikor egy szoftver „beleseje”, vagyis a programkódja bárki számára elérhető, szabadon átnézhető, módosítható és újrahasznosítható. Ilyen például a WordPress, a Linux, vagy sok okostelefonos alkalmazás alapja.
A „nyílt súly” (open-weight) kifejezés hasonló elven működik, csak a mesterséges intelligencia (AI) világában. Ahelyett, hogy a programkódot tennék közzé, itt a mesterséges intelligencia megtanult „tudása” – vagyis az úgynevezett „súlyai” – válik nyilvánosan elérhetővé.
De mit is jelent ez pontosan?
Amikor egy AI modellt „tanítanak”, az olyan, mintha rengeteg példán keresztül „iskolába járna”: szövegeket olvas, kérdésekre válaszol, és közben fokozatosan megtanulja, hogyan reagáljon a különböző helyzetekre. Ez a tanulási folyamat egy matematikai hálózatban rögzíti a tapasztalatait – ezeket nevezzük súlyoknak. A GPT‑OSS esetében ezek a tanulás során kialakult beállítások most szabadon letölthetők.
Fontos megjegyezni: ez nem azt jelenti, hogy a modell minden titkát megosztják. Nem kapjuk meg például azokat a konkrét adatokat, amin tanították, vagy az egész tanítási infrastruktúrát. De azt igen, amit végül „megtanult” – és ezt használni is tudjuk.
Miért jelent ez hatalmas előrelépést?
Független működés: AI internet nélkül
A legtöbb modern, nagy nyelvi modell csak felhőalapú API-n keresztül érhető el. Ez azt jelenti, hogy minden kérés egy távoli szerveren történik, ami adatvédelmi, biztonsági és rendelkezésre állási szempontból is kihívást jelent.
A GPT‑OSS modellek viszont lokálisan futtathatók – tehát ha van egy megfelelően felszerelt gépünk (különösen GPU-val), akkor teljes offline élményt biztosíthatunk, internetes lekérések nélkül. Ez különösen fontos például:
- Egészségügyi adatokkal dolgozó intézmények számára.
- Szigorú adatvédelmi szabályozás alatt működő európai cégeknek (pl. GDPR).
- Katonai, kormányzati vagy kutatói környezetben.
Teljesítmény: nem csak játékszer
A GPT‑OSS modellek valós teljesítménye meglepően erős. A benchmarkok szerint a kisebbik modell, a gpt‑oss‑20b teljesítménye vetekszik az OpenAI o3-mini modellel, míg a nagyobb, gpt‑oss‑120b modell már közelíti a legmodernebb zárt modellek kapacitását.
Felhasználási példák:
- Ügyfélszolgálati chatbotok.
- Tudásbázisokra épülő kérdés-válasz rendszerek.
- Szövegírás, marketing tartalomgenerálás.
A két modell technikai összehasonlítása
Tulajdonság | gpt‑oss‑20b | gpt‑oss‑120b |
---|---|---|
Paraméterek száma | ~21 milliárd | ~117 milliárd (MoE: mixture of experts) |
Memóriaigény | min. 16–24 GB GPU VRAM | 80–100 GB RAM, 4×GPU vagy AI chip ajánlott |
Elérhetőség | Letölthető, Windows AI Foundry és AWS támogatás | Ugyanaz, de erősebb gépet igényel |
Finomhangolás | Lehetséges kisebb adatbázison | Nagyvállalati szintű finomhangolás |
Ajánlott használat | Lokális AI-asszisztens, chatbot, offline generátor | Komplex, domain-specifikus rendszerek |
A gpt‑oss‑120b különlegessége, hogy ún. Mixture of Experts (MoE) architektúrát alkalmaz – ez azt jelenti, hogy nem minden paraméter aktiválódik minden kérdésnél, csak egy részük. Ez jelentősen csökkenti a számítási költséget, miközben megőrzi a nagy teljesítményt.
Kockázatok és kihívások
Bár a GPT‑OSS óriási lehetőséget kínál, nem szabad figyelmen kívül hagyni a veszélyeket sem:
Visszaélés lehetősége
- Kártékony chatbotok fejlesztése (pl. phishing, csalás).
- Felnőtt vagy erőszakos tartalmak generálása.
- Prompt injection típusú támadások.
Technikai belépési küszöb
Egy 20–120 milliárd paraméteres modell futtatása nem egyszerű feladat. Szükség van:
- Erős grafikus kártyára (pl. Nvidia RTX 3090 vagy újabb).
- AI-specifikus könyvtárak ismeretére (pl. Hugging Face, PyTorch).
- GPU-szerverekre vagy edge AI-eszközökre, ha nincs saját hardver.

És ez miért számít igazán?
Most először tényleg a tiéd lehet az AI
Eddig, ha mesterséges intelligenciát akartál használni, mindig csatlakoznod kellett valamilyen szolgáltatáshoz – általában külföldi nagyvállalat szervereihez. Kérdést küldtél, és választ kaptál, de minden az ő rendszerükben zajlott.
A GPT‑OSS modellek viszont letölthetők és futtathatók saját gépen, akár internetkapcsolat nélkül is. Ez nemcsak kényelmi, hanem adatvédelmi szempontból is hatalmas előrelépés: ha érzékeny adatokról van szó – legyen az jogi, egészségügyi vagy céges információ – ezek most végre a számítógépen belül maradhatnak. Az AI nem küldi el őket sehova, hanem helyben dolgozik velük.
Nem vagy többé kiszolgáltatva
Ez a modell arra is lehetőséget ad, hogy függetlenedj a nagy szolgáltatóktól. Korábban egy saját AI-megoldás fejlesztéséhez vagy egy drága API-t kellett használni, vagy olyan nyílt modelleket, amelyek messze nem voltak olyan jók, mint a zártak.
Most viszont letöltheted a GPT‑OSS egyik modelljét, és:
- beillesztheted egy saját alkalmazásba,
- működtetheted lokálisan, a saját szabályaid szerint,
- és akár testre is szabhatod.
Ez különösen értékes lehet például kisvállalkozásoknak, startupoknak vagy ügynökségeknek, akik AI-ra építenék a terméküket, de eddig korlátozta őket az ár vagy a technikai hozzáférés.
Testre szabható – úgy, ahogy neked kell
A GPT‑OSS nem egy készre gyártott, megváltoztathatatlan „okosdoboz”. Inkább egy okos, nyitott szemléletű asszisztens, aki már sok mindent tud, de készen áll arra, hogy megtaníts neki új dolgokat.
Ez a tanítás – vagy ahogy a szakma mondja: finomhangolás – lehetővé teszi, hogy a modell a te világodra szabott válaszokat adjon. Néhány példa:
- Egy biztosító megtaníthatja a modelljét a saját termékeire, feltételeire, gyakori kérdéseire.
- Egy iskolai rendszer AI-ja beszélhet oktatási nyelven, az adott tantárgyhoz igazodva.
- Egy jogi iroda megtaníthatja a modellnek, hogyan válaszoljon például peres vagy szerződéses kérdésekre.
Ezzel az AI nem általános lesz, hanem kontextusérzékeny, célspecifikus – ami óriási különbség, ha valódi értéket akarunk belőle kihozni.
Bele is nézhetsz, nem csak használod
A legtöbb mesterséges intelligencia olyan, mint egy titokzatos fekete doboz: beírsz valamit, kijön egy válasz, de fogalmad sincs, hogyan jutott oda.
A nyílt súlyú modelleknél viszont a modell működése is átlátható. Elemezheted, mit és hogyan tanult, finomíthatod a viselkedését, sőt akár módosíthatod is a működési elveit. Ez különösen értékes kutatók, adatbiztonsági szakértők, de akár pedagógusok számára is, akik jobban szeretnék érteni, hogyan „gondolkodik” az AI.
A mesterséges intelligencia eddig zárt falak mögött élt: csak a nagyok fértek hozzá az igazán komoly technológiához. Most viszont bárki leülhet egy erősebb gép elé, és kipróbálhatja, hogyan tudna az AI-val együttműködni, tanulni, dolgozni.
És bár igaz, hogy a működtetéshez szükség lehet komolyabb erőforrásokra (főleg a nagyobb modell esetén), a lehetőség már nyitva áll. A döntés már nem csak a tech óriások kezében van – hanem a tiédben is.