Ezt is olvasd el: AI a szövegírásban: Hogyan javíthatod tartalomstratégiádat mesterséges intelligenciával? Megnézem >
AI

OpenAI GPT‑OSS: Új korszak a nyílt mesterséges intelligenciában

Az OpenAI 2025. augusztus 5-én új mérföldkőhöz érkezett: bemutatta első, „open-weight”, vagyis nyílt súlyú nyelvi modelljeit a GPT‑2 óta – több mint 6 év kihagyás után. A két új modell, a gpt‑oss‑20b és a gpt‑oss‑120b, nemcsak a mesterséges intelligencia közösség számára jelent óriási előrelépést, hanem a fejlesztők, kutatók, vállalkozások és szabályozó szervek számára is.

A nyílt súly fogalma

Mit jelent az, hogy „nyílt súlyú” AI-modell?

Valószínűleg sokan találkoztak már a „nyílt forráskód” (angolul: open source) kifejezéssel – ez az, amikor egy szoftver „beleseje”, vagyis a programkódja bárki számára elérhető, szabadon átnézhető, módosítható és újrahasznosítható. Ilyen például a WordPress, a Linux, vagy sok okostelefonos alkalmazás alapja.

A „nyílt súly” (open-weight) kifejezés hasonló elven működik, csak a mesterséges intelligencia (AI) világában. Ahelyett, hogy a programkódot tennék közzé, itt a mesterséges intelligencia megtanult „tudása” – vagyis az úgynevezett „súlyai” – válik nyilvánosan elérhetővé.

De mit is jelent ez pontosan?

Amikor egy AI modellt „tanítanak”, az olyan, mintha rengeteg példán keresztül „iskolába járna”: szövegeket olvas, kérdésekre válaszol, és közben fokozatosan megtanulja, hogyan reagáljon a különböző helyzetekre. Ez a tanulási folyamat egy matematikai hálózatban rögzíti a tapasztalatait – ezeket nevezzük súlyoknak. A GPT‑OSS esetében ezek a tanulás során kialakult beállítások most szabadon letölthetők.

Fontos megjegyezni: ez nem azt jelenti, hogy a modell minden titkát megosztják. Nem kapjuk meg például azokat a konkrét adatokat, amin tanították, vagy az egész tanítási infrastruktúrát. De azt igen, amit végül „megtanult” – és ezt használni is tudjuk.

Miért jelent ez hatalmas előrelépést?

Független működés: AI internet nélkül

A legtöbb modern, nagy nyelvi modell csak felhőalapú API-n keresztül érhető el. Ez azt jelenti, hogy minden kérés egy távoli szerveren történik, ami adatvédelmi, biztonsági és rendelkezésre állási szempontból is kihívást jelent.

A GPT‑OSS modellek viszont lokálisan futtathatók – tehát ha van egy megfelelően felszerelt gépünk (különösen GPU-val), akkor teljes offline élményt biztosíthatunk, internetes lekérések nélkül. Ez különösen fontos például:

  • Egészségügyi adatokkal dolgozó intézmények számára.
  • Szigorú adatvédelmi szabályozás alatt működő európai cégeknek (pl. GDPR).
  • Katonai, kormányzati vagy kutatói környezetben.

Teljesítmény: nem csak játékszer

A GPT‑OSS modellek valós teljesítménye meglepően erős. A benchmarkok szerint a kisebbik modell, a gpt‑oss‑20b teljesítménye vetekszik az OpenAI o3-mini modellel, míg a nagyobb, gpt‑oss‑120b modell már közelíti a legmodernebb zárt modellek kapacitását.

Felhasználási példák:

  • Ügyfélszolgálati chatbotok.
  • Tudásbázisokra épülő kérdés-válasz rendszerek.
  • Szövegírás, marketing tartalomgenerálás.

A két modell technikai összehasonlítása

Tulajdonsággpt‑oss‑20bgpt‑oss‑120b
Paraméterek száma~21 milliárd~117 milliárd (MoE: mixture of experts)
Memóriaigénymin. 16–24 GB GPU VRAM80–100 GB RAM, 4×GPU vagy AI chip ajánlott
ElérhetőségLetölthető, Windows AI Foundry és AWS támogatásUgyanaz, de erősebb gépet igényel
FinomhangolásLehetséges kisebb adatbázisonNagyvállalati szintű finomhangolás
Ajánlott használatLokális AI-asszisztens, chatbot, offline generátorKomplex, domain-specifikus rendszerek

A gpt‑oss‑120b különlegessége, hogy ún. Mixture of Experts (MoE) architektúrát alkalmaz – ez azt jelenti, hogy nem minden paraméter aktiválódik minden kérdésnél, csak egy részük. Ez jelentősen csökkenti a számítási költséget, miközben megőrzi a nagy teljesítményt.

Kockázatok és kihívások

Bár a GPT‑OSS óriási lehetőséget kínál, nem szabad figyelmen kívül hagyni a veszélyeket sem:

Visszaélés lehetősége

  • Kártékony chatbotok fejlesztése (pl. phishing, csalás).
  • Felnőtt vagy erőszakos tartalmak generálása.
  • Prompt injection típusú támadások.

Technikai belépési küszöb

Egy 20–120 milliárd paraméteres modell futtatása nem egyszerű feladat. Szükség van:

  • Erős grafikus kártyára (pl. Nvidia RTX 3090 vagy újabb).
  • AI-specifikus könyvtárak ismeretére (pl. Hugging Face, PyTorch).
  • GPU-szerverekre vagy edge AI-eszközökre, ha nincs saját hardver.

És ez miért számít igazán?

Most először tényleg a tiéd lehet az AI

Eddig, ha mesterséges intelligenciát akartál használni, mindig csatlakoznod kellett valamilyen szolgáltatáshoz – általában külföldi nagyvállalat szervereihez. Kérdést küldtél, és választ kaptál, de minden az ő rendszerükben zajlott.

A GPT‑OSS modellek viszont letölthetők és futtathatók saját gépen, akár internetkapcsolat nélkül is. Ez nemcsak kényelmi, hanem adatvédelmi szempontból is hatalmas előrelépés: ha érzékeny adatokról van szó – legyen az jogi, egészségügyi vagy céges információ – ezek most végre a számítógépen belül maradhatnak. Az AI nem küldi el őket sehova, hanem helyben dolgozik velük.

Nem vagy többé kiszolgáltatva

Ez a modell arra is lehetőséget ad, hogy függetlenedj a nagy szolgáltatóktól. Korábban egy saját AI-megoldás fejlesztéséhez vagy egy drága API-t kellett használni, vagy olyan nyílt modelleket, amelyek messze nem voltak olyan jók, mint a zártak.

Most viszont letöltheted a GPT‑OSS egyik modelljét, és:

  • beillesztheted egy saját alkalmazásba,
  • működtetheted lokálisan, a saját szabályaid szerint,
  • és akár testre is szabhatod.

Ez különösen értékes lehet például kisvállalkozásoknak, startupoknak vagy ügynökségeknek, akik AI-ra építenék a terméküket, de eddig korlátozta őket az ár vagy a technikai hozzáférés.

Testre szabható – úgy, ahogy neked kell

A GPT‑OSS nem egy készre gyártott, megváltoztathatatlan „okosdoboz”. Inkább egy okos, nyitott szemléletű asszisztens, aki már sok mindent tud, de készen áll arra, hogy megtaníts neki új dolgokat.

Ez a tanítás – vagy ahogy a szakma mondja: finomhangolás – lehetővé teszi, hogy a modell a te világodra szabott válaszokat adjon. Néhány példa:

  • Egy biztosító megtaníthatja a modelljét a saját termékeire, feltételeire, gyakori kérdéseire.
  • Egy iskolai rendszer AI-ja beszélhet oktatási nyelven, az adott tantárgyhoz igazodva.
  • Egy jogi iroda megtaníthatja a modellnek, hogyan válaszoljon például peres vagy szerződéses kérdésekre.

Ezzel az AI nem általános lesz, hanem kontextusérzékeny, célspecifikus – ami óriási különbség, ha valódi értéket akarunk belőle kihozni.

Bele is nézhetsz, nem csak használod

A legtöbb mesterséges intelligencia olyan, mint egy titokzatos fekete doboz: beírsz valamit, kijön egy válasz, de fogalmad sincs, hogyan jutott oda.

A nyílt súlyú modelleknél viszont a modell működése is átlátható. Elemezheted, mit és hogyan tanult, finomíthatod a viselkedését, sőt akár módosíthatod is a működési elveit. Ez különösen értékes kutatók, adatbiztonsági szakértők, de akár pedagógusok számára is, akik jobban szeretnék érteni, hogyan „gondolkodik” az AI.

A mesterséges intelligencia eddig zárt falak mögött élt: csak a nagyok fértek hozzá az igazán komoly technológiához. Most viszont bárki leülhet egy erősebb gép elé, és kipróbálhatja, hogyan tudna az AI-val együttműködni, tanulni, dolgozni.

És bár igaz, hogy a működtetéshez szükség lehet komolyabb erőforrásokra (főleg a nagyobb modell esetén), a lehetőség már nyitva áll. A döntés már nem csak a tech óriások kezében van – hanem a tiédben is.

< Vissza