Kapcsolat: Kővári Bence
Az útmutató lépésről lépésre bemutatja, hogyan lehet Word-dokumentumokat automatizáltan idegen nyelvre fordítani a formátum megőrzésével.
A fordítás a nyílt forráskódú DocuTranslate eszközzel és egy tetszőlegesen választott MI modellel történik (pl. OpenAI „gpt-5.1” ). A cél a minél pontosabb, mégis gyors első változat elkészítése; a végső szöveg minősége érdekében az emberi átolvasás továbbra is szükséges.
Megjegyzés: Egyetemi anyagok esetében a szakterminológia következetessége kiemelten fontos, ezért elengedhetetlen a saját szótár (glossary) használata.
- Jelenleg nincs egyetemi/kari szinten elfogadott szótár a szakkifejezésekre, bizottságok neveire stb. Ha elérhető hivatalos lista, az útmutatót frissítjük.
- Nincs egységes iránymutatás a brit vs. amerikai angol használatára. A mellékelt szótár egy régi minisztériumi lista alapján készült kiindulópontként.
- Telepítsd a Python-t: python.org/downloads
- Szerezz API kulcsot a választott szolgáltatótól (pl. OpenAI, Gemini).
- (Opcionális) Egészítsd ki a szótárat: glossary.xlsx.
- Szerkeszd a beállításokat a translate.py fájlban (API kulcs, modell, bemeneti/kimeneti fájlok).
- Futtasd a fordítást:
python translate.py
Telepítő letöltése, futtatása: python.org
A nyílt forráskódú DocuTranslate szoftvert használjuk. A projekt háromféle telepítési lehetőséget ajánl, részletek a hivatalos oldalon találhatók.
A fordításhoz több különböző nagy nyelvi modell szolgáltatás használható. Érdemes a megbízható és fejlett szolgáltatókat választani, például:
Figyelem: Az API kulcsot soha ne oszd meg, és ne töltsd fel verziókezelőbe!
Bár a nyelvi modellek jók az általános fordításban, a rögzített fordítású kifejezéseket (intézménynevek, szabályzatok, tanszékek, bizottságok, szervezeti egységek) célszerű szótárban meghatározni.
Javaslat:
- Nézd át a fordítandó anyagot, és gyűjtsd ki a problémás kifejezéseket.
- Alternatívaként készíts egy első gépi fordítást, majd az angol változatot átnézve gyűjtsd össze a javítandó terminusokat.
A rendszer JSON formátumú szótárt vár, a szerkesztést pedig megkönnyíti a mellékelt minta Excel: glossary.xlsx
Egyszerű JSON minta:
{
"Tanulmányi és Vizsgaszabályzat": "Academic and Examination Regulations",
"Hallgatói Önkormányzat": "Student Union"
}Tipp: Az utolsó tag után nincs vessző
A fordítást a translate.py futtatásával végezzük. Futtatás előtt szerkeszd a fájlban található beállításokat:
api_key: a szolgáltatótól kapott API kulcsmodel_id: csak akkor módosítsd, ha nem az alapértelmezett modellt használod (példa: OpenAI „gpt-5.1”)uzinfo_mini.docx: a forrásfájl (megadható teljes elérési úttal is)translated_uzinfo_mini.docx: a célfájl neve (automatikusan egyOutputmappába kerül). A név térjen el az eredetitől.
Tipp: A kimeneti fájlnevet mindig változtasd meg, így nem írja felül a forrást.
A fordítást a következő paranccsal kezdeményezheted:
python translate.py
- A futás során előfordulhat kínai nyelvű napló/üzenet – ez normális, a program eredetileg kínai.
- A fordítás jellemzően gyors; nagyobb anyagoknál is többnyire másodpercek alatt elkészül az első változat.
Megjegyzés: Ha a folyamat elakad, az API elérés vagy a konfiguráció (pl. kulcs, modell, jogosultságok) a leggyakoribb ok.
- Ellenőrizd, hogy a Python verzió megfelel-e (3.9+ ajánlott).
- Ellenőrizd az API kulcs érvényességét és a szolgáltatói kvótát.
- Ha a
translate.pyhibaüzenetet ad, olvasd el figyelmesen; tipikusan a konfigurációs érték vagy fájl-elérési út a gond.
Ezt a projektet klónozhatod kiindulásként, de ügyelj rá, hogy az API kulcsodat véletlenül se töltsd fel a tárolóba ( .gitignore, környezeti változók használata ajánlott).
Vannak esetek, amikor a gépi fordítás nem megfelelő – például az ESCO kompetenciák programleírásokban. Mivel ezeknek hivatalos nevük és leírásuk van, érdemes a hivatalos forrásból dolgozni:
- Töltsd le a magyar és angol nyelvű kategórialistát az ESCO honlapjáról.
- Keresd ki a magyar elnevezésekhez tartozó azonosítókat (pl. http://data.europa.eu/esco/skill/dc9a236c-c640-43c3-812f-269403591edb).
- Azonosító alapján keresd ki az angol elnevezéseket és leírásokat.
- Cseréld a már lefordított dokumentumban a táblázatot a hivatalos angol megfelelőkre.
Ha találsz hibát vagy javaslatod van, írj a fenti kapcsolati címen, vagy küldj javaslatot (pull request) a repóhoz. 🙂