Open Access cikkek konvertálása JATS XML formátumra

OData támogatás
Konzulens:
Dr. Lengyel László
Automatizálási és Alkalmazott Informatikai Tanszék

Napjainkban az interneten szabadon közzétett és bárki által hozzáférhető cikkek száma egyre növekvő tempóban gyarapszik, így ezek gépi feldolgozása egyre kecsegtetőbb. Sajnos azonban a publikációk csak az esetek töredékében érhetők el erre alkalmas formátumban, általában egyedül PDF-ben lehet őket letölteni.

Mivel ezen formátum kialakításakor az egységes megjelenítés volt a középpontban, az emberi olvasók számára nem jelent problémát a használata, viszont a gépi feldolgozásnak jelentős kihívást jelent a PDF-ből történő információkinyerés. Adott tehát az ötlet, hogy előnyös lenne egy későbbi automatizált hozzáférést elősegítő formátumra hozni a publikációkat.

A diplomamunka keretei között megvizsgálom a felvetődött problémára kínált jelenleg elérhető megoldásokat. Ezek áttekintése után igyekszem egy való életben is hasznosítható alternatívával szolgálni a PDF-ből a jól strukturálható Journal Archiving and Interchange Tag Set 1.0 követelményeinek eleget tevő XML fájlba történő konvertálással.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.