Hír

A mesterséges intelligencia szerepének vizsgálata az intézményi adattárak munkafolyamataiban 5/3

Az intézményi adattárak (intézményi repozitóriumok, IR) kritikus szerepet játszanak az egyetemek és más szervezetek kutatási eredményeinek megőrzésében és bemutatásában. Azonban ezen adattárak metaadatainak kezelése egyedülálló kihívásokat jelent, főként azért, mert a metaadatokat a felhasználók hozzák létre a dokumentumok feltöltésekor. A kutatók és a hallgatók általában kevésbé törődnek a metaadatok minőségével, mint a könyvtárak, és sietve végzik azt el a, hogy megfeleljenek az akadémiai vagy a finanszírozói kötelezettségnek. A repozitóriumokban található régi metaadatok idővel inkonzisztenciákat, hibákat és hiányosságokat halmozhatnak fel, ami tovább bonyolítja a munkafolyamatokat.
 
Az alábbi bejegyzés összefoglalja az OCLC RLP Metaadatok munkafolyamatában az MI kezelése munkacsoport Intézményi adattárak részlegének eredményeit. (A munkacsoport tagjai: Michael Bolam – Pittsburghi Egyetem, Helen Williams – Londoni Közgazdasági Egyetem)
 
A csoport 2025 áprilisa és júliusa között ötször ülésezett, és négy ülésen az MI által az IR metaadatok munkafolyamatainak hatékonyságának és termelékenységének növelésére kínált lehetőségekkel foglalkoztak. Gondosan mérlegelték a megvalósítás lehetséges akadályait és a szakmai készségek megőrzésére és a munkával való elégedettségre gyakorolt hatásokat is. Mint a legtöbb új technológia esetében, az MI használata a repozitóriumok munkafolyamatainak kontextusában is lehetőségeket és kompromisszumokat jelent. A kulcs az MI potenciáljával kapcsolatos nyitottság és a jelenlegi képességek és intézményi felkészültség reális értékelése közötti egyensúly megteremtése.
 
Az MI alapvető munkafolyamat-lehetőségei
 
A munkacsoport két kritikus IR-munkafolyamatot azonosított, ahol az MI hasznos eszköz lehet
- Feltöltési folyamatok (beleértve a metaadatok létrehozását)
- Régi metaadatok tisztítása és kezelése
Ezekből a kontextusokból több olyan lehetőséget is azonosítottak, ahol az MI-alapú eszközök növelhetik a hatékonyságot és a termelékenységet.
 
Az önarchiválás élményének javítása
 
A munkacsoport tagjai számos lehetőséget megvitattak, amelyekkel az MI javíthatja az IR-feltöltési folyamatot,  ezek többsége a benyújtáskor hiányos vagy hibás metaadatok kezelésére összpontosított. Mind az önálló, mind a közvetített feltöltési munkafolyamatokban a felhasználók gyakran nem tudnak teljes és pontos metaadatokat szolgáltatni, mert a hallgatók és a kutatók a metaadatok létrehozását terhesnek és időigényesnek tartják. Az MI-eszközökkel javítható problémákra példák az alábbiak:
- Teljes szövegelemzésen alapuló tárgyszavazási javaslatok
- Összefoglalók hiányában absztraktok generálása
- Feltöltött fájlokból (vagy intézményi egyéb információforrásokból) alapvető metaadatok kivonása a tároló rekordok előzetes kitöltése érdekében
 
A fájlfeldolgozás és a metaadatok kinyerésének racionalizálásával, valamint a teljesség biztosításával az MI-eszközök használata potenciálisan csökkentheti a kutatók terheit az önálló feltöltés során, valamint a közvetített feltöltéseket kezelő repozitórium-adminisztrátorok terheit. Az MI-eszközök felhasználhatók teljes szövegű fájlok beolvasására és bizonyos metaadatelemek kinyerésére, hogy előre kitöltsék vagy gazdagítsák az adattár rekordjait.
 
A régi metaadatok fejlesztése
 
A munkacsoport tagjai szerint jelentős lehetőségei vannak a metaadatok háttérrendszerben történő fejlesztésének: 
 
Komplex entitáskapcsolatok kezelése. A repozitóriumoknak állandó problémát jelentenek a szerzők neveinek és intézményi hovatartozásainak egyértelműsítése, különösen olyan kutatási eredmények esetében, amelyek több szerzőt is magukban foglalnak, akik más intézményekhez is tartozhatnak. Az MI-eszközök segíthetnek a nevek és az intézményi hovatartozások csoportosításában, javaslatokat tehetnek olyan állandó azonosítókra, mint az ORCID, az ISNI és a WorldCat Person Entities, valamint több kapcsolatot biztosíthatnak a szerzők, intézmények és kutatási eredmények között.
 
A régi adatok gazdagítása és javítása. A meglévő adattárakban számos felhalmozódott probléma lehet, például hiányzó adatok, következetlen metaadatok és szabványok, valamint a rendszerátállások és egyéb technológiai változások által okozott anomáliák. Az MI-eszközök segíthetnek az adattárak automatizált átvizsgálásában, hogy azonosítsák a hiányosságokat és az inkonzisztenciákat, és azokat automatikusan kijavítsák vagy felülvizsgálatra jelöljék . Emellett javaslatokat is tehetnek a hiányzó anyagok kiegészítésére, például absztraktok hozzáadására.
 
Közzétételi állapot nyomon követése. Az intézményi adattárakban található kutatási eredmények gyakran előzetes nyomtatványok vagy más anyagok, amelyek máshol hivatalos közzétételi folyamatban vannak. Az MI-eszközök automatikusan ellenőrizhetik a „nyomdában lévő” anyagok közzétételi állapotának változásait, és szükség szerint megfelelő módosításokat végezhetnek az adattárban található rekordokban.
 
Ez természetesen nem egy kimerítő lista a lehetőségekről, de rámutat az alapvető munkafolyamatbeli kihívásokra és működési problémákra, amelyeket az MI-eszközök potenciálisan megoldhatnak – különösen a hiányos vagy pontatlan metaadatokra, amelyeket a metaadatok létrehozását terhesnek tartó és mindenesetre valószínűleg nem jártas metaadat-szakemberek adnak meg. A rossz minőségű metaadatok negatív hatással vannak olyan tevékenységekre, mint a megfelelősségi jelentések, a kutatások hatásának értékelése és az intézményi kutatási eredmények megtalálhatósága. Az MI-eszközök segíthetnek a repozitóriumi adminisztrátoroknak abban, hogy a metaadatok kézi kezelésével töltött időt stratégiaibb, magasabb értékű tevékenységekre fordítsák.
 
Az MI stratégiai felhasználása az IR munkafolyamatokban
 
A megbeszélések során néhány alapelv is szóba került, amelyekkel maximalizálható az MI értéke az intézményi repozitóriumok munkafolyamataiban.
 
Fókusz az IR munkafolyamat elején: A megbeszélések során kiderült, hogy az IR munkafolyamatokban a legsikeresebb MI-megvalósítások a feltöltés folyamatának korai szakaszában történő beavatkozásra összpontosítanak. A hiányzó metaadatok pótlása vagy a pontatlanságok kijavítása a feltöltéskor hatékonyabb, mint a későbbi javítás.
 
Ez arra utal, hogy az MI integrációjának prioritásként kezelése a „front-end” folyamatokban, a „back-end” tisztítás helyett lehet az optimális megközelítés. Egy másik javaslat az MI támogatás zökkenőmentes integrációjának elősegítésére a tároló munkafolyamatokba az volt, hogy prioritást élvezzenek azok a folyamatok, amelyek kevesebb emberi felülvizsgálatot igényelnek.
 
Az MI által nyújtott hozzáadott érték kritikus értékelése: A viták során kiemelkedő téma volt, hogy az MI integrációja megköveteli annak előnyeinek alapos mérlegelését. Az MI valóban időt takarít meg, vagy csak áthelyezi a munkát a munkafolyamat más részeire? Sok azonosított probléma megoldható nem MI-alapú megközelítésekkel – például szkriptek használatávall, továbbfejlesztett rendszerfunkciókkal vagy a munkafolyamat átalakításával –, anélkül, hogy MI-technológiákra lenne szükség. Milyen minőségi küszöböt kell elérniük az MI-eszközöknek ahhoz, hogy egyenrangúak legyenek a meglévő metaadatokkal kapcsolatos gyakorlatokkal, például a hagyományos hatósági ellenőrzéssel vagy a kapcsolódó adatok módszereivel, vagy azokat felülmúlják?
 
Ezeknek a kérdéseknek a megválaszolása segít a munkatársaknak eldönteni, hogy az MI integráció valódi értéket jelent-e, és hogy a várható előnyök igazolják-e a bevezetés és használat költségeit.
 
Nyitott kérdések az MI-ről
 
A munkacsoport több, repozitóriumokkal kapcsolatos szempontot is felvetett. Az egyik a könyvtárnak a felhasználók által a feltöltés során létrehozott metaadatok módosítására vonatkozó jogkörének tisztázatlanságára vonatkozott, ami felveti a feltöltők az MI által generált tartalom feletti ellenőrzésének kérdését. Ezenkívül az MI-megoldásoknak figyelembe kell venniük az egyes dokumentumokhoz való hozzáférés korlátozásának szükségességét, például a potenciálisan szabadalmaztatható információkat tartalmazó doktori disszertációk esetében; ezek az anyagok például nem alkalmasak MI-modellek képzési adatainak felhasználására.
 
Számos egyéb kérdés is felmerült, többek között a továbbképzés és készségfejlesztés szükségessége, a szakmai készségek elvesztésével kapcsolatos aggodalmak, a minőségi metaadatok biztosításának fontossága, valamint az emberi szakértelem fenntartásának szükségessége.
 
A részleg több fontos tanulságot is azonosított az intézményi repozitóriumok közösségének jövőbeli fejlődése szempontjából:
 
A valós példák elengedhetetlenek. A közösségnek konkrét esettanulmányokra van szüksége, amelyek dokumentálják a tényleges munkafolyamatokat, és mérhető időmegtakarítást és jobb eredményeket mutatnak be, nem csak elméleti lehetőségeket.
 
A technikai útmutatásoknak hozzáférhetőnek kell lenniük. Az MI bevezetésének bevált gyakorlatait olyan nyelven kell közölni, amelyet a nem technikai metadatacsapatok is megértenek és alkalmazni tudnak.
 
Etikai keretrendszerekre van szükség. A közösség jelentősen profitálna az MI felelősségteljes használatára vonatkozó gyakorlati iránymutatásokból, amelyek kifejezetten a repozitóriumok metaadatainak létrehozására vannak szabva.
 
Fontos a stratégiai fókusz. Ahelyett, hogy kizárólag a hatékonyság érdekében alkalmaznák a mesterséges intelligenciát, a repozitóriumok vezetőinek az implementációkat egyértelmű stratégiai célokhoz kell igazítaniuk, például a keresés javításához és a kutatási intelligencia lehetővé tételéhez.
 
Következtetés
 
A megbeszélések legfontosabb tanulsága az volt, hogy az MI integrációjában kritikus szerepet játszik az emberi tényező. Ez magában foglalja az MI által generált tartalmak „emberi felügyeletének” fenntartását, valamint a repozitóriumok üzemeltetőinek szakmai fejlődési és munkával kapcsolatos elégedettségi igényeinek kielégítését. A repozitóriumok MI-stratégiáinak kidolgozása során egyensúlyt kell teremteni az MI-alapú automatizálás ígérete és az emberi közvetítés alapvető szerepe között a metaadatok létrehozása és kezelése terén.
 
Megjegyzés: Ahogyan az várható volt, az MI-technológiákat széles körben alkalmazták a projekt során. Különböző eszközöket – többek között a Copilot, a ChatGPT és a Claude programokat – használtak a jegyzetek, felvételek és átiratok összefoglalásához. Ezek hasznosak voltak a három alcsoportra vonatkozó betekintések összefoglalásához, azért, hogy gyorsan azonosítani tudják a blogbejegyzésben leírt átfogó témák típusait.
 
A kép forrása a cikk.
 
Share

További oldalak

 

Kapcsolat

Cím: 1016 Budapest, Szent György tér 4-6. (Budavári Palota F épület)
Postacím: 1276 Budapest, Pf. 1205

Tel: +36 1 224-3725

Corporate Site - This is a contributing Drupal Theme
Design by WeebPal.