2009. október 26., hétfő

Fejős László: Adalékok az ETO új kiadásához és konkordanciájához (folytatás)

A Könyvtári Intézet az ETO új kiadásához megvásárolta a UDC Consortium 2000. évi MRF-fájlját. Nagy mennyiségű változást látva benne , arról született döntés, hogy ehhez az állapothoz kell "felhozni" a magyar ETO-t. Költségkímélés okán az ezt követő évek adatbázisaira nem fizettünk elő, hiszen nem volt - s a körülmények miatt nem is lehetett - olyan szándék, hogy ezeket menet (vagyis a "2000-eshez igazítás") közben majd beépítjük.
A kiadásra kapott átfutási idő azonban lejárt, és 2005-ben, amikor elkészült a nyomdai kézirat és azt be kellett mutatni a konzorciumnak, illetve regisztrációs számot kérni a kiadáshoz, bizony mégis fizetnünk kellett. De ez nem volt haszontalan, hiszen utóbb szükség volt a teljes törlési/áthelyezési adatbázisra a konkordanciához, amit akkor visszamenőleg megkaptunk a 2001-2004 közötti időszak változásaival egyetemben.
Az előfizetés fejében a konzorcium megküldi az aktualizált mesterfájlt (MRF) és külön-külön fájlban az új, a módosított és a törölt/áthelyezett jelzetek iso*-állományát. A két előző információ a mesterfájl rekordjaiban is szerepel, a törölt jelzetek azonban nem kerülnek be az exportba, vagyis hiányoznak az adatbázisból. Ezért is okozott nagy örömöt, hogy a CD-n volt egy General ref 1994-2003 nevű mappa, amiből egyértelműen kinyerhetők lesznek a megszűnt jelzetek - gondoltuk nagy reménnyel. Az adatbázis indexelése után látszott, az első törlési dátum 1993 szeptembere, amikor 794 jelzetet töröltek, helyeztek át. Viszont gyanúra adott okot, hogy sem 1999-es, sem 2000-es adat nem volt benne. Az utóbbit tudtuk pótolni az előfizetéssel kapott iso-fájlból.
Az adatok további elemzéséből, összehasonlításából az derült ki, hogy csak a két adatbázis, az 1990-es saját és a 2000. évi MRF-fájl összefésülésekor kialakult állapotból lehet és kell kiindulni. Ekkor ugyanis kiestek az 1990-esek közül azok, amelyek nem voltak a 2000-esben, és (újként) bekerültek azok, amelyek nem voltak az 1990-esben. Az utóbbi tényre a 901-es mezőben látható évszám, a módosulásra pedig a 921-es mezőben lévő évszám utalt, a következő, 922-es mezőben megadva annak a mezőnek az azonosítóit, ahol a módosulás történt.
Kicsit olyan az 1992-es konzorciumi adatbázis létrehozásakor kialakult állapot, mint a kitalált középkor. Módosulási adataik ugyanis (természetes módon) csak a saját alapjukhoz mérten változások. Így aztán az a konkordancia-megelőlegezésnek szánt információ, amit a táblázatban elhelyeztünk (s amire eleddig nem volt példa), vagyis hogy a jelzet új (megadtuk a beléptetés dátumát), vagy revíziója volt, módosult (itt is megadtuk a dátumot), nem igazán mérvadó. Ennek alapján elkezdve a konkordanciakészítést, nagyon sok esetben kiderült, a jelzet nem új és nem is módosult a miénkhez képest.
A korábbi konkordanciákkal összehasonlítva szerettünk volna egyszerűbb, áttekinthetőbb, a konkordancia-eseteket tisztán megmutató és az adatbázisokban legnagyobbrészt automatikus átvezetésre, átjelzetelésre alkalmas konkordanciatáblát létrehozni.
A hagyományokból az új jelzetekre vonatkozóan átvettük azt az evidenciát, hogy nem érdemes terhelni velük a konkordanciát, hiszen új lehetőségként amúgy is kínálják magukat. A konkordancia alapja tehát: mi módosult (szűkült vagy bővült a jelzet tartalma), mi szűnt meg vagy került át új helyre. Erről kell számot adnunk.
Nézzünk előtte egy összehasonlító táblázatot a mennyiségi változásokról. (Időközben betekintésre, egy későbbi előfizetés reményében megkaptuk a 2006. évi MRF-fájlt is, így annak adatait is szerepeltetjük az összehasonlításban, hogy a felfedezni vélt tendenciára megerősítést nyerjünk.)
Játék a számokkal! Az új jelzetek száma 62 056-29 630 = 32426, ennyi az eltérés az 1990. és a 2000. évi jelzetmennyiség között. Igen ám, de a konzorcium jelentése szerint 1099 jelzet utód nélkül szűnt meg, s a későbbi egybevetésből meg kiderült, az 1990-es jelzeteink közül ténylegesen 4457 jelzetnek nincs utódja. Hogy az utóbbiakban mennyi az átfedés, már nem is volt értelme vizsgálni...

Nézzük közelebbről a túlsúlyba került segédtáblázatok változásait!A földrajzi, nyelvi és az általános ismérvek szerinti alosztások mennyisége nőtt szembetűnően. Eltűnt viszont a szempont szerinti pont-nulla-nullás speciális alosztás, amelynek pótlása külön gondot okoz, ugyanis a jelzetek helyettesítésére - szokatlan módon - főtáblázati jelzeteket alkottak az időközben kiürített 005-ös osztályban, de csak 2001-ben, így ezeket ebben a konkordanciában nem tudjuk ajánlani, hiszen az időszak vége 2000.
Az ETO ellenzői úgy vélekednek, hogy a viszonylag könnyen fellelhető főtáblázati számokkal kellene csak "megfogalmazni" a tartalmat. A segédtáblázatok használata a felhasználó számára befogadhatatlan, kezelhetetlen, főként a régebben korlátozottan közös, utóbb speciális alosztásnak nevezett segédtáblázatok esetében. Mégis azt látjuk az előbbi táblázatból, hogy a segédtáblázati jelzetek mennyisége exponenciálisan növekszik, vélhetően a jelzetalkotás rugalmasságának bővítése reményében. Ebből meg azt a következtetést kell levonnunk, hogy a számítógépes integrált rendszerek programozóinak fokozottan koncentrálniuk kellene a jelzetszerkesztéssel létrehozott összetett ETO-jelzetek elemzésére, értelmezésére, természetes nyelvre fordítására. Amire persze van indirekt válasz is a Köztauruszban:
Lássunk példát erre!
A magyarországi felsőoktatás 2007. évi évkönyve angol nyelven
ETO-jelzetekkel kifejezve:
az 1990-es ETO alapján: 378(439)"2007"(058)=20
a 2000-es ETO alapján: 378(439)"2007"(058)=111
Az időalosztás értelemszerű, itt: "2007". A (058) formai alosztás helyett a tezaurusz főtáblázati számot tartalmaz az évkönyvre, s az angol nyelv bizony még a régi...
A tezauruszból vett példákból látható, hogy egy összetett fogalom hiba nélkül összeállítható elemeiből, ha háttéradatbázisból dolgozhatunk. Az a baj, hogy pl. a tezaurusz teljes mélységű, a magyar szabvány szerinti relációk szerinti megjelenítésére és kezelésére, sajnos, csak kevés Magyarországon honos könyvtári program képes.
Látszólag eltértünk tárgyunktól, de hitem szerint mégsem. Ugyanis csak úgy lehet rugalmasan, viszonylag könnyen (de emberi beavatkozás, mérlegelés, minősítés nélkül valószínűen sohasem, ám most biztosan nem) átállni az új jelzetrendszerre, ha az integrált rendszer kellő mélységben ismeri az ETO-jelzetek szerkezetét. Az pedig jegyei alapján könnyen felismerhető, azonosítható. (Hála Dewey jövőbe látó bölcsességének!)A tezauruszban az elemek:


A konkordancia

Több nekifutás, a minél kisebb hibaarány érdekében végzett elemzés, a gyors, automatizálható megoldások reményének elvesztése után alakult ki az a stratégia, ami alapján végül is készül az 1990-es és a 2000-es ETO közti megfeleltetés, vagyis konkordancia. Ez pedig szövegelemzésen alapuló egybevetés.
Az adatbázisba importáltuk a konzorcium megszűnt, áthelyezett jelzeteket tartalmazó rekordjait (I.), mögé tettük az 1990-es kiadás jelzetrekordjait (II.), végül importáltuk a 2000-es kiadás jelzetrekordjait (III.). Az elemzés alapja természetesen az adatbázis magja, az 1990-es kiadás jelzetállománya (II.) volt.
1) Az első összehasonlításban kiestek azok a rekordok, amelyekben a jelzet és feloldása II-ben és III-ban karakterre megegyezett.
2) Ezt követte az adatbázison (I) alapuló "utódkeresés". (Amit természetesen egyenként ellenőrizni kell.)
3) Az utolsó "fordulóban" jegyeződtek be a NJS1990-es, vagyis a nem jelzett sorsú 1990-es jelzetek, amelyek utódjául a kiváló Pascal-programozó Tar Katalin munkája nyomán szövegelemzéssel kerültek be javaslatok az utódlásra. Azt azonban, hogy ezek jók vagy sem, csak egyenkénti áttekintéssel, ellenőrzéssel lehet és kell eldönteni.
Ebbe a jegyzékbe nagyjából 17 500 jelzet került, s hozzájuk átlagban három javaslat 1700 oldalon. Köztük vannak a nem jelzett sorsúak, ezeknek "utódot" kell keresni... (A Korán például nem eshet ki az ETO-ból, mert abból akár világfeszültség is következhet, márpedig most nincs önálló jelzete.) Kiesett a rabszolgaság, a földesúr, a hűbériség stb. amelyek ma valóban "nem aktuálisak", de történetiségükben létező és használt fogalmak, vagyis nem halhatnak el...
Ki nem fejezhető hálám Haralyi Krisztina kolléganőmnek, aki piros bejegyzéseimet kékre váltva egyengeti, s ezek mellé Barátné Hajdu Ágnes zöldje is megjelenik majd a munkapéldányban, vagyis három szintű az ellenőrzés.

A konkordanciatáblázat

Mint már szó esett róla, a konkordanciatáblát a lehető legjobban áttekinthető módon szerettük volna kialakítani, mellőzve minden külön értelmezendő helyzetet.

Konkordanciaféleségek:
a) Az A oszlopban szereplő jelzettel valami történt.
b) A B oszlopban az 1990-es táblázatbeli jelzetfeloldás olvasható.
c) Ha a C oszlop nem üres, a régi jelzet helyét új jelzetértelmezés, új fogalom foglalta el (1. példa).
d) A D oszlop a jelzet-átirányításokat mutatja (1-2. példa).
a à jel továbbosztást is jelenthet (3. példa),
a H. h. képzett jelzetet ajánl a régi főtáblázati szám helyett (4. példa),
a H. t. jelzi, hogy a régi táblázatban szereplő képzett jelzet változatlanul használható (6. példa).
e) Az E oszlopban az érvényben maradt régi jelzet értelmezési módosulását, vagy a régi jelzet új helyén használatos értelmezését látjuk (1., 2., 3., 5. és 7. példa). (Helyenként a konkordanciakészítéskor beszúrt helyesbítést láthatunk, mint a 7. példánál.)Alapelv: azokat a jelzeteket, amelyeket (feltételezés szerint!) dokumentumfeltárásra használtak már, pótolni kell, természetesen nem új jelzet létrehozásával, hanem a meglévők bevonásával, esetleg jelzetszerkesztéssel (példa erre az új táblázatból ésszerűsítési és rövidítési szándék okán kimaradt magyar hegységek beillesztése a konkordanciába névalosztással). Persze lehetnek még "felfedezéseink", a munka most nagyjából a kétharmadánál tart.

Az ETO és a szakrendi tárolás

Minden tisztelet a nemes elődöké - nagyjából ezt summázza immár szinte négy évtizede minden új kiadású raktározási táblázat előszava, s ez természetesen nem is vitatható. Az már inkább, hogy e tisztelet, még ha Sallai Istvánnak szól is, nem tarthatja tovább változatlanságban a raktározási táblázatot.
Mégse járja, hogy négy évtizede olyannyira eltávolodott egymástól az ETO és a szakrendi tárolás, hogy ma már azt lehet tanítani róla: semmi közük egymáshoz. (Leszámítva azt az apróságot, hogy természetesen az aktuális ETO-ból csoportképzéssel lesznek raktári jelzetek.)


Az új raktározási táblázat megalkotásához országos, felsőoktatási, megyei, városi, iskolai stb. könyvtáraktól kértünk közreműködőket, véleményezőket, hogy lehetőség szerint minél több könyvtártípus képviselői határozzák meg az új, ajánlott raktározási rend jelzetrendszerét.
A munkapéldányként kiküldött anyag (l. az Excel-táblát) nem erőszakosan, de sugallta a változtatás igényét. A beérkező javaslatok többsége ezt vissza is igazolta. Ebben a szellemben, a konkordanciával párhuzamosan készül az új raktározási táblázat, legalább négy könyvtártípus igényeit figyelembe véve. Köztük azokét is, amelyek nem akarnak változtatni, hiszen a táblázat A és B oszlopa is bekerül az új kiadásba.)
A gépi rendszerek számára a konkordanciát iso-, XML vagy tagolt szövegfájlban, a raktározási táblát a két utóbbiban tudjuk majd szolgáltatni.

* ISO 2709 sz. szabvány szerinti bibliográfiai adatcsere-formátum.

Forrás: Könyv, Könyvtár, Könyvtáros 2008. április Fejős László: Adalékok az ETO új kiadásához és konkordanciájához

Fejős László: Adalékok az ETO új kiadásához és konkordanciájához

Ha nem tudod megmondani, hogy a szomszéd szobából az elmúlt öt éven belül mikor ment nyugdíjba a kollégád, sürgősen írd le azt, amire még emlékszel szakmai múltadból s amiről vannak feljegyzéseid a fontosnak tartott dolgokból. Főként, ha selejtezni kényszerülsz.
És ha emlékezeted megcsal, meg feljegyzéseid is foghíjasak, az égiek elnézik majd neked. (A földiek is később...) (F. L.)

A tisztánlátás érdekében és az ETO-munkálatok felróható késlekedése magyarázatául (de semmiképp szerecsenmosdatásként) feltétlenül szükséges néhány tényt rögzíteni. Nem csak az ETO FID által működtetett rendszere omlott össze az 1990-es évek elején, aminek természetesen korszakos hatásai voltak a magyar ETO-kiadásra. Amikor a Könyvtári Intézet még KMK-ként (Könyvtártudományi és Módszertani Központként) működött, a két legfontosabb dokumentumfeldolgozási területnek, a formai és a tartalmi feltárásnak - mint a dokumentum-hozzáférés bástyáinak - referensei voltak az intézetben, akik főállásban csak ezzel foglalkoztak. Jött a rendszerváltozás, érdekes módon nemcsak társadalmi, gazdasági, hanem esetenként szakmai is, az utóbbi feltűnésmentes átstrukturálódással. Ami a formai feltárást illeti, ebben nem volt katartikus változás, a tartalminak viszont személyi következményei lettek.
Fontos megemlíteni, mert kapcsolódik témánkhoz, hogy ebben az időszakban vonult be a könyvtári számítógép-alkalmazásba a személyi számítógép, felváltva a mikroszámítógép-alkalmazás nálunk eufórikus időszakát. (Csak a tárolási lehetőségek léptékváltását érzékeltetendő: a 165 ezer bájtos - ugyanennyi betűnyi - hajlékonylemez helyett a PC-ket már 10-30 megabájtnyi (10-30 millió betűnyi tárolóképességű) merevlemezzel szerelték fel, ami mai léptékeinkez mérve mosolyogtató, akkor korszakosnak tűnő volt, 60-180-szoros tárolási helybővülést jelentett. Ha még a memóriaváltást is mellévesszük: a mikrogépek - pl. a Commodore 64 - munkára fogható memóriája 26 kilobájtról majd' nyolc megabájtra, vagyis 320-szorosára változott alapkiépítésű PC-nél is... A külföldi példák nyomán markánsan kirajzolódott az integrált könyvtári rendszerek jövőbeli képe, s ebben az időszakban alkalom volt rá, hogy a magyar könyvtári számítógépesítés részére megfogalmazódhassanak azok az elvek, amelyek máig hatóan rögzíthették volna a könyvtárgépesítés pilléreit (szabványos adatszerkezet, egységes karakterkészlet, a tartalmi feltárás tisztességes megoldása a feldolgozás támogatására). Kell, hogy beszéljünk róla: készült ilyen előterjesztés a KMK-ban, amelynek "megüzenős" válasza a Könyvtári Levelező/lapban jelent meg a vezércikk tekintélyével: "nem kell az egypártügyi könyvtárrendszer".
Talán az ETO-gondozás ügye is ennek vált áldozatává, vélvén: ezt se kényszerítsük senkire.
Hogyan is hihette akkoriban az OMFB (Országos Műszaki Fejlesztési Bizottság) naiv főosztályvezetője, hogy a "cége" által kiírt 100 millió forint pályázati összeget könyvtáraink majd hajlandóak lesznek egy-egy nagyobb lendületet adó, összefogással megfogalmazott célra igényelni, ha egy országos értekezleten vezetőik lelkére (eszére?) hat. Ehelyett a pálya szélére küldték azt az egyébként az akadémiai szférában működő és a hazai könyvtárgépesítésben úttörő szerepet vállalt kft-t, amely a központi adatszolgáltatás megalapozásának ígéretével, CD-re összegyűjtött, akkori katalógusrekordok hozzáférhetővé tétele az akkoriban még ritkaságszámba menő CD-ROM-olvasók tömeges szétosztásával a könyvtárak között - legalább városi könyvtár szintig és további központi feldolgozás finanszírozása a pályázati összegből stb. Azzal vádolták meg, hogy saját túlélésére akarja átjátszani a könyvtáraknak szánt összeget. Az abban az időben (az 1990-es évek elején!) nagy összegnek számító százmilliót így aztán több ezer felé osztva sikerült szétforgácsolni, hogy nyoma se maradt annak, ami valaha is lett volna...
Visszatérve fő témánkhoz: 1990-91-ben Babiczky Béla és Schneller Károly szerkesztésében jelent meg az utolsó előtti magyar ETO- (tévesen rövidítettként jelölt, ténylegesen közép-) kiadása, amely "adatbázis-kimenetből" készült. 1991 nyarán Rónai Tamás, a KMK ETO-referense, aki a KMK-OMIKK közös kiadású ETO-kiadás koordinátora volt, próbálkozott a számítógépes jelzet- és mutatórekordok begyűjtésével, igyekezetének eredménye a karakterkonverzióval használhatóvá tehető mutató lett, a táblázati rész a Fényszedő Központ Kft. olasz kiadványszerkesztője átalakításában adatbázis számára kinyerhetetlenné vált. Jómagam megpróbáltam az OMIKK-tól "szélnek eresztett" csoport tagjaitól az adatbázis esetleg megmaradt részeit összegyűjteni, egy kuriózumként kezelhető részleten túl eredménytelenül.
A FID (amely 2001. március 31-ével szűnt meg) 1992-ben átadta az ETO-kiadások tulajdonosi jogát a (nonprofit szervezetként működő, hágai székhelyű) UDC Consortiumnak, amely a nemzeti középkiadásokból válogatva egy teljes "kiadásnak" tekintett jelzetállományú adatbázist hozott létre. Ehhez a mi jelzeteinkből jóval később nagy terjedelemben emeltek át, saját kiadásunkban utóbb félreértéseket okozva ezzel.
Felismerve a nemzetközi ETO-fejlesztés megváltozott körülményeit, Rónai Tamás a magyarországi ETO-kiadások gondozását egy többé-kevésbé szervezettől független iroda keretein belül képzelte el, aminek létjogosultságát az ETO sorsának megvitatására az OSZK-MKE által összehívott országos értekezlet (1993. november 26.) résztvevői nem vitatták, ám finanszírozója nem akadt. Ezen az értekezleten felsőoktatási, az országos feladatkörű és megyei könyvtárak képviselői (igazgatói) vettek részt. A száz meginvitált könyvtárnak kiküldött kérdőívből 32 érkezett vissza (jó arány!). A kérdések a következők voltak (zárójelben a rájuk adott igen válaszok):
Csatlakozik-e a hazai ETO-fejlesztéshez? (32);
Egyetért-e ETO-iroda létrehozásával? (31);
Anyagilag támogatná-e az ETO-gondozást? (12).Az értekezlet nyomán 1993 decemberében NKA-pályázat készült ETO-iroda létrehozására. Létjogosultságát főként azzal indokolták, hogy a statisztikai felmérések szerint 1991-ben a 8000-nyi könyvtári szolgáltató hely 90 százaléka (7200) használta az ETO-t, ez komoly érv volt (lehetett volna) a támogatás mellett. A pályázatban támogatást kértek az MRF-adatbázis évenként megvásárlásához (kb. negyedmillió forint évente), továbbá irodai eszközök (számítógép stb.) beszerzésére. Az OSZK vállalta magára az irodavezető és az adminisztrátor bérét, helyiséget kínált és ennek közüzemi díjfizetését, továbbá a dologi kiadásokat (posta, kiszállás stb.), valamint a működés és a gazdálkodás felügyeletét.
A pályázat nem nyert támogatást.
Az intézeten belül az Oktatási és módszertani osztályhoz tartozott a szakterület, az osztály akkori vezetője, Csapó Edit igyekezett napirenden tartani az ETO-val kapcsolatos teendőket, amelynek az előbb említetten túli előzménye volt az a minta az MRF-adatbázisból, amelyet a konzorcium eljuttatott az intézményhez, amelyből (a 622-es osztály kapott 172 jelzetnyi mintaanyagából) Rónai Tamás kérésére adatbázisszeletkét definiáltam a tanulmányozáshoz, mégpedig abban a programban, amit a konzorcium is használt az adatbázis-építéshez: MicroIsisben. Mindez csak arra volt jó, hogy belekóstoljunk az ETO számítógépes kezelésének világába, a mezőket nem is neveztük meg, csak rendszerazonosítókat használtunk:

1994 nyarán elkészült az 1990-es kiadás adatbázisba rögzítéséhez szükséges adatbázis-generálás MikroIsisben. Ez papírkiadás-centrikus volt, csak némileg (mezőazonosítókban egyáltalán nem) követte a konzorcium MRF-adatszerkezetét.
Rónai Tamás utolsó próbálkozása volt az a kérdőív, amellyel a könyvtárak ETO-fejlesztésben való készségét mérte fel.
A csekély aktivitás, a megálmodott ETO-iroda esélytelensége vagy más egzisztenciális tényező volt-e az oka, nem tudni - Rónai Tamás megvált az intézettől, szakreferensi helyét nem töltötték be, ezt követően nem volt referense az ETO-nak, s talán azt is kijelenthetjük, képviselete sem a könyvtári szabványosításban.
Kérem, ne tekintsék személyem szerénytelen előtérbe állításának, ha jelzem, ettől az időtől kezdve, de hangsúlyozottan adatbázis-kezelési szinten kerültem kapcsolatba az ETO sorsával. Akkor, 1996-ban kézenfekvő volt, hogy az ETO-gondozásra létrejött UDC Consortium munkamódszeréhez igazodva, ahol is egy ún. MRF-fájlba írták át a nemzeti kiadások alapján összeállított, teljesnek tekintett szakrendi táblázatokat, a magyar ETO-t is adatbázisba kellett rögzíteni.
Pályáztunk, s nyertünk egymillió forintot. Ebből rekonstruáltuk az 1990-es ETO-táblázat adatbázisát (újrarögzítéssel), az adatok mozgatását megkönnyítendő vásároltunk egy mai szemmel nézve szerény teljesítményű notebookot (30 megabájt winchester, 8 megabájt memória), megvásároltuk az 1997-es, majd az 1998-as MRF-adatbázist, valamint finanszírozni tudtuk néhány évig külső munkatársi munkaszerződéssel a honosítási munkát, ami sajnos, elég lassan haladt. Ez utóbbinak nemcsak az szolgált magyarázatául, hogy a magyar kiadásban nem szereplő jelzetek szöveganyagát fordítani kellett angolból, hanem az is, hogy a magyar ETO-fejlesztés hagyományai szerint a honosítás némi átszerkesztéssel, egyes jelzetek továbbosztásával, mások összébbhúzásával készült, ami értelemszerűen lassította a munkát.
A kialakított adatszerkezet, amely - mint említettem - a leendő papírkiadás későbbi szerkesztési munkáinak megkönnyítését szolgálva eltért a konzorcium által használttól, s a jelzethierarchiát tükrözte, de már voltak azzal közös, technikai adatokat tároló mezői:

1996 ősze és 1997 áprilisa között elkészült az adatbázis, a nyelvi alosztás nélkül, mert abban annyi volt a változás, hogy úgy tűnt, nem érdemes rögzíteni, viszont a jelzetek mellé fűztük a megmentett mutatóállományt, amelyben értékes szerkesztési munka állt. (Akkor még nem gondoltuk, hogy az eredeti adatbázishoz kell majd jelzetről-jelzetre visszanyúlnunk, amikor majd a konkordanciához a jelzetek utódait keressük, s ehhez az eredeti nyelvi alosztások kellenek majd, de utólag pótoltuk.)
A honosított, szerkesztett változaton dolgozó Barátné Hajdu Ágnes kemény munkát végzett. Az alapanyag az 1990-es adatbázis volt, ezt építgette kétablakos képernyőn a konzorciumtól megvásárolt 1997-es, majd 1998-as adatbázis angol nyelvű rekordjaiból átemeltekkel, amiket eközben magyarra fordított, és a hierarchiát, a továbbosztást is bővítette vagy szűkítette a meghonosodott szerkesztési elvek szerint.
Közben 1997 októberére a KMK összehívta az alkalmazói tanács ülését, amelynek napirendjén az ETO-fejlesztés, -honosítás kérdései és az új raktározási tábla (alap az 1977-es ETO-kiadás) álltak. A létrejött munkabizottság ténykedése révén 1999-ben megjelent az új raktározási táblázat, amelyben nem következett be lényeges változás, vagyis konzerválta az akkor harminc éve kövült állapotot, hogy az ETO és a szakrendi raktározás közel sincsenek szinkronban.
Természetesnek kell elfogadnunk, hogy a munka lassan haladt, a pénz is elfogyott. Újra pályáztunk, s jó ajánlóink voltak: Babiczky Béla tanár úr, aki változatlan lelkesedéssel állt a hazai ETO-gondozás mellé, és Vajda Erik, aki még ekkor is kardoskodott az ETO-iroda létrehozása mellett, és hivatalos támogató szakvéleménye mellé egy magánajánlást is mellékelt (1998. február 2.) Ennek lényege, hogy

- a honosítás nem lehet egy ember feladata, ehhez szélesebb körű szakmai munkabizottságra van szükség,
- az MRF adatbázist azzal teljesen megegyező hiteles magyar ETO-adatbázisként kell létrehozni és hozzáférhetővé tenni,
- végül pedig az ennél részletesebb felosztásokat használók által létrehozott jelzeteket begyűjtve és a hivataloshoz illesztve lehetne egy mélyebb szakozás mindenki által hozzáférhető adatbázisát is ki kellene alakítani.

Pályázatunkat nem fogadták el, támogatás később sem érkezett. Pénz híján a munka tétován haladt tovább, majd leállt. Barátné Hajdu Ágnes keze alól kikerült egy (kéziratban maradt) módszertani füzet.
A felvetődött súlyos szakmai kérdésekre 1999 novemberében magától a szakmától akartunk választ kapni, mégpedig a könyvtárosok levelezőlistáján, a Katalisten (a kor akkori szintjének megfelelően ékezetek nélküli levélben), ennek egyetlen témája: Kell-e az ETO gepi adatbazisa?

A kérdésre néhány, az ETO-t ellenző, ám sokkal több, a további munkára bátorító levél érkezett a listára, közülük Ungváry Rudolf hosszú elemzéséből egy immár klasszikussá vált idézetet másolok ide: "Az ETO szép. Szép, mint minden, ami szervesen, emberek ezreinek hozzáértő, évszázados közreműködésével született. Az ETO mára a magyar szakmai kultúra közkincse lett. Az évezred első évtizedében fog eldőlni, hogy a jelenlegi igazgatás hogyan vonul be a magyar kultúrtörténetbe: mint akik elpocsékoltak vagy megmentettek valamit."
A vélemények szerkesztett változata megjelent a 3K-ban, (Könyv, Könyvtár, Könyvtáros, 2000. 3. sz., 23-40. p.), ennek pozitív záradéka volt: 2000. február 18-án a nemzeti könyvtár főigazgatója, Monok István az ETO-korszerűsítésben részt vevő munkatársakkal folytatott munkamegbeszélésen arra tett ígéretet, hogy az OSZK saját költségvetéséből fedezi a munka 2000 szeptemberére várható befejezésének, az MRF-adatbázis-frissítés előfizetésének és az 1999-2000. évi változások december végéig befejeződő átvezetésének költségeit.
A határidő teljesítésére, sajnos, nem látszott esély, ami azt bizonyította, hogy ez tényleg nem lehet egyszemélyes feladat...
Közben a nevet változtatott intézet (KMK-ból Könyvtári Intézet lett) viszonylag rövid idő alatt második vezetőváltásán esett túl. Az új igazgató, Dippold Péter is elővette az ETO ügyét. Arra a megállapodásra jutottunk, hogy Vajda Erik javaslatát felélesztve új alapokra helyezzük a honosítás elvét. Bármily fájdalmas volt is elveszíteni a közel három évnyi munkát, amellyel az 1977-1998-as MRF alapján átszerkesztésekkel az 58-as osztály végéig sikerült aktualizálni a jelzetállományt, 2000 nyarán fontos döntés született.
Áttekintve az ETO-honosítás készültségi szintjét, a Könyvtári Intézet akkori vezetősége meglepő döntést hozott. Időlegesen leállíttatta az átvezetési munkákat azzal, hogy új finanszírozási forrás bevonása után az ne átszerkesztéssel, hanem az eredeti konzorciumi adatbázis teljes jelzettartományának változtatás nélküli átvételével és fordításával készüljön. A döntés hátterében az állt, hogy egyértelművé vált: az "egyszerű" honosítás szintű ETO-gondozás finanszírozása sem lesz könnyen megoldható a későbbiekben, ráadásul az átszerkesztés sajátosan egyedivé teszi a magyar ETO-t, a konzorciumi változások átvétele viszont nem igényli rendszeresen szakterületi szakértők bevonását. Az ETO szerkezetében bekövetkezett nagy arányú változásokhoz képest a magyar ETO állapota nem ígérte a gyors befejezést, miközben kiderült, 2000-ben is további tetemes módosulás történt az alapnak tekintett UDC MRF adatbázisban.
Nem szeretném az ezt követő, az ETO-kötetek megjelenéséig, vagyis 2006 májusáig tartó időszakot évek szerint, legfeljebb a munkamenet tagolásában felidézni.
Első lépés volt, hogy folytatásként az 59-es osztálytól a táblázat végéig készüljön el az MRF-adatbázishoz igazítás a fogalom-meghatározás szintjéig.
Az OSZK támogatást kapott a (tulajdonképpen nemzeti) tezaurusz létrehozásához, s ebben az egyik nagyon fontos, a tartalmi feltárás eszköztárát kiemelkedően gazdagító döntés is benne volt: a lexikai egységek mellé kerüljön be az ETO-jelzet és ennek minden szerkesztett mutatóeleme. Az 1990-es KMK-OMIKK kiadásából megmentett és használhatóvá tett, értékes szerkesztési munkát őrző mutatókat időközben hozzáfűztük a jelzetek rekordjaihoz. Egészen természetes, hogy az alapadatbázisban sem tartozott valamennyi jelzethez mutató, hiszen ennek nem célja minden jelzet tükröztetése, az újonnan beemelt jelzetekhez meg nyilvánvalóan nem készültek ilyenek, hiszen csak egyetlen mezőt fordítottunk ebben a "menetben". Mindenesetre jótékony volt a pályázati határidő, sikerült is teljesíteni, és nem okozott gondot, hogy a mutatók helyett akkor a lefordított jelzetfeloldási mezőket adtuk.
A következő lépésként a 2000. évi MRF-adatbázist fűztük hozzá ETO-adatbázisunkhoz, aminek következtében kiestek belőle a már nem érvényes jelzetek és beépült számos új.
Összehasonlításul: az 1990-es jelzetmennyiség 29 766 volt, a 2000. évivel ez a szám 62 056-ra nőtt. A rekordokat ez időtől kezdve kétnyelvűként kezeltük, s ma is kétnyelvűek. A rekordszerkezetben a mezőnév utáni a szám a mezőazonosító, köztük az esetleges almező-azonosítókkal, a második a definiált maximális hosszúság, aminek a Winisisben már nincs oly nagy jelentősége, a harmadikban a 0 azt jelenti, hogy betű és szám is lehet, az egyes (mint a jelzet) csak szám, a negyedik, hogy ismételhető-e, ha 0: nem, ha 1: igen.

A feladat pedig a további adatbázismezők (alkalmazási példák, magyarázatok stb.) lefordítása volt. Ez több menetben zajlott.
A fordítások nagy részét ugyanaz a (megbízható helyről ajánlott) szakfordító-szakozó könyvtáros házaspár készítette, ugyanők a megnevezés mezőt is fordították.
Ezt követően szakterületekre bontva könyvtári szakemberek vették gondozásba a rekordokat, majd a lektorálás következett.
Minden munkafolyamat a számítógépes adatbázisban zajlott.
Igazi távmunka volt ez! Egyeztető megbeszéléssel indult, ahol a szándék szerint minden apró részletre kiterjedő írásos útmutatót, egy Winisis programot a teljes ETO-MRF összefésült adatbázissal kaptak kézhez a külső munkatársak, hogy ne csak vállalt szakterületüket, hanem a teljes rendszert lássák. Az elektronikus levelezés meg olykor este 11 körüli telefonok voltak kommunikációs csatornáink. Mindez a szerepvállalás személyességét is jelezte.
A kész munkák szeletenként érkeztek vissza, ezekből épült fel újra az adatbázis, immár a honosított magyar ETO-adatbázisként (miközben persze voltak apró izgalmak elveszettnek vagy többletnek látszó jelzetrekordok miatt).
Nem tudom, valaha is volt-e rá példa, hogy a különböző szakok gondozásába az egyes területeknek a szakmában dolgozó szakértőit vonták volna be, most törekvés volt, hogy a könyvtáros munkatársak úgy vállalják el a területek gondozását, hogy ha szükségét érzik, maguk vonnak be ilyen szakembereket.
Az első forduló tehát a jelzetrekordok minden szöveges mezőjének fordítása volt.
A másodikban (miközben eltelt némi idő, hiszen pénzügyi forrást kellett találni a finanszírozásra, s ezt végül a Könyvtári Intézet saját lehetőségeinek átcsoportosításával oldotta meg) ezek lektorálása történt meg, lehetőség szerint úgy, hogy senki se önmagát ellenőrizze.
A harmadik fázis a már véglegesnek tekinthető adatbázisból a nyomtatott kimenet volt a kiadványszerkesztés számára. A kiadás előtti utolsó munkamenet tehát a korrektúra volt, lett volna, ha bizonyos szakterületeken nem ugrott volna vissza a lektorálás, vagy hogy azt ne mondjuk, a jelzetstruktúra újraszerkesztésének szintjére.
Az adatbázisból kinyert, megjelenítendő jelzetelemek kiadványba szerkesztésére a Könyvtári Intézet a szegedi Scriptum Informatika Rt.-vel kötött szerződést. Ez a cég számos saját fejlesztésű szövegellenőrzőt is "bevetett" a nyers szöveganyag szűrésére. A nyomdai kéziratba ennek ellenére és minden korábbi gondos ellenőrzés dacára a korrektúra során nagyon sok javítás került, ami nem fért bele a céggel kötött szerződés anyagi keretébe, ezért a nyomdai előkészítés befejező munkálataira és a mutató teljes tördelésére, nyomdai előkészítésére a Könyvtári Intézetben került sor - könyvtáros, legalábbis a korrektúra átvezetésében megfizethető külső munkatársak bevonásával.

*

Mint ennek a tíz évnyi, 1996-2006 közötti időszaknak az ETO-gondozásban akarva-akaratlanul (igazán belecsöppenve) szerepet vállalt "vezénylő" szereplője megköszönöm "külső munkatársaim" lelkes közreműködését, támogatását, tanácsait. Sokan közülük a feladatot sokszorosan túlteljesítve igyekeztek a legjobb megoldásokat megtalálni, s azt sem akarom elhallgatni, néhányan szakmai múltjukhoz, tekintélyükhöz képest bizony nemcsak felületesek voltak, de kifejezetten gyengén teljesítettek, amint a biztonsági okból beépített többszörös ellenőrzés ezt bizonyította.
Köszönöm mindenkori vezetőimnek is az elnéző türelmet és bátorítást, amellyel a sokszor kilátástalan helyzetekben mellettem álltak.

*

A 62 056 jelzet táblázati része két kötetben, 843+554 oldalon, mutatója 843 oldalon jelent meg 2006 májusának végén.
Az ETO nem szabvány. A teljes kiadás füzeteit mint szabványokat a Szabványügyi Hivatal 2001. október 1-jei hatállyal visszavonta, az 1990-es ETO-t pedig eleve szabványmegjelölés nélkül adták ki.
Az új kiadás a UDC Consortium engedélyével és publikációs számával jelent meg. Mint egy szakma közmegegyezésen alapuló osztályozó rendszere mégis szakmai szabványnak tekintendő.
A magyar változatban közreműködők és a közreadó tisztában vannak azzal, hogy az elvégzett munka minden igyekezetük ellenére sem lehet hiba nélküli. Noha kívánatos lett volna, lehetetlen volt ezzel egy időben közreadni a konkordanciajegyzéket, amelynek megjelentetése a nagy tömegű változás miatt rendkívül fontos és sürgős. "Előlegként" a táblázati részben minden új jelzet után Új jelzet! Bevezetés: ... megjegyzés jelzi, ha a jelzet új, és megadja a bevezetés, illetve az utolsó módosítás dátumát is. A lázas munka közben nem tűnt fel, mert nem volt idő az ellenőrzésére, ezek gyakran fals adatok. Sok így jelzett ETO-szám ugyanis se nem új, se nem módosított a mi 1990-es kiadásunkhoz képest, hiszen ezeket változtatás nélkül tőlünk vették át a nemzetközi kiadásba. Erre pedig legyünk büszkék.
A konkordanciajegyzék (sajnálatosan még mindig) készülőben van. Elveiről, szempontjairól, a minél inkább automatizálható átjelzetelési lehetőségekről a folytatásban olvashatnak majd a következő számban.


Forrás: Könyv, Könyvtár, Könyvtáros 2008. március Fejős László: Adalékok az ETO új kiadásához és konkordanciájához