2009. június 9., kedd

Válas György: A visszakeresés öt eszköze között kell lennie az ETO-nak!

Vajda Erik tartalmas és részletes hozzászólása a "kell-e ETO?" kérdést "milyen keresőeszközök kellenek?" kérdéssé szélesítette. Az általa leírtakkal többségükben egyetértek, részletekben nem mindennel.

Nem csekély számítógépes információkeresési tapasztalatom alapján az a véleményem, hogy az eredményes és hatékony számítógépes információkereséshez (és az OPAC elterjedése óta a kutya közönséges katalóguskeresés is ide tartozik) 5 eszköz párhuzamos használati lehetőségére van szükség. Lehetőségére, mert (mint Erik is írta) azt a konkrét keresésben konkrétan kell eldönteni, hogy az öt eszköz közül melyiket vagy melyek kombinációját használjuk. Ezek a következők:

1) tezaurusz;

2) "szabad" tárgyszavas keresés;

3) hierarchikus osztályozási rendszer;

4) speciális adatmezők kötött formátumú keresése;

5) szabad szöveges keresés.

Véleményem szerint ezeket az eszközöket szinte optimálisan nyújtja az INSPEC adatbázis egy jól körülhatárolt tématerületen. Olyan megvalósítása azonban, amely az ETO-hoz hasonlóan az ismeretek teljes körére kiterjedni törekedne, nincs, és alig is képzelhető el. Ennek a teljes keresési eszköztárnak a megvalósítása inkább csak aszimptotikusan közelíthető célként értelmezhető.

Járjuk sorra az öt eszközt!

A tezaurusz szükségességéhez nem férhet kétség. A szinonimák csapdájának elkerüléséhez, a pongyolaságból eredő veszteségek kiküszöböléséhez és sok más keresési probléma megoldásához ez a legjobb eszköz. Jó tezauruszt azonban csak korlátozott tématerülethez lehet készíteni. Az általános igényű tezauruszok (pl. ROOT) annyira felületesek, hiányosak, hogy épp a keresésre nem használhatók. A különféle területekre készült tezauruszok viszont nem egyesíthetők szupertezaurusszá, egyebek mellett azért nem, mert épp az egyik legfőbb cél, a szinonimák kiküszöbölése szenved csorbát egy ilyen egyesítéskor.

A "szabad" tárgyszavak jegyzéke a tezaurusz mellett sem szólható le, a tezaurusz mellett is megvan a maga helye. Szükségességének három fő szempontja: Beleférnek olyanjellemző kifejezések, amelyek a tezauruszba nem préselhetők bele, például a földrajzi nevek.

Belekerülhetnek a dokumentumok feldolgozása során olyan új fogalmak, amelyek még nem jutottak el a szükségképpen lassabban változó tezauruszig, és amelyek a tudomány és egyéb kulturális területek gyors fejlődése során tömegével keletkeznek.

Belekerülhetnek a témát szűkítő olyan speciális kifejezések, amelyek túlságosan részletfogalmak a tezaurusz számára, de nagyon jellemzőek a dokumentumok egy szűk körére. Mindemellett ráadásul a "szabad" tárgyszavak jegyzéke a tezauruszfejlesztő legfontosabb forrása. Talán ide sorolható a keresés azokban a speciális adatmezőkben is, amelyek formátuma nem kötött, de a kitöltésük besorolási állomány (authority file) alapján történik, mint a katalógusban a szerző vagy a kiadó szerinti keresés. A tezauruszos kereséshez ez nem hasonlítható, mert hiányoznak a tárgyszavak horizontális és vertikális kapcsolatai.

A hierarchikus osztályozási rendszer, mint Erik is írta, nélkülözhetetlen. Számos keresési cél másképp elérhetetlen. Talán az általa mondottakhoz hozzátenném: ha volna átfogó tezaurusz, akkor is kellene mellette hierarchikus osztályozási rendszer, de mivel ilyen tezaurusz nincs, marad az osztályozási rendszer olyan keresésekre is, amelyeket egyébként jobb volna tezaurusszal végezni.

A hierarchikus osztályozási rendszer szükségességére tehát a válaszom egyértelmű, az ETO szükségességére már sokkal visszafogottabb: az ETO nélkülözhetetlen, amíg nincs helyette jobb. Sajnos nincs, és sokáig nem is lesz helyette jobb, mert nagy nemzetközi összefogás kéne egy jobb rendszer megalkotására, erre pedig pillanatnyilag nincs meg a szükséges szándék sem.

Miért kellene jobb? Csak nagyon felületesen ismerem az ETO-t, de azt a nagy hibáját igen, hogy a több helyre is besorolandó dokumentumoknak (ha komolyan vesszük, akkor minden dokumentum több helyre sorolandó be) az ETO furcsa összetett jelzetet ad, amely ráadásul nem egyértelmű, függ attól, hogy melyik besorolási helyet tekinti a besoroló elsődlegesnek, ráadásul még így is csak kevés helyre sorolható be a dokumentum. A gépi keresésnek az olyan osztályozási rendszer felel meg, amelyben csak egyszerű, egyértelmű besorolási jelzetek vannak, azokból viszont akárhányat kaphat egy dokumentum, esetleg úgy, mint a COMPENDEX-ben, hogy vannak közöttük elsődlegesek, azokból is több, és vannak másodlagosak.

Amíg ilyen osztályozás híján kell az ETO, addig természetszerűleg kell a karbantartása is.

A speciális adatmezők kötött formátumú kereséséről könnyen elfelejtkezik az, aki nem keres rendszeresen, pedig ez fontos. A katalógusban ilyen az ISBN vagy ISSN és a kiadás éve szerinti keresés, de a szabadalmi keresésben például nélkülözhetetlen a szabadalomszám szerinti keresés. Ez azért külön keresési típus, mert a kereső kifejezés kötetlen, nem jegyzékből kell venni, viszont a formátuma szigorúan kötött.

Minden más keresési lehetőség megkoronázása, ha mellettük szabad szövegben is lehet keresni. Vannak esetek, amikor ez a leghatékonyabb. Egyes speciális esetekben egészen egyszerű keresés is végezhető így, például a Magyar Elektronikus Könyvtár teljes szövegében mindössze 5 találatot kaptam a "szobort" (sic!) szóra, de az esetek többségében csak akkor használható jól, ha a Boole-keresés mellett erős eszközei vannak a kontextus szerinti keresésre is.

Végül egy egészen más lapra tartozó kérdés: Kedves Erik! Semmiképpen sem kellett volna a master file-t maszter fájlnak írnod, sőt, durva hiba lett volna. Talán mesterállománynak lehet magyarítani, hasonlóan ahhoz, ahogy a hanglemezgyártásban mesterlemeznek hívják a master disk-et.


Forrás: Könyv, Könyvtár, Könyvtáros 2000. március Kell-e még az ETO?

Nincsenek megjegyzések:

Megjegyzés küldése