jövőobszervatórium: Moby Dicktől a gépi megértésig

2010. december 16., csütörtök

Moby Dicktől a gépi megértésig

Az első információkezelési forradalomra akkor került sor, amikor – még a földművelésre valóáttérés előtt – az emberek átlagéletkora eléggé megnőtt ahhoz, hogy az utódaik számára átadható mennyiségű tudást gyűjtsenek össze. A másodikra pedig akkor, amikor az írásnak köszönhetően az információkat képesek voltunk a biológiai entitástól (értsd: az embertől) függetlenül rögzíteni.

Ami az elsőt illeti a kőkorszakban az átlagéletkor 20 év körül volt, és ez azt jelentette, hogy a nők csupán 5-8 éven keresztül szülhettek. Tehát ez egy olyan kor volt, amikor „a demográfiai feltételek nem kedveznek a szellemi felfedezések generációk közötti továbbadásának”, mondja Herwig Birg német demográfus. Ugyanis a szülők és gyerekek túlságosan rövid ideig éltek egymás mellett.
A második nagy váltás, az írás jelentőségét valószínűleg nem kell hosszan taglalni, úgyhogy ehelyett tegyük is fel azt a kérdést, hogy mi lesz a harmadik információkezelési forradalom. Az írás megjelenése óta persze sor került előrelépésekre: például a könyvtárak létrejöttére (amelyek a történelem folyamán először gyűjtöttek össze nagyobb mennyiségű tudást, mint amit egy ember nem hogy felhalmozni, de akár csak befogadni képes). Illetve a 18. sz. közepére megjelentek az enciklopédiák is, melyeknek az volt a célja, hogy mintegy „szupersűrű könyvtárként” szolgálva gondoskodjanak róla, hogy „az elmúlt évszázadok erőfeszítései ne vesszenek kárba”, de ez persze nem változtatott meg mindent, és ha a „hogyan tovább”-ra keressük a választ, akkor valószínűleg Borges Bábeli Könyvtárából érdemes kiindulni. Ebben olyan rendszerrel van szó, ahol minden, meghatározott terjedelmű (vagyis esetünkben mintegy négyszáz oldalas) könyvet megalkotnak - ez a filozófus Quine megfogalmazásával élve „hipercsillagászati számosságú” művet jelent. A továbbadandó információk létrehozásánál eddig az „előbb szűrd meg, utána tedd közzé elvet” alkalmaztuk: az ember kiválasztotta, hogy akár szóban, akár pedig írásban továbbadott. A jövőben azonban elvileg miért is ne tehetnénk meg, hogy megpróbálunk legenerálni egy adott szabályrendszer és nyelv figyelembe vételével minden, meghatározott terjedelmű könyvet, majd pedig megpróbáljuk kiszűrni azokat, amelyek használhatóak? Ezzel az eddigieket megfordítva az „előbb tedd közzé, aztán szűrd meg” elvet alkalmaznánk – valahogy úgy, mint ma az interneten, ahová leginkább bárki és bármit feltehet.
Gondot fog jelenteni persze, hogy viszonylag alacsonyan tartsuk a létrehozott verziók számát: a Moby Dick-nek például mintegy száz millió olyan változata van, amely csupán egyetlen karakterben különbözik az eredetitől. És persze – mint ahogy a mai internetes keresőknél is ez az egyik központi kérdés - gondot fog jelenteni az is, hogy a látszólag érdekes és használható információk közül kiszűrjük azokat, amelyek valóban használhatóak, relevánsak és újak, de innentől kezdve az adatbányászat egy egészen új válfaja is kialakulhat, és a tudományos (méghozzá természettudományos) kutatás egyik formájává válhat a szövegek Bábeli Könyvtárában (vagy ha úgy jobban tetszik: fázisterében) való keresgélés.
Amihez minden bizonnyal valamiféle gépi megértésre lesz szükség – de végső soron miért is ne próbálnánk meg?

Nincsenek megjegyzések:

Megjegyzés küldése

Megjegyzés: Megjegyzéseket csak a blog tagjai írhatnak a blogba.