11.6.06

forum kognitywistyczne i Sumerowie

Na dzisiejszym spotkaniu Forum Kognitywistycznego Jerzy Tyszkiewicz i Wojciech Jaworski mówili o tabliczkach z pismem klinowym, a dokładniej: o swoim (jako matematyków) udziale w dziele ich odszyfrowywania. Artykuł na ten temat pojawił się niedawno w Gazeta.pl, jednak referat niesformatowany pod kątem przeciętnego czytelnika GW zawsze będzie ciekawszy.

Tabliczki z pismem klinowym są w pewnym sensie zarówno marzeniem, jak i najgorszym koszmarem badacza. Marzeniem, ponieważ jest ich dużo (ponad 40 000 sztuk) i są świetnie zachowane. Koszmarem z dość podobnych powodów: jest ich dużo, są świetnie zachowane i... przeraźliwie nudne: mówią głównie o tym, kto co przyjął, od kogo i w jakiej ilości. Biurokracja sprzed czterech tysięcy lat, zapisana w istotnie wieloznacznym systemie ideograficzno-sylabicznym.

Język Sumerów sam w sobie stanowi zagwozdkę, ponieważ był aglutynacyjny i nie ma obecnie żadnego żywego (ani lepiej znanego wymarłego) języka, który byłby podobny. Dlatego wiedza na jego temat pochodzi głównie z tabliczek Akadów (mówiących językiem semickim), którzy byli na tyle mili, że sporządzali coś w rodzaju słowników sumeryjsko-akadzkich. Minus jest taki, że wiemy na przykład, że Sumerowie, w przeciwieństwie do Akadów, używali głoski ,,o'', jednak ci siłą rzeczy jej nie zapisali, zatem nie mamy pojęcia, gdzie mogła się znajdować.

Tabliczki zostały w sporej części sklasyfikowane, przetransliterowane i wrzucone do wielkiej bazy danych. Jest ona dostępna w Internecie, z możliwością jej przeszukiwania. Ma ona też swoje wiki (bardzo w duchu Web 2.0). Mam takie przeczucie, że pismo klinowe może stać się konikiem Nº 1 historyków-amatorów będących zarazem geekami. Praktycznie wszystko, czego potrzeba do dokonania być może nawet znaczących odkryć jest przecież dostępne w sieci...

W związku z tym, że tabliczek jest aż tak dużo i stanowią aż tak mało przyjemny materiał dla człowieka, aż kusi, aby do ich analizy zaprzęgnąć komputer. I właśnie o tym jak to się robi opowiadali dzisiejsi referenci.

Pierwszy pomysł polega na tym, aby poszukiwać tabliczek zawierających podobne dane liczbowe: jeśli, powiedzmy, dwie tabliczki zawierają liczbę 84 (mocno nieokrągłą w ich systemie liczbowym), jest bardziej niż prawdopodobne, że tabliczki są w jakiś sposób powiązane. Jeżeli udałoby się zidentyfikować grupę tabliczek jako pochodzących z jednego warsztatu, można by próbować wyciągnąć jakieś wnioski na temat demografii sumeryjskiej.

Drugi pomysł jest nieco bardziej subtelny (choć zarazem może gubić część tego, co poprzedni mógłby znaleźć) i polega na opracowaniu gramatyki tabliczki klinowej. Na przykład, jeżeli wiemy, że większość tabliczek jest zapisem pewnej transakcji (np. urzędnik Iksemesz przyjął 4 owce nieokreślonej płci od Igrek-Kidu, w czwartym miesiącu roku za panowania Szulgiego, gdy założono świątynię w Ninurcie), możemy sobie zrobić parser, które wydobędzie z rekordu tabliczki interesujące nas dane. Z efektów jego działania będziemy mogli sporządzić sobie ładną tabelkę, ustawić chronologicznie i wnioskować, na przykład, że w takim a takim roku pogorszyła się koniunktura lub, jeśli byśmy nagle natrafili na kryzys po kilku latach urodzaju, że państwo zostało splądrowane przez Amorytów lub coś w tym stylu.

Swoją drogą, najbardziej mnie zafrapowało to, że narzędzia programistyczne potrzebne do tego typu zabaw są stosunkowo proste i doskonale znane. Ośmielę się zaryzykować nawet mocniejszą tezę: normalnie wyposażony Unix posiada out of the box prawie wszystkie narzędzia konieczne do tego typu analiz, nawet bez konieczności jakiegoś zakrojonego na szeroką skalę programowania. Jeśli chodzi o metodę pierwszą, do głowy przychodzi mi filtr napisany w perlu wykrywający za pomocą wyrażeń regularnych liczby w tabliczkach, stary dobry diff(1), wreszcie baza danych gromadząca wyniki. Oczywiście, miło by było mieć jeszcze jakąś metodę rozpoznawania naprawdę cennych podobieństw (szansa, że dwie niepowiązane tabliczki zawierają liczbę 2 jest dużo większa niż że zawierają one liczbę 84), jednak wciąż: z technicznego punktu widzenia nie wydaje się to stanowić wyzwania.

Wniosek z tego wszystkiego może być następujący: nie chodzi o to, aby się bawić nowymi, skomplikowanymi narzędziami bądź takie wymyślać. Czasem lepsze może być twórcze zastosowanie narzędzi prostych i doskonale znane.

3 komentarze:

Anonimowy pisze...

Mama jest z Pana dumna czytajac te wspaniele mysli

Anonimowy pisze...

Jak to milo ujrzec kawalek mojej starej dziedziny - historii, ktora nawet studiowalem przez rok :] Mialem sie nawet uczyc pisma klinowego...

Ryszard Szopa pisze...

Ja pod koniec podstawówki miałem totalnego fioła na punkcie Sumerów i w ogóle wszystkiego, co związane z Mezopotamią. W pewnym momencie nawet nauczyłem się pisać swoje imię (czy też raczej jego wersję dostosowaną bardziej do sylabicznego pisma: ra-sza-ra-da, lub coś w tym stylu, i konsekwentnie rysowałem ołówkiem na ławkach :]