27.5.06

o czynie społecznym, o seminarium i o spamie

Dzisiaj był dzień dość bogaty we wrażenia. Wczesnym rankiem (tak koło 10oo ;-)) zerwałem się, aby czym prędzej popędzić na Czyn Społeczny, czyli doprowadzenie ślicznego podwórka Instytutu Filozofii do stanu używalności. Obecnie (to znaczy, do dzisiaj) było to składowisko śmieci i gruzu. Od teraz, miejmy nadzieję, będzie to miejsce gdzie filozofowie będą mogli sobie wyskoczyć na fajkę i poczytać lekturę na ćwiczenia.

Do całej akcji przylgnęła nazwa Czyn Społeczny, ja sądzę jednak, że inna nazwa byłaby odpowiedniejsza: Budowanie Społeczeństwa Obywatelskiego. Oddolnie i własną inicjatywą (żeby nie powiedzieć przedsiębiorczością) zdobyliśmy nowe miejsce do siedzenia na przerwach. W każdym razie, abstrahując od nazewnictwa, pomysł zostało przyjęty przez sporą grupę studentów całkiem entuzjastycznie, niezależnie od opcji światopoglądowej.

Ja sobie nie pobudowałem zbyt długo, bo już o 12oo było seminarium (tzn. Forum Kognitywistyczne), więc skopawszy ze 12 m2 przyszłego trawnika udałem się do zakładu logiki.

Pierwszy referat nie został zrobiony nawet w połowie, więc nie mam co o nim pisać. Za to drugi, Łukasza Dębowskiego, bardzo mi się spodobał. Referent zastanawiał się, czy istnieją jakieś teorioinformacyjne właściwości (czyli na przykład złożoność Kołgomorowa etc.) tekstu sensownego. Intuicja mówi, że owszem -- zjawiska fizyczne powinny być albo bardzo regularne, albo zupełnie chaotyczne. W bardziej poetyckim ujęciu problem polega na tym, aby rozróżnić myśl od szumu za pomocą narzędzi matematycznych.

Jeśli chodzi o zastosowania, moga one być kosmiczne. Dosłownie. Pomyślcie o wielkich radioteleskopach nasłuchujących kosmos... Jeśli dałoby się faktycznie odkryć odcisk palca (ang. fingerprint: pozwolę sobie na określenie komputerowe) sensownego przekazu, mielibyśmy doskonałą metodę by stwierdzić, czy w ogóle warto marnować moc obliczeniową na próby rozszyfrowania szumu z kosmosu.

Mi oczywiście przyszły do głowy zastosowania dużo bardziej przyziemne, choć moim zdaniem co najmniej tak samo przyjemne (biorąc pod uwagę kosmiczne odległości, świadomość, że coś tam jest mogłaby być tylko bardziej frustrująca). Mianowicie, mam przeczucie, że spam jest nieco różny od zwykłych wiadomości pod względem zawartości informayjnej. Gdyby więc udało tę różnicę odnaleźć i wykorzystać ją do skonstruowania spamfiltra... (A góglowy spamfiltr tak słabiutko ostatnio działa -- zapewne stąd takie pomysły.)

Oczywiście, na razie są to marzenia małego zwierzątka w fabryce pizzy mrożonej. Wyniki zaprezentowane mówiły póki co o długości słów (czy też, konkretniej, pewnych powtarzających się sekwencji znaków). Czyli o tym, jakiej długości są te ,,słowa” i ile ich w tekście jest (dla niecierpliwych: ilość ,,słów” w tekście szacuje się jako nieco więcej niż c*n1/2). Nie jest to niby wiele, ale: lepszy rydz niż nic. Jak zaobserwował jeden z uczestników seminarium, można by to zastosować do pisma linearnego A. Nie pomogłoby to bezpośrednio w translacji, ale przynajmnie byśmy widzieli, jakiej długości słów się spodziewać.

Tym niemniej, jeśli chodzi o spam, sądzę, że w przyszłości można się wiele spodziewać po teorii informacji (bazy serwerów to nie jest najelegantsza metoda radzenia sobie ze śmieciami). Skoro da się wyczaić, czy księgi rachunkowe nie są oszukane (tzw. prawo pierwszych cyfr), jest nadzieja, że i na spamerów przyjdzie kryska.

Nie jestem specjalistą w dziedzinie teorii informacji, więc być może piszę jakieś głupoty. Bardziej zainteresowanym polecam zajrzeć (jako dobry początek) na stronę internetową Łukasza Dębowskiego.

Brak komentarzy: