Lygtis su 457,153 nežinomaisiais
Gyvenimas, Menas, Muzika, Nepažymėta, Verslas No Comments »Plazminiai televizoriai, antikiniai kilimai, porno filmų nuoma, vandens kanalo valymas, ančių namelis, prabangūs baldai ir prasimanytos paskolos - tai yra keletas iš įdomesnių britų parlamentarų išlaidų, sukėlusių didžiulę pasipiktinimo bangą Didžiojoje Britanijoje. Tačiau man asmeniškai kur kas įdomiau buvo išgirsti apie tai, kaip įsiplieskė šis skandalas. Pasirodo, kažkoks apsukrus veikėjas nusikopijavo visą terabaitą duomenų iš Parlamento kanceliarijos: iš viso apie 2 milijonus finansinių išklotinių, sąskaitų ir čekių, kuriuos per 4 metus pateikė politikai. Po nesėkmingų bandymų parduoti duomenis keliems laikraščiams, kanceliarijos ‘kurmis’ pagaliau prastumė juos už nenustatytą sumą (spėjama, kad apie £100K) Daily Telegraph laikraščiui, kur 25 žurnalistų komanda metė visus darbus į šoną ir netrukus pradėjo drebinti politinį establishment’ą savo skandalingais atradimais.
Per pirmas dvi savaites politinis skandalas padidino Daily Telegraph cirkuliaciją 600,000 vienetų ir pavertė šio laikraščio žurnalistus tikrais tyriamosios žurnalistikos didvyriais. Tačiau ką tokioje situacijoje daryti konkurentams? Na, teoriškai mes visi žinome, kad bet kurioje krizėje glūdi naujos galimybės, bet kaip tokio skandalo įkarštyje, neturint inkriminuojančių dokumentų, susigražinti žmonių pagarbą ir dėmesį? The Guardian pasiūlė genialų sprendimą šiai problemai, kurį į savo vadovėlius turėtų įtraukti visi žurnalistikos, programavimo, vadybos ir karinės žvalgybos profesoriai. Likus savaitei iki tos akimirkos, kai iš Parlamento kanceliarijos pavogti dokumentai bus paviešinti, the Guardian redakcija nusprendė sukurti įrankius, kurie leistų pasitelkti į pagalbą dešimtis tūkstančių savanorių dokumentams analizuoti. Tad, kai pdf formatu pateikti dokumentai pagaliau atsirado internetinėje svetainėje, laikraščio skaitytojai per pirmas tris dienas sugebėjo išanalizuoti beveik 170,000 dokumentų.
The Guardian sukurta “crowdsource’inė” aplikacija, kurią rasite čia, pateikia internete lankytojui pdf bylą ir prašo jo pažymėti kokio tipo tai dokumentas ir kokio pobūdžio yra jo turinys: išlaidos ančių nameliui, pavyzdžiui, yra įdomus, bet visuomenėje jau žinomas tarnybinių lėšų panaudojimo atvejis, o, sakykime, traukinio bilietas būtų pripažintas neįdomiu dokumentu. Lankytojai taip pat gali perrašyti dokumentuose pateikiamus duomenis ir tokiu būdu paversti sunkiai analizuojamą informaciją apie išlaidas lengvai pjaustomais statistiniais duomenimis. Pavyzdžiui, šioje lentelėje galima matyti, kad konservatoriai mėgsta gyventi brangesniuose apartamentuose nei leiboristai, bet pastarieji su kaupu atsigriebia dekoruodami savo virtuves, namus ir sodus. Mane labiausiai pritrenkusi aplinkybė visoje šioje istorijoje yra tai, kad The Guardian programuotojo komanda sugebėjo sukurti šią aplikaciją lygiai per 1 savaitę. Viso labo vieną savaitę darbo, o sukurtas įrankis sėkmingai atlaiko 10,000 unikalių vartotojų per dieną srautą, talpina savyje 457,153 dokumentus ir padeda sėkmingai atlikti milžiniškos apimties darbą.

Kaip tai įmanoma? Jeigu jūs taip pat kamuoja šis klausimas, tai pateiksiu keletą ištraukų iš interviu su Simon Willison’u, programuotoju vadovavusiu šiam projektui.
Jūsų bendradarbiai dirba nemokamai, todėl padarykite šį užsiėmimą linksmu. Galvodami apie tai kaip pritraukti skaitytojus į svetainę, projekto komanda nusprendė įtraukti žaidimo elementus: jie leido lankytojams klasifikuoti pateiktus dokumentus pasirenkant vieną iš keturių filtrų “įdomu,” “neįdomu,” “įdomu, bet jau žinoma,” ir “ištirkite šį dokumentą!” Tituliniame puslapyje lankytojai gali matyti kaip toli pasistumėjo visas projektas, kas suvienija žmones bendram tikslui. Kad šiame žaidime atsirastų logiška pasakojimo gija, Simon’as taip pat pridėjo parlamentarų nuotraukas prie jų dokumentų. “Žmonių reakcija buvo išskirtinai teigiama ir dalyvių skaičius iš karto išaugo,” - teigia jis. Galiausiai, koks žaidimas be čempionu? Tad pirmadienį, puslapyje atsirado darbščiausių “analitikų” sąrašas.

Visuomenės dėmesys yra sunkiai suvaldomas, todėl startuokite iš karto. Laukdami ketvirtadienį turėjusių pasirodyti dokumentų, programuotojai manė, kad reikalui esant aplikacijos startą galima bus atidėti iki penktadienio. Tačiau klausydami TV ir radijo pranešimų jie netrukus supranto, kad veikti reikia dabar, kai visa šalis sulaikiusi kvapą laukia dokumentų pasirodymo. “Ketvirtadienį tapo aišku, kad tai yra karščiausia naujiena ir, kad jeigu mes nesugebėsime startuoti ketvirtadienį, tai mes prarasime skaitytojų susidomėjimą,” - toliau pasakoja Simonas Willison’as. Tad aplikacija startavo net nepraėjusi apkrovų testo, su darbiniu sąsajos dizainu ir be back-end’o sprendimo išanalizuotiems duomenims pateikti (pirmoji ataskaita pasirodė tik pirmadienį). Daugelis programuotojų tokioje situacijoje jaustųsi labai nepatogiai, bet tokios yra žurnalistikos taisyklės, ponai.
Programavimo greitis yra labai svarbus, todėl naudokite framework’us. Na, šitie žodžiai turėtų skambėti kaip muzika kai kuriems mano kolegoms, jau gerus pusantrų metų kalbantiems apie frameworkų (čia tokie programavimo šablonai sutaupantys daug laiko ir nervų) nešamą gėrį. Willisono projektas buvo sukurtas ant Django web framework’o skirto “terminų spaudžiamiems perfekcionistams”. Nors sukurti patį Django užtruko tris metus, jo dėka The Guardian aplikaciją galima buvo paleisti į internetinius vandenis vos po savaitės. “Tokia aplikaciją galima buvo laisvai sukurti su Ruby on Rails arba naudojant PHP programavimo kalbą,” - teigia Willison’as, bet “mano galva, Django geriausiai tinka šiai užduočiai. <..> Kai dizaineris ir su kliento kodu dirbantis inžinierius įsijungė į projektą, aš galėjau ramiai atiduoti jiems jų dalis ir visiškai nesijaudinti dėl klientų naršyklėse veikiančio kodo [kokybės]“.
Lankytojai pasirodys iš karto ir dideliais kiekiais, todėl paruoškite savo serverius. Dar viena naujovė, kurią The Guardian IT komanda išbandė šiame projekte, buvo EC2 debesies paslauga (angl. cloud service). EC2 yra papildomas Amazon.com verslas, apie kurį žino tik nedaugelis rašytojų ir skaitytojų, bet interneto start-upų savininkai, įskaitant ir Twitter’į, tiesiog negalėtų išsiversti be šios paslaugos. EC2 teikia svetainių talpinimo paslaugas pagal poreikius, neribodamos jums suteikiamos serverio vietos. Willisono komanda žinojo, kad jie sulauks didelio lankytojų srauto pradžioje, kuris ilgainiui mažės, todėl pirkti naujus serverius nebuvo prasmės. Be to, tam visiškai nebuvo laiko. Tuo tarpu sukurtos aplikacijos talpinimas EC2 “debesyje” buvo greitai įgyvendinimas sprendimas ir, pagal Willison’o paskaičiavimus, kainuos laikraščiui vos £50.
Perskaičius šiuos patarimus, viskas atrodo akivaizdu ir paprasta, juk Lietuvos laikraščiai turi tokias pat galimybes ir susiduria su panašiais iššūkiais - nuobodžiaujantys skaitytojai, sklerotiška auditorija, spaudžiantys terminai ir riboti biudžetai. Tačiau viena svarbi aplinkybė skirianti tautinę žiniasklaidą (gal su nedidele 15min išimtimi) nuo The Guardian laikraščio yra požiūris į web2.0 verslo principus: tuo tarpu, kai britai galvoja kaip įdarbinti anonimines mases ir pritaikyti technologijas kasdieniams iššūkiams įveikti, mes girdime kaip lietuviškų laikraščių redaktoriai lygina blogerius su musėmis ir traktuoja savo skaitytojus kaip inertišką masę, kurią reikia toliau liuliuoti paburnojimais ant valdžios, tendencingais reportažais ir nesibaigiančia reklama, tik gink Dieve neduokite jiems jokių įrankių, neleiskite jiems parodyti jokios iniciatyvos ir nesitikėkite iš jų jokio sąmoningumo. Tad, kol kas, Seimo nariai, galite miegoti ramiai. Ir ančių namelį irgi galite pirkti.






Recent Comments