Kako prikupljati podatke bolje od drugih?
Kako prikupljati podatke bolje od drugih?
03/10/2012
Ključni problem za sve medije u svijetu je gubitak ekskluzivnosti u kombinaciji s demokratizacijom tehnologije izdavaštva. Mogu li podaci pomoći?
Novinarstvo je uvijek ovisilo o tehnologiji. Izum štamparskog stroja, a kasnije tehnologije za prenos radio i TV signala, predstavljaju platforme koje su novinarstvu uvijek davale konkurentnu prednost. Medij je obično bio jedina organizacija koja je uspijevala da dođe do publike tokom noći ili direktno.
No, to više nije tako.
Danas svako može iznajmiti web server, instalirati blogerski softver i početi da objavljuje. Ljudi s mobitelima mogu u tren oka fotografisati svaki događaj i informisati brojnu publiku putem društvenih medija. Sada postoji milion izvještača.
Zbog toga rad sa podacima nudi novu mogućnost: ako novinari nauče da tokom dužeg vremena prikupljaju podatke bolje od drugih, možda ipak neće pobijediti u utrci ko će prvi izvijestiti. Ali, mogu se preusmjeriti na objašnjavanje konteksta, dubine i pozadine. I dati bolje odgovore.
Evo jednog odličnog primjera koji pokazuje kako i zašto ovaj pristup može biti uspješan: baze podataka kriminala. U bazi podataka The Los Angeles Timesa pod imenom Homicide Report se prikupljaju podaci o teškim napadima, za svaki pojedinačni slučaj. Za razliku od nekadašnjeg izvještavanja, gdje bi obično bila objavljena samo priča, ljudi sa deska zaduženog za podatke prikupljaju sve podatke tokom dužeg vremena: vrijeme, mjesto, ime žrtve itd. Naravno, oni pišu članak.
Ali, baza podataka raste, što redakciji omogućava da jednostavno pritisne dugme i napravi analizu, poredeći godine jednu s drugom. Geografski podaci omogućavaju redovno ažuriranje karte koja pruža pregled. I tako dalje.
Vremenom ova baza podataka može pružiti najpotpuniji i najjednostavniji pregled teških zločina u regionu. Naravno, možda postoji javni arhiv u policijskom uredu koji u osnovi sadrži iste stvari. Ali, takvi arhivi često nisu svima dostupni. Nedostaju im informacije o onome što se dogodilo kasnije. Ne pružaju kontekst o tome kako je određeni grad reagovao na porast kriminala. Dakle, novina može ponuditi najbolji kontekst za svakoga ko je zabrinut zbog ovog problema ili za vlastitu bezbjednost.
Kada se koristi na ovaj način, 'data novinarstvo' ne predstavlja samo novi pravac, već i olakšava i ubrzava novinarstvo. Paul Bradshaw, predavač novinarstva u Ujedinjenom Kraljevstvu, smatra da je ovaj aspekt često zanemaren.
Praćenje kriminala je samo jedna od tema o kojoj se mogu prikupljati podaci. Sada postoje i brojni drugi projekti kao Homicide Report, za druge regije i za druge teme.
Oakland Crime, naprimjer, obezbjeđuje filtere, zbog čega je lako vidjeti obrasce svih počinjenih krivičnih djela i da li postoje 'krizna žarišta' gdje je zaista opasno. Projekat Crime Spotting u gradu Washingtonu je još jedan primjer. Oni su u avgust 2012. godine započeli kampanju o Kickstarteru, web stranici gdje projekti mogu dobiti finansijska sredstva kroz priloge velikog broja ljudi (crowdsoarcing). I čini se da su ljudi spremni da finansiraju ovakav oblik novinarstva i struktuiranih informacija – u prvih 15 dana je zabilježen priliv od 18.000 dolara od potrebnog budžeta od 40.000 dolara.
Redovnost bilježenja podataka
Koje još oblasti postoje? Šta je sa saobraćajem? Automobilskim sudarima? Cijenama kuća, nekada i sada? Troškovima života? Kada se shvati ključni koncept, jasno se vidi da je poenta jednostavno da se podaci prikupljaju bolje nego što to drugi čine i da se oni učine razumljivim. Tehnologija koja je potrebna za ovakve projekte je izuzetno pojeftinila, mnogi sastavni dijelovi često predstavljaju otvorene izvore i sve što je potrebno je strategija i nešto znanja iz programiranja i kodiranja. Ostaje još samo da to naprosto radite iz dana u dan.
Ovakvi projekti konačno ispunjavaju zahtjev koji je 2006. godine formulisao Adrian Holovaty. U temi na blogu pod naslovom «Suštinski način na koji novine treba da se promijene», on tvrdi da prenošenjem podataka u HTML stranice vremenom gubimo dosta vrijednosti. Jednostavno bilježenje događaja, pamćenje kada se nešto desilo, gdje se desilo, ko je učestvovao – zajedno sa što više dodatnih podataka, može postati stub lokalnog i regionalnog izvještavanja u mnogim redakcijama bilo gdje u svijetu.
Ova oblast je u začetku. Novinari polako shvaćaju da pristup struktuiranim, provjerenim podacima predstavlja prednost.
Kao rezultat toga, u toku je više inicijativa koje pomažu redakcijama da se bave podacima:
FreeDive olakšava pretvaranje proračunske tablice u pretraživu bazu podataka.
Projekat Panda, koji vodi tim iz Chicago Tribunea, predstavlja redakcijsku arhivu skupova podataka.
Platforma CKAN Fondacije Open Knowledge je pravi sistem vođenja podataka (CMS). Naprimjer, Vlada Ujedinjenog Kraljevstva je koristi za web stranicu Open Data
Rnews, koji koristi New York Times, predstavlja standard koji pomaže u praćenju podataka o objavljenim tekstovima, što omogućava lakšu razmjenu linkovanih podataka između različitih platformi, tema i vremena.
A ako imate podatke i samo želite da vizuelno predstavite ono što ste pronašli, onda vam Datawrapper* pomaže u vizuelnom predstavljanju podataka u četiri koraka, a grafikone koje na taj način dobijete ubacuje na bilo koju web stranicu.
Većina ovih alata predstavlja otvorene izvore i besplatni su za korištenje. Mnoge od njih su napravili novinari, koji su se udružili sa šifrantima ili su to sami znali uraditi. Za njihovo korištenje je potrebno malo truda, ali obično nisu isuviše komplikovani.
«Nadziranje podataka»
Svi ovi projekti – ili sama ideja o njima – vremenom mogu stvoriti čvrstu osnovu za izvještavanje. Radi se o «nadziranju podataka», kako se to naziva na web stranici Spreadsheetjournalism.
Da bi što više redakcija ovo prihvatilo, mora se prevazići jedno osnovno nerazumijevanje: ovakvi projekti ne povećavaju količinu posla, već pojednostavljuju rad izvještača. Sve što je potrebno je da se instalira jedan od ovih alata, a zatim da se strpljivo prikupljaju dostupni podaci tokom dužeg vremena. Nakon godinu do dvije, mogu se analizirati lokalni statistički podaci za par minuta, a ta mogućnost puno vrijedi. Ona izvještačima vrijeme provedeno na istraživačkom radu može skratiti sa nekoliko sati na nekoliko minuta.
Neka ono što nudite bude nešto čemu ljudi mogu vjerovati
Ima tu još jedna bitna perspektiva: zapitajte se, kada tragate za informacijama na webu, koliko često možete zaista vjerovati nekom izvoru? Toliko mnogo sadržaja se objavljuje samo radi privlačenja malo pažnje da informativni izvori kojima se može vjerovati mogu izgraditi svoju budućnost nasuprot svoj plitkosti i nekorektnosti. Drugi, uključujući zvanične institucije, mogu ispravno izvještavati, ali mogu doći u iskušenje da prešute, naprimjer, nagli porast incidenata.
Opremljeni redovno ažuriranim podacima provjerenog kvaliteta, novinari mogu steći konkurentnu prednost. Ne radi se više toliko o tome da prvi izvijeste o nečemu, već da budu ti koji će pojasniti kontekst nečega što se desilo: Kako to utiče na zajednicu? Kako utiče na svakog pojedinca?
Vremenom uviđamo da u svijetu u kojem često ima isuviše informacija, mnoga bitna pitanja javnosti ipak ostaju bez odgovora. Ako započnemo prikupljanje važnih podataka i njihovo pročišćavanje, vizuelno predstavljanje i pronalaženje odgovora, korak po korak, ovakve kolekcije će jačati vrijednost novinarstva.
* Napomena: Mirko Lorenz je ideju za Datawrapper dobio 2011. godine. Projekat je finansirala njemačka institucija ABZV za obučavanje novinara u novinama (http://www.abzv.de). Trenutna nedovršena verzija se koristi od februara 2012. godine. On sada radi sa Nicolasom Kayserom-Brilom i Gregorom Aischom (driven-by-data) na drugoj, naprednijoj verziji.