Podaci i budućnost novinarstva
Podaci i budućnost novinarstva
Tekst je preuzet sa Onlinejournalismblog.org gde je objavljen pod naslovom "The mass market was a hack”: Data and the future of journalism.
-----------------------------------------------------
Ako ste novinar i dobri ste u nekoj od ovih disciplina: Computer Assisted Reporting (CAR), programiranje, infografika, statistika - trenutno ste izuzetak. Ali ne zadugo. Stvari se brzo menjaju.
U poslednja dva stoleća novinarska valuta bile su informacije: pretvarali smo obične metale u zlato narativa. Informacije se, međutim, menjaju.
Nekada su osnovni metali bila svedočenja očevidaca, kao i intervjui. Kasnije smo naučili kako da ’otopimo’ zvanične izveštaje, istraživanja i finansijske izveštaje. U skorije vreme u naše ’legure’ su umešane izjave i saopštenja za medije.
Ali sada novinari moraju da se uhvate u koštac sa novom vrstom informacija: podacima. A to je ogromna tema.
Podaci: šta, kako i zašto
‘Podaci’ su opšti termin, pa ga treba definisati: ne govorim ovde o statističkim podacima ili uopšteno o brojkama, jer tu nema ništa novo za novinare. Kada govorim o podacima mislim na informacije koje se mogu obraditi kompjuterski.
Tu je ključna razlika: jedno je kada novinar pregleda finansijske podatke na papiru; a sasvim je drugo kada može da prekopava po tim podacima u spreadsheetu, ili da napiše programsku skriptu kojom će ih analizirati i uporediti sa drugim izvorima informacija. Takođe možemo lakše da analiziramo nove vrste podataka, kao što su podaci koji pristižu u realnom vremenu (live data), velike količine teksta, pravilnosti u ponašanju korisnika, kao i veze u društvenim mrežama.
A to je, što se mene tiče, od ogromne važnosti. Zapravo ima potencijal da preobrazi novinarstvo. Kada dodamo kompjutersku moć našem novinarskom arsenalu možemo da radimo više, brže, tačnije i u saradnji sa drugima. Što sve otvara nove mogućnosti – ali i nove opasnosti. Stvari će se promeniti.
U proteklih 40 godina i više mogli smo da naslutimo promenu koja dolazi. Razvoj spreadsheeta i baza podataka od ’60ih godina naovamo doneo je promenu time što je organizacijama – uključujući i vlasti – postalo daleko lakše da digitalizuju informacije počev od toga gde troše naš novac do toga koliko ljudi se leči od kojih bolesti i gde.
Izum world wide web-a je ’90ih godina je povećao količinu podataka dostupnu novinarima obezbeđuući platformu gde svi ti spreadsheetovi i baze podataka mogu da se objave i da im pristupe i ljudi i kompjuterski programi – kao i mrežu za njihovu distribuciju.
A onda su se dva kulturna pokreta susrela i dodala političku dimenziju širenju podataka: pokret za otvorenost podataka (the open data movement) i pokret za povezane podatke (the linked data movement). Novinari bi trebalo da znaju za ova dva pokreta: argumenti u prilog tome da su se razvili iz potrebe da se vlast učini transparentnom i odgovornom lekcija su iz borbe protiv čvrsto etabliranih interesa, dok eksperimenti sa mogućnostima novinarstva zasnovanog na podacima pokazuju kojim putem treba ići dalje.
Dok se pokret za otvorenost podataka zalaže za to da važne informacije – kao što su one o javnoj potrošnji, naučne informacije i mape – budu javno dostupne zarad društvene i ekonomske dobrobiti društva, pokret za povezane podatke (čiji je pokretač Sir Tim Berners-Lee, izumitelj weba) se zalaže za to da podaci budu dostupni na takav način da se mogu povezati sa drugim setovima podataka kako bi, na primer, neki kompjuter mogao da vidi da je direktor neke kompanije imenovan u određenom vladinom ugovoru ista osoba koja je plaćena kao konsultant na izradi dokumenta u vezi s tim ugovorom. Zagovornici takođe tvrde that će ovo za rezultat imati i ekonomske i društvene pogodnosti.
Konkretni rezultati oba pokreta mogu se videti u SAD i Velikoj Britaniji – a najočigledniji su u pokretanju repozitorija za vladine podatke kakvi su Data.gov (pokrenut 2009) i Data.gov.uk (pokrenut 2010) – ali i u manje poznatim eksperimentima, kakvi su Where Does My Money Go? (Gde ide moj novac?, prim. prev.) – koji koristi podatke da bi pokazao kako su raspodeljeni javni troškovi – i Mapumental – koji kombinuje podatke o putovanjima, cene nekretnina i korisničke ocene lokacije da bi vam dao instant-predloge delova grada koji bi mogli biti najbolje mesto za vas na osnovu vaših zahteva.
Međutim, ima na desetine, ako ne i stotine sličnih primera od zdravsta i nauke do kulture i sporta. Živimo u vreme neprevaziđene dostupnosti podataka – neki to još zovu i ‘Big Data’ – ali mediji ipak uglavnom sporo reaguju.
To će se uskoro promeniti.
Novinar koji zna s podacima
Tokom prošle godine sve veći broj medija je počeo da baca pogled i van svojih ustaljenih proizvodnih traka usmerenih samo na priču; počeli su da vide vrednost podataka. U Velikoj Britaniji je prekretnica bila jedna priča o troškovima poslanika: kada jedna novina diktira medijsku agendu šest nedelja, ostatatak Fleet Streeta će obratiti pažnju na to – a u srcu ove priče su bili podaci, milion unosa na jednom disku. Od tada je svaki ozbiljan medij proširio svoje aktivnosti na obradi podataka.
U SAD je novinar-programer Adrian Holovaty pokrenuo nešto novo sa svojim sajtom ChicagoCrime.org, koji je mashup podataka, i njegovim ‘potomkom’ pod nazivom Everyblock koji se zasniva na otvorenom kodu, dok je Aron Pilhofer inovirao odsek za interaktivnost u New York Timesu, a novi medijski projekti kao što su Talking Points Memo ili ProPublica koriste podatke kao odskočnu dasku za istraživanje rada vlasti.
Onima koji na rade na ovakvim projektima sve to izgleda veoma uzbudljivo. A zapravo smo na samom početku. Novinarstvo koje se zasniva na obradi podataka podrazumeva veliki raspon disciplina – od Computer Assisted Reportinga (CAR) i programiranja, to vizualnog predstavljanja podataka i statističke obrade. Ako ste novinar koji je dobar u nekoj od ovih disciplina - trenutno ste izuzetak. Ali to neće dugo trajati: profesija će morati da podigne nivo veština ili neće više imati čime da se proda.
Mediji su godinama zarađivali od toga što su bili posrednici koji obrađuju sadržaj između trgovine i konzumenata, vlasti i građana, ali je internet taj poslovni model učinio zastarelim. Nije više dovoljno da novinar bude dobar u pisanju – ili uređivanju. Ima milion drugih koji mogu bolje da pišu – veliki broj njih radi u odnosima s javnošću, marketingu ili vladi. Iako će nam uvek trebati profesionalni naratori, mnogi novinari su naprosto radnici na proizvodnoj traci.
Tako će izdavaštvo morati da ustanovi nove vrednosti u tom novom okruženju, makar iz komercijalnih razloga ako ne drugih, kao i nove metode koje će novinarstvo učiniti isplativim.
Novinarstvo koje se zasniva na obradi podataka je među njima. Obilje javno dostupnih podataka bogat je izvor sirovina. Ono što nedostaje su veštine da se takvi podaci lociraju i da se pretvore u nešto smisleno – bilo da su to programerske veštine kojima se odjednom ubiraju velike količine podataka sa weba (engl. scraping, prim. prev.) i porede sa drugim izvorima, veštine grafičkog dizajna neophodne za vizualni prikaz podataka, kao i znanje statistike da se podaci obrade.
“Masovno tržište je bilo diletantsko”: šanse za novu ekonomiju
Tehnološke mogućnosti su ogromne. Kako raste kompjuterska moć obrade podataka, raste i našta sposobnost da u podacima nalazimo odgovore na pitanja, da ih kombinujemo i predstavljamo. Razvoj proširene stvarnosti otvara posebno privlačne mogućnosti za izdavaštvo: zamislite da možete da vidite lokalne priče zasnovane na obradi podataka preko svojih mobilnih telefona, ili da im sami dodajete podatke. Gore pomenuti eksperimenti iz poslednjih pet godina izgledaće primitivno u poređenju s tim.
A tu je i komercijalni potencijal. Izdavaštvo za većinu izdavača znači prodavanje reklama, a ne prodavanje sadržaja. A tu podaci imaju sve veću ulogu. Masovno tržište je bilo diletantsko. Kao što kaže izreka: “Pola para koje sam potrošio na reklamu su bačene; problem je što ne znam koja polovina”.
Međutim, Google, Facebook i drugi koriste merljivost weba da bi smanjili mogućnost za grešku, a izdavači bi trebalo da ih slede. Tu ima smisla staviti podatke u centar pažnje – dok omogućavate korisniku da obrađuje podatke koje ste skupili na temu sigurnosti u saobraćaju, ponuda oglašivača će verovatno glasiti “Možemo da prikažemo različite reklame u zavisnosti od toga za kakve je informacije zainteresovan korisnik”, ili “Možemo da uputimo korisnika na lokalno zastupništvo u njegovoj blizini”.
Kolaborativna budućnost
Skeptičan sam po pitanju mogućnosti etabliranih izdavača da se prilagode takvoj budućnosti, ali bilo da se oni prilagode ili ne, drugi hoće. A obrazovanje i iskustvo novinara će morati da se promeni. Ova profesija već dugo počiva na ljudima sa humanističkim diplomama koji su izuzetno verbalno sposobni, ali po pravilu nisu matematički pismeni. Zbog toga profesija trpi stalne kritike jer su blogeri – stručnjaci u nekim oblastima – ukazali na neke početničke greške novinara u izveštavanju o nauci, zdravlju ili finansijama, a to ne sme tako da se nastavi.
Trebaće nam više novinara koji će moći da napišu savršen zahtev pozivajući se na zakon o dostupnosti informacijama; više istraživača koji poznaju ’nevidljivi web’, skrivene delove weba gde se nalaze baze podataka. Trebaće nam programeri-novinari koji će moći da pišu programe kojima će skupljati, sortirati, filtrirati i pohranjivati podatke s weba, kombinovati ih ili porediti s drugim izvorima. Trebaće nam dizajneri koji mogu vizualno da predstave te podatke na najjasniji mogući način – ne samo da bi informacije lepo izgledale, već i zbog bolje distribucije – infografika je sve značajniji izvor poseta sajtovima.
Postoji opasnost od senzacionalizma u podacima – predstavljanja javno dostupnih statističkih podataka na spektakularan način kojem nedostaje kontekst ili detaljnije objašnjenje. Urednici će morati statistički da se opismene da bi ovo sprečili. U suprotnom ćemo ih lako prozreti.
Međutim, inovacija neće biti potrebna samo u novinarskom i uredničkom procesu. Prodaja reklamnog prostora će morati da iskusi istu revoluciju koju su iskusili novinari, moraće da nauči jezik web-metrike, bihejvioralnog oglašavanja i prodaje ovih pogodnosti oglašivačima.
A kao oni koji objavljuju podatke, i menadžeri će morati da usvoje filozofije pokreta otvorenog pristupa podacima i povezanih podataka da bi iskoristili sve dobrobiti koje im oni donose za efikasnost u poslu. The New York Times i The Guardian su objavili programerske interfejse (API) kojima omogućuju drugima da prave nove web servise koristeći njihov sadržaj. Za uzvrat dobijaju pristup tehničkoj, matematičkoj i dizajnerskoj ekspertizi koju inače ne bi mogli da plate, i imaju koristi od novih proizvoda i novih publika, budući da je (u slučaju Guardiana) oglašavanje uključeno u ovu uslugu. Kako ove prednosti budu sve više prepoznate kao takve, i drugi izdavači će slediti ovaj primer.
Nadam se da će to voditi kolaborativnijem novinarstvu. Najveći resurs jednog izdavača je njegova publika. Do sada su izdavači samo pakovali taj resurs za oglašivače. Ali sada, kada publika ima pristup istim informacijama i alatima kao i novinari, i nalazi se u interakciji sa oglašivačima i međusobno, vredna je na više načina.
Istovremeno opada vrednost redakcije: smanjuju se redakcije, a smanjuje im se i kompetitivna prednost; ni jedan novinar ne poseduje svu dubinu i širinu veština koje zahtevaju statistička obrada podataka, CAR, programiranje i dizajn potrebni za novinarstvo koje se oslanja na obradu podataka. Novi medij – i novo tržište – zahtevaju nova pravila. Povezana i iterativna forma novinarstva kojoj smo već svedoci na internetu verovatno će postati još konvencionalnija kako se izdavači budu okretali od modela koji kao proizvod vidi novinarsku priču prema modelu koji počinje od podataka.
----------------------------------------------------------------------------------------------------------
Tekst je verzija članka (pre uredničke intervencije) napisanog za izveštaj ‘Brave News Worlds (PDF)‘ International Press Institute-a
Tekst je preuzet, preveden i objavljen na MC Online uz odobrenje Online Journalism Blog-a, gdje je objavljen 23.09.2010. pod naslovom "The mass market was a hack”: Data and the future of journalism.
Svako dalje korištenje i distribucija ovog teksta podliježe uvjetima korištenja sadržaja Online Journalism Blog-a koji su u cjelosti dostupni na sajtu http://onlinejournalismblog.com/.
Oprema teksta: redakcija MC Online.