Tag Archives: open data

The downsizing of data.gov: learning to manage expectations

Tim Berners-Lee at TED giving the famous "Raw data now" talk

Bad news for open government and open data activists everywhere. data.gov, the Obama administration flagship open data portal, is being taken down downsized on the wake of the recent federal budget cuts. So is former White House CTO Vivek Kundra’s IT dashboard. Especially data.gov is a hard blow: that is the template, imitated by the faster-moving governments and envied by the citizens of the slower-moving ones.

What went wrong? Steve O’Keeffe summarized it like this: GIGO and overpromise. I am not qualified to judge GIGO in this case, but overpromise rings a bell. The movement is wired along Tim Berner-Lee’s “Raw Data Now”: release the datasets, civic hackers and market forces will do the rest. Decision makers in the faster-moving administrations were all too happy to comply: the number of datasets you release is an easy to monitor measure of acitivity, and it looks great on press releases.

The demand-side has been sagging. This is unsurprising: interpreting data to tell causally convincing stories is hard. Civic hackers need to know their measurement theory, probability theory, statistics, econometrics; computer prowess does not take you beyond download. We did have some good examples of data driven journalism, but most of the media ignore the data and stick to interviewing academia and gov brass when they want coverage of economic/social/environmental issues. Makes sense too: there is not enough readership for data driven journalism yet.

Worse, we were told that new ecosystem of innovative services would arise from the availability of government data, leading to growth and jobs. Hard to resist: the package of innovation, growth and jobs in one phrase is one of the very few passwords that will unlock serious funding these days, and proponents and funders alike went with it. Couple of years down the road, we do have some cool apps and some companies that use the data. We even have some jobs generated around data availability, but the numbers are unimpressive. The most I’ve heard trumpeted is 60 employees for a single company. That, too, is hardly a surprise: if your business is based on an open-access, unexhaustible resource like gov data, economic theory tells us it’s going to be hard to bake any seriouse margin into it. You tend to get undercut and outcompeted by non profits and zero-overhead college students operating out of laptops. Profit requires scarcity, not abundance – just ask music recording studios. Keefe’s post contains an interesting little fact, and that is the private business has indeed invested in data, but private and very muck locked down.

Given all this, and in the light of the demise downsizing of data.gov, I would recommend the open gov movement to resist the temptation to promise anything we are not sure we can achieve in any scenario. Envision low-cost, low-hype operations; offer the collaboration of nonprofits and the civil society; emphasize that, while people are welcome to make money out of value-added-on-open-data services, that is not the point of the exercise. The point is increasing the transparency, accountability, and efficiency of public policy. It will be less cool, it will take us off the spotlight and the big funding grants, but it will keep the movement going, almost invulnerable to disenchantment, budget cuts and lobby capture. If I am wrong, great: another year from now, we can make a comeback and boast all the jobs open data will have created in the mean time.

Open Data summertime

Sorry, this post in Italian only. It is a call to arms for a collaborative translation into Italian of the Open Knowledge Foundation’s Open Data Manual. The rationale is that many Italian public authorities seem to be sincerely considering opening up their data, but they find taking the first step quite intimidating – lots of jargon to cut through. If you know enough Italian to help, read on!

È un buon momento per gli open data in Italia. Diverse amministrazioni mi sembrano considerare con sincero interesse l’idea di aprire i propri dati, nell’interesse della trasparenza e della collaborazione. Fare il primo passo, però, richiede il superamento di una certa timidezza iniziale. Lo capisco bene: ci sono scogli giuridici da evitare, un’infarinatura di know-how tecnico da acquisire, e la tentazione del “chi me lo fa fare” è sempre in agguato. In più, molta letteratura rilevante è in inglese.

E così, nella mitica mailing list di Spaghetti Open Data a un certo punto è nata l’idea di tradurre in italiano l’Open Data Manual della Open Knowledge Foundation, che è un documento ben organizzato, scritto per persone che non sanno nulla di open data. Come per tutte le cose veramente sentite, non è chiaro chi abbia avuto l’idea: qualcuno ha dato la colpa a me, ma io sono sicuro di non avere proposto nulla del genere (può essere che abbia detto “sarebbe bello”). Comunque sia, un paio d’ore dopo quelli della OKF avevano caricato il Manuale sul web per la traduzione.

È un venerdì di agosto. Proporre ora un’esperienza collaborativa (tra l’altro impegnativa come una traduzione) va contro ogni regola della comunicazione web. Ma va bene così: è un’operazione che si è montata praticamente da sola, e questo in genere è un buon segnale. In effetti, al momento in cui scrivo abbiamo già tradotto il 15% del manuale! Per il rimanente 85, tutti i lettori di Contrordine Compagni sono invitati ad arruolarsi. Va benissimo anche tradurre solo una o due frasi. Istruzioni:

  1. andate qui e registratevi.
  2. andate qui. Cliccate sul link “Open Data Manual → all.pot” e poi su “Translate now”.

Io sto facendo la mia parte e sono qui.

Detoxifying politics: open data and our common future

Sorry, this post in Italian only. The gist is that open data only empower citizens if there is a critical mass of data literate citizens that can give rise to competing interpretations. Otherwise, they risk toxyfying further the political debate, and governments are party right to be wary of just putting everything out there without a context.

Non mi sento quasi mai a mio agio nel discutere di politica. Il modo in cui decidiamo sul nostro futuro comune mi sembra qualche volta completamente fuori centro: si parla delle personalità dei leaders invece che delle loro politiche. Le stesse politiche sembrano assumere connotati molto diversi a seconda di chi le propone: i “nostri” tagli di bilancio sono un’assennata misura di controllo degli sprechi, mentre quelli degli avversari sono stangate indiscriminate su servizi essenziali. Il tutto è decisamente troppo emotivo; troppo perché votare “di pancia” rischia di avere conseguenze gravi (chi fosse interessato può leggersi Il mito dell’elettore razionale di Bryan Caplan). Nel corso della recente campagna referendaria, per esempio, si è parlato molto poco di energia nucleare e di modelli di gestione dell’acqua: hanno prevalso affermazioni vaghe ed emotive come “non mi fido di questo paese” (ma la usi la sanità pubblica? La scuola? Le autostrade?) o “restituiamo il futuro ai nostri figli” (nel senso di usare il nucleare perché produce meno gas di serra o di usare più carbone e petrolio perché non sono radioattivi?).

Mi sono fatto l’idea che i dati in formato aperto potrebbero essere un elemento di riequilibrio della discussione. Non solo i dati contengono fatti, ma discutere sull’interpretazione dei dati conduce ad analisi sempre più sofisticate: “guarda, il PIL è cresciuto molto più sotto il governo dei Grigi del misero 0.3% all’anno dell’amministrazione dei Colorati!” “Vero, ma considera che gli anni di amministrazione dei Colorati hanno coinciso con una depressione mondiale. L’indicatore giusto è il differenziale di crescita tra il nostro paese e la media mondiale, ed esso rende giustizia alla sagge politiche di rilancio condotte dai Colorati.” Per prevalere, i duellanti sono costretti a confrontarsi con il dato. Cosa misura veramente? Come interpretarlo?

Perché questo succeda, naturalmente, i dati sono essenziali, ma non sufficienti: ci vuole anche una fetta di opinione pubblica, per quanto minoritaria, che sappia usarli per costruire storie sul nostro vivere insieme e proporle alla discussione comune. In mancanza di questo i dati possono venire usati male, o branditi come armi, e diventare strumenti di riduzione della qualità del dibattito. È per questo che sto nel movimento open data, e, in quel movimento, mi sono autoassegnato il ruolo di proporre iniziative di stimolo della domanda di dati e data literacy. Nel video qui sopra (20 minuti) provo a spiegare meglio la mia posizione.