Tag Archives: open data

The quantified man 2: data on running embraces the dark side

Two weeks ago, as I was training for the Milano Relay Marathon, I received an unexpected email. It was from insurance company Europ Assistance, which offered all athletes discounts on its health insurance products. It came as a surprise, because I am careful to deny my consent to my data being used for marketing. I called the trainer of our group, who had taken care of entering us into the race, and he assured me he is very careful about that too. Maybe, he said, Europ Assistance got through the privacy barriers because it actually delivers a service to athletes: health insurance for the duration of the race. I got to the finishing line and there they were, measuring “health parameters” and, I am sure, promoting their products.

The rationale of an aggressive marketing towards long distance runners are clear. Insuring anyone who runs a marathon is profitable, because she is likely to be quite healthy and will be paying up for years before requiring that the insurer pays for treatment. I wonder if insurance companies are tempted by the reciprocal strategy, that of NOT insuring people who do not show up in the myriad databases associated with a healthy lifestyle (members of sport clubs, gym aficionados etc.). This kind of behavior is advantageous for its perpetrator (in this case insurance companies), but socially harmful (risk is not spread, and people who need care most can’t get it). Should this happen, private insurance would prove an inadequate solution to the health care of the citizenry, and policy makers should build and protect national health services.

Incidentally, the list of participants to the Milano Relay Marathon is far from the the most potentially momentous database from the point of view of the companies. Genomic startup 23andme sequences your DNA based on a sample received by mail, and computes your “risk factors” for 100 diseases — for $99. In the discussion on the social consequences of a pervasive Internet I see many people trying to scare their fellow citizens with stuff that most experts consider unfounded: we will unlearn to read any text longer than a tweet, we will shut ourselves in our homes to chat with strangers online instead of living the rich social life of our elders, we will bump into paedophiles and terrorists in every other social networking website. Internet skeptics are good at whistle blowing; they could be very useful to society by blowing the whistle for the real risks, like those associated with the inevitable loss of privacy on health data. And we that care about open data (and love data about our own running) had better meditate on whether transparency can become too much of a good thing.

Here is a more positive earlier post on running as mass generation and consumption of data)

L’uomo quantificato 2: il lato oscuro dei dati sulla corsa

Due settimane fa, mentre mi allenavo per la Milano Relay Marathon, ho ricevuto un’e-mail a sorpresa. A scrivermi era l’assicurazione Europ Assistance, che offriva a tutti gli atleti sconti sulle polizze salute. Mi sono stupito, perché nego sempre il consenso a ricevere comunicazioni promozionali. Ho chiamato l’allenatore del gruppo di runners di cui faccio parte, che si era incaricato delle iscrizioni di tutti noi, e lui mi ha assicurato di essere molto attento a fare lo stesso. Forse, mi ha detto, Europ Assistance era riuscita a passare attraverso il filtro della legge sulla privacy perché erogava un servizio agli atleti: l’assicurazione sanitaria durante la gara. All’arrivo, letteralmente dieci metri dopo il traguardo, il personale Europ Assistance misurava “parametri sanitari” e, immagino, diffondeva informazioni sui propri prodotti.

Le ragioni di un marketing tanto aggressivo nei confronti dei partecipanti a una corsa di fondo sono chiare. Assicurare noi maratoneti è molto redditizio, perché curiamo la nostra salute e in media pagheremo premi per molti anni prima di richiedere alle compagnie di pagare cure mediche. Mi chiedo però se le compagnie assicurative non siano tentate di fare anche il contrario, cioè NON assicurare chi non compare nei database associati a uno stile di vita sano (società sportive, iscritti a palestre etc.). Questo comportamento è vantaggioso per chi lo mette in atto (in questo caso le compagnie assicurative) ma dannoso per la società (non si condivide il rischio, e proprio chi ha più probabilità di avere bisogno di cure non le può ottenere). Se si verificasse, ne conseguirebbe che le assicurazioni private non sono uno strumento adatto a fornire assistenza sanitaria ai cittadini, e i decisori pubblici dovrebbero orientarsi decisamente verso la costruzione e la difesa di servizi sanitari nazionali.

Tra l’altro, l’elenco degli iscritti alla Milano Relay Marathon non è certamente il database più potenzialmente esplosivo dal punto di vista delle compagnie: la startup genomica 23andme sequenzia il vostro DNA a partire da un batuffolo di cotone inviato per posta, a partire da 99 dollari, e calcola i “fattori di rischio” di cento malattie. Nel dibattito sulle conseguenze sociali della diffusione generalizzata di Internet vedo agitare molte paure che la maggior parte degli esperti considera infondate: disimpareremo a leggere ogni testo più lungo di un tweet, ci rinchiuderemo in casa a chattare invece di uscire e incontrare persone interessanti come facevano i nostri socievoli genitori, ci intratterremo con pedofili e terroristi. Gli Internet-scettici, che hanno dato prova di una notevole vis polemica, potrebbero essere molto utili alla società impegnandosi su rischi concreti come quello della privacy sanitaria. E noi che abbiamo a cuore l’apertura dei dati (e siamo affamati di dati sul nostro correre) faremmo bene a chiederci seriamente se in questo caso la trasparenza non possa rivolgersi contro di noi.

(Qui un post più positivo sulla corsa come generazione e consumo di massa di dati di performance atletica)

Aperti nonostante tutto: gli open data italiani segnano un punto

Martedì a Roma è successa una cosa bellissima: è stato presentato OpenSpending Italy, il primo contributo dell’Italia alla piattaforma internazionale OpenSpending.

I dati esistevano già. Sono quelli dei conti pubblici territoriali, che il Dipartimento di Politiche per lo Sviluppo ha cominciato a raccogliere nel 1998. E non solo esistevano, ma erano già in formato aperto; della loro pubblicazione aperta va dato atto al Dipartimento e alle sue e ai suoi dirigenti. Eppure, credo, l’annuncio di martedì segna una svolta importante.

C’è stato un salto nell’accessibilità. Dati di grande rilievo sui conti pubblici italiani (spesa pubblica consolidata dello Stato e delle amministrazioni regionali e locali, divisa per regione) sono accessibili con modalità di visualizzazione interattive, avanzate e facilmente confrontabili con iniziative analoghe all’estero (in lingua inglese), Ancora più interessante, questi dati sono stati pubblicati in forma di widget: chiunque può copiare e incollare il codice di embed dovunque voglia visualizzarli, come io ho fatto più sopra.

Ma il salto più interessante è nell’ampiezza e nella diversità della collaborazione che ha prodotto questo risultato. I dati di OpenSpending Italy sono stati raccolti, puliti e associati a metadati da funzionari pubblici italiani della Ragioneria Generale dello Stato e del Dipartimento di Politiche per lo Sviluppo; elaborati attraverso software scritto e adattato da sviluppatori inglesi e tedeschi della Open Knowledge Foundation, che fa parte del terzo settore; e pubblicato attraverso i canali dedicati al data journalism del quotidiano britannico Guardian, che naturalmente è un’impresa privata. L’idea è stata partorita nei luoghi di ritrovo del movimento open data italiano, e soprattutto in un luogo virtuale: la mailing list di Spaghetti Open Data, nata a settembre 2010 per offrire a funzionari pubblici e hacker civici un luogo dove discutere di dati aperti in un contesto costruttivo e rispettoso.

Grazie a questa diversità “gestita” (nel senso che comportamenti irrispettosi non vi sono tollerati) SOD – come altri luoghi – consente a persone che hanno percorsi e competenze complementari di incontrarsi, esplorarsi e, forse, fare qualcosa insieme. OpenSpending Italy è nato da una collaborazione tra due meravigliose civil servants, Aline Pennisi della Ragioneria Generale dello Stato e Simona De Luca del Dipartimento di Politiche per lo Sviluppo, e il civic hacker Stefano Costa di Open Knowledge Foundation Italia. Stefano ha coinvolto i suoi colleghi internazionali (in particolare Jonathan Gray e Friedrich Lindenberg); e questi hanno chiamato in causa Guardian Media (Simon Rodgers, che in quel momento si trovava in Italia — come del resto Gray — per partecipare al Festival del Giornalismo di Perugia). In 72 ore i dati erano pronti per essere sparati sulla prima pagina di OpenSpending e sul datablog del Guardian.

Questa vicenda, almeno per me, porta un messaggio molto chiaro: il movimento open data italiano è maturato molto prima del previsto. I dati stanno crescendo; stiamo convergendo su standard per la pubblicazione; abbiamo tools di visualizzazione, luoghi di ritrovo fisici e virtuali, simpatizzanti nelle pubbliche amministrazioni e nell’ISTAT. Abbiamo amici stranieri che condividono il nostro interesse e con cui siamo in grado di collaborare alla pari. Abbiamo anche una leadership emergente: rilasciato OpenSpending Italy, Aline sta già lavorando con OpenPolis e Open Linked Data Italy su un progetto che si chiama Open Bilanci, che mira a rendere facilmente accessibili i bilanci degli oltre 8000 comuni italiani. E tutto questo in un paese che viene percepito (con buone ragioni) come bloccato, declinante, indifferente.

Poi ok, la stampa ha fatto un po’ di confusione nel riportare in modo corretto fonti e coverage esatti dei dati (Pasquale Notargiacomo su Repubblica, con un inciampo buffo, li attribuisce al Dipartimento del Tesoro, che esiste negli USA ma non qui da noi!), ma è un ottimo inizio, e sono certo che nel tempo ci insegneremo l’un l’altro a essere più rigorosi. Per quanto mi riguarda, sono molto orgoglioso e felice del piccolo contributo che do al movimento open data italiano, mantenendo la mailing list di SOD (sono una specie di portinaio del condominio). Tutti insieme, servitori dello Stato, geeks e semplici curiosi stiamo dimostrando che si possono fare cose utili qui e ora, con le risorse che ci sono e con le competenze che abbiamo, senza aspettare grandi riforme o rinnovamenti culturali. Possa questa attitudine diffondersi ad altri aspetti della sfera pubblica. Sa il cielo che ne abbiamo bisogno.