Dez mil quilômetros de estradas,
mil quilômetros de trilhos de metrô,
650 quilômetros de ciclovias,
e 800 metros de bonde elétrico
se já esteve em Roosevelt Island.
Esses são os números relativos
à infraestrutura de Nova York.
São estatísticas da nossa infraestrutura.
Números divulgados em relatórios
de órgãos municipais,
como a Secretaria de Transporte,
que orgulhosamente informa
quantos quilômetros de estradas mantém.
O MTA vai se gabar da extensão
das linhas do metrô.
A maioria desses órgãos
fornecem estatísticas.
Estas são de um relatório deste ano
da Comissão de Táxis e Limusines,
em que descobrimos que há cerca
de 13,5 mil táxis aqui em Nova York.
Bem interessante, né?
Mas já se perguntaram
de onde vêm esses números?
Pois, para esses números
existirem, alguém na prefeitura
precisa parar e dizer: "Eis aqui um número
que alguém pode querer saber.
Um número que os cidadãos querem saber."
Daí, voltam para seus dados brutos,
contam, adicionam, calculam
e aí publicam relatórios,
e esses relatórios têm números assim.
O problema é: como eles
sabem todas nossas dúvidas?
Temos muitas perguntas.
De fato, há literalmente
um número infinito de perguntas
que podemos fazer sobre a cidade.
Os órgãos do governo não dão conta.
Assim, o paradigma não funciona, e acho
que nossos urbanistas percebem isso,
pois, em 2012, o prefeito Bloomberg
sancionou uma lei que chamou
de a mais ambiciosa e abrangente
legislação de dados abertos do país.
Em grande parte, ele está certo.
Nos últimos dois anos, a cidade divulgou
mil arquivos de dados nesse portal,
e é bem impressionante.
Então, vamos lá e vemos dados como estes
e, em vez de só contar o número de táxis,
podemos fazer diversas perguntas.
Eu tinha uma pergunta:
quando é a hora do rush em Nova York?
Que é uma coisa bem chata:
qual é a hora do rush?
E pensei comigo mesmo:
esses táxis não são só números,
são dados de GPS rodando por nossas ruas,
registrando cada corrida que fazem.
Há dados aí, e olhei para esses dados
e calculei a velocidade média
dos táxis em Nova York durante o dia.
Dá pra ver que, da meia-noite
até cerca das 5h18 da manhã,
a velocidade aumenta e, a partir daí,
as coisas se invertem,
e eles ficam cada vez mais lentos
até cerca das 8h35 da manhã,
quando acabam rodando
em torno dos 17 km/h.
O táxi comum roda a 17 km/h
nas ruas da cidade,
e acontece de ficar assim...
... o dia inteiro.
(Risos)
Daí pensei: acho que não há hora do rush
em Nova York, apenas dia de rush.
(Risos)
Isso faz sentido e é importante
por diversas razões.
Para um gestor de transportes,
deve ser bem interessante saber isso.
Mas, se quiser chegar rápido a um lugar,
agora sabe que basta pôr o alarme
para as 4h45 da manhã, e pronto.
É Nova York, certo?
Mas há uma história aí.
Esses dados não estavam
disponíveis dessa forma.
Na verdade, vieram do chamado
Freedom of Information Law Request,
ou Requisição FOIL.
Este é um formulário do site
da Comissão de Táxis e Limusines.
Para acessar os dados,
é preciso pegar esse formulário,
preenchê-lo, e depois eles te notificam.
Um cara chamado Chris Whong
fez exatamente isso.
Chris foi lá, e disseram para ele:
"Traga um HD novinho em folha
ao nosso escritório,
deixe-o aqui por cinco horas, copiamos
os dados e você busca de volta".
E foi daí que vieram esses dados.
Chris é o tipo do cara que quer
tornar públicos esses dados,
para ficarem on-line para todos,
e esse gráfico veio daí.
E o fato de isso existir é incrível;
esses registros de GPS são muito legais.
Mas os cidadãos precisarem
andar por aí com HDs,
coletando esses dados
para torná-los públicos,
quando já eram meio
que públicos, acessíveis,
mas não eram públicos, eram "públicos".
O governo pode fazer melhor que isso.
Não faz sentido nossos cidadãos
andando por aí com HDs.
Mas nem todos os dados dependem
de uma Requisição FOIL.
Eis um mapa que fiz dos cruzamentos
mais perigosos de Nova York,
baseado em acidentes com ciclistas.
As áreas vermelhas são as mais perigosas.
E a mais perigosa é
o East Side de Manhattan,
especialmente a área mais ao sul,
com maior número de acidentes.
Isso faz sentido, pois ali há
mais ciclistas vindo das pontes.
Mas há outros lugares dignos de atenção,
como Williamsburg
e a Avenida Roosevelt, no Queens.
E é exatamente o tipo de dado
que precisamos para o Vision Zero.
É exatamente o que estamos procurando.
Há uma história atrás desses dados também.
Eles não surgiram do nada.
Quantos aqui conhecem essa logomarca?
É, alguns de vocês.
Já tentaram copiar e colar dados
de um arquivo PDF e depois decifrá-los?
Mais mãos levantadas agora.
Mais pessoas tentam copiar e colar
do que conhecem a logomarca. Gostei!
Na verdade, os dados que acabaram
de ver estavam em PDF.
De fato, há centenas de páginas em PDF
disponibilizadas pela nossa polícia
e, para acessar, ou vocês copiam
e colam por centenas de horas,
ou fazem como John Krauss.
John Krauss pensou:
"Não vou copiar e colar esses dados.
Vou escrever um programa."
Chama-se "NYPD Crash Data Band-Aid",
e vai no site da polícia e baixa os PDFs.
Todos os dias o programa procura;
se encontrar um PDF, ele baixa,
roda um programa
que extrai os dados do PDF,
produz um texto
e coloca na Internet, para que as pessoas
possam fazer mapas assim.
E o fato de os dados estarem aqui,
o fato de termos acesso a eles,
aliás, cada linha dessa
tabela é um acidente.
Imaginem quantos PDFs há aqui.
O fato de termos acesso a isso é ótimo.
Mas parem de liberar dados em PDF,
ou nossos cidadãos vão
ter de extrair dados de PDF.
Isso é desperdício
do tempo dos cidadãos,
e a prefeitura pode fazer melhor que isso.
Bem, a boa notícia
é que a administração Blasio
liberou esses dados poucos meses atrás,
e agora então podemos de fato acessá-los,
mas ainda há uma porção
de dados escondidos em PDF.
Por exemplo, nossos dados criminais
estão disponíveis apenas em PDF.
E não apenas os dados criminais,
o próprio orçamento do município.
Nosso orçamento está disponível
apenas no formato PDF.
Não somos os únicos
a não conseguir analisá-los.
Nossos próprios legisladores,
que votam o orçamento,
também apenas o acessam em PDF.
Daí, nossos legisladores não conseguem
analisar o orçamento que estão votando.
E acho que a cidade pode fazer
um pouco melhor que isso.
Mas há uma porção de dados
não escondidos em PDFs.
Eis um exemplo de um mapa que fiz
com as hidrovias mais sujas de Nova York.
Bem, como medi essa sujeira?
Foi de um jeito um pouco estranho,
mas olhei o nível dos coliformes fecais,
que é uma medida da matéria fecal
em cada uma das nossas hidrovias.
Quanto maior o círculo,
mais suja é a água.
Assim, os círculos grandes são água suja,
e os menores, água mais limpa.
O que veem são hidrovias internas.
Dados que foram coletados pela prefeitura
nos últimos cinco anos.
E as hidrovias internas são,
em geral, mais sujas.
Faz sentido, não é mesmo?
E aprendi umas coisas com isso.
Primeira, nunca nadem em algo
que termine com "creek" ou "canal".
Segundo, também descobri
a hidrovia mais suja de Nova York
por essa medida, uma medida.
Em Coney Island Creek,
não a Coney Island onde nadam,
felizmente, mas do outro lado,
vi que 94% das amostras coletadas
lá nos últimos cinco anos
tinham níveis fecais tão altos
que deveria ser ilegal nadar naquela água.
E esse não é o tipo de fato propalado
num relatório municipal, né?
Não vai estar na capa página do NYC.gov.
Não vão ver isso lá,
mas o fato de podermos
acessar esses dados é incrível.
Mas, repito, não foi superfácil,
pois não estavam
no portal de dados abertos.
No portal de dados abertos, havia apenas
parte deles, um ano ou poucos meses.
Eles estavam no site
da Secretaria do Meio Ambiente.
E cada um desses links é uma planilha
Excel, e cada planilha é diferente.
Cada cabeçalho é diferente:
você copia, cola, reorganiza.
E aí pode fazer mapas, o que é ótimo,
mas a cidade pode fazer melhor,
padronizando os dados.
E estamos chegando lá, pois
há este site feito pela Socrata,
chamado Open Data Portal NYC.
Aqui é onde ficam 1,1 mil arquivos
sem esses problemas que mencionei,
e esse número está
crescendo, o que é ótimo.
Vocês podem baixar dados
em qualquer formato, CSV, PDF ou Excel.
O que quiserem, podem baixar
do jeito que acharem melhor.
O problema é que, uma vez feito isso,
vão descobrir que cada órgão codifica
os endereços de forma diferente.
Assim, podemos ter
nome da rua, cruzamento,
rua, bairro, endereço, edifício,
endereço do prédio.
Então, mesmo tendo o portal,
gasta-se tempo padronizando
nossos campos de endereço.
E essa não é a melhor forma
de usarmos nosso tempo.
Podemos fazer melhor como cidade.
Podemos padronizar nossos endereços
e, assim, vamos ter mais mapas como este.
Este é um mapa de hidrantes de Nova York,
mas não de quaisquer hidrantes.
Estes são os 250 hidrantes
campeões de multas de trânsito.
(Risos)
Assim, aprendi algumas
coisas com este mapa.
Primeiro, não estacione
no Upper East Side.
De jeito nenhum; não importa onde
parar, vai levar uma multa de hidrante.
Segundo, descobri os hidrantes
campeões de multa em Nova York.
Eles estão no Lower East Side
e arrecadam mais de US$ 55 mil por ano
em multa por estacionar em local proibido.
E achei estranho quando vi isso.
Então pesquisei um pouco mais,
e acontece que há um hidrante
e algo chamado extensão da calçada,
um lugar de uns 2m para se andar,
e depois um lugar para estacionar.
Então os carros chegam e veem o hidrante:
"A vaga vai até lá, estou bem".
Na verdade, a vaga está
lá demarcada bonitinha.
Daí, estacionam ali, mas a polícia
discorda dessa marcação, e multa.
E não fui o único a levar uma multa.
Vejam só o carro do Street View do Google
ali com a mesma multa de trânsito.
Daí, escrevi sobre isso no meu blog,
I Quant NY, e o DOT respondeu, dizendo:
"Apesar de o DOT não ter recebido
qualquer reclamação sobre esse lugar,
vamos rever a marcação na pista
e fazer as alterações necessárias".
E pensei cá comigo:
"Resposta típica do governo,
tudo bem, vou cuidar da minha vida".
Mas, poucas semanas depois,
algo incrível aconteceu.
Repintaram o lugar,
e por um segundo vislumbrei
o futuro dos dados abertos,
pois vejam só o que aconteceu aqui.
Durante cinco anos, levamos multas
nesse lugar, pois era confuso,
e daí um cidadão descobriu isso,
avisou à prefeitura e, em poucas semanas,
o problema foi resolvido. Incrível!
E há quem veja isso como um fiscal.
Não é, tem a ver com parceria.
Empoderar os cidadãos para serem
melhores parceiros do governo.
E não é tão difícil assim,
só precisamos de algumas mudanças.
Se camuflarem os dados, e os cidadãos
tiverem todas as vezes de requisitá-los,
melhor liberá-los, é sinal de que é
preciso torná-los públicos.
E, se você é um órgão do governo
liberando um PDF,
vamos aprovar legislação que exija
publicar isso com os dados originais,
pois esses dados vêm de algum lugar,
não sei de onde, mas vêm,
e depois podem publicá-los em PDF.
E vamos adotar e compartilhar
padrões de dados abertos,
começando com nossos
endereços aqui em Nova York.
Vamos padronizar nossos endereços,
pois somos referência em dados abertos.
Apesar desses problemas,
somos líderes absolutos nisso.
Se estabelecermos um padrão
para os dados, outros vão nos seguir.
O estado vai seguir,
talvez o governo federal.
Sei que parece loucura,
mas outros países poderão seguir,
e não estamos tão longe assim
de escrever um programa
para mapear informação de 100 países.
Não é ficção científica; estamos
bem perto disso na verdade.
E, a propósito, quem estamos
empoderando com isso?
Não é apenas John Krauss ou Chris Whong.
Há centenas de "meetups" acontecendo
em Nova York agora mesmo.
"Meetups" ativos, com milhares
de pessoas participando
depois do trabalho e nos finais de semana,
analisando dados abertos,
para tornar nossa cidade um lugar melhor.
Grupos como BetaNYC, que semana
passada lançou o citygram.nyc,
que dá acesso às reclamações feitas
no site da prefeitura, por região.
É só colocar o endereço
e acessar as reclamações.
E não é apenas a comunidade tecnológica
que está atrás dessas coisas.
São os gestores urbanos,
como meus alunos em Pratt.
Agentes de políticas públicas, todo mundo,
cidadãos de diversos segmentos.
E, com algumas mudanças
pequenas, graduais,
podemos estimular a paixão
e a habilidade de nossos cidadãos
para usar dados abertos
e fazer nossa cidade ainda melhor,
seja com um conjunto de dados,
ou com um lugar para estacionar.
Obrigado.
(Aplausos)