Dez mil quilômetros de estradas, mil quilômetros de trilhos de metrô, 650 quilômetros de ciclovias, e 800 metros de bonde elétrico se já esteve em Roosevelt Island. Esses são os números relativos à infraestrutura de Nova York. São estatísticas da nossa infraestrutura. Números divulgados em relatórios de órgãos municipais, como a Secretaria de Transporte, que orgulhosamente informa quantos quilômetros de estradas mantém. O MTA vai se gabar da extensão das linhas do metrô. A maioria desses órgãos fornecem estatísticas. Estas são de um relatório deste ano da Comissão de Táxis e Limusines, em que descobrimos que há cerca de 13,5 mil táxis aqui em Nova York. Bem interessante, né? Mas já se perguntaram de onde vêm esses números? Pois, para esses números existirem, alguém na prefeitura precisa parar e dizer: "Eis aqui um número que alguém pode querer saber. Um número que os cidadãos querem saber." Daí, voltam para seus dados brutos, contam, adicionam, calculam e aí publicam relatórios, e esses relatórios têm números assim. O problema é: como eles sabem todas nossas dúvidas? Temos muitas perguntas. De fato, há literalmente um número infinito de perguntas que podemos fazer sobre a cidade. Os órgãos do governo não dão conta. Assim, o paradigma não funciona, e acho que nossos urbanistas percebem isso, pois, em 2012, o prefeito Bloomberg sancionou uma lei que chamou de a mais ambiciosa e abrangente legislação de dados abertos do país. Em grande parte, ele está certo. Nos últimos dois anos, a cidade divulgou mil arquivos de dados nesse portal, e é bem impressionante. Então, vamos lá e vemos dados como estes e, em vez de só contar o número de táxis, podemos fazer diversas perguntas. Eu tinha uma pergunta: quando é a hora do rush em Nova York? Que é uma coisa bem chata: qual é a hora do rush? E pensei comigo mesmo: esses táxis não são só números, são dados de GPS rodando por nossas ruas, registrando cada corrida que fazem. Há dados aí, e olhei para esses dados e calculei a velocidade média dos táxis em Nova York durante o dia. Dá pra ver que, da meia-noite até cerca das 5h18 da manhã, a velocidade aumenta e, a partir daí, as coisas se invertem, e eles ficam cada vez mais lentos até cerca das 8h35 da manhã, quando acabam rodando em torno dos 17 km/h. O táxi comum roda a 17 km/h nas ruas da cidade, e acontece de ficar assim... ... o dia inteiro. (Risos) Daí pensei: acho que não há hora do rush em Nova York, apenas dia de rush. (Risos) Isso faz sentido e é importante por diversas razões. Para um gestor de transportes, deve ser bem interessante saber isso. Mas, se quiser chegar rápido a um lugar, agora sabe que basta pôr o alarme para as 4h45 da manhã, e pronto. É Nova York, certo? Mas há uma história aí. Esses dados não estavam disponíveis dessa forma. Na verdade, vieram do chamado Freedom of Information Law Request, ou Requisição FOIL. Este é um formulário do site da Comissão de Táxis e Limusines. Para acessar os dados, é preciso pegar esse formulário, preenchê-lo, e depois eles te notificam. Um cara chamado Chris Whong fez exatamente isso. Chris foi lá, e disseram para ele: "Traga um HD novinho em folha ao nosso escritório, deixe-o aqui por cinco horas, copiamos os dados e você busca de volta". E foi daí que vieram esses dados. Chris é o tipo do cara que quer tornar públicos esses dados, para ficarem on-line para todos, e esse gráfico veio daí. E o fato de isso existir é incrível; esses registros de GPS são muito legais. Mas os cidadãos precisarem andar por aí com HDs, coletando esses dados para torná-los públicos, quando já eram meio que públicos, acessíveis, mas não eram públicos, eram "públicos". O governo pode fazer melhor que isso. Não faz sentido nossos cidadãos andando por aí com HDs. Mas nem todos os dados dependem de uma Requisição FOIL. Eis um mapa que fiz dos cruzamentos mais perigosos de Nova York, baseado em acidentes com ciclistas. As áreas vermelhas são as mais perigosas. E a mais perigosa é o East Side de Manhattan, especialmente a área mais ao sul, com maior número de acidentes. Isso faz sentido, pois ali há mais ciclistas vindo das pontes. Mas há outros lugares dignos de atenção, como Williamsburg e a Avenida Roosevelt, no Queens. E é exatamente o tipo de dado que precisamos para o Vision Zero. É exatamente o que estamos procurando. Há uma história atrás desses dados também. Eles não surgiram do nada. Quantos aqui conhecem essa logomarca? É, alguns de vocês. Já tentaram copiar e colar dados de um arquivo PDF e depois decifrá-los? Mais mãos levantadas agora. Mais pessoas tentam copiar e colar do que conhecem a logomarca. Gostei! Na verdade, os dados que acabaram de ver estavam em PDF. De fato, há centenas de páginas em PDF disponibilizadas pela nossa polícia e, para acessar, ou vocês copiam e colam por centenas de horas, ou fazem como John Krauss. John Krauss pensou: "Não vou copiar e colar esses dados. Vou escrever um programa." Chama-se "NYPD Crash Data Band-Aid", e vai no site da polícia e baixa os PDFs. Todos os dias o programa procura; se encontrar um PDF, ele baixa, roda um programa que extrai os dados do PDF, produz um texto e coloca na Internet, para que as pessoas possam fazer mapas assim. E o fato de os dados estarem aqui, o fato de termos acesso a eles, aliás, cada linha dessa tabela é um acidente. Imaginem quantos PDFs há aqui. O fato de termos acesso a isso é ótimo. Mas parem de liberar dados em PDF, ou nossos cidadãos vão ter de extrair dados de PDF. Isso é desperdício do tempo dos cidadãos, e a prefeitura pode fazer melhor que isso. Bem, a boa notícia é que a administração Blasio liberou esses dados poucos meses atrás, e agora então podemos de fato acessá-los, mas ainda há uma porção de dados escondidos em PDF. Por exemplo, nossos dados criminais estão disponíveis apenas em PDF. E não apenas os dados criminais, o próprio orçamento do município. Nosso orçamento está disponível apenas no formato PDF. Não somos os únicos a não conseguir analisá-los. Nossos próprios legisladores, que votam o orçamento, também apenas o acessam em PDF. Daí, nossos legisladores não conseguem analisar o orçamento que estão votando. E acho que a cidade pode fazer um pouco melhor que isso. Mas há uma porção de dados não escondidos em PDFs. Eis um exemplo de um mapa que fiz com as hidrovias mais sujas de Nova York. Bem, como medi essa sujeira? Foi de um jeito um pouco estranho, mas olhei o nível dos coliformes fecais, que é uma medida da matéria fecal em cada uma das nossas hidrovias. Quanto maior o círculo, mais suja é a água. Assim, os círculos grandes são água suja, e os menores, água mais limpa. O que veem são hidrovias internas. Dados que foram coletados pela prefeitura nos últimos cinco anos. E as hidrovias internas são, em geral, mais sujas. Faz sentido, não é mesmo? E aprendi umas coisas com isso. Primeira, nunca nadem em algo que termine com "creek" ou "canal". Segundo, também descobri a hidrovia mais suja de Nova York por essa medida, uma medida. Em Coney Island Creek, não a Coney Island onde nadam, felizmente, mas do outro lado, vi que 94% das amostras coletadas lá nos últimos cinco anos tinham níveis fecais tão altos que deveria ser ilegal nadar naquela água. E esse não é o tipo de fato propalado num relatório municipal, né? Não vai estar na capa página do NYC.gov. Não vão ver isso lá, mas o fato de podermos acessar esses dados é incrível. Mas, repito, não foi superfácil, pois não estavam no portal de dados abertos. No portal de dados abertos, havia apenas parte deles, um ano ou poucos meses. Eles estavam no site da Secretaria do Meio Ambiente. E cada um desses links é uma planilha Excel, e cada planilha é diferente. Cada cabeçalho é diferente: você copia, cola, reorganiza. E aí pode fazer mapas, o que é ótimo, mas a cidade pode fazer melhor, padronizando os dados. E estamos chegando lá, pois há este site feito pela Socrata, chamado Open Data Portal NYC. Aqui é onde ficam 1,1 mil arquivos sem esses problemas que mencionei, e esse número está crescendo, o que é ótimo. Vocês podem baixar dados em qualquer formato, CSV, PDF ou Excel. O que quiserem, podem baixar do jeito que acharem melhor. O problema é que, uma vez feito isso, vão descobrir que cada órgão codifica os endereços de forma diferente. Assim, podemos ter nome da rua, cruzamento, rua, bairro, endereço, edifício, endereço do prédio. Então, mesmo tendo o portal, gasta-se tempo padronizando nossos campos de endereço. E essa não é a melhor forma de usarmos nosso tempo. Podemos fazer melhor como cidade. Podemos padronizar nossos endereços e, assim, vamos ter mais mapas como este. Este é um mapa de hidrantes de Nova York, mas não de quaisquer hidrantes. Estes são os 250 hidrantes campeões de multas de trânsito. (Risos) Assim, aprendi algumas coisas com este mapa. Primeiro, não estacione no Upper East Side. De jeito nenhum; não importa onde parar, vai levar uma multa de hidrante. Segundo, descobri os hidrantes campeões de multa em Nova York. Eles estão no Lower East Side e arrecadam mais de US$ 55 mil por ano em multa por estacionar em local proibido. E achei estranho quando vi isso. Então pesquisei um pouco mais, e acontece que há um hidrante e algo chamado extensão da calçada, um lugar de uns 2m para se andar, e depois um lugar para estacionar. Então os carros chegam e veem o hidrante: "A vaga vai até lá, estou bem". Na verdade, a vaga está lá demarcada bonitinha. Daí, estacionam ali, mas a polícia discorda dessa marcação, e multa. E não fui o único a levar uma multa. Vejam só o carro do Street View do Google ali com a mesma multa de trânsito. Daí, escrevi sobre isso no meu blog, I Quant NY, e o DOT respondeu, dizendo: "Apesar de o DOT não ter recebido qualquer reclamação sobre esse lugar, vamos rever a marcação na pista e fazer as alterações necessárias". E pensei cá comigo: "Resposta típica do governo, tudo bem, vou cuidar da minha vida". Mas, poucas semanas depois, algo incrível aconteceu. Repintaram o lugar, e por um segundo vislumbrei o futuro dos dados abertos, pois vejam só o que aconteceu aqui. Durante cinco anos, levamos multas nesse lugar, pois era confuso, e daí um cidadão descobriu isso, avisou à prefeitura e, em poucas semanas, o problema foi resolvido. Incrível! E há quem veja isso como um fiscal. Não é, tem a ver com parceria. Empoderar os cidadãos para serem melhores parceiros do governo. E não é tão difícil assim, só precisamos de algumas mudanças. Se camuflarem os dados, e os cidadãos tiverem todas as vezes de requisitá-los, melhor liberá-los, é sinal de que é preciso torná-los públicos. E, se você é um órgão do governo liberando um PDF, vamos aprovar legislação que exija publicar isso com os dados originais, pois esses dados vêm de algum lugar, não sei de onde, mas vêm, e depois podem publicá-los em PDF. E vamos adotar e compartilhar padrões de dados abertos, começando com nossos endereços aqui em Nova York. Vamos padronizar nossos endereços, pois somos referência em dados abertos. Apesar desses problemas, somos líderes absolutos nisso. Se estabelecermos um padrão para os dados, outros vão nos seguir. O estado vai seguir, talvez o governo federal. Sei que parece loucura, mas outros países poderão seguir, e não estamos tão longe assim de escrever um programa para mapear informação de 100 países. Não é ficção científica; estamos bem perto disso na verdade. E, a propósito, quem estamos empoderando com isso? Não é apenas John Krauss ou Chris Whong. Há centenas de "meetups" acontecendo em Nova York agora mesmo. "Meetups" ativos, com milhares de pessoas participando depois do trabalho e nos finais de semana, analisando dados abertos, para tornar nossa cidade um lugar melhor. Grupos como BetaNYC, que semana passada lançou o citygram.nyc, que dá acesso às reclamações feitas no site da prefeitura, por região. É só colocar o endereço e acessar as reclamações. E não é apenas a comunidade tecnológica que está atrás dessas coisas. São os gestores urbanos, como meus alunos em Pratt. Agentes de políticas públicas, todo mundo, cidadãos de diversos segmentos. E, com algumas mudanças pequenas, graduais, podemos estimular a paixão e a habilidade de nossos cidadãos para usar dados abertos e fazer nossa cidade ainda melhor, seja com um conjunto de dados, ou com um lugar para estacionar. Obrigado. (Aplausos)