Em defesa do modelo de dados OpenStreetMap

By | Junho 6, 2022

Estive recentemente em um hotel com um desses slots de porta onde você pode colocar seu cartão-chave para encher o quarto. O hotel já colocou um cartão especial nele, para que não possa ser retirado. Dessa forma, as luzes e os condicionadores de ar ficam ligados 24 horas por dia.

Pode-se imaginar engenheiros e/ou usuários de produtos satisfeitos em vários fusos horários: felizes com grande sucesso, design de hotel que reduziria custos e economizaria energia, centenas de pequenas caixas de cartão projetadas nos quartos. Eles provavelmente receberam uma recompensa ou um aumento de salário ou algum outro reconhecimento.

Tudo o que os usuários tinham que fazer em um hotel real, que os designers provavelmente nunca visitariam, era cumprir as regras.

Mas a vida encontra um caminho.

Um formato de arquivo é uma exibição de alguns dados como um conjunto de caracteres que podem ser armazenados na memória, salvos em disco ou enviados por uma rede.

Alguns formatos são muito simples como arquivos txt, onde o que você vê é o que está no disco. Alguns são um pouco mais complicados, como o HTML que pega o texto e depois encerra as coisas dizendo “esta parte está em negrito” ou “esta parte é um link”.

Alguns formatos são muito complicados e os dados e a exibição de dados no disco podem ser muito diferentes uns dos outros. Por exemplo, se você estiver reproduzindo um arquivo de música, poderá ouvi-lo, mas o arquivo em si pareceria um absurdo impenetrável para a maioria das pessoas.

Os formatos de arquivo eram muito importantes 20-40 anos atrás, porque os computadores eram basicamente incríveis naquela época. Eles eram literalmente milhões de vezes piores do que são agora em todos os sentidos, então os formatos tinham que ser pequenos e rápidos.

Mas ainda assim, quanto mais simples for, mais pessoas o usarão em geral.

Há uma quebra na conexão quando o designer e o usuário de algo são pessoas diferentes. Exemplo canônico (projetar coisas do dia a dia) é um fogão com quatro queimadores dispostos em um quadrado, mas os botões de controle dispostos em uma linha. Isso exige que você pense. Exigir que você pense é o oposto de um bom design.

O design se torna mais importante quanto mais sua vida depende dele. Por exemplo, em kryptonomicon, Protagonista americano encontra um morteiro russo:

Shaftoe revisa as instruções. Não importa que estes sejam impressos em russo, porque eles são analfabetos de qualquer maneira. Uma série de parábolas é desenhada, um morteiro apoiando uma perna e alemães explodindo apoiando o oposto.

A conexão entre o designer e o usuário é chamada para o principal problema do pagador em economia. Qual é o meio é este; Eu ganho cara, mas você perde coroa. Isso significa que se alguém pagar por seus erros, você cometerá erros. Isso significa que eles podem fazer placas um pouco mais baratas e milhões de pessoas podem girar o botão errado todos os dias.

A resposta é, como qualquer proprietário de produto lhe dirá, aproxime-se do cliente. Para falar com eles. Para entendê-los. Para sentir a dor deles. Grande curto:

O Deutsche Bank tinha um programa chamado KYC (Conheça seu cliente), que, embora não envolvesse nada tão radical quanto conhecer de fato seus clientes, exigia que eles se encontrassem com seus clientes, pessoalmente, pelo menos uma vez.

O problema de falar com um cliente sobre tudo o que você faz é que você pode estar errado. Isso pode ser embaraçoso. É trabalho duro. Traz feedback negativo, que ninguém quer ouvir. Então, encontre a pessoa certa para o produto realmente falar com o cliente é um pouco como encontrar uma estrela do mar de seis patas. Possível, mas você precisará de equipamento especial e tempo.

É por isso que o design ruim está em toda parte.

Existe uma defesa barata, e essa é a simplicidade. Se você não quer ou não pode falar com os clientes, pelo menos simplifique as coisas. Quanto mais simples, mais pessoas o usarão.

E é isso que OpenStreetMap (OSM) modelo e formato é simples. Em um modelo de mapa geográfico, grosso modo, existem pontos – nós – no espaço. Se estiverem sozinhos, podem ser restaurantes e picos de montanhas. Se você conectá-los em uma linha, podem ser estradas e rios. Se você conectá-los em um anel, pode ser lagos ou ilhas. E é mais ou menos isso, e é dimensionado de nada para milhões de usuários.

Esses nós e outras coisas são coladas por algo chamado marcas, que são uma maneira ilimitada e aberta de descrever qualquer coisa na Terra.

Essa simplicidade era – e é – necessária porque os clientes, em sua maioria, trabalham de graça. comunidade OSM são voluntários. Voluntários escrevendo software e voluntários vagando para coletar dados. Quanto mais difícil você dificultar a edição, menos voluntários você terá.

Eu omito todas as razões técnicas pelas quais isso é ótimo porque a API principal do OSM é extremamente rápida, escalável, atômica e livre de manutenção. E todas as pessoas que o endureceram depois que eu o projetei.

O design do OSM é simples, mas também um pouco caótico pela mesma razão que é simples: é um espelho do mundo humano, que afinal é caótico. Este tem sido um ponto sensível para os tipos de pessoas que querem projetar algo distante, e os usuários que seguem as regras fazem o que lhes é dito.

Por (quase) décadas, algumas dessas pessoas reclamaram das deficiências do modelo de dados. É um pouco inconsistente e, para muitos usos, você precisa processar os dados.

Você vê, OSM não é armazenado estritamente geograficamente. Isso é intencional porque é muito simples, mas significa que nós na Finlândia às vezes podem ser conectados a nós em Barbados. Você precisa verificar coisas estranhas como essa se estiver processando dados brutos em um mapa. Não é realmente um grande problema, mas coisas que quebram os dados acontecem.

Agora você pode consertar tudo isso as regras.

Você pode ter regras que digam que você não pode conectar a Finlândia a Barbados. Que ruas de mão única não podem acabar uma em cima da outra. Esses países não podem ser renomeados. Que as estradas devem saber onde estão sem examinar seus nós individuais.

E você comete erros todas as vezes. À medida que os países mudam de nome, o estado outrora conhecido como Turquia fez exatamente isso. E talvez haja algum cabo submarino que conecte a Finlândia e Barbados, quem sabe.

E esse é o ponto, as regras e a complexidade têm deficiências completamente desconhecidas. Desvantagens como destruir todo o projeto.

A cada regra e complexidade extra, você torna o sistema menos humano e menos divertido. Torná-lo para os cientistas da computação Rube Goldberg Machine enquanto o esteriliza de todos os prazeres da vida.

Então, é claro, é exatamente isso que eles querem fazer.

A Fundação OSM, que supervisiona o projeto OSM, cresceu com seu financiamento. O Grupo de Trabalho de Engenharia OSMF (EWG) tem “ordenado”(Acho que é a linguagem OSMF para pago) um defensor de longa data de regras e complexidade para, uh, explorar como adicionar regras e complexidade ao OSM.

Aqui estou tentado a ver se posso dar a tarefa DALL · E 2 com “uma imagem fotorrealista de alguém jogando um bebê fora com a água do banho”.

Embora possa ser previsível que a pessoa que quer fazer é alemã, ou irônico que aparentemente o EWG pulou seu próprio procedimento para ordenar isso, engraçado que o EWG rejeitou a sua própria decisão (“Formatos mais simples são melhores.”), a triste a coisa está escrita grande na própria postagem do blog:

… torna o processamento de dados OSM extremamente complicado e intensivo em recursos.

O problema é que o processamento de dados OSM é complicado e requer muitos recursos.

Portanto, o problema não tem nada a ver com as pessoas olhando para os dados do OSM, o que é bilhão pessoas agora. Não tem nada a ver com mapeamento e edição de voluntários, o que é milhão Das pessoas. Não tem nada a ver com tornar mais fácil para os voluntários criarem software de edição de mapas, que é milhares Das pessoas.

Não, esse é o problema dezenas pessoas que processam dados. O processamento aqui, a propósito, é quase totalmente automatizado para a maioria das coisas, apenas leva tempo.

Vamos rezar para que o EWG apenas jogue um osso para Jochen para ir brincar no canto e parar de incomodar os adultos.

A imagem que me vem à mente é de Fonte. Que belo edifício, no entanto, temos que acrescentar algo barroco e grego na frente. Portanto, todo o ponto é perdido.

Claro, tudo isso já foi feito. Existem formatos geográficos e sistemas de edição online muito mais complicados do que o OSM. Eles têm uma consistência maravilhosa, ferramentas de edição poderosas que exigem treinamento para usar e documentos de 200 páginas apenas no modelo de dados. E, claro, ninguém os usa.

A questão é o que fazer em vez disso?

Fale com o cliente.

Isso não é complicado, mas a OSMF tem todos os problemas dos donos de produtos na empresa, além de um motivo sem fins lucrativos, voluntários inflamáveis, muito dinheiro que não pode ser gasto, falta de liderança e um sistema eleitoral que vence mais alto.

acabei de conhecer uma pessoa do OSMF que já conversou com os clientes (“usuários finais” se você não gosta da palavra “cliente”) e ele se foi.

Por outro lado, falo com clientes em todo o mundo o tempo todo.

Eles são divididos em dois tipos. Editores de mapas voluntários e provedores de serviços que processam dados OSM em serviços para usuários finais como você.

Eles vêm dizendo essencialmente a mesma coisa há anos – precisamos inserir mais dados (especialmente endereços e locais de interesse) no mapa para que os usuários finais possam pesquisar no OSM por “100 main street, cityville” e encontrar o que estou procurando por.

Não está claro para mim como complicar o sistema e reescrever todas as ferramentas irá acelerá-lo. Nocautear, certo?

O Facebook também conversou com o cliente, e alguns deles reclamaram da consistência dos dados do OSM, como faz Jochen. O Facebook resolveu isso de uma maneira maravilhosa como o OSM: luz do dia. Daylight é um cartão baseado em OSM desinfetado, consistente e limpo que não exigia que todos ao redor do mundo usassem o OSM para alterar o que eles fazem.

Portanto, antes de dar suporte à solução, tente conversar com os usuários primeiro para ver se o problema é real.

Deixe uma resposta

O seu endereço de email não será publicado.