Mathesis: AC, Antes dos Computadores 6 Organizando Informação

segunda-feira, 5 de julho de 2021

AC, Antes dos Computadores 6 Organizando Informação

AC, Antes dos Computadores: Sobre a Tecnologia da Informação, da Escrita à Era do Dado Digital

Por Stephen Robertson

[65]6 Organizando Informação

Cada ato de comunicação envolve organização de informação – escolher o que comunicar, e como o expressar, quer em fala ou escrita ou algum outro método. Todas as formas de escrita, mesmo escrita a fim de realçar a própria memória (por exemplo, uma lista de compras), requerem organização – de ideias, conexões, fatos, palavras, números, sentimentos, desejos, intenções, histórias, opiniões, ou qualquer coisa. Nós já vimos como as formas mais primitivas de escrita existiam para propósitos semelhantes aos de comércio e administração, e tal escrita é necessariamente um ato de organização. Outro propósito, que se desenvolveu no início, provavelmente conta como o primeiro esforço científico: o estudo dos céus.

Astronomia

A observação das estrelas, mais particularmente, observação e registro sistemáticos, começou muito cedo na história humana. Muito do que nós agora conhecemos sobre ela deriva-se de fontes escritas do primeiro milênio a.C., particularmente tabletes de argila babilônicos, mas esses certamente incluiam material de fontes muito mais antigas, agora perdidas. Um particular conjunto de observações do planeta Vênus data do século XVII a.C.

Tal dado observacional poderia razoavelmente ser denominado de ‘informação’ precisamente porque ele é sistematicamente coletado e organizado para registro. De fato, ele agora pode prover-nos com informação não prevista por seus autores. A despeito de várias incertezas sobre a precisão das cópias que nós temos e as interpretações exatas do registro, essas observações agora podem ser usadas para validar aspectos de cronologia histórica, porque nosso conhecimento astronômico presente permite-nos determinar as posições exatas dos planetas no segundo milênio a.C.

Astrônomos babilônios construíram extensos catálogos de estrelas e [66]constelações. Nós temos cópias de dois desses tais catálogos, os originais provavelmente datando de aproximadamente 1200 e 1000 a.C.

É claro, questões astronômicas são importantes para assuntos humanos. Sol, lua e estrelas têm sido os mais importantes recursos de navegação através dos mares abertos desde que os humanos tentaram semelhante navegação – somente substituídos por navegação por satélite na história recente. A navegação astronômica, como praticada através dos últimos dois ou três séculos, requer a preparação e distribuição de almanaques náuticos contendo tabelas indicando as posições do sol, lua e 57 estrelas selecionadas (assim como, famosamente, um relógio ou cronômetro marinho preciso).

O Computus

Para um exemplo antigo da percebida importância de dados astronômicos, uma das questões que muito ocuparam a igreja cristã primitiva era quando celebrar a Páscoa. A questão trouxe à existência uma inteira área de estudo chamada de Computus, dedicada aos vários eventos e ciclos astronômicos pelos quais os calendários são determinados. O cálculo adequado da data da Páscoa requer levar em contar a extensão do verdadeiro ano solar (aproximadamente 365 dias e um quarto – mas o quarto não é exato), o verdadeiro ano lunar (novamente aproximadamente 29 dias e um quarto), e a semana de sete dias. A extensão do ano solar (então assumida ser de 365 dias e um quarto exatamente) fora a base para a introdução do calendário juliano sob Júlio César no primeiro século a.C. Várias versões diferentes do cálculo da Páscoa foram definidas, mas aquela que veio a dominar foi formalizada pelo Venerável Beda no século VIII, seguindo uma fórmula inventada por Dionísio, o Exíguo, no século VI. O grande trabalho de Beda no Computus, On the Reckoning of Time, contém um número de tabelas baseadas em predições astronômicas, e mostra a data de cada Páscoa por muitos anos no futuro.

Muito mais tarde, no século XVI, o calendário gregoriano foi introduzido pelo Papa Gregório. A diferença entre os calendários juliano e gregoriano tem a ver com a diferença entre os assumidos 365 dias e um quarto e a verdadeira extensão do ano solar. Mas a razão específica para sua introdução foi reajustar a data da Páscoa em relação às temporadas, em particular ao equinócio de primavera, a qual tinha sido [a data] no [67]começo da era cristã. Atualmente, a data da Páscoa como celebrada na maioria das igrejas ocidentais difere daquela usada na maioria das igrejas ortodoxas. Isso é uma consequência do fato de que as igrejas ocidentais converteram-se ao calendário gregoriano, enquanto que as igrejas ortodoxas aderiram ao calendário juliano.

Cobrança de impostos

Outro exemplo antigo de organização de informação tinha a ver taxação.

Nós sabemos que havia um sistema de tributação no Egito, no começo do Império Antigo, aproximadamente ente 3000 e 2800 a.C. As pessoas mais fáceis de serem taxadas eram os fazendeiros, porque eles tanto possuíam seus meios de produção (campos e gado) como o que eles produziam eram claramente visível a todos. Assim, o princípio poderia ser de que 10% da colheita vá para o governador local ou coletor de impostos. Exceto que isso era difícil de fiscalizar – você teria de ter alguém vigiando o fazendeiro o tempo todo. Mas você pode medir os campos dele uma vez ou a intervalos longos, e também contar seu gado. Para os campos, você poderia assumir que um campo de um certo tamanho terá uma certa produção em um ano, e taxar o fazendeiro a partir dessa base. Talvez você necessite distinguir entre os muito produtivos campos localizados na planície da cheia do Nilo, e os campos um pouco menos férteis nas colinas. Então o fazendeiro pode ser taxado não no que ele atualmente produz, mas no sistema que se assume que ele produza.

Tudo o que requeria do coletor de impostos manter registros, em uma forma padronizada. Que áreas de campos, em cada categoria de produção, este fazendeiro nomeado tem? Imediatamente nós não apenas vemos que o mundo confuso foi manipulado em um formulário arrumado, mas também que essa manipulação não é neutra. É para a vantagem do fazendeiro que seu campo na extremidade das encostas é classificado como ‘colina’ – mas para o coletor de impostos, a vantagem é reversa. Uma vez que o coletor de impostos é o letrado que efetivamente produz e mantém os registros, a visão dele provavelmente prevalecerá!

Censo

Uma das coisas que o coletor de impostos tem de saber é quem os contribuintes são, e o que eles possuem. Governos têm conduzido censos por tanto tempo quanto eles tem estado sistematicamente coletando impostos. É claro, há outros [68]propósitos para a condução de censos – conhecer quem convocar para serviço militar, todos os tipos de exercícios planejados que precisam de dados estatísticos, e assim por diante. A palavra mesma é latina, e em Roma originariamente significava uma lista daqueles disponíveis para serviço militar. Mas o conceito é provavelmente pelo menos tão antigo quanto cobrança de impostos.

Na Inglaterra do século XI, William o Conquistador, iniciou um censo de todas as suas propriedades, pessoas inclusas, chamado de Domesday (Doomsday) Book. O livro está primariamente organizado em torno da terra – e propriedades rurais. Em semelhantes tempos feudais, as pessoas vinham com a terra. Mas eles incluíam os nomes (primeiros nomes) dos sublocatários (under-tenants) do senhor do feudo;

Censos modernos normalmente estão vinculados às noções de ‘residência’ e ‘casa’. Um relatório é feito para cada lar, e inclui cada pessoa residente naquela casa. Ambas as noções são vagas nas extremidades. Mesmo assim, os requerimentos para a execução de censo desempenharam um papel importante no desenvolvimento das ideias de processamento de informação, como nós deveremos ver no capítulo 11.

História

Em sociedades humanas primitivas, história e mitologia estão irremediavelmente entrelaçadas. Alguém poderia dizer que o mesmo é verdadeiro hoje, como no dito atribuído a Winston Churchill, de que ‘a história é escrita pelos vencedores’. Mesmo assim, nós agora associamos os grandes historiadores grego-clássicos do século V a.C., Heródoto e Tucídides, com a tentativa de colocar a história sobre um fundamento mais sistemático, e para a basear em evidência cuidadosamente reunida, no processo de distinguir história de mitologia. Embora eu iniciei este livro argumentando que a história registrada não poderia começar até que nós tivéssemos desenvolvido a escrita, é claro que isso não é suficiente – nós não começamos imediatamente o registro sistemático da história porque nós inventamos a escrita. Esses dois gregos tiveram predecessores significantes sobre os quais pouco é conhecido; mas o papel deles no desenvolvimento da historiografia, o estudo sistemático da história, é claro. Embora eles diferissem quanto entre eles quanto à ênfase, eles defendiam a recolha, análise e avaliação meticulosas da evidência, de testemunhas e documentos sobre os eventos e circunstâncias que eles queriam descrever.

[69]Bibliotecas

Nós já vimos no capítulo 4 a importância de bibliotecas em nossa história, como um método de comunicação. Elas também desempenham um papel central nos métodos de organização de informação.

Considere, por exemplo, as grandes bibliotecas clássicas que eu mencionei: a Biblioteca de Alexandria, por exemplo, ou a Casa da Sabedoria em Bagdad, ou a biblioteca de um dos grandes monastérios medievais. Em todos esses casos, estudiosos chegariam a lugares remotos esperando encontrar iluminação de algum tipo. A biblioteca de Alexandria, por exemplo, poderia ter contido centenas de milhares de itens (a coleção parece ter consistido principalmente ou inteiramente de rolos de papiro; um único trabalho poderia consumir múltiplos rolos). Ou localizar itens conhecidos particulares, ou procurar por múltiplos itens sobre um assunto, teria sido uma tarefa longe do trivial. A biblioteca estava organizada por assunto, cada assunto tendo um contêiner para conter uma coleção de rolos. Uma tábua acima do contêiner listava os conteúdos do mesmo, e cada rolo tinha uma etiqueta anexado a ele, dando o autor e assunto. Esse tipo de informação também foi a base para o que se supõe ser o primeiro catálogo de biblioteca, produzido por um bibliotecário chamado de Calímaco para uma parte do material na biblioteca de Alexandria no terceiro século a.C. Apenas para indicar a escala do problema da descoberta, o catálogo prosseguia por 120 rolos.

A arte do catálogo de biblioteca (pensando agora no presente) é de interesse para nós por duas razões. A primeira é que ela fornece uma organização dos livros e outros materiais na biblioteca. Ela faz isso ao coletar informação ou dados sobre cada livro (algumas vezes referidos como metadados), especificando, por exemplo, seu autor ou autores, seu título, quando e onde ele foi publicado, alguma codificação de seu assunto, etc. Ela então fornece ferramentas de acesso de modo que o livro possa ser identificado de uma variedade de maneiras, digamos, consultando o autor. A localização de um livro em uma estante, bem provavelmente como parte de um arranjo temático, fornece uma (mas apenas uma) maneira de o encontrar. Um catálogo tipicamente fornece múltiplas maneiras, adequadas a diferentes formas ou tipos de consulta. Como isso depende de outras tecnologias disponíveis. Antes da disponibilidade de catálogos de biblioteca baseados em computador, várias formas de índice foram necessárias – alguns foram cartões, alguns impressos em papel.

A segunda razão pela qual nós podemos estar interessados em catálogos de biblioteca é por causa da organização mesma do catálogo de dados. Considere, por exemplo, os [70]elementos de dados sugeridos acima (autor, título, editor, data, assunto). Se um índice baseado em muitos desses elementos é requerido, cada um tem de ser tratado de uma maneira consistente através dos itens diferentes. Por exemplo, a fim de tornar fácil (ou mesmo possível) procurar por um nome de autor em um índice, o registro do nome do autor precisa seguir um formato e conjunto de regras bem formados – e (idealmente) ser consistente se o mesmo autor tiver escrito múltiplos livros. Isso bem poderia requerer alguma manipulação do confuso mundo real.

Apenas para exemplo, eu tenho um livro em minha estante do grande físico e vencedor do prêmio nobel Richard Feynman. Bem, na realidade, o nome do autor aparece como Richard P. Feynman. Em outro lugar (não neste livro) é possível descobrir que o seu nome do meio é Phillips. Outro livro, contendo uma coleção de seus escritos, é intitulado de No Ordinary Genius: The Illustrated Richard Feynman – o qual dá como autor Richard Phillips Feynman (junto com outra pessoa como editor). Tudo isso provavelmente não importa muito, uma vez que índices de autores normalmente são ordenados pelo sobrenome, e seria bem provável encontrar entradas para Feynman, Richard; Feynman, Richard P.; e Feynman, Richard Phillips bem próximas umas das outras. Além disso, Feynman é um nome relativamente incomum. E como eu somente tenho um Feynman neste livro, eu posso resolver-me com Feynman, P. no índice de Pessoa nas costas. Mas nomes podem causar problemas muito sérios do que isso – alguma discussão adicional abaixo.

Formulários

Um tipo muito particular de organização é requerido quando você tem de preencher um formulário, seja em papel ou online. Cada vez que você preenche um formulário você está inserindo informação que você tem, sobre você e o mundo em volta de você, em um tipo de organização de informação projetado por outra pessoa. Não obstante o quão confuso o mundo em torno de você seja, ou a informação que você tem sobre ele, o formulário faz você pensar sobre ele de uma maneira peculiar.

Tomemos um nome, por exemplo. Você tem um nome. Mais de um, eu posso dizer com alguma confiança (e qualquer formulário que você tem de preencher pode bem assumir) que você tem um sobrenome que você herdou de seus pais, ou talvez adquirido depois por casamento, e um ou mais nomes dados – mas se você tem mais do que um, provavelmente é apenas o primeiro que você efetivamente usa. Assim, a posição no formulário na qual se supõe que você coloque seu único nome costumeiro dado é bem provavelmente rotulada como ‘Primeiro nome’ (em minha infância, era frequentemente rotulada [71]como ‘Nome cristão’, embora essa terminologia obviamente culturalmente enviesada tenha amplamente desaparecido). Um formulário nos EUA poderia pedir por uma ‘Inicial do meio’.

Mas a totalidade da estrutura é culturalmente enviesada, é claro. Chineses vindo ao Oeste tipicamente aprendem a inverter seus dois nomes – porque por padrão, na China, o sobrenome vem primeiro. Alguém do subcontinente indiano (eu tenho amigos assim) pode ter adquirido apenas um nome singular como uma criança, e teve de inventar um segundo para o propósito de preencher formulários e (mais geralmente) vive no oeste. Eu tenho vários parentes a quem foram dados dois nomes mas, efetivamente, usam o segundo. Eu também tenho amigos e parentes com sobrenomes duplos, não hifenizados mas espaçados, como o compositor Ralph Vaughan Williams – que não é um problema quando eles têm de preencher um formulário eles mesmos, mas definitivamente é um problema para o catalogador de biblioteca. Outras partes do mundo tem práticas diferentes – por exemplo, em Espanha e Portugal, a maioria das pessoas tem sobrenomes duplos. E, é claro, se nós voltarmos na história assim como formos para outro lugar na geografia, a série de variações é imensa. Frequentemente, o mundo confuso tem de ser tratado para se ajustar a um formulário ordenado. E esse é apenas a primeira mesma porção do formulário!

Endereços

A próxima questão de seu formulário, após seu nome, muito provavelmente, é seu endereço – embora como seu nome, o formulário pode requerer que ele seja dividido em múltiplas partes. Isso em si mesmo é um requerimento levemente estranho neste dia e era. Se um amigo escreve um endereço para mim em um pedaço de papel, eu provavelmente não terei dificuldade de o analisar – distinguindo o número da casa, o nome da rua, o nome da cidade e o código postal. É um processo simples o suficiente – assim eu esperaria que uma máquina fosse capaz de o realizar razoavelmente bem. (Se o formulário que você preenche já não for online, é provável de ser abastecido numa máquina brevemente após o preenchimento.) Então, por que não é deixado à máquina realizar a análise?

Uma razão podeira ser que o formulário de um endereço é muito fortemente dependente, histórica e culturalmente. Mais especificamente, os sistemas de código postal discutidos no capítulo 2 têm estado muito estreitamente envolvidos na determinação das formas padrões de endereço. Além disso, embora tenha havido tentativas (desde o [72]estabelecimento da União Postal Universal em 1874) para definir uma forma padrão internacional para endereços postais, elas agora parecem ter sido abandonadas. A partir do ponto de vista apenas do correio, isso provavelmente não importa muito – a União Postal Internacional é uma estrutura federal, assim, enquanto o serviço postal onde a carta é postada pode reconhecer o país de destino, ele pode deixar o resto do endereço para interpretação pelo serviço postal local naquele país. Contudo, isso pode causar problemas para outros usos de endereços (dos quais há muitos).

Um exemplo primário corrente é o código postal. Embora as primeiras divisões de grandes cidades em regiões postais começassem no século XIX (Londres 1857), e algumas tentativas mais detalhadas começassem nos anos de 1930, essas principalmente se originaram a partir dos anos de 1960 e 1970, um período que ainda poderia ser exatamente considerado como o ponto alto do correio, mas talvez seu termo. Muitos sistemas de código postal forneceram um nível bastante rude de granularidade, um distrito contendo muitas casas, mas alguns dos quais são muito mais precisos. No sistema do Reino unido, por exemplo, um código postal não identifica unicamente um endereço, mas específica um grupo pequeno, de até uma centena, mas provavelmente muito menos.

Códigos postais (de fato, endereços no geral) servem ou contribuem para um número de funções diferentes que não são apenas entregas postais. Por exemplo, códigos postais comumente são usados para navegação por satélite (a despeito do fato de que eles foram projetados principalmente antes que a navegação por satélite fosse inventada). Mas para esse propósito, alguém gostaria de uma granularidade muito fina. No todo, o sistema do Reino Unido funciona muito bem para esse propósito, particularmente em cidades, mas algumas vezes, no interior, ele não é preciso o suficiente. Mas há variação considerável entre países, mesmo entre aqueles países que têm códigos postais.

Retornando à questão de análise acima levantada: o que agora nós encontramos comumente no Reino Unido é que o preenchedor de formulário é convidado a prover apenas o código postal, e então permitir ao computador deduzir quase completamente o restante do endereço, oferecendo ao usuário uma pequena escolha de números de casa e possivelmente de nomes de rua. Essa dedução está baseada em um banco de dados, ao qual o computador tem acesso, de códigos postais correspondentes endereços completos. Para fazer sentido dessa afirmação, nós precisamos falar um pouco sobre bancos de dados.

[73]O conceito de um banco de dados

A despeito de meus comentários acima sobre as dificuldades inerentes a ambos, dados de nome e endereço são frequentemente exibidos como um grande exemplo de um tipo de informação com um alto grau de estrutura, um alto grau de regularidade e um alto grau de consistência. Como um resultado, é tomado para ser um bom candidato para armazenamento em um computador no que é comumente conhecido como um banco de dados. Se você mantém seus contatos em seu computador ou seu telefone ou ambos, eles serão mantidos em um banco de dados. Isso significa que, mesmo se alguns endereços tomam uma forma levemente diferente de outras, ou algum dado está faltando de algum, eles todos são mantidos em uma estrutura comum. Há várias razões para fazer isso dessa maneira: essencialmente elas giram em torno de como tal dado pode ser processado automaticamente, incluindo para exibição para você. Dessa maneira, por exemplo, você esperaria ser capaz de ver uma lista alfabética de nomes. Uma vez mais, a ordenação alfabética de nomes não é muito simples quanto poderia parecer; não obstante, você provavelmente espera que seu computador, e seu telefone, se ele for mesmo remotamente esperto, ser capaz de fazer isso.

Bancos de dados, e programas de computador que manipulam bancos de dados, são centros de interesse no mundo da computação. De fato, a manutenção e manipulação de bancos de dados são uma função vastamente mais importante do que o cálculo para computadores. Considere, por exemplo, os computadores em seu banco, os quais cuidam de sua conta bancária. Claramente eles têm de fazer algum cálculo, quando você adiciona ou saca fundos ou move-os de um ponto a outro – mas de longe a função mais importante deles é manter registros consistentes de todas essas transações, assim como de todas as informações relacionados a essa e todas as outras contas. Além disso, você provavelmente nunca viu esses computadores cometerem erros aritméticos – essa é a parte fácil – mais muito provavelmente viu casos onde, por uma razão ou outra, transações desapareceram sem pistas (AWOL).

Se você frequentemente faz transferências online, e alguma vez cometeu um erro, você pode ter descoberto que um erro no número da conta destino pode ser muito pior do que um erro no montante. Um número de conta não é realmente um número em absoluto (ninguém nunca precisa fazer aritmética com números de conta): é um código identificando um conjunto particular de registros de bancos de dados. Como você pode ter lido em muitas reportagens de jornal, se você transferir dinheiro para uma conta errada, e o titular da conta não está com vontade de fazer nada sobre isso, nem você nem seu banco podem recuperar o dinheiro. Até muito recentemente, no [74]Reino Unido pelo menos, os bancos nessas circunstâncias tipicamente não verificavam nomes, somente números de contas. Isso é provavelmente por causa de todos aqueles problemas discutidos acima com respeito a nomes. Se você não conhece a forma exata do nome de seu beneficiário, como mantida no banco de dados do banco, então as chances são muito altas de que você o informaria em uma forma levemente diferente, assim os bancos preferem depender do código. Mesmo assim, é muito mais fácil para um ser humano cometer um erro com um longo código numérico, assim a lógica pode ser contraprodutiva.

Variedades de bancos de dados

Bancos de dados vêm em muitas formas diferentes. Na época atual, um banco de dados é geralmente considerado ser mantido em um computador. Muitos sistemas semelhantes seguem o princípio de que os dados devem ser divididos nas menores partes coerentes, e que regras exatas de inferência devam ser especificadas, determinando completamente o que pode ser aprendido através da recombinação dos elementos de dados em novas maneiras. Isso é uma visão reducionista, e tem uma forte analogia ao status de cálculo aritmético desde que as regras para isso foram codificadas. Alguns tipos de dados são receptivos a essa abordagem, e isso traz vantagens para manipulá-los de maneiras bem entendidas. Contudo, nem todos os dados, muito menos toda informação, pode ser tratado dessa maneira.

No passado, muito antes dos computadores ou da cunhagem do termo banco de dados, nós tínhamos visto muitas coleções de informação que agora seriam chamadas de bancos de dados. Dentre aquelas que nós discutimos neste capítulo, todas as coleções de formulários preenchidos, todos os registros de bibliotecas, todos os conjuntos de resultados de censo (e todas as tabelas derivadas deles), todos os registros de coletores de impostos das pessoas e instituições que eles taxam, todos os registros de bancos sobre pessoas, contas, transações e assim por diante, podem ser vistos como bancos de dados. Tudo envolvendo regras de organização e manipulação.

Nós retornamos ao tema do cálculo no capítulo 10, e ao tema mais amplo do processamento de informação no capítulo 11.

Próximo capítulo

ORIGINAL:

Robertson, Stephen, B C, Before Computers: On Information Technology from Writing to the Age of Digital Data. Cambridge, UK: Open Book Publishers, 2020. p.65-74. Disponível em: <https://doi.org/10.11647/OBP.0225>

TRADUÇÃO:

EderNB do Blog Mathesis

Licença: CC BY 4.0

Mathesis

Páginas

segunda-feira, 5 de julho de 2021

AC, Antes dos Computadores 6 Organizando Informação

Nenhum comentário:

Postar um comentário

Elementos de Lógica - Livro II - Capítulo I Das Operações da Mente e dos Termos

Arquivo do blog

Marcadores