segunda-feira, 16 de agosto de 2021

AC, Antes dos Computadores 11 Processamento de Dados

AC, Antes dos Computadores: Sobre a Tecnologia da Informação, da Escrita à Era do Dado Digital


Por Stephen Robertson


Capítulo anterior


[123]11 Processamento de Dados


Nos Estados Unidos, um censo da população é empreendido a cada década. O censo de 1880 requereu 8 anos para ser analisado completamente, e o Escritório do Censo mal pretendia ser capaz de completar a análise do censo de 1890 em tempo muito menor. A solução para esse problema foi desenvolvida por Herman Hollertih.


Tabulação


Cada análise do censo envolve a ordenação de resultados em categorias, contando o número de resultados em cada categoria, e registrando os números resultantes. Quaisquer respostas às questões do censo, isolada ou combinadamente, poderiam ser a base para categorização. Esse processo de ordenação e contagem pode ser descrito como tabulação, a criação de tabelas (impressas).

O sistema de Hollerith envolvia cartões perfurados – usando ideias de Jacquard, quem nós encontramos no capítulo 7 (ele provavelmente não conhecia o trabalho de Babbage). Cada registro individual do censo (representando uma pessoa) seria codificado em um cartão perfurado. Cada questão do censo seria associada com um grupo de posições de perfuração, e a resposta individual codificada como orifícios perfurados em algumas dessas posições. Dessa maneira, por exemplo, a questão de idade tinha posições para diferentes faixas de idade. Para a questão de gênero, havia duas posições, masculino e feminino, e um orifício era perfurado em uma delas. Você poderia pensar que esse dado necessita apenas de uma posição, onde a ausência ou presença de um orifício indicaria homem ou mulher. Mas isso assumiria (a) que essa questão é sempre respondida de uma maneira ou de outra, e (b, mas seriamente para o sistema Hollerith) que o mecanismo de contagem é tão capaz de contar a ausência assim como a presença de orifícios. Bem, alternativamente você poderia fazer alguma coisa envolvendo subtração de números na tabela final. De qualquer maneira, Hollerith usava duas posições para essa e outras questões sim-não, a despeito [124]do número limitado de posições vazias à sua disposição.

Hollerith desenvolveu uma máquina chamada de tabuladora, na qual um operador inseriria cada cartão por vez. A máquina operaria automaticamente um número de contadores, incrementando-os conforme apropriado para cada cartão. Um contador poderia estar associado com uma única posição de perfuração, dessa maneira registrando o número de cartões com orifícios naquela posição – por exemplo, um contador para cada faixa de idade. Mas a máquina também permitia as questões serem tabeladas cruzadamente – contadores poderia ser estabelecidos para combinações de perfurações. Na primeira versão da máquina, essas combinações eram preestabelecidas, mas subsequentemente, Hollerith desenvolveu uma mesa de conexões (plugboard) que permitia novas combinações serem estabelecidas. Isso efetivamente tornou a máquina, pelo menos em algum grau, programável.


O operador colocar cada cartão por vez na máquina, e os contadores apropriados (indicadores) são incrementados, de acordo com os orifícios perfurados no cartão.

Figura 17: O tabulador de Hollerith, de Scientific American, 1890. http://www.cbi.umn.edu/hostedpublications/Tomash/Cortesia a Biblioteca Erwin Tomash.


Os cartões que Hollerith usou para esse propósito eram do mesmo tamanho que as notas de banco dos EUA. Isso foi uma escolha deliberada de Hollerith, em parte porque ela capacitou-o a conseguir caixas baratas para seus cartões! Embora o tamanho das notas de banco [125]dos EUA tenha sido reduzido desde então, o tamanho do cartão permaneceu o mesmo, e está consagrado em um padrão internacional.


Os usos da tabulação


A invenção de Hollerith permitiu à análise do censo dos EUA ser completada em dois anos, e dentro do orçamento. Rapidamente ela foi adotada por muitos outros censos nacionais. Mas também se tornou claro que ela poderia ser usada para muitos outros propósitos, permitindo a análise de diferentes tipos de dados de maneiras que não teriam sido factíveis quando tudo era feito manualmente. A invenção deu origem a uma nova indústria, a qual se tornou conhecida como indústria do tabulador; a análise de dados usando tabuladores e toda a maquinaria associada tornou-se conhecida como processamento de dados.

O sistema foi adotado por companhias de seguro e outras. Já no meio dos anos de 1980, uma das companhias de ferrovia dos EUA usou o sistema de Hollerith para compilar estatísticas relacionadas ao tráfego de mercadorias, e para auditar as contas. Outros negócios seguiram o exemplo. A variedade das aplicações incluía transações de conta, contabilidade de folha de pagamento (payroll accounting), gestão de inventário, e faturamento (billing).

Por mais de meio século, sistemas baseados em tabuladores foram usados para uma grande variedade de propósitos de processamento de dados, por uma imensa variedade de companhias e organizações. Quando eu comecei trabalhando no campo de recuperação de informação (information retrieval) ao final dos anos de 1960, ainda havia companhias usando sistemas de tabuladores para pesquisar bancos de dados científicos (de uma maneira similar a como nós pesquisamos a web usando um motor de busca como o Google) – embora, inevitavelmente, por aquela época, eles estivessem sendo substituídos por computadores.

Enquanto isso, os cartões perfurados desenvolveram uma nova vida como um mecanismo de entrada para computadores – como nós veremos abaixo.


Registros de unidade


De volta ao capítulo 6, nós discutimos a ideia de um banco de dados. Uma coleção de dados do tipo para o qual os tabuladores eram usados, tais como um conjunto de resultados de censos, é um tipo de banco de dados. Vale a pena explorar suas características em termos de bancos de dados.

Em minha descrição dos dados do censo acima, eu falei sobre registros relacionados a cada indivíduo: um cartão perfurado representa uma pessoa. Nesse caso, nós poderíamos considerá-lo ser um banco de dados simples (flat), que é um com apenas um único tipo de [126]registro. Contudo, os dados do censo tipicamente são um pouco mais complexos do que isso. Em particular, os dados são normalmente (pelo menos atualmente no Reino Unido) efetivamente coletados por casas em vez de individualmente. Uma única casa com um único endereço muito provavelmente inclui mais de um indivíduo.

Em um moderno banco de dados de computador, a organização dos dados provavelmente refletiria isso, tendo cada registro individual vinculado a um registro de casa separado. Assim o banco de dados teria (pelo menos) dois tipos diferentes de registo, junto com um mecanismo de vinculação. O registro da casa conteria dados tais como o endereço, e o registro individual daria a idade, o gênero, etc. Se ou não os dados do censo são efetivamente analisados dessa maneira, é fácil de imaginar questões que alguém poderia fazer que atravessam esses tipos de registro: por exemplo, ‘tabule casas pelo número de crianças em idade escolar em cada uma delas’.

Um banco de dados simples de registros de unidade de um único tipo, tal como os construídos nos cartões perfurados de Hollerith para o censo de 1890 nos EUA, pode servir muito bem para certos tipos de análise mas tem suas limitações. Certamente seria possível derivar dois conjuntos diferentes de registros de unidade a partir dos mesmos dados básicos: por exemplo, ao perfurar um cartão representando cada casa – e mantendo-o separado dos cartões individuais. Mas a vinculação seria difícil, e algumas análises não seriam possíveis.

Todas as muitas aplicações da tecnologia do tabulador, da invenção do sistema de Hollerith até que eles se extinguissem nos anos de 1960, tinham de ser abordadas com essas limitações em mente. Dessa maneira, cada uma dependia da escolha de uma unidade como a base para os registros de unidade. Conjuntos separados de registros de unidade poderiam ser criados para diferentes tipos de unidade, para serem analisados separadamente, mas não para serem subsequentemente vinculados, exceto manualmente.


Os negócios


A despeito de semelhantes limitações, os sistemas tabuladores foram amplamente adotados. Hollerith formou uma companhia para explorar sua invenção. A companhia de Hollerith fundiu-se com três outras para formar a CTR em 1911; em 1924, a companhia fundida foi renomeada como International Businees Machines – IBM. Nos anos cinquenta e sessenta, a IBM redefiniu-se como uma companhia de computadores; nos anos 80 ela desenvolveu o PC (não o primeiro computador pessoal, mas um dos mais bem-sucedidos comercialmente). Mas antes disso, ainda no primeiro quartel do século, outras companhias [127]rivais de tabuladores foram formadas, e desenvolveram-se de outras maneiras. Por exemplo, James Powers, quem assumira a construção de equipamento de análise de censo no interior da Agência de Censo dos EUA, formou a companhia Powers Tabulating Maching em 1911. Ela eventualmente se fundiu com a companhia Remington de máquinas de escrever, a qual nós já encontramos, como Remington Rand.

O desenvolvimento de novos negócios e a rivalidade comercial caminharam de mãos dadas. JoAnne Yates, no artigo Co-Evolution of Information Processing Technology and Use, tem uma discussão fascinante da relação entre a indústria de seguros e as companhias tabuladoras. Muitas inovações tecnológicas foram guiadas pelas demandas das companhias de seguro, que tendiam a fazer as companhias de seguro competirem umas contras as outras, a fim de obterem o desenvolvimento de que elas necessitavam.

Algumas dessas inovações particulares são:

  • a habilidade de acumular (somar) números codificados em cartões, bem como simplesmente de os contar (isso eventualmente evoluiu para uma função aritmética completa);

  • a habilidade para ordenar um baralho (deck) de cartas em categorias (o tabulador de Hollerith incluía um auxílio bastante simples para a ordenação humana, mas as companhias de seguro queriam um processo muito mais rápido);

  • a habilidade para imprimir, gerando relatórios automaticamente (o design de Hollerith requeria um operador humano para transcrever os números indicados pelos contadores); e

  • a habilidade para codificar, e portanto imprimir, caracteres alfabéticos (por exemplo, nomes e endereços), assim como numéricos.


No terceiro caso, por exemplo, por exemplo, a companhia de Powers tinha um dispositivo funcional de impressão consideravelmente antes da IBM. Contudo, a IBM eventualmente alcançá-la-ia com um bom produto, e seu músculo comercial consideravelmente maior capacitou-a a dominar a indústria por muitos anos. O último acontecimento foi iniciado quando uma das companhias de seguro do Reino Unido assumiu o controle do braço no Reino Unido da companhia de Powers.

Naturalmente, o primeiro (e virtualmente todos os subsequentes) perfuradores de cartão (keypunchs) alfanuméricos usavam o teclado QWERTY Sholes com o qual nós já somos familiares. E de fato, em 1928, a IBM comprou uma das primeiras companhias de máquinas de escrever [128]elétricas, Eletromatic, e tornou-se um competidor principal no negócio de máquinas de escrever, eventualmente chegando a dominar o mercado de máquinas de escrever elétricas em escritórios de luxo (high-end), o que efetivamente se transferiu na transição para os computadores.


A transição


A continuidade entre o mundo de processamento de dados baseado em tabulador e mundo da computação é notavelmente forte. Para começar, pelo menos até onde se diz respeito aos computadores da IBM, cartões perfurados eram usados para entrada de dados, tanto para os dados a serem analisado quando para as instruções do programa. Isso queria dizer que os perfuradores de cartão (keypunchs) e os alimentadores de cartão (card feeders) e os leitores de cartão (card readers), assim como os cartões mesmos, poderiam ser reaproveitados, e operadores de perfuradores de cartão (keypunch operators) treinados poderiam ser apontados para diferentes tarefas.

Mas mesmo fora do ambiente da IBM, o conceito dos usos de negócio nos quais os computadores poderiam ser colocados começou a partir do que o processamento de dados fizera antes que os computadores surgissem. É claro, as companhias inovam, inventam novas maneiras de usar os recursos que elas têm, incluindo computadores. Mas raramente essas inovações surgem do nada, e frequentemente envolvem fazer alguma coisa que você já está fazendo, mas de uma maneira melhor ou mais flexível ou mais confiável. E além disso, essas funções são mais suscetíveis de mecanização usando tabuladores e também essas funções que são as mais obviamente computadorizáveis.

No final dos anos de 1940, após o fim da Segunda Guerra Mundial, acadêmicos assumiram a ideia de desenvolver computadores – alguma sensação do que poderia ser possível sobreviveu à destruição total do Bletchley Park (ver próximo capítulo). É claro, eles tinham muitas ideias sobre o que poderia ser feitos com computadores, em quais usos eles poderiam ser colocados – muitos deles girando em torno de cálculo, uma vez que pessoas trabalhando em computadores eram frequentemente matemáticos, físicos e engenheiros. Aplicações incluíam, cálculos astronômicos, previsão do tempo, modelagem matemática de estruturas de engenharia ou processos químicos, e assim por diante.

Mas como um negócio, operando no mundo dos negócios, a computação apenas decolou ao começar de algum lugar que os outros negócios poderiam reconhecer como útil. O lugar de partida foi a existente indústria do tabulador e suas aplicações existentes. Como nós vimos, essas aplicações não eram primariamente [129]sobre cálculo. Elas eram sobre ordenação, armazenamento, manipulação e gerenciamento de registros.


Dados


Eu falei sobre bancos de dados, mas vale a pena pensar um pouco mais sobre dados. No tear de Jacquard, um orifício em um cartão representa um mecanismo de controle para uma máquina, e é apenas em retrospetiva que ele parece com uma representação codificada do padrão de tecido. A noção de Babbage (a qual, é claro, nunca se concretizou) era que semelhantes orifícios poderiam codificar não apenas dados numéricos (a serem operados), mas também operações aritméticas que poderiam ser aplicadas sobre eles, e portanto, de fato, a sequência das operações e as regras de decisão (branching), as quais nós agora chamamos de algoritmo.

Semelhantes considerações abstratas provavelmente estavam muito longe da mente de Hollerith quando ele desenvolveu o seu sistema, mas ele tinha uma noção de que elas poderiam codificar características de pessoas. E uma de suas fontes de inspiração foi um sistema em uso em ferrovias, onde o condutor perfuraria cada bilhete com códigos para identificar o passageiro. Outra fonte foi o rolo do piano, um rolo contínuo de papel no qual a fendas eram cortadas para representar e reproduzir notas tocadas no piano, uma representação quase digital da música (não é propriamente digital – a extensão de cada fenda é uma representação analógica do tempo pelo qual cada nota é sustentada). Dessa maneira, há o começo de uma ideia de que há algum tipo de abstração do que nós poderíamos chamar de dados.

Através do próximo meio século ou mais, essa noção desenvolveu-se lentamente. Em particular, a ideia é centrada em torno da associação com caracteres que podem ser teclados ou impressos. E nós conhecemos caracteres - nós temos letras e dígitos. Oh, e símbolos especiais e marcas de pontuação. Oh, e nós descobrimos que precisamos estender um pouco a noção, para incluir espaços iniciais, retornos de carro (carriage returns) e novas linhas (line feeds) (a habilidade para imprimir um endereço de três linhas a partir de um cartão IBM realmente chegou tarde). De fato, basicamente qualquer coisa que pode ser uma tecla em uma máquina de escrever – conforme máquinas de escrever tornaram-se elétricas, a elas também foi dada uma teclar para retornos de carro, como oposta a alavanca na extremidade esquerda do carro, a qual era a norma para máquinas de escrever manuais.

A despeito de Morse e de mais de um século de telecomunicações, não foi antes dos anos de 1960, bem dentro da era da computação, que a ideia emergiria que nós poderíamos necessitar de uma forma padrão de codificação para todos esses caracteres, para [130]todos os propósitos diferentes de processamento de dados e de telecomunicações. Então dois padrões diferentes surgiram: ASCII, o qual foi explicitamente projetado para ser um padrão, e EBCID, que se tornou um padrão de fato por causa de seu uso pela IBM (nós encontramos esses no capítulo 5). Os dois padrões tomaram como suas bases os tipos de caracteres que alguém vê em um teclado de máquina de escrever.

Como com números, o armazenamento e manipulação interna de semelhantes dados em computadores não necessariamente retém a ligação direta com os caracteres imprimíveis. Nós já vimos que números podem ser convertidos e então armazenados e manipulados em um número de maneiras diferentes – o mesmo se aplica a outros tipos de dados. Isso já era verdadeiro no cartão original de Hollerith – a questão do gênero é representada por duas posições de orifício chamadas de H e M, em vez de pelas palavras Homem e Mulher. Mas muitas outras transformações semelhantes podem ser feitas dentro de um computador, mesmo se a representação externa (a entrada a partir de um teclado, ou a saída para uma impressora ou uma tela) sempre for feita usando as palavras com as quais nós somos familiares.

Agora, finalmente, nós podemos pensar em todo texto e todo número como dados, e, em particular, dados digitais, armazenáveis, transmissíveis e processáveis em uma imensa variedade de maneiras, mas essencialmente todos pelos mesmos tipos de máquinas. Requereria um pouco mais de tempo para a ideia de dados que também englobaria imagens e música, mas isso eventualmente aconteceria, como nós vimos no capítulo 7. Ademais, não apenas nós podemos pensar em texto e números e fotografias como dados, em algum sentido nós temos de os pensar dessa maneira. Como com tantas outras influências da tecnologia, não há como voltar.


Próximo capítulo


ORIGINAL:

Robertson, Stephen, B C, Before Computers: On Information Technology from Writing to the Age of Digital Data. Cambridge, UK: Open Book Publishers, 2020. p.123-130. Disponível em: <https://doi.org/10.11647/OBP.0225>


TRADUÇÃO:

EderNB do Blog Mathesis

Licença: CC BY 4.0

Nenhum comentário:

Postar um comentário