Mathesis: AC, Antes dos Computadores 7 Imagem e Som

segunda-feira, 12 de julho de 2021

AC, Antes dos Computadores 7 Imagem e Som

AC, Antes dos Computadores: Sobre a Tecnologia da Informação, da Escrita à Era do Dado Digital

Por Stephen Robertson

[75]7 Imagem e Som

Para este capítulo e os dois seguintes, nós deixamos de lado pelo momento o mundo da escrita e dos caracteres, alfabetos e dígitos numéricos, para considerarmos imagens e sons.

Como nós vimos no capítulo 1, imagens desempenharam um papel inicial no desenvolvimento de sistemas de escrita. Contudo, naquele momento os caminhos separaram-se. Quando se chega ao registro de informação em uma forma outra que não a linguagem convencional, tais como diagramas ou imagens ou pinturas, imagens em movimento, e som, nós temos (em geral) ignorado a sequência linguagem escrita-alfabeto-código digital. Mas imagens, em particular, têm sua própria sequência que leva do desenvolvimento da fotografia, na primeira metade do século XIX, à hodierna digitalização quase universal de todas as coisas.

Hoje a maioria das pessoas está consciente de que as imagens são comumente formadas por pixels, em um arranjo retangular – as câmeras tipicamente são vendidas levando em conta o número de pixels que elas têm. Se você olhar através de uma lente de aumento para uma imagem impressa em uma revista, você pode ver os pixels. Abaixo, eu descreverei a sequência de desenvolvimento das primeiras fotografias às imagens hodiernas baseadas em pixels. Contudo, primeiro é digno de nota explorar um par de atalhos para produção de imagens.

Arte

Uma forma muito antiga de arte, visível, por exemplo, nas cidades de Pompeia e Herculano, a qual foi enterrada em cinza vulcânica no século I a.C., usa o método do mosaico. No mosaico, uma imagem é formada por pequenos ladrilhos; cada ladrilho é de uma única cor. A sutileza que pode ser expressa por tais meios é surpreendente. Contudo, há uma diferença significante entre o traçado de um mosaico e a noção moderna de imagem digitalizada. Na versão moderna, a imagem é construída sobre uma grade retangular – a cor de cada intersecção da grade é registrada. No mosaico, tipicamente os ladrilhos (mesmo se eles são frequentemente [76]quadrados individualmente) são comumente dispostos seguindo a forma do projeto, assim aquela fronteira curvada na imagem é comumente constituída de duas linhas curvadas de ladrilhos (ver Figura 3, por exemplo).

Figura 3: Mosaico da Roma antiga, apresentando uma pantera – detalhe de Pompeia, Museu Arqueológico Nacional, Nápoles, https://commons.wikimedia.org/wiki/File:MANNapoli_SN_mosaic_Panthere.jpg, Domínio público.

Muito depois, no final do século XIX, um pequeno grupo de artistas (Georges Seurat e outros) desenvolveu uma técnica de pintura dependendo de pequenos pontos de cor. Em vez de criar uma cor desejada em particular misturando um pequeno número de cores básicas ou primárias em uma paleta, eles usariam as mesmas cores básicas individualmente, perto uma da outra em pequenos pontos, de maneira que para o olho elas pareceriam misturar-se na cor desejada. O método ficou conhecido como pointilism. Supõe-se que um de seus efeitos é iluminar a sensação de cor do espectador (ver Figura 4).

Figura 4: Honﬂeur, un soir, embouchure de la Seine (detalhe), de George Seurat, Museu de Arte Moderna, Nova York, https://commons.wikimedia.org/wiki/File:Georges-Pierre_Seurat_-_Honfleur,_un_soir,_embouchure_de_la_Seine_-_Google_Art_Project.jpg, Domínio público.

Tecelagem

Uma forma simples de tecelagem envolve um conjunto paralelo de fios de urdidura esticados sobre uma estrutura, um mecanismo para suspender fios para longe dos outros, e uma lançadeira para passar o fio de trama de um lado para outro, entre os fios de urdidura suspensos e aqueles deixados nivelados. Antes do próximo passo, os fios erguidos são retornados ao nível e os fios restantes erguidos no lugar.

[77]Se você quiser entrelaçar um padrão colorido de qualquer tipo, a urdidura e / ou os fios de trama podem ser de diferentes cores. Mas para entrelaçar um padrão complexo, até uma imagem, requer-se um controle mais complexo. Uma maneira de fazer isso é como se segue. O fio de trama é um de uma única cor neutra, mas os fios de urdidura são colocados como uma sequência de cores, como poderia ser; amarela / verde / vermelha / azul, repetidas ao longo da largura do tecido. Então a cor de uma posição em particular no tecido, na frente ou face de cima, é determinada por quais fios de trama foram suspensos (e estão visíveis) e quais foram deixados nivelados. Como na pintura pointlist, se os fios estão pertos o suficiente, o olho percebe a mistura das cores básicas selecionadas como uma nova cor.

Um método como esse dá origem a uma invenção fascinante, devida a Joseph-Marie Jacquard. Ele inventou um sistema para controlar um tear usando uma sequência de cartões de papelão perfurados, um para cada passagem da lançadeira. As posições dos buracos perfurado em cada cartão controlavam quais dos fios de urdidura deviam ser erguidos para a próxima passagem. Uma sequência de cartões poderia ser perfurada, potencialmente de qualquer grau de complexidade, para produzir um design complexo no tecido. Os cartões com buracos perfurados podem ser vistos como uma representação digitalizada do projeto acabado (ver figura [78]5).

Figure 5: Um moderno tear de Jacquard, https://commons.wikimedia.org/wiki/File:India_-_Sights_%26_Culture_-_Hand-loom_pattern_cards_ for_silk_sari_weaving_(2507306023).jpg, CC BY 2.0.

O tear de Jacquard foi um grande desenvolvimento na tecnologia de tecelagem. Precedendo a fotografia, ele continuou em uso por quase dois séculos, em paralelo com, mas independentemente de, os desenvolvimentos da imagem fotográfica descritos abaixo. Os teares de hoje controlados por computador são descendentes diretos da invenção de Jacquard, mas finalmente agora integrados ao resto do mundo digital. Contudo, o uso de cartões perfurados por Jacquard devia inspirar dois desenvolvimentos bem diferentes, como nós veremos em capítulos posteriores. James Essinger, em Jacquard’s Web, argumenta convincentemente pela posição seminal de Jacquard no desenvolvimento das tecnologias de informação.

Fotografia

A ideia da fotografia, usando químicos sensíveis à luz, foi desenvolvida na primeira metade do século XIX. O nome melhor conhecido daquela época, Louis Daguerre, inventou uma forma de fotografia chamada de daguerreotype em [79]1839, mas um método mais exitoso e de longa vida foi o calotype de William Henry Fox Talbot (1841). Esse foi o precursor do processo negativo que foi a norma para a fotografia até o desenvolvimento da câmera digital no final do século XX.

Como um aparte, o nome de Talbot é um grande exemplo do tipo de problema com nomes que eu discuti no capítulo anterior. Ele é usualmente referido como ‘Fox Talbot’, segundo a assunção de que era um sobrenome duplo sem hífen – ele era referido dessa maneira até durante a vida. Efetivamente, ele não considerava Fox, um nome de família de sua mãe, como parte de seu sobrenome. Adicionalmente, ele normalmente usava o ‘primeiro’ nome, Henry, não William.

A fotografia nessa forma pode ser descrita como um processo analógico. Nós fazemos distinção entre analógico e digital: em uma representação analógica de alguma coisa, uma variável contínua ou regular do mundo exterior é representada por uma variável contínua ou regular no sistema. No caso da fotografia quimicamente baseada, a luz causa uma mudança química na placa – mais luz causa mais mudança, em uma maneira mais ou menos regularmente variante.

Neste ponto, alguém familiar com fotografia química tradicional bem poderia objetar ‘E quanto à textura (grain) e granulação (graininess)?’. É verdadeiro que em um nível fino, o processo químico não é regular. Mas isso não é uma questão de design: em vez disso é um acidente do processo. É quando nós começamos a projetar a granularidade que nós chamamos alguma coisa de ‘digital’.

Quando nós deliberadamente fatiamos o mundo, ou alguma parte regularmente variante do mundo, em partes discretas, a fim de o medir ou representá-lo ou processá-lo, nós estamos começando o processo de digitalização. Como nós veremos abaixo, alguns processos são mistos, no que eles incluem alguns elementos contínuos que têm de ser divididos em partes discretas e alguns que não têm – assim é particularmente no desenvolvimento a partir da simples fotografia química monocroma às imagens digitais de hoje.

Contudo, a fim de tornarmos esse processo um pouco mais claro, nós começamos com um exemplo mais simples: o som.

Som

Assim como com muitas coisas, o som digitalizado precede a era do computador, embora não por muito. A forma padrão de som digitalizado, modulação de código [80]de pulso (pulse code modulation), foi inventada por Alec Reeves em 1937 e ainda está em uso hoje.

O som é formado por ondas de pressão movendo-se através do ar ou outro meio. Uma nota puramente musical é uma simples onda sinusoidal de frequência fixa (o dó médio é aproximadamente 260 Hertz, ou ciclos por segundo); todos os outros sons são padrões mais complexos de mudança de pressão. Alguém pode desenhar um gráfico de como a pressão varia ao longo do tempo – ele parece-se com uma linha ondulante (ver Figura 6). Um microfone (inventado no século XIX) transforma as ondas de pressão em ondas elétricas, de uma maneira análoga, de modo que o padrão de corrente elétrica variante parece-se com o padrão de pressão variante no ar.

Figura 6: Som. Diagrama: o autor.

A fim de digitalizar uma curva contínua como essa, nós precisamos transformar duas quantidades separadas, as quais são naturalmente contínuas, em elevações discretas. As duas quantidades são tempo e pressão. Assim, primeiro, nós dividimos o tempo: escolhemos intervalos discretos de tempo – no caso do CD de áudio, 44.000 vezes por segundo. Em seguida, nós medimos e discretizamos a pressão em cada um desses intervalos. Novamente, no CD de áudio, os níveis discretos de pressão são definidos com 16 bits – quer dizer, há 2¹⁶(o que é aproximadamente 65.00) variações de pressão. O resultado é uma representação que pode ser pensada como transformando a curva regular de pressão em uma linha escalonada, com passos muito curtos – novamente, o diagrama mostra uma imagem aproximada. Ao reproduzir, o tocador [de CD] tem de recriar (a uma aproximação estreita) a curva regular a partir dessa curva escalonada digitalizada.

Isso é uma modulação de pulso código, e é tudo de que nós precisamos para digitalizar um único canal de som. Para som estéreo (novamente, como em CDs), nós precisamos de dois canais separados como esse (mais sobre som estéreo no próximo capítulo). A invenção do CD como um meio de gravação digital no final dos anos de 1970, permitiu à indústria de gravação de música fazer uma transição relativamente suave para a era digital – embora a relação entre música e o mundo digital mais geralmente seja mais complexa do que isso, como discutido adicionalmente no capítulo 9.

Agora, retornemos à fotografia e seus desenvolvimentos.

Imagens em movimento

Uma fotografia mostra uma imagem estática, um instantâneo no tempo. Como nós transformamos isso em uma imagem em movimento?

Provavelmente você já conhece a resposta para essa questão – e em qualquer caso, é muito parecido com parte do que eu descrevi acima para o som. Embora o tempo seja, em princípio, uma variável contínua, nós podemos tratá-lo como discreta ao tomar passos muito [82]pequenos de tempo, e, a cada um desses passos de tempo, nós tirarmos uma fotografia. Efetivamente, os passos não necessitam ser quase tão pequenos quanto os do som – o filme tipicamente funciona somente a 24 quadros por segundo. Se você ver uma imagem mudando em passos pequenos 24 vezes por segundo, parece muito como se ela estivesse movendo-se regularmente. Principalmente, você provavelmente não está consciente das mudanças em passos.

Esse princípio, sobre o qual o filme está baseado, foi entendido nos tempos vitorianos – em museus, algumas vezes você verá brinquedos vitorianos usando a mesma ideia, por exemplo, um tambor giratório com fendas. Se você olhar para ele de lado, cada fenda dá uma visão momentânea de um desenho; a próxima, a qual aparece um momento depois, é como a sua anterior apenas com pequenas mudanças. A impressão é de movimento. Efetivamente, construir uma câmera para filme foi um pouco complicado, mas, nos anos de 1870, Eadweard Muybridge demonstrou a ideia com uma série de fotografias de um cavalo galopando. As fotografias foram tiradas por câmeras paradas separadas do lado do curso, mas o efeito é o de uma câmera de filme acompanhando o cavalo. Muybridge desenvolveu um aparelho para mostrar a imagem em movimento, o Zoopraxiscope, muito como o brinquedo descrito acima.

A primeira patente para uma câmera de cinema foi devida a Louis Le Prince em 1888, e o processo tornou-se prático nos anos de 1890. Note que é apenas a variável de tempo que nós estamos tratando discretamente. O ordinário filme antigo de celuloide retém o processo analógico ordinário para cada quadro individual.

Cor

Paralelamente ao desafio de registro de imagens em movimento, inventores vitorianos preocuparam-se com aquele de desenvolver fotografia em cores.

O princípio básico é baseado na ideia de cores primárias. Essa ideia esteve por ai a partir de, pelo menos, o século XVII, e uma teoria específica relativa à percepção humana foi apresentada por Thomas Young em 1802, desenvolvida adicionalmente por Hermann von Helmholtz em 1855, e proposta para fotografia pelo físico James Clerk Maxwell em 1855. A ideia era que quaisquer cores podem ser formadas a partir de um pequeno número de cores primárias, provavelmente três. As primárias do artista são normalmente consideradas ser o vermelho, amarelo e azul. Efetivamente, a ideia de cores primárias é um pouco complexa e confusa; eu retornarei a ela abaixo. Mas se nós assumirmos entrementes que a ideia é boa, então nós temos, em princípio, uma maneira natural de construir uma fotografia colorida – tome três fotografias separadas, com filtros vermelho, amarelo e azul [83]e, em seguida, imprima as três imagens resultantes sobrepostas, em vermelho, amarelo e azul. Em termos das ideias discutidas acima, o completo espectro contínuo de cor pode ser reduzido a somente três componentes discretos.

Mas uma vez mais, fazer isso efetivamente é um pouco complicado. A tentativa de Maxwell em 1861 não foi muito exitosa: a ideia teve de esperar até os anos de 1890 para ser desenvolvida em uma forma memso remotamente prática, e até 1907 para um sucesso verdadeiramente comercial. No sistema Autochrome introduzido pelos irmãos Lumière em 1907, a placa fotográfica incluía uma tela integrada de pequenos grãos de amido de batata tingidos, distribuídos irregularmente, mas pequenos o suficiente para que o olho não distinguísse os grãos individuais. A área da placa sob um grão colorido responderia a essa luz colorida, e não às cores que fossem excluídas pelo filtro. Quando desenvolvida (incluindo um processo de reversão para retornar de uma imagem negativa a uma positiva imagem), cada área da imagem seria vista através do filtro colorido correto, o mesmo ao qual ela fora exposta. A despeito do número de desavantagens, isso foi um sistema de sucesso que perdurou até os anos de 1950.

Nos anos de 1930, dois exitosos musicistas clássicos trabalhando para a Kodak desenvolveram um processo (Kodakchrome) com diferentes emulsões sensitivas à luz, respondendo à luz vermelha, verde e azul, respectivamente, todas na mesma placa. Isso tornou-se essencialmente o sistema dominante de fotografia de cor (tanto em fotografia parada quanto em filme de cinema) até que o digital assumisse o controle.

Outras ideias vitorianas

Outra ideia que emergiu nos tempos vitorianos foi aquela das imagens 3D. Aqui o princípio básico precede a fotografia: Charles Wheatstone demonstrou um estereoscópio 1838. Era um aparelho que apresentava a cada olho um retrato (ele usava desenhos), os dois retratos juntos sendo levemente diferentes, de uma maneira a causar o visualizador a mesclar os dois em uma cena tridimensional. Embora parte de nossa percepção de profundidade venha de outras maneiras, um componente importante vem de nossa visão binocular, e o aparelho de Wheatstone tanto depende de, bem como demonstra, esse fato.

Quase tão cedo quanto foi possível de o fazer, vários sistemas usando duas câmeras foram desenvolvidos, permitindo ao visualizador ver imagens fotográficas paradas em 3D de lugares e cenas comercialmente preparadas. Há vários métodos diferentes de fazer com que as imagens apresentadas aos dois olhos de difiram, mas [84]o princípio é o mesmo, até e incluindo o filme e televisão em 3D modernos.

Outra preocupação era ser capaz de imprimir fotografias em periódicos. A tinta de periódico é ou on ou off – não é possível imprimir tons de cinza diretamente no processo de impressão de periódicos. Os periódicos da época às vezes usavam gravuras à água-forte (etchings), as quais poderiam ser preparadas com muito esforço, e poderiam representar cinzas por sombreamento com linhas (hatching) e outros artifícios; mas produzir uma gravura à água-forte a partir de uma fotografia (essencialmente uma cópia de artistas da fotografia) não era ideal. Já nos anos de 1850, Talbot teve uma ideia para como produzir uma placa de impressão diretamente a partir de uma fotografia, embora, uma vez mais, isso requeresse um pouco mais para ser tornado prático. A ideia é reduzir a imagem a uma grade de pontos negros, de tamanhos variados. Em áreas da pintura onde os pontos são pequenos, o olho vê principalmente papel branco; naquelas áreas onde os pontos são grandes, o olho vê cinza escuro. As primeiras imagens em meio tom (halftone) impressas apareceram nos anos de 1870, e nos anos de 80 métodos comercialmente exitosos foram desenvolvidos. Métodos semelhantes ainda estão em uso, incluindo para impressão de imagens coloridas.

Transmissão fac-símile

Nós já vimos como, para propósitos que têm a ver com imagens, nós precisamos discretizar alguma parte regulamente variante da imagem. Nós já discretizamos tanto o tempo (para o filme de cinema) quanto o espectro de cor (para imagens coloridas); agora nós temos de voltar nossa atenção para outras regularidades.

Uma foto ou imagem (bidimensional) tem …bem, duas dimensões. Se você é de qualquer maneira familiar com gráficos, então você poderia pensar nelas como as dimensões x e y. X é o componente esquerda-direita, e y é o componente cima-baixo. Pensando, por um momento, apenas em imagens paradas monocromáticas, através dessas dimensões, a imagem pode variar em qualquer ponto entre preto e branco, quer dizer, ela pode adotar qualquer tom de cinza. Isso (o brilho) representa uma terceira variável regular para adicionar às duas dimensões.

Se você quer transmitir qualquer coisa através de uma linha de telefone ou canal de rádio, você tem apenas duas variáveis regulares com as quais jogar: o nível do sinal e o tempo. Para o som (canal único), isso é tudo de que você precisa: como nós vimos acima, um microfone transforma tempo e variação de pressão de ar em tempo e variação de corrente elétrica, os quais podem ser transmitidos através de um cabo de telefone ou canal de rádio. Mas para imagens, nós temos uma terceira variável. Segue-se [85]que nós devemos fazer alguma coisa diferente com uma delas.

Uma vez mais, os vitorianos identificaram o desafio – os primeiros experimentos sérios com transmissão de fax foram realizados por um escocês, Alexander Bain, nos anos de 1840 (quer dizer, bem antes da invenção do telefone!). Sua ideia básica, a qual permaneceu o método dominante até as modernas máquinas de fax, era de escanear (scan) o original, em uma linha de lado a lado, e então descer uma pequena distância e escanear uma nova linha bem próxima da anterior. A imagem inteira seria coberta por uma sucessão de linhas.

Os originais de Bain tiveram de ser preparados especificamente para esse propósito, e apenas lidariam com preto e branco. Requerer-se-ia alguns anos mais, para os anos de 1880, antes que alguém pudesse escanear uma fotografia existente, em tons de cinza, e mais tempo ainda para qualquer tipo de transmissão comercial de fax. Mesmo assim, houve sistemas comerciais de sucesso nos anos de 1920.

Nós agora vimos que Bain discretizou a dimensão y, deixando a dimensão x para ser representada analogicamente pelo tempo, e o brilho analogicamente pelo nível do sinal.

Televisão

Assim, a próxima coisa a inventar é a transmissão (através de cabos ou rádio) de imagens moveis. Mas nós já temos os ingredientes para isso: se nós discretizarmos tanto a dimensão y quanto a dimensão da imagem móvel, nós somos deixados com apenas duas dimensões requerendo representação análoga.

O processo de escaneamento linha por linha para imagens em movimento tem um nome escaneamento raster. (Por alguma razão essa palavra não é comumente usada no contexto de fax, embora o princípio seja exatamente o mesmo.) Em uma antiquada televisão de tubo, o feixe de raios catódicos que causa o fósforo na tela a brilhar segue o mesmo processo raster para regenerar a imagem.

A ideia de usar um tal método para transmissão de televisão também é vitoriana. Um método eletromecânico de escaneamento raster foi patenteado (mas não efetivamente desenvolvido) nos anos de 1880. Novamente, o desenvolvimento de sistemas comerciais (como oposto a demonstrações) requereu um pouco mais de tempo; o nome mais estreitamente associado com a invenção da televisão é o de John Logie Baird, nos anos de 1920 e 1930. A BBC fez sua primeira transmissão de televisão em 1929, e começou as transmissões regulares em 1932. Inicialmente o escaneamento raster era baseado em processos eletromecânicos, e usava 30 linhas por imagens, incrementando [86]até 240 linhas em 1936. Mas métodos eletrônicos já estavam no ar, e no mesmo ano a BBC mudou para um sistema eletrônico de 405 linhas. Isso foi substituído nos anos de 1960 por uma versão de 625 linhas.

E quanto à televisão colorida? Novamente, nós sabemos como fazer, em princípio – nós necessitamos de três componentes, assim cada quadro têm de ser transmitido três vezes, um para cada cor. Vários esquemas foram inventados para fazer isso, mas sistemas comercias começaram nos anos de 1950.

Há um problema interessante na extremidade de exibição. Nós agora temos um tubo de raios catódicos com três canhões separados de raios catódicos construindo um padrão raster na tela, a qual agora tem três diferentes fósforos coloridos. Como assegurar que o raio correto atinja o fósforo correto? A maneira usual de fazer isso é ter o fósforo em pontos rigorosamente empacotados, e uma tela de filtro de metal exatamente atrás dele, com um padrão de orifícios. Esses ficam alinhados de modo que o raio correspondente ao vermelho só pode alcançar a tela de exibição onde há pontos de fósforo vermelho, e assim por diante. Nós podemos pensar nisso como um tipo de discretização de último minuto da dimensão x.

Digitalização completa

Agora, é claro, quase todo nosso som (gravado e / ou transmitido), e quase todas nossas imagens paradas e em movimento (do mesmo modo), está completamente digitalizado. Câmeras digitais, tanto paradas quando moveis, contêm grades de minúsculos fotorreceptores, que registram a intensidade de luz digitalmente em três cores. Aparelhos de exibição e impressão transformam dados baseados em pixel em imagens visíveis. Entre um e outro extremo, todos os tipos de processamento podem ocorrer, inteiramente no domínio digital. Telefones, rádio, e som gravado são tratados de modo semelhante. O seu celular digitaliza o som mesmo, e receber som digital da outra extremidade. Seu telefone fixo provavelmente ainda não faz isso – ele envia um sinal análogo para a troca, onde ele provavelmente é digitalizado, e recebe um sinal análogo de volta.

Se você voltar em sua máquina do tempo para os anos de 1840, para buscar Talbot e trazê-lo adiante no tempo, pare primeiro nos anos de 1980. Nessa época ele ficaria completamente surpreso por muitas coisas, incluindo miniaturização e mecanização, embora se você mostrasse-lhe a máquina em sua farmácia local que era usada para desenvolver e imprimir suas fotos, ele seria capaz de obter alguma compreensão dos processos químicos e óticos envolvidos. Mas se trouxesse-o à terceira década do século XXI, ele não reconheceria [87]coisa alguma do que quer que fosse parte do processo, em qualquer estágio entre a lente da câmera e a exibição em sua tela.

Próximo capítulo

ORIGINAL:

Robertson, Stephen, B C, Before Computers: On Information Technology from Writing to the Age of Digital Data. Cambridge, UK: Open Book Publishers, 2020. p.75-87. Disponível em: <https://doi.org/10.11647/OBP.0225>

TRADUÇÃO:

EderNB do Blog Mathesis

Licença: CC BY 4.0

Mathesis

Páginas

segunda-feira, 12 de julho de 2021

AC, Antes dos Computadores 7 Imagem e Som

Nenhum comentário:

Postar um comentário

Elementos de Lógica - Livro II - Capítulo I Das Operações da Mente e dos Termos

Arquivo do blog

Marcadores