segunda-feira, 19 de julho de 2021

AC, Antes dos Computadores 8 Sobre Física e Fisiologia

AC, Antes dos Computadores: Sobre a Tecnologia da Informação, da Escrita à Era do Dado Digital


Por Stephen Robertson


Capítulo anterior


[89]8 Sobre Física e Fisiologia


Na trilogia Foundation, de Isaac Asimov, escrita nos anos de 1940 mas sobre um futuro distante, ele descreve um aparelho que reproduz uma gravação de uma imagem 3D em movimento com som. O dispositivo de exibição é um cubo de vidro, no qual o visualizador vê uma figura humana falando – alguma coisa como uma cabeça falante na televisão, mas em 3D. Asimov não diz isso explicitamente, mas a impressão é que a imagem habita o espaço 3D dentro do cubo; as pessoas podem assistir-lhe a partir de todos os lados, mas as pessoas de trás verão apenas as costas da figura. Asimov foi um bioquímico, mas alguém poderia descrever isso como a versão de um físico de um filme 3D. Isso está em um contraste completo com o stereoscope original de 1838 de Wheatstone, e o filme e televisão 3D modernos, e de fato com virtualmente tudo tentado entre essas duas datas, os quais poderiam ser descritos como dependendo de fisiologia – do fato de que nós percebemos profundidade através de nossa visão binocular.

Neste capítulo eu quero explorar um pouco esse espaço. Eu retornarei à visão 3D depois, como no capítulo anterior, eu começarei com o som.


Som 3D


Nossa sensação da localização da fonte de um som depende em parte do fato de que nós temos dois ouvidos. A diferença entre o que nossos ouvidos ouvem e informam ao cérebro permite-nos algum grau de sensação direcional de onde o som estava vindo. Essa é a base para sistemas de som estéreo. Dados sons diferentes de dois alto-falantes separados em uma sala, nossos ouvidos podem ter alguma ilusão da localização do som.

Contudo, essa ilusão não é muito boa. Os sons distribuídos para nossos dois ouvidos pelos dois alto-falantes (em uma sala com sua própria característica auricular) são somente uma aproximação muito grosseira do que poderia ser ouvido em um ambiente real com fontes reais de som, e, é claro, ecos reais a partir de qualquer outra coisa que esteja naquele ambiente. Então, qual poderia ser uma maneira melhor?

[90]Há duas maneiras de prosseguir. Uma delas é ter muito mais alto-falantes, potencialmente com sinais diferentes para cada um. Sistemas de ‘som circundante (surround sound)’, usados em cinemas, por exemplo, são um passo nessa direção. Mas isso poderia ir mais além. Uma vez eu encontrei uma performance pública de uma gravação de um moteto de 40 partes. Em um grande salão nos fundos de uma igreja, havia 40 alto-falantes, cada um montado em um suporte à altura da cabeça, distribuídos em um círculo aproximado em torno de uma sala. Eu pude vaguear em volta e para fora e para dentro enquanto a música estava tocando, ouvindo de diferentes maneiras, por exemplo, concentrando-me em uma ou pequeno grupo de partes, com o resto no fundo. Exatamente o que eu ouvia em cada ponto dependia de qual maneira eu estava encarando, assim como de minha localização. Em adição a uma diferente localização relativa dos ouvidos conforme alguém se vira, nossos ouvidos são eles mesmos, até certo ponto, direcionais, e a cabeça de alguém lança uma sombra auricular.

Isso é uma verdadeira tentativa física de uma solução para o problema. Contudo, não é uma abordagem geral viável para alta-fidelidade (hi-fi) na sala de estar!

A outra direção seria fisiológica. Nós podemos levar muito mais seriamente a ideia de distribuição de diferentes sinais para cada ouvido – de fato, bom fones de ouvido fazem um ambiente auricular muito mais limpo, cada ouvido ouvindo seu próprio sinal, sem nenhuma interferência ou cruzamento ou ecos. Contudo, a fim de fazer isso apropriadamente, a gravação devia ser feita de uma maneira similar. Quer dizer, alguém deveria usar um par de microfones, cada um em seu próprio suporte semelhante a uma concha, em cada lado de um objeto na forma de uma cabeça.

Isso é conhecido como gravação binaural ou cabeça de manequim (dummy head), e é muito diferente de gravação estéreo normal. É seriamente difícil de se realizar satisfatoriamente. Primeiro, a cabeça de todos é de uma forma diferente, como os seus ouvidos e canais auriculares. Segundo, se o ouvinte move-se ou vira sua cabeça enquanto ouvindo, a cabeça de manequim não se move da mesma maneira no tempo correspondente durante a gravação, assim, nesse ponto, a experiência do ouvinte será distorcida. Gravação binaural não pode ser uma solução geral, não mais do que múltiplos alto-falantes podem ser.

Dessa maneira o som comum e circundante (surround) ocupa uma posição inquieta em algum lugar entre uma solução física verdadeira e uma fisiológica verdadeira. Isso não quer dizer que gravação e reprodução de som é necessariamente ruim – algumas coisas topam-se maravilhosamente. Mas é, necessariamente, em algum grau, uma distorção do som original.


[91]A física da cor


Se você passar uma luz branca brilhante através de um prisma, para uma superfície branca, você consegue uma exibição do espectro de cores, como em um arco-íris. Esse fenômeno foi estudado por Isaac Newton no século XVII, mas não foi inteiramente entendido até o XIX. O espectro de luz visível é agora entendido ser parte de um espectro muito maior englobando todas as ondas eletromagnéticas, incluindo rádio, micro-ondas, raios x, raios gama, assim como aquelas precisamente fora da variação visível, chamadas de infravermelhas e ultravioletas.

A luz e o resto são formas de ondas, as quais podem ser caracterizadas por seus comprimentos de onda; o espectro mostra todos os diferentes comprimentos de ondas. A luz visível tem comprimentos de onda aproximadamente entre 380 nanômetros (violeta) a 750 nm (vermelho). A luz branca normalmente contém uma variação completa de cores. Uma superfície pode refletir luz de diferentes cores em diferentes graus – então a superfície pode ser percebida como colorida. Comumente isso seria uma marca (smear) através de alguma variação do espectro. Também uma fonte de luz pode gerar misturas diferentes de cores. Lâmpadas com filamentos antigos tipicamente produzem luz que é mais forte na extremidade vermelha do espectro do que à luz do dia. Lâmpadas modernas frequentemente podem ser construídas para emular as antigas ou para ser próximas da luz do dia – essas são atualmente referidas como branco morno (warm white) e luz do dia (daylight) respectivamente, com o branco frio (cool white) em algum ponto entre.

Um caso que será útil para discussão adicional é o da lâmpada de sódio, frequentemente usada para iluminação pública. Ela é incomum no que a luz que ela produz é estritamente monocromática (para uma grande aproximação) – quer dizer, de apenas um único comprimento de onda, aproximadamente 590 nm, muito bem na fronteira amarela-laranja. Se a única fonte de luz em uma cena é uma lâmpada de sódio, é impossível distinguir a cor de qualquer superfície, porque, não importa quão muito ou pouco é refletida a partir de uma superfície, toda ela é de uma única cor.


A fisiologia da percepção de cor


As células sensíveis à luz em nossos olhos são de dois tipos, bastonetes (rods) e cones. Os bastonetes não distinguem entre cores; contudo, os cones são ulteriormente divididos em três tipos com diferentes sensitividades à cor, o que nos capacita a ver cores. Esses são chamados de cones vermelho, verde e azul, o que é uma maneira aproximada de descrever suas respectivas sensitividades às cores diferentes do espectro. Mas efetivamente, [92]cada tipo corresponde a uma marca de diferentes comprimentos de onda, e essas marcas sobrepõem-se consideravelmente.

Se a nossos olhos é apresentada luz monocromática (tal como a de uma lâmpada de sódio), a resposta de cada tipo depende de onde, em sua resposta marcada (smeared), a luz monocromática esta. A luz de sódio fica bem perto do pico da marca-resposta das células vermelhas, mas também com uma resposta significante de célula verde (muito pouca resposta de célula azul). Nossa percepção de cor depende de razões ou proporções dessas diferentes respostas – o cérebro diz ‘isto muito vermelho, junto com isto muito verde, mas muito pouco azul, parece um amarelo-laranja particularmente virulento’. É apenas através dessas proporções que nós percebemos cores.

Se a luz atingindo nossos olhos não fosse monocromática, mas marcada ao longo de uma variação de comprimentos de onda na direção da extremidade vermelha, não obstante nós obteríamos um efeito muito semelhante: quer dizer, uma resposta muito proporcional desses três tipos de cones. Há efetivamente muitas combinações diferentes dos comprimentos básicos de onda que nossos olhos são bem incapazes de distinguir.


A teoria das três cores


Dado que nossos olhos possuem somente os três tipos de cones para distinguir cores, parece plausível que nós possamos construir cores usando as três primárias. Quer dizer, deveria ser possível enganar o olho para pensar que ele está vendo qualquer cor particular ao apresentá-lo combinações apropriadas das três primárias.

Do que nós precisamos para cores primárias? Os cones de cores sugerem alguma coisa como vermelha, verde e azul. De fato, isso é o que normalmente é usado para o que é chamado de cores aditivas. Se você começa com fontes de luz vermelha, verde e azul, você pode gerar luz branca e mais ou menos uma completa variação de cores. Isso é feito exatamente em alguns sistemas de projeção, com três projetores separados para as três cores, todos focados na mesma tela branca. Algo semelhante ocorre em telas de computadores e televisões, com pontos de cores bem embalados. Em cada caso, não há interferência entre as cores – se a luz vermelha é projetada, adicionar verde ou azul não afetará a luz vermelha mesma, e o olho está livre para ver a mistura.

Para impressão em papel branco, nós temos uma situação diferente. Aqui nós começamos com luz branca, mas a tinta de impressão exclui algumas cores por filtro – quanto mais tinta nos adicionamos, mas escuro o resultado (isso é chamado de cores subtrativas). Para esse [93]propósito é melhor não usar vermelho / verde / azul mas as cores complementares, ciano / magenta / amarelo. Contudo, é muito mais difícil fazer as cores parecessem certas. A maioria das impressoras usa tinta preta (porque imprimir sobreposto as três primárias não produz um bom negro); algumas fazem ajustes muito mais complicados.

Para um artista, misturando tintas coloridas, novamente, a situação é diferente. A mistura de tintas está mais próxima das cores subtrativas que das aditivas, mas não funciona exatamente como tinta de impressão subtrativa. Um conjunto mais usual de primárias para esse propósito seria vermelha / amarela / azul, mas a maioria dos artistas usa uma variação muito mais ampla de cores para misturar.


Problemas


A abordagem de três cores para imagens provou-se exitosa, mas vale a pena explorar alguns dos problemas em torno dela.

Primeiro, pensemos novamente sobre a luz de sódio, e sobre tirar fotografias. Se eu fotografo uma lâmpada de sódio, os três receptores primários em minha câmera responderão de uma maneira que é semelhante à resposta dos três tipos de cones. Então, se eu exibir a fotografia resultante em minha tela de computador (a qual usa tecnologia LED), a imagem na tela será formada por uma combinação de células LED vermelhas, verdes e azuis. O desafio de exibir uma imagem que parece boa para mim é o desafio de reproduzir em meus olhos aproximadamente as mesmas respostas proporcionais que a lâmpada de sódio original produziu. O sistema poderia obter isso, embora se nós pensarmos em termos de espectro, é muito claro que a marca produzida pela minha tela seja imensamente diferente da luz monocromática de sódio mesma.

Isso importa? Bem, isso poderia importa muito.

Para começar, nem todas as espécies animais são tricotômicas como nós somos. Algumas têm apenas dois receptores diferentes de cores; alguns têm quatro (especialmente pássaros, répteis e alguns peixes). Um animal tetracromático verá cores distintas que nós não podemos ver. Dessa maneira, mesmo se a imagem na tela parecer boa para mim, ela falharia em satisfazer os pássaros!

Uma sugestão interessante, não ainda demonstrada, é que efetivamente alguns humanos têm tetracromatismo – ou ao menos alguns de nós possuem quatro tipo diferentes de cones, o que efetivamente poderia dar-nos tetracromatismo, se nós soubéssemos como os usar. Eu digo ‘nós’, mas efetivamente é muito mais provável em mulheres do que em [94]homens, por razões genéticas. Até pode ser o caso de que algumas mulheres sejam capazes de os usar e, dessa maneira, ver uma variedade mais ampla de cores que a maioria de nós. Mas, mesmo se isso não ocorre, as respostas dos indivíduos podem diferir.

É bem conhecido, é claro, que algumas pessoas são menos sensíveis a certas diferenças de cores do que a maioria – isso é normalmente referido como ‘daltonismo (colour blindness)’. Mas, se algumas pessoas são mais sensíveis, ou mesmo se algumas pessoas são diferentemente sensíveis, isso significa que alguma coisa que eu vejo como uma boa combinação de cores poderia parecer uma pobre combinação para essas pessoas.

Poderia haver uma solução física para esse problema? Idealmente, nós poderíamos gostar de representar o completo espectro de cor com muitas cores diferentes e finamente graduadas. Seria possível ter mais do que três cores ‘primárias’, mas é muito improvável que nós possamos ir muito longe nessa direção com câmeras ou telas de exibição (digamos). Dessa maneira, mais uma vez, o que nós temos é uma acomodação.


Pontos, linhas, quadros, pulsos


A maioria das discretizações de variáveis regulares (smooth) no mundo (mas nem todas, como nós vimos) envolve dividir a continuidade em passos muito pequenos. Isso funciona (quando funciona) porque nossas percepções fazem um pouco de sua própria regularização (smoothing), e desse modo restauram alguma regularidade (smoothness) a algo que efetivamente não é em absoluto regular. Esse processo provavelmente envolve não somente os órgãos dos sentidos mesmos, mas também os processos neurais que se seguem quando o input sensorial é transmitido ao cérebro. Em alguns casos, o órgão sensorial mesmo gera sinais discretos mesmo a partir de input regular, e esses sinais discretos precisam ser interpretados regularmente (smoothly). Nós já vimos como nossos olhos geram sinais discretos a partir de diferentes variações de cores; é também o caso de que o brilho (ou intensidade) é transmitido [na sequência] olho-cérebro pelo número de bastonetes ou cones que dispara (fire); em um dado intervalo temporal, cada um dispara ou não, assim, em algum nível, o processo interno é digital de qualquer maneira.

Assim, alguma regularização é natural, e isso sugere que não há problema sobre a apresentação de dados aos nossos sentidos em elevações discretas, dado que elas sejam pequenas o suficiente. Mas isso levanta a questão do que ‘pequeno o suficiente’ significa, e se há quaisquer outros efeitos de semelhante discretização. Os artistas pointilliste como Seurat tinha uma teoria de que o método deles de pintura, construindo tons de cores a partir de pequenos pontos de cores primárias, efetivamente aprimorava nossa percepção de cor, fazendo as imagens parecem mais brilhantes.

[95]Alguns filmes recentes têm sido gravados e reproduzidos a 48 quadros por segundo, em vez dos tradicionais 24. Embora 24 qps1 seja rápido o suficiente para que o visualizador não esteja consciente da oscilação, parece que a regularidade de 48 qps causa algumas pessoas a sentirem-se doentes. Assim, de fato, podem haver efeitos de um tipo bem oblíquo.


Três dimensões


Agora, retornemos à exibição em 3D, onde nós começamos este capítulo.

Uma solução física para exibição em 3D seria criar uma imagem-modelo em espaço 3D, a qual alguém poderia andar em volta e ver a partir de ângulos diferentes, exatamente como se ela fosse real. Mas isso não parece ser uma boa solução para filmes em 3D (por exemplo). Poderia funcionar para cenas envolvendo pessoas em uma sala, mas cenas ao ar livre com prédios teriam de ser grandemente reduzidas em tamanho, e aquelas com panoramas distantes não funcionariam de maneira alguma.

O método binocular explorado por Wheatstone é uma solução muito mais plausível. Como mencionado, ele depende do fato de que muito de nossa percepção de profundidade vem de nossa visão binocular, com os dois olhos voltando-se um pouco para dentro para se focarem em algo próximo. Há outros efeitos – é também o caso de que cada olho implementa o seu próprio foco – é algo semelhante à maneira pela qual uma câmera é focada, pelo ajustamento das lentes. Contudo, isso apenas é importante para objetos muito próximos. A grande distância, a visão binocular também não ajuda muito – uma pista útil aqui na terra é o que artistas chamam de perspectiva tonal, onde a atmosfera interveniente causa os objetos a parecem mais obscuros e levemente mais azuis do que ele pareceriam de perto (na lua, sem atmosfera, é impossível dizer quão distantes as montanhas estão ou quão altas elas são). E é claro, há o tipo usual de perspectiva geométrica – porque nós sabemos que tipos de alturas os humanos tipicamente têm, uma boa pista de quão longe eles estão é o seu tamanho percebido.

Em filmes e fotografias paradas, ambos os tipos de perspectiva estão presentes de qualquer maneira, é claro – e de fato, quando assistindo a um filme, alguém normalmente está bem consciente da tridimensionalidade da cena. A atual tecnologia 3D de filmes não tenta ajusta o foco monocular, mas adiciona o componente de visão binocular para aprimorar a ilusão de tridimensionalidade.

Essa ilusão tem alguns componentes interessantes. Por exemplo, suponha que você esteja assistindo a um filme 3D, e você vê uma postagem no primeiro plano e [96]alguém passando por trás dela a alguma distância. Alguém assistindo ao mesmo filme do outro lado da sala verá a mesma coisa – a pessoa e a postagem alinhar-se-ão com os olhos dela no mesmo instante que elas se alinharão com os seus. Isso não faz sentido geometricamente.

Mesmo assim, assim como com o som e a cor, a ilusão é o que é importante. Uma mistura pragmática de física e fisiologia obtém uma boa ilusão.

No próximo capítulo, eu considerarei outras maneiras de representar tipos particulares de imagens e sons.


Próximo capítulo


ORIGINAL:

Robertson, Stephen, B C, Before Computers: On Information Technology from Writing to the Age of Digital Data. Cambridge, UK: Open Book Publishers, 2020. p.89-96. Disponível em: <https://doi.org/10.11647/OBP.0225>


TRADUÇÃO:

EderNB do Blog Mathesis

Licença: CC BY 4.0

1NOTA DO TRADUTOR: qps (quadros por segundo).

Nenhum comentário:

Postar um comentário