No texto, o enfoque é a publicidade, no entanto, ganha relevância nesses tempos de Edward Snowden – que nos liberou a todos da acusação de delírio persecutório - o grau de sofisticação utilizado na coleta, seleção, análise e uso de dados garimpados por meio da internet.
Os recursos materiais (equipamentos, estruturas de rede, servidores) e subjetivos (inteligência, algorítimos, softwares) mobilizados são impressionantes. Se para a publicidade há esse empenho, imagine para a “segurança”, que tem um orçamento muito maior à disposição, particularmente nas grandes potências.
Ao tratar da publicidade, o texto suscita alternativas que o cidadão teria para enfrentar essa nova realidade. Já que oferece essa “matéria prima” (seu dados) aos grandes conglomerados comerciais, diz especialista dos EUA, deveria ser remunerado. Aponta mesmo para associações de cidadãos e sindicatos que se organizariam para alcançar esse novo patamar.
O debate, no entanto, deve ser ampliado. E cabe um destaque para o texto escondido na URL do Le Monde (endereço eletrônico do jornal, talvez a primeira versão do título do artigo): “Grande irmão, esse vendedor”. Iria ainda mais longe: “Grande irmão, esse vigilante”. O cidadão configura-se mais complexo do que o consumidor, assim, a pergunta, apesar de não ser nova, só precisa ser inserida no novo contexto, considerando as transformações da era digital: o que o homem e a mulher podem fazer para enfrentar as grandes corporações e os estados com poder ainda mais concentrado? Agora, reaparelhados com novos e modernos recursos de tecnologia?
Como o nosso computador nos manipula
Tudo começou com uma invenção genial, o cookie. Uma única linha de código - por exemplo, MC1:UID = 6daa554691bd4 f9089dc9d92e5cdadf4 - depositada no seu navegador por sites que você visita, é suficiente para que anúncios direcionados sejam exibidos em sua tela.
Nomeado em referência aos cookies (biscoitos) que os restaurantes entregam junto com a conta, o cookie apareceu a partir de 1994, ano em que a web se abriu ao público. Vinte anos depois, continua a ser a pedra angular da publicidade on-line, uma indústria que movimentou em 2013 um volume de negócios global de 102 bilhões de dólares.
Atado 108 vezes em somente 3 cliques

Os cookies são geridos por empresas especializadas que os depositam, os recolhem, os classificam, os analisam, os implantam e os revendem. Eles são usados para identificá-lo, para rastreá-lo de sítio em sítio, para lembrar suas senhas, gerenciar suas compras, para determinar se sua navegação é rápida ou lenta, hesitante ou determinada, sistemática ou superficial ...
O objetivo é criar seu perfil, ou seja, criar arquivos personalizados, armazenados em bancos de dados. Em outras palavras, são utilizados para melhor conhecê-lo, a fim de apresentar-lhe a mensagem publicitária certa, no momento certo e no formato certo. Você pode apagar os cookies, mas novos chegarão assim que você retomar a navegação. E se você bloqueá-los, a maioria dos sítios não funcionará mais. Alguns cookies têm uma vida longa: aqueles interpostos pela Amazon hoje são projetados para durar até 2037.
Um exemplo francês: a partir da página inicial de e-commerce Priceminister, seu navegador recebe de uma vez 44 cookies provenientes de 14 agências especializadas - como RichRelevance, Doubleclick, Exelator ... Se for para o item “celular”, você receberá 22 novos cookies. E clicando em uma imagem de um smartphone Samsung, você desencadeará uma nova onda de 42 cookies de 28 fontes diferentes; portanto, em três cliques, você será ligado 108 vezes a umas quarenta bases de dados. Se você começar a comprar o telefone, mas abandonar ao longo do caminho, você vai chamar a atenção da empresa francesa Criteo, especializada em "redirecionamento". Propagandas sobre o produto que você quase comprou permanecerão em sua tela durante vários dias e irão segui-lo em todos os sítios que você visitar.
Criteo precisa de máquinas poderosas: para identificar um visitante, fazer o contato com a plataforma que gera os espaços publicitários, oferecer um preço, fechar o negócio e começar a exibir o banner, ela dispõe de 13 centésimos de segundo – caso contrário o espaço será vendido a um concorrente.
Empresa de porte médio, Criteo recebe 20 terabytes (20 seguidos de doze zeros) de dados por dia, e afeta 850 milhões de internautas por mês, algumas centenas de vezes. O volume de dados processados por um gigante como o Google é desconhecido, mas sabemos que ele tem mais de um milhão de servidores em todo o mundo. Para refletir essa realidade, os matemáticos inventaram uma nova unidade, o zettabyte (um número acompanhado de 21 casas decimais) . (Recentemente o Google ressaltou que "quer rastrear compras físicas a partir de sua busca". Veja texto no final).
Perfis detalhados
Para refinar a pontaria, os publicitários cruzam os cookies com outros dados recolhidos na internet: seu endereço de IP (Protocolo de Internet que identifica e localiza seu computador), a sua linguagem habitual, as suas consultas registradas nos motores de busca da internet, o modelo de seu computador e de seu navegador, o tipo de seu cartão de crédito ... Se você tiver fornecido dados pessoais – ao fazer uma compra ou preencher um questionário – esses também serão usados. Às vezes os seus dados de Internet serão cruzados com outros, do mundo real - extratos de cartão de crédito, recibos de caixas, mudanças no seu telefone ...
A empresa Acxiom, especializada no cruzamento de informações provenientes de cookies e de dados obtidos por outros meios, vende aos anunciantes perfis selecionados segundo 150 critérios, incluindo "faz costura", "hospeda um pai idoso" ou "possui um gato". Um arquivo contendo dados de milhares de pessoas é vendido, em média, por 60 centavos de euros, mas o preço pode subir até 250 euros para perfis detalhados. Por exemplo, para uma empresa farmacêutica, uma lista de adultos obesos que compraram produtos de emagrecimento. Esses dados são "anônimos", porque, para classificá-lo, os computadores não precisam de seu nome - apenas têm de saber a sua renda, seus desejos, suas necessidades, seu sexo, sua idade, sua profissão, seus hobbies, sua etnia, CEP, suas doenças, a sua situação familiar, sua casa, seu carro, sua religião, suas viagens …
O detalhamento pode ir até a mudança do preço de um produto de acordo com o perfil. Quando um site de viagens identifica que você acabou de realizar uma comparação de preços, ele reduz os seus preços para alinhá-los com os dos seus concorrentes, em condições de concorrer até mesmo nas "taxas". Se você se conectar a partir de um computador de €3.900, o site irá exibir quartos de hotel mais caros do que se você usar um laptop de €300. A livre escolha do consumidor, aparentemente multiplicada pela potência do computador, na verdade, parece, de fato, reduzida. Teria o homem digital aceitado ser dominado pelas máquinas com o único propósito de fazer compras menos cansativas?
"Nós deixamos as tecnologias nos moldar"
O filósofo William Bates, professor de história da tecnologia na Universidade da Califórnia, em Berkeley, observa que grandes profissionais de dados exploram uma característica essencial dos seres humanos: "eles nos fazem compreender que nós não controlamos o nosso próprio comportamento e, em certo sentido, eles têm razão. Estatisticamente, as pessoas reagem muito previsivelmente em determinadas situações, dependendo de mecanismos cerebrais que não conhecem."
Uma situação que amplifica a aceleração da inovação: "por um lado, a tecnologia da informação influencia nosso cérebro; nós não pensamos mais da mesma forma que as gerações anteriores, destaca William Bates. Mas, por outro lado, poucos de nós, incluindo os jovens, compreendem como funciona um computador. Nos submetemos às tecnologias, mas ainda não criamos as ferramentas intelectuais para nos ajudar a entender o que acontece conosco".
O filósofo, no entanto, relativiza essa angústia existencialista: "desde o início da civilização, os seres humanos são construídos pela cultura e evoluem nesse contexto, que também inclui a tecnologia. É o que nos distingue dos animais. Seria ingênuo acreditar que o cérebro humano tenha sido uma vez "mais natural" ou "mais livre", e que as novas tecnologias nos tenha privado de alguma coisa".
Para influenciar o nosso cérebro, os publicitários têm um enorme poder de computação. Eles usam matemáticos para conceber algorítimos, desenvolvedores para os traduzir em linguagem de informática, engenheiros para construir a arquitetura de bases de dados, analistas para capturar e explorar os dados ...
Algoritmos autodidatas
O setor já vive uma nova revolução graças aos constantes avanços tecnológicos. A última moda é a "análise preditiva": em vez de reagir ao comportamento dos usuários, os publicitários querem prever suas ações e agir por antecipação. Para isso, eles apelam para uma disciplina ainda experimental: “machine learning”, ou aprendizagem automática, aprendizagem de máquina, um ramo da inteligência artificial que procura dotar os computadores de capacidade de melhorar o seu desempenho sem intervenção humana. De acordo com Franck Le Ouay, Diretor Científico da Criteo, “a 'aprendizagem de máquina' sugere a capacidade de um programa adaptar-se a uma nova situação. Nós desenvolvemos algoritmos autorregulados e com autonomia de aprendizagem".
Se uma noite, por voltas das 18 horas, o programa detectar que os parisienses usam a Internet menos do que o habitual, ele modulará a exibição dos anúncios em conformidade com essa observação. Melhor: em breve, o sistema poderá constatar, ao consultar um sítio de tráfego rodoviário, que um grande engarrafamento bloqueia a capital. Assim, poderá deduzir que os parisienses chegarão mais tarde em casa, o que irá deslocar o horário normal de uso da Internet ... Criteo, que já emprega 160 matemáticos, vai contratar mais uma centena em 2014. Franck Le Ouay eleva sua expectativa muito alto: "nos deveremos alcançar a façanha de realizar mais previsões com a mesma quantidade de dados".
As experiências se multiplicam. O matemático Erick Alphonse, da Universidade de Paris XIII, está desenvolvendo um sistema chamado Predictive Mix. Ele estuda inicialmente dois grupos de usuários: um verá um banner publicitário na sua tela, o outro não. Ao comparar a taxa de compra do produto em cada grupo, poderá quantificar a eficácia da mensagem.
De posse desses primeiros resultados, Predictive Mix irá separar os perfis em quatro grupos. O usuário que comprar um produto sem ver a publicidade é um "cativo": inútil desperdiçar dinheiro para convencê-lo; aquele que compra quando vê uma publicidade, mas deixa de comprar quando vê, é um "refratário": é necessário deixá-lo tranquilo, sozinho; o que nunca compra nada deve ser esquecido – é muito difícil de ser convencido; finalmente, quem não comprar nada na ausência de publicidade, mas começar a comprar assim que é atingido pela mensagem, é um "receptivo", o alvo de maior interesse.
Na etapa seguinte, o computador compara a amostra de "receptivo confirmado" com a população em geral contida em um banco de dados. Todos os usuários cujo perfil for semelhante ao do "receptivo", serão, por sua vez, classificados como tal. E o anunciante poderá eliminar de sua campanha os outros três grupos. "Com esse direcionamento final, explica Erick Alphonse, o anunciante economiza dinheiro, pois comprará menos espaço ao mesmo tempo que realizará um melhor retorno sobre o investimento".
Taxonomia da web
Outra empresa francesa, Weborama, embarcou em uma aventura ainda mais pesada: explorar a "teia de palavras" ou "rede de palavras" (web des mots). Programas automáticos, robôs, recolhem textos publicados em uma ampla gama de sítios e de fóruns. A partir desses dados brutos, os linguistas da Weborama irão extrair um léxico de seis mil termos relevantes no contexto da propaganda.
Em uma segunda etapa, os matemáticos deverão organizar a web como um "espaço métrico": calculando a distância relativa entre as palavras, conforme sejam mais ou menos associadas dentro da mesma frase. Em seguida, eles reúnem as palavras associadas em 177 grupos temáticos - seguro, jogos, comida, esporte, animais de estimação ... O proprietário da Weborama, Alain Levy, resume assim sua abordagem: "esta taxonomia é a nossa visão da web. A referência não é o sítio, mas a palavra".
Então terá início a exploração comercial. Por meio de acordos com agências, Weborama implanta cookies em milhões de navegadores. Então, esses são identificados na internet e recolhem as palavras selecionadas em todos os sítios visitados. "A cada perfil é assim atribuída uma nuvem de palavras que o caracteriza", esclarece Alain Levy. Os computadores, então, irão projetar essa "nuvem" sobre o banco de dados que contém os grupos de palavras e atribuir a cada perfil uma nota por categoria.
Cruzando notas - por exemplo, 13 dos 14 (o máximo) para as palavras associadas com a moda, 12 para o design, mas apenas 2 para o esporte, um para carros - Weborama será capaz de dizer ao anunciante o que se esconde por trás de cada cookie: "essa seria, por exemplo, uma mulher de 34 a 49 anos, apaixonada por moda, indiferente ao esporte, explica Alain Levy. Essa mulher não atrairá a atenção de uns anunciantes, mas será muito desejável para os outros. L'Oréal vai estar disposto a pagar €2 para exibir um banner na sua tela”. Weborama tem até agora 62 milhões de perfis para França – mas existem duplicidades, porque uma pessoa pode usar vários dispositivos (PC, smartphone, tablet). A atualização é permanente, com cada clique provocando mais cálculos.
Grande esperança
A análise preditiva permeia todos os setores. Padrões são criadas para facilitar a migração dessas novas habilidades para as indústrias tradicionais. Na França, a empresa Dataiku desenvolveu um conjunto de softwares que permitirá que quadros sem formação de ponta em informática possam se envolver na gestão de bases de dados e análise preditiva: "nossos clientes em potencial", diz Florian Douetteau, proprietário da Dataiku, "são empresas industriais com grande estoques de dados não utilizados e que queiram explorá-los para resolver problemas de forma inovadora". Ele cita o exemplo de uma empresa de parquímetros que deseje, a partir de dados de um estacionamento, modelar o tráfego em milhares de cidades.
A grande esperança dos pesquisadores é que os computadores sejam capazes de dar sentido a dados difusos e caóticos, entregues a granel. Descobrindo padrões e correlações que nenhum ser humano poderia ter imaginado, responderão a perguntas que não foram feitas.
Diante disso, o debate sobre a existência de uma "inteligência" nesses computadores com capacidade de autoaprendizagem é obsoleto. Para os profissionais do setor, o importante não é saber se a máquina funciona como um cérebro humano, mas conseguir que obtenha, por caminhos diferentes, os resultados iguais ou superiores àqueles que os humanos tenham alcançado.
Sobre a relação entre o homem e a máquina, vários pensadores americanos a resumiram em uma questão que deve ser respondida por cada um: os seus conhecimentos complementam o saber fazer de seu computador, ou o seu computador faz o trabalho melhor sem você? De fato, os matemáticos começaram a destruir alguns postos da publicidade - analistas, planejadores, etc . Resta saber se o crescimento dessas técnicas cada vez mais invasivas causará uma reação das populações-alvo.
Estratégia de auto-defesa
O filósofo William Bates lembra que nada é manipulado: "o fato de nosso cérebro ser maleável significa que a tecnologia não nos predetermina inteiramente. Em certos momentos históricos, podemos decidir o que queremos . Mas, para isso, temos de pensar e agir. Isso pode ser o que mais nos assusta. Se escolhermos que a inovação tornou-se incontrolável, estaremos nos eximindo de qualquer responsabilidade, é mais confortável".
Por seu lado, Melanie Swan, uma californiana que se define como uma "filósofa da tecnologia", observa que muitos internautas começam a implementar estratégias de autodefesa: "espalham seus dados em vários sites - suas fotos com um serviço, os seus e-mails em outro, seus pedidos em um terceiro - na esperança de que nenhuma dessas empresas possam estabelecer o seu perfil completo. Esse comportamento é indício de uma "proto sensibilidade" para o problema. Eles sentem que algo está errado, mas permanecem impotentes. Mas isso está mudando".
De acordo com Melanie Swan, assistimos nos Estados Unidos ao nascimento de um movimento intelectual que tem o objetivo de encorajar as pessoas a se tornarem sujeitos ativos neste negócio: “quando deixamos uma empresa tomar posse de nossos dados pessoais, realizamos uma transação, fornecemos matéria-prima que tem valor. No entanto, não temos nenhum poder de barganha, aceitamos as condições impostas pela indústria". A solução é óbvia: "eu acho que as pessoas vão se unir e se organizar para defender seus interesses como fornecedores de dados. Para fazer isso, eles vão ser guiados por associações de consumidores, ou mesmo sindicatos. Só uma resposta coletiva e unida pode restaurar o equilíbrio. "Se os usuários são capazes de mudar o equilíbrio de poder com a indústria, podem exigir que sejam pagos por seus dados, ou impor condições e restrições sobre seu uso. Para os pensadores do Vale do Silício, essa estratégia pode ser mais eficaz do que as leis impostas pelo Estado, muitas vezes, escondendo uma guerra de interesses.
Yves Eudes (repórter). Le Monde, 13 de abril de 2014.
Google quer rastrear compras físicas a partir de sua busca
O Google quer rastrear as compras físicas que são feitas após as pessoas clicarem em links publicitários de um produto ou loja do buscador. De acordo com o Wall Street Journal, a companhia de tecnologia já teria feito parcerias com empresas de dados digitais, são elas a Acxiom e a DataLogix. Ao cruzar dados de usuários anônimos com informações apresentadas por cookies de rastreamento, a companhia poderá mostrar quantos produtos foram comprados em lojas físicas a partir da navegação em sua plataforma. Um teste de rastreamento será realizado com seis empresas, incluindo a loja de artesanato Michaels. A atual ferramenta publicitária do Google, a AdWord, já possui 40% do mercado de publicidade digital dos Estados Unidos.
Publicado em Revista Espírito Livre, em 15 de abril de 2014.