O livro Todo Mundo Mente, do autor Seth Stephens-Davinowitz escancara aspectos íntimos de todos nós através de pesquisas com os dados e rastros que deixamos online.
“Mentimos para as pessoas, mas não para o Google”.
Nessa análise e resumo do livro vou te contar sobre os variados estudos que foram feitos com os dados de vários grandes sites e a correlação que eles tem com nossas ações e discursos. Mais especificamente como tendemos a não ser tão transparentes com outros ou mesmo com nós mesmos.
Se você gosta de livros, considere se inscrever para o meu Clube do Livro.
O que está atrás da cortina do ‘Big Data'?
Devemos admitir: Não importa o quão sincero dizemos que somos com nós mesmos e com os outros ao nosso redor, ainda mentimos em algum ponto ou outro.
Seja para exacerbar nossas características benevolentes em um questionário de estilo de vida ou não contar tudo sobre o que fazemos quando não tem ninguém olhando, todo mundo esconde alguma coisa ou se ilude.
No entanto, com o constante aumento de dados coletados sobre nós por, por exemplo, pesquisas do Google, podemos ver o que está oculto e descobrir as verdades. Com esse grande volume de dados acumulados sobre incontáveis aspectos da existência humana – chamado também de Big Data – agora é possível analisar e revelar os padrões do nosso comportamento e identificar preferências que nunca imaginamos antes.
Nesse livro, o autor Seth Stephens-Davinowitz nos conta o que o Big Data tem a nos oferecer, de nos informar nosso estado de saúde a revelar estranhas características humanas.
A ciência de dados é mais intuitiva do que pensamos
Você já ouviu o termo, mas o que exatamente é big data? A pista está no nome. Big data se refere a um imenso volume de dados. Um volume que é tão vasto, na verdade, que a mente humana mal consegue compreendê-lo. Em outras palavras, big data são dados para os quais é necessário poder computacional para reconhecer padrões.
Paradoxalmente, no entanto, apesar de sua escala notável, a ciência de dados tem um aspecto intuitivo. Afinal, se você pensar bem, somos todos cientistas de dados de certa forma. O autor aponta para sua avó. Num dia de Ação de Graças (feriado dos Estados Unidos), ela começou a sugerir ao autor como sua parceira ideal deveria ser – pelo menos no que dizia respeito a ela! A parceira precisava ser inteligente, legal, engraçada, sociável e bonita (embora nenhuma supermodelo se aplique). Aos 88 anos, sua avó tinha visto muitos relacionamentos irem e virem. Ela estava usando anos de coleta de informações e dados para articular as características que considerava essenciais em relacionamentos de sucesso.
Ela estava utilizando informações para detectar padrões e prever como certas variáveis impactariam umas nas outras – exatamente como faria um cientista de dados. No entanto, embora a ciência de dados seja um processo intuitivo, a intuição em si não é realmente ciência. É por isso que utilizar os dados coletados corretamente é essencial para refinar a visão de mundo de uma pessoa.
Os dados nos fornecem o material para confirmar ou refutar nossas intuições iniciais. Ajuda-nos a identificar padrões e previsões mais precisos do que a experiência pessoal sozinha poderia. Vamos voltar para a vovó; ela estava convencida de que os relacionamentos duram mais se os parceiros tiverem amigos em comum. Essa noção foi baseada em sua própria experiência, já que ela e seu marido passaram muitas noites com seus amigos no Queens, em Nova York. Mas, na realidade, o tamanho da amostra era muito pequeno e os dados concretos sugerem que ela estava enganada. Um estudo de 2014 realizado por Lars Backstrom e Jon Kleinberg, baseado em dados do Facebook, mostrou que casais com mais amigos em comum tinham maior probabilidade de mudar seu status de relacionamento de “em um relacionamento” para “solteiro” Isso mostra que, embora uma intuição possa nos levar longe, os dados refinam até a perspectiva da pessoa mais intuitiva.
O Google é um ótimo exemplo de como Big Data pode constantemente nos dar novas informações
A ciência de dados é muito útil, mas o que a torna especial não é a quantidade de dados coletados, mas sim o fato de os dados serem úteis; em outras palavras, é o tipo de dado que pode revelar padrões ou fazer previsões.
O Google é um exemplo disso. O mecanismo de pesquisa de Larry Page e Sergey Brin, fundado em 1998, tornou-se um gigante não apenas porque foram capazes de coletar muitos dados. O que diferencia o Google é que os dados coletados podem ser usados de forma eficiente. Antes do Google, quando você digitava “Bill Clinton” em um mecanismo de pesquisa, você recebia apenas sites que continham a frase com mais frequência.
Frequentemente, você receberia um monte de sites irrelevantes em suas pesquisas. O algoritmo de Brin e Page funcionou de forma diferente. Eles descobriram que um site provavelmente era mais relevante para alguém se tivesse mais links de outros sites que levassem o usuário até ele. Portanto, o site oficial da Casa Branca, que foi linkado milhares de vezes por milhares de sites diferentes, seria mais útil do que, por exemplo, um site com apenas cem menções do nome de Clinton.
Eles agregaram todos os dados sobre links e foram capazes de detectar padrões e prever quais informações eram mais relevantes para o usuário. Ao longo do livro, o autor explica quatro razões pelas quais o big data é tão poderoso e a abordagem do Google é um bom exemplo do primeiro motivo:
Big data é uma novidade.
Ele nos oferece um fluxo constante de novas informações. Antes dos dias de big data, você tinha que esperar as agências de estatísticas nacionais para coletar e calcular as taxas de desemprego atuais por meio de pesquisas por telefone, ou esperar por um relatório dos Centros de Controle e Prevenção de Doenças para aprender sobre as taxas de infecção para certas doenças.
Mas agora você poderia usar o big data do Google para rastrear ambos – e foi exatamente isso que o engenheiro do Google Jeremy Ginsberg fez. Ele mostrou que pesquisas no Google relacionadas à gripe, como “sintomas de gripe”, indicam a disseminação da gripe e podem ser usadas para rastrear a disseminação da doença em áreas geográficas e ao longo do tempo.
Todo mundo mente, mas o Big Data não mente
Recentemente, graduados da Universidade de Maryland foram questionados sobre suas médias de notas (o chamado GPA para os estadunidenses). Entre os entrevistados, dois por cento admitiram que se formaram com um GPA inferior a 2,5 em uma escala de quatro pontos. No entanto, de acordo com registros oficiais, o número era muito maior, de 11 por cento.
Embora seja apenas um exemplo, ele demonstra uma verdade universal sobre pesquisas: as pessoas mentem.
Mas por que? Bem, é natural que queiramos ter uma boa aparência, tanto para nós mesmos quanto para os outros, então as pessoas adaptam suas respostas para ter uma visão mais positiva de si mesmas.
Esse comportamento de dar respostas que nos fazem parecer melhores é chamado de viés de desejabilidade social.
Além disso, muitas vezes há uma pré-disposição entre os entrevistados para querer impressionar a pessoa que administra a pesquisa. Queremos causar uma boa impressão, quer sejamos anônimos ou não.
Para dar um exemplo extremo, se você estiver respondendo a perguntas em uma pesquisa com alguém que se parece com seu pai, pode não estar disposto a detalhar experiências com drogas na faculdade. É uma propensão humana a contar inverdades, o que torna as pesquisas pouco confiáveis quando se trata de tentar entender o comportamento, pensamentos, desejos e crenças.
Isso nos leva à segunda razão pela qual o big data é tão poderoso:
Ele não mente.
Por ser coletado por meio de comportamento online não filtrado, sempre revelará a verdade. Afinal, as pessoas têm muito menos probabilidade de mentir ou distorcer os resultados ao inserir os termos nos mecanismos de pesquisa quando nenhum questionador está envolvido.
Vamos considerar o assunto do sexo anal. A maioria das pessoas admitiria em uma pesquisa ou entrevista que gostava de usar ocasionalmente um pedaço de fruta em suas fantasias sexuais anais?
Depende da pesquisa, mas provavelmente não.
Mas quando o autor analisou dados do site pornô PornHub, ele descobriu que algumas mulheres estavam procurando por “maçã anal”.
Isso só mostra que o big data pode revelar algumas coisas surpreendentes sobre as pessoas que elas podem não querer compartilhar diretamente com outro ser humano.
Big Data pode também nos ajudar a entender subconjuntos de dados
É difícil entender o quão grande é o big data. A cada dia, enormes quantidades de dados passam pelo Google por si só, sem falar em outros mecanismos de pesquisa ou outros sites em geral.
O volume desses dados significa que agora podemos fazer coisas que nunca poderíamos fazer antes. Este é o terceiro grande poder do big data:
O tamanho dos conjuntos de dados significa que podemos ampliar um subconjunto e extrair informações dele de maneira confiável.
Vamos considerar um exemplo do mundo real. O professor de Harvard, Raj Chetty, queria investigar se as pessoas achavam que o sonho americano ainda estava vivo. Ele decidiu usar o big data para ajudar a formar uma resposta a uma pergunta mais precisa: as pessoas cujos pais são pobres podem crescer para se tornarem ricas?
A equipe de Chetty usou registros fiscais coletados pelo US Internal Revenue Service. No total, eles tiveram mais de um bilhão de dados fiscais e esses dados foram reveladores. Eles mostraram que, quando comparado com outros países desenvolvidos, como Dinamarca e Canadá, a situação nos Estados Unidos não era muito boa para os pobres.
Uma pobre estadunidense tinha 7,5 por cento de chance de obter sucesso em seu campo escolhido. Mas para dinamarqueses e canadenses, as chances eram de 11,7% e 13,5%, respectivamente. Esse era o quadro geral, mas a beleza do big data é que Chetty podia ampliar diferentes estados, cidades, vilas e bairros.
Ao fazer isso, ele descobriu que os dados revelavam que o sonho americano existia – mas apenas em alguns lugares. Em San Jose, Califórnia, um americano pobre tinha 12,9% de chance de enriquecer, o que é melhor do que na Dinamarca. Mas para um americano que cresceu em Charlotte, Carolina do Norte, as chances eram de apenas 4,4%. É essa capacidade de aumentar o zoom que demonstra como o big data pode nos dar uma compreensão diferenciada do mundo, onde e em qualquer escala que escolhermos.
Big data possibilita a realização de testes A/B de forma mais simples e barata
Todos os dias, somos bombardeados com histórias sobre correlações. Um alimento está ligado a uma doença. Um hábito está ligado ao sucesso. Essas correlações parecem críveis à primeira vista, mas a correlação não implica necessariamente em uma relação de causa e efeito.
Na realidade, para aprender sobre o efeito causal de algo, você precisa estabelecer a causalidade usando experimentos controlados e randomizados, comumente chamados de testes A / B.
Por exemplo, um estudo pode relatar que pessoas que bebem álcool moderadamente geralmente são mais saudáveis. Mas isso implica que beber moderadamente faz com que nossa saúde melhore? Claro que não.
Para testar se beber moderadamente melhora a saúde, você precisaria ter um grupo de indivíduos selecionados aleatoriamente divididos em dois grupos. Um grupo bebia, digamos, uma taça de vinho tinto por dia, enquanto o outro grupo não bebia nada.
Depois de um ano, os dois grupos seriam comparados. Se o primeiro grupo fosse mais saudável do que o grupo dois, isso implicaria que beber moderadamente era uma causa de melhoria da saúde. O big data torna muito mais fácil conduzir testes A / B e esta é a quarta razão pela qual o big data é tão poderoso. Antes do surgimento do big data, a execução de testes A / B era bem complicada.
Por exemplo, para testar o impacto de uma propaganda, você teria que recrutar participantes, pesquisá-los e analisar os resultados. Mas agora, os cientistas de dados podem escrever um programa que analisa dados de testes A / B. A campanha presidencial de Barack Obama em 2008 empregou essa abordagem e ficou famosa.
Os diretores da campanha de Obama queriam criar um site que motivasse as pessoas a se inscrever e doar. Eles usaram diferentes combinações de imagens e texto e, então, foram capazes de analisar os dados relevantes para deduzir qual layout foi o mais bem-sucedido.
Até agora, já estabelecemos uma série de aspectos positivos do Big Data. A seguir, vamos voltar para os negativos.
O Big Data não é tão bom quando temos muitas variáveis ou questões não quantificáveis
Embora existam vantagens definitivas para o big data, ele não é perfeito. Sua maior limitação torna-se evidente em conjuntos de dados com muitas variáveis. É difícil extrair respostas confiáveis porque o número de variáveis obscurece as descobertas possíveis.
Vamos considerar o trabalho do geneticista comportamental Robert Plomin. Em 1998, ele pensou ter encontrado um gene, IGF2r, que era indicativo do QI das pessoas.
Ele obteve um conjunto de dados compilado de várias centenas de alunos contendo informações sobre os níveis de DNA e QI. Plomin comparou seu DNA com QIs alto e baixo e descobriu que o IGF2r tinha duas vezes mais probabilidade de ocorrer em alunos com QI alto.
Infelizmente, a correlação foi um acaso. Quando Plomin repetiu a comparação do conjunto de dados alguns anos depois, a correlação entre o IQ e a ocorrência do IGF2r estava longe de ser vista.
É fácil perceber por quê. O genoma humano consiste em milhares de genes; se as correlações ocorrem, é sempre possível que elas aconteçam apenas por acaso. Existem tantas variáveis que os padrões podem ocorrer aleatoriamente.
Há outro problema com Big Data é que frequentemente faltam os chamados ‘pequenos dados', o tipo de dados que se refere à experiência humana.
Big data pode medir muito, mas às vezes as respostas mensuráveis não são necessariamente o que buscamos. Por exemplo, o Facebook pode facilmente medir cliques e curtidas usando big data. Mas fazer isso não diria nada à empresa sobre a experiência das pessoas com o site.
Em circunstâncias como essas, pequenos dados são essenciais. O Facebook coleta esse tipo de dados por meio de outros métodos, nomeadamente por meio de pesquisas em menor escala para perguntar aos usuários sobre suas opiniões e experiências no site.
O Facebook também emprega psicólogos e sociólogos para ajudar a empresa a ter uma noção das experiências do usuário não mensuráveis. Isso mostra que o big data não é perfeito – e os problemas são ainda mais profundos.
Governos não deveriam usar Big Data para agir no nível do indivíduo
Cada vez que você digita em uma pesquisa do Google ou compra um produto on-line, você está contribuindo para o big data.
Mas e quanto às considerações éticas?
E se o governo tivesse acesso a esses dados? O que eles poderiam fazer com isso?
Digamos que alguém digitou “Eu quero me matar” em um mecanismo de busca. A polícia local deve ser notificada? Em casos como esses, as autoridades simplesmente não agem e não podem agir em um nível individual – e com razão.
Todos os meses, ocorrem 3,5 milhões de pesquisas no Google relacionadas a suicídio nos Estados Unidos. Em contraste, o número de suicídios no país é inferior a 4.000 por mês. Isso implicaria em um grande desperdício de recursos policiais se eles decidissem localizar o indivíduo em questão toda vez que um pensamento suicida fosse digitado em um computador.
Mas também há uma dimensão ética que não devemos esquecer. Os governos deveriam ter permissão para possuir e usar dados de pesquisa pertencentes a indivíduos? Afinal, isso equivaleria a uma invasão de privacidade.
Essas considerações éticas não impediriam os governos de usar big data em nível regional, especialmente porque mais e mais evidências apontam para uma correlação entre pesquisas online e ação subsequente. Por exemplo, os pesquisadores Christine Ma-Kellams, Flora Or, Ji Hyun Baek e Ichiro Kawachi descobriram em um estudo de 2016 que as pesquisas relacionadas a suicídio no Google estão significativamente correlacionadas com as taxas reais de suicídio. Mas essa correlação só era válida em nível estadual.
Então, como as autoridades estaduais e os departamentos de polícia podem usar esses dados? Bem, eles poderiam usá-lo em programas de prevenção de suicídio em áreas locais específicas, como em níveis estaduais ou municipais.
Eles poderiam divulgar informações em comerciais de rádio e TV, com dicas sobre onde ir ou para quem ligar se as pessoas precisassem de ajuda. Isso mostra que, além de revelar todos os tipos de coisas interessantes sobre os humanos, o big data também pode ser usado de forma produtiva em situações da vida real.
Conclusão
A mensagem principal deste livro é que as pessoas raramente respondem às pesquisas com honestidade, o que distorce nossa compreensão do mundo
Mas com o aumento do big data – ou seja, a coleta de quantidades incrivelmente grandes de dados em, por exemplo, pesquisas do Google -, somos capazes de detectar padrões no comportamento humano e identificar preferências que nunca conhecíamos antes.
Como conselho, o autor fala:
Não se preocupe se você tiver fantasias sexuais pervertidas. Você não está sozinho!
Embora você provavelmente não consiga que todos admitam seus fetiches, isso pode ser apenas porque alguns indivíduos se preocupam em serem socialmente excluídos. Então, se você ousar, fale sobre suas verdadeiras preferências! É provável que você receba algumas aparências estranhas, mas, como revela o Big Data, é quase certo que haja alguém como você por aí.
Em vez de escondê-lo, você pode transformar todas as coisas bizarras e estranhas que você normalmente digita no Google em um tópico de conversa. Talvez então você possa começar a normalizar alguns dos aspectos não falados do comportamento humano.
Análise
Eu gostei muito de ler esse livro porque não só é um tópico muito interessante quanto o jeito dele escrever é leve, cômico e também fácil de compreender. Os exemplos são bem ilustrativos dos pontos chave do livro e também traz reflexões de situações que provavelmente já passamos.
Recomendo o livro “Todo Mundo Mente” porque o reconhecimento desse comportamento de omissão de informações é fundamental para aumentar nossa consciência nessa vida. Ficar nos iludindo e reproduzindo ações sem pensar é um caminho que só tende a criar bloqueios, traumas e dificuldade de relacionamentos. À medida que compreendemos um pouco mais de nossas ações, motivações e comportamentos, fica mais fácil questionar, aceitar e, quem sabe, mudar.
No meu ponto de vista, ser mais sincero com nós mesmos e com os outros é o melhor caminho e posso dizer que esse livro me ajudou a isso.
O que você achou desse resumo? Me conta abaixo nos comentários.
Divirta-se!