Fala-se muito mal da Estatística. De um lado, constitui grande injustiça para com uma ciência sem a qual hoje talvez nem sobrevivêssemos direito. De outro, trata-se da compreensível reação contra a maneira pela qual a Estatística é usada e abusada para "provar" o duvidoso e manipular a chamada realidade objetiva. Compreendo o sujeito que disse, como já lembrei aqui antes, que a Estatística é a arte de mentir com precisão, porque de fato o seu uso inescrupuloso e falsário equivale a isso.
Começo lembrando a famosa média. Em grande parte dos casos em que ela é empregada em indicadores sociais e econômicos, não quer dizer nada, ou melhor, quer dizer muito pouco. Se Bill Gates passasse a ser residente da cidade de Itaparica, teríamos talvez a renda per capita mais alta do planeta ou com certeza uma das mais altas, sem que um itaparicano sequer passasse a ganhar mais um centavo. Isso porque a renda per capita é uma média aritmética e, por conseguinte, sensível em excesso aos valores extremos. Então, numa população em que um ganha por mês um milhão de borodongas e os outros cinco borodongas cada, falar em renda per capita é ridículo.
Precisamos, portanto, saber da mediana. Talvez por às vezes revelar-se incomodativa, não é muito mencionada, notadamente em estatísticas oficiais. A mediana dá mais peso e significado à média. É o valor que se encontra exatamente no meio dessa coletividade. Ou seja, não é bastante saber que a renda média é 1.000. É preciso saber também (estou simplificando e peço desculpas a estatísticos e matemáticos em geral) o valor que divide esses indivíduos pela metade, ou seja, o ponto em relação ao qual exatamente a metade ganha menos e a metade ganha mais. Quando a média é próxima da mediana, isso significa que a distribuição é mais ou menos simétrica. Quando não, a distribuição é tortinha. Logo, a mediana pode, por exemplo, desmoralizar a renda per capita, se demonstrar que metade da população ganha muito abaixo desta e a outra metade muito acima. Mas ninguém fala na mediana.
Também tem, desculpem, a moda. Não a moda fora da qual estou, mas a moda estatística mesmo, ou seja, o valor mais freqüente, o que mais ocorre numa população determinada. Assim, se a renda média dos habitantes da próspera comunidade de Lulalápolis, é R$ 1.000 por mês, mas a mediana é 100 e/ou a moda é oitentinha, já vemos bem como podemos (e somos) ser engabelados. É por isso que até a Bethânia, que não é de sair por aí falando ou fazendo manifestações, se revelou na imprensa um pouco irritada com esse país maravilhoso (virtual, estatisticamente siliconado, digo eu) a que ela não consegue chegar.
Também convivemos acriticamente com uma porção de chutes que desonram e desmerecem a Estatística, tais como a conversão de coexistência numa relação de causa e efeito. É como o torcedor do Flamengo achar que a causa da vitória do time dele foi ter entrado um urubu em campo, logo antes do jogo. Não vamos discutir com torcedor, tudo bem. Mas coisas boas que acontecem são vinculadas a outras de maneira absolutamente arbitrária e aí, em propaganda comercial por exemplo, para esquecer um pouco a política, acabamos acreditando em afirmações que não passam de reformulações de vigarices como "todos os que morreram de enfarte do miocárdio no ano passado faziam uso de água". Verdade, mas claro que não prova que tomar banho faz mal ao coração. Com espertas artes, porém, nos enrolam muito nessa linha.
E as categorias? O sujeito enche a boca e diz: "Depois de tantos anos de meu governo, o número de ricos cresceu em 20% e o de pobres diminuiu em 32%." Além dos probleminhas de média, mediana e moda, que sempre estão rondando, é muito fácil (e é isso que se faz) dizer que rico é quem ganha mais de R$ 2.000 por mês. Fico até admirado por não haverem proposto R$ 1.500, porque o número de ricos ia bombar. Até a felicidade é quantificada e lemos a sério, como parvos, que o povo tal tem o maior índice de felicidade do mundo ou semelhantes despautérios.
E a coleta dos dados? Desde antes da definição das categorias e das perguntas, desde o início do planejamento, um dos maiores problemas que o estatístico sério encontra é a feitura de uma coleta de dados "neutra", que não influencie as respostas. Em rigor, impossível, porque até condições meteorológicas podem influir nas respostas. As próprias perguntas podem induzir a determinado tipo de resposta. A roupa, o sexo, a idade, o sotaque, o local, a época, a hora, as palavras e expressões usadas, a ordem das perguntas, o tamanho do questionário, e centenas de outros fatores podem, mesmo nas pesquisas mais honestas e cientificamente orientadas, levar à distorção de resultados. Há até, em confusão com esses e outros fatores, o perigo de o entrevistado querer responder o que acredita que se espera dele e não o que de fato pensa.
Há muito mais, um dia desses falo mais. Enche mesmo o saco nos tratarem como a uma tropa de burros, que não somos. Somos, sim, otários, comodistas, coniventes e subservientes, mas isso já é outro problema.