Editor: Luiz Gustavo B. de Proença
Colaboradores: Airton J. Camilotti Jr; Danilo Burko; Guilherme Garrido; Larissa Fabri; Oquesana Silva
BIOESTATÍSTICA – TABELAS E GRÁFICOS
Análise exploratória à Base da análise de dados.
Introdução:
A estatística é um segmento da matemática que estuda agrupamentos metódicos, séries de fatos ou dados numéricos. E seus princípios decorrem da teoria da probabilidade.
Exemplos com a palavra “estatística”:
“A produção industrial espanhola já havia recuado 19,7% em abril e 24,7% em março, na maior queda desde o início da série estatística em 1992. Folha de São Paulo, 03/07/2009”.
"Estatística: a ciência que diz que se eu comi um frango e tu não comeste nenhum, teremos comido, em média, meio frango cada um, Pitigrilli”.
Tipos de estatística:
Pode ser dividida em três tipos distintos com suas características e peculiaridades assim como o uso adequado delas. Ela pode ser:
- Estatística descritiva: É a caracterização dos objetos estudados. Ela aplica várias técnicas para descrever e sumarizar um conjunto de dados. Possui técnicas que costumam se classificar em: I) Gráficos descritivos, II) Descrição tabular, III) Descrição paramétrica, que serão posteriormente aqui descritos.
- Estatística Analítica: investigação das relações entre as características estudadas.
- Estatística inferencial: avaliação da possibilidade de generalização dos resultados. Usada para identificar relações entre variáveis que representem ou não relações de causa e efeito.
àpor motivos de conteúdo, somente a estatística descritiva será tratada aqui.
Por motivos didático e organizacional, a estrutura da Estatística Descritiva está a seguir:
· Tabular
o Dados Qualitativos
§ Frequência absoluta
§ Frequência relativa
§ Frequência acumulada (ordinais)
o Dados Quantitativos (categorizados)
§ Frequência absoluta
§ Frequência relativa
§ Frequência acumulada
o Dados Quantitativos (não categorizados)
§ Medida de tendência central
§ Medida de dispersão
· Gráfica
o Dados Qualitativos
§ Colunas ou barras
· Frequência absoluta ou relativa
§ Diagrama por setores (pizza)
· Frequência relativa à número de classes
o Dados Quantitativos
§ Histograma
§ Forma da distribuição simétrica
§ Polígono de frequências
§ Forma da distribuição
· Curtose ou achatamento
· Simetria
o Simétrica
o Assimétrica
Frequência absoluta é o número de vezes que um valor da variável se repete. Já a frequência relativa é o determinada em percentagem pela relação "frequência absoluta da variável e o somatório dos valores citados". Exemplo: 200 pessoas praticam esportes. Dentre eles há: futebol, vôlei, basquete, natação, tênis e ciclismo. Observar os resultados:
MODALIDADE ESPORTIVA |
FREQUÊNCIA ABSOLUTA |
FREQUÊNCIA RELATIVA |
Futebol |
70 |
70/200=0,35 ou 35% |
Vôlei |
50 |
50/200=0,50 ou 50% |
Basquete |
40 |
40/200=0,40 ou 40% |
Natação |
20 |
20/200=0,20 ou 20% |
Tênis |
15 |
15/200=0,15 ou 15% |
Ciclismo |
5 |
5/200=0,05 ou 5% |
|
|
|
Total |
200 |
100% |
Histograma:
é uma representação gráfica da distribuição das frequências.O histograma é um gráfico composto por retângulos
Na análise gráfica, os valores qualitativos podem ser apresentados de acordo com: I) Colunas e barras; II) Diagrama de Pizza. As colunas e barras são usadas para a fácil visualização da quantidade numérica
das variáveis.
As barras se encontram em posição horizontal enquanto as colunas em posição vertical. Já nos valores Quantitativos, quatro analises gráficas são comumente usadas: I) Histogramas; II) Forma de distribuição simétrica; III) Polígono das frequências; IV) Forma da distribuição.
Medidas de Dispersão:
As medidas de dispersão são usadas para a variabilidade de dados quantitativos. Entre elas, as medidas mais comuns e mais usadas são a Variância e sua raiz quadrada, o Desvio Padrão.
Variância: A variância é calculada subtraindo o valor observado do valor médio.
Exemplo: a pessoa A tirou as seguintes notas: 7; 5 e 3. Já a pessoa B tirou 6; 5; e 4.
A variância é o cálculo que mostra o quanto esses valores fugiram da média. Ao subtrair dos respectivos v
alores, as médias, encontramos para A, os valores 2; 0 e -2 (7-5; 5-5; 3-5) e para B, 1; 0; -1 (6-5; 5-5; 4-5). O segundo passo do cálculo, é elevar cada valor ao quadrado individualmente. Ou seja, Teremos para A: 4; 0 e 4. E para B, 1; 0 e 1. No terceiro passo, somam-se todos os valores de A e todos os valores de B. Depois disso, é só dividir pelo número de elementos.
A: (4+0+4)/3 = 2,667
B: (1+0+1)/3 = 0,667
Desvio Padrão:
O desvio padrão é a raiz quadrada da variância.
A: 1,633
B: 0,817
Conclusão: Podemos concluir que a pessoa B teve uma melhor regularidade de notas.
Referências:
http://www.dicio.com.br/estatistica/
http://www.dicionarioweb.com.br/estat%C3%ADstica/
http://pt.wikipedia.org/wiki/Estat%C3%ADstica_descritiva
http://www.mundoeducacao.com.br/matematica/frequencia-absoluta.htm
http://www.bancodeconcursos.com/matematica/frequencia-absoluta-frequencia-relativa/3120.html
http://pt.wikipedia.org/wiki/Estat%C3%ADstica_descritiva
http://upload.wikimedia.org/wikipedia/commons/8/87/Histograma_wiki.png