Estude grátis

Estatística

É uma disciplina fundamental que lida com a coleta, análise, interpretação e apresentação de dados. Ela é essencial para tomar decisões informadas em diversas áreas, da ciência à economia, auxiliando na compreensão de padrões, tendências e na inferência de informações a partir de conjuntos de dados. A estatística desempenha um papel crucial na pesquisa, planejamento e tomada de decisões em muitos contextos.

CONCEITOS BÁSICOS

ESTATÍSTICA

É a ciência que utiliza a coleta de dados, sua classificação, sua apresentação, sua análise e sua interpretação para se tomar algum tipo de decisão.

ESTATÍSTICA DESCRITIVA

É o ramo da Estatística que se ocupa em organizar e descrever os dados que podem ser expressos por tabelas e gráficos.

ESTATÍSTICA INFERENCIAL

É o ramo da Estatística que utiliza técnicas de análise e interpretação de dados, a partir de uma amostra de uma população, e fornece conclusões sobre este conjunto.

POPULAÇÃO

Na coleta de dados sobre determinado assunto, chama-se população estatística, o conjunto formado por todos os elementos que possam oferecer dados relativos ao assunto em questão.

Podemos dizer que população é qualquer conjunto que reúna todos os elementos que tenham pelo menos uma característica comum, objeto de estudo.

AMOSTRA

É um subconjunto de uma população. A seleção da amostra pode ser feita de várias maneiras, dependendo, entre outros fatores, do grau de conhecimento que temos da população, da quantidade de recursos disponíveis e outros fatores. A seleção da amostra deve fornecer um subconjunto de valores mais parecido possível com a população original.

Exemplo: Uma pesquisa típica de audiência na televisão utiliza uma amostra de 5000 lares e, com base nestes dados, formula conclusões acerca de uma população de todos os milhões de lares no país.

CENSO

É o método utilizado para um trabalho com uma população.

DADOS ESTATÍSTICOS

Os dados são denominados quantitativos quando são representados por números ou medidas, como por exemplo as alturas de uma população, o número de filhos e o salário bruto. Quando os dados representam contagens são discretos e quando representam mensurações são contínuos.

Os dados são chamados de qualitativos ou nominais quando são definidos por categorias tais como: cor dos olhos, sexo, nível de escolaridade, naturalidade.

AMPLITUDE DE UMA AMOSTRA

A amplitude total dos dados é a diferença entre o valor máximo e o valor mínimo da amostra.

Exemplo: Um pesquisador, contratado pela empresa de cervejas, deseja estudar quantas cervejas por semana seus clientes bebem. A amostra com 10 clientes resultou nos seguintes números: 2, 3, 7, 1, 10, 11, 5, 2, 8, 9.

A amplitude desta amostra é igual a 11 – 1 = 10.

ROL

Os dados coletados em uma amostra podem ser organizados em tabelas ou gráficos. Para isso, antes devemos organizá-los em sequências crescentes ou decrescentes denominadas Rol.

Exemplo: No exemplo anterior organizando em ordem crescente temos: 1, 2, 2, 3, 5, 7, 8, 9, 10, 11.

DADOS BRUTOS

Podemos considerar como dados brutos aqueles que não estão numericamente organizados.

Exemplo: 2, 3, 7, 1, 10, 11, 5, 2, 8, 9.

VARIÁVEIS

Uma outra definição que aparece na análise de dados estatísticos é o conceito de variável.  

Uma variável é quantitativa quando seus valores podem ser representados por contagem (variáveis quantitativas discretas) ou mensuração (variáveis quantitativas contínuas).

Uma variável é qualitativa quando apresentam como resultado um atributo, qualidade ou preferência de um entrevistado.

SÉRIES ESTATÍSTICAS

Uma série estatística é um conjunto de dados estatísticos que fazem referência aos seguintes fatores: tempo, local e fenômeno.

Os exemplos mais comuns de séries estatísticas são:

  • a série temporal, cronológica ou histórica;
  • varia o tempo;
  • a série geográfica, territorial ou espacial;
  • varia o local;
  • a série específica ou especificativa;
  • varia o fenômeno.

Elementos essenciais em uma tabela:

  • Título: é a indicação contida na parte superior da tabela, onde deve estar definido o fato observado;
  • Corpo: é constituído por linhas e colunas, que fornecem o conteúdo das informações prestadas;
  • Cabeçalho: é a parte da tabela que apresenta a natureza do que contém cada coluna.

Há ainda os elementos que complementam a tabela como, por exemplo:

  • Fonte: designação da instituição que forneceu os dados estatísticos.

Exemplo: Datafolha, IBOPE, IBGE, INPE e etc.

  • Notas: esclarecimentos de natureza geral.

TABELAS DE FREQUÊNCIAS

Um processo que possibilita uma leitura mais sucinta dos dados é a construção de uma tabela de frequências.

Exemplo 1: Uma entrevista com 20 pessoas é realizada no estado do Rio de Janeiro. O objetivo da pesquisa era saber qual o time do entrevistado.

Dos 20 entrevistados foram encontrados os seguintes resultados para a frequência absoluta dos entrevistados:

Flamengo (f= 10)

Vasco (f2 = 6)

Fluminense (f3 = 2)

Botafogo (f4 = 1)

Note que f1 + f2 + f3 + f4 = 20.

Definimos frequência relativa absoluta assumido por uma variável como a razão entre a frequência absoluta e o número total de dados.

Exemplo 2: Para avaliar o tempo de permanência em um supermercado, o gerente mensurou em minutos o tempo de permanência de 20 clientes na loja. Os tempos estão representados na tabela abaixo.

Para representar esses dados em uma tabela de frequência devemos:

a) calcular a amplitude da amostra; 60 – 48 = 12 cm

b) dividir o intervalo em subintervalos de mesmo comprimento. Como exemplo, tomemos 4 subintervalos de comprimento igual a 3: [48, 51[; [51,54[; [54,57[; [57,60]. Esses subintervalos são chamados de classes e o comprimento de cada um é chamado de amplitude da classe;

c) conte quantas observações se situam em cada classe, respeitando os intervalos fechados à esquerda e abertos à direita, e coloque as observações numa tabela do tipo abaixo.

Onde,

fi (frequência absoluta): frequência que o intervalo aparece na distribuição;

fri (frequência relativa): é a percentagem do valor dos dados em relação ao total da amostra;

fac (frequência acumulada): é a soma das frequências absolutas começando pelo menor valor;

frac (frequência relativa acumulada): é a porcentagem do valor das frequências acumuladas em relação ao total da amostra.

GRÁFICOS

GRÁFICO EM LINHA

Esse tipo de gráfico é usado sobretudo quando temos observações temporais de uma variável em estudo e desejamos representá-la no tempo (abscissa) a fim de reconhecer possíveis tendências e/ou sazonalidade (comportamento periódicos repetidos). O exemplo a seguir ilustra bem a utilidade do gráfico em linha para a evolução do preço da ação da empresa PETRO S.A.

GRÁFICO EM BARRAS HORIZONTAIS

Os dados que estejam organizados em colunas ou linhas em uma tabela podem ser representados em um gráfico de barras horizontais. Gráficos de barras ilustram comparações entre itens individuais.

Considere a utilização de um gráfico de barras horizontais quando:

  • os rótulos dos eixos forem longos;
  • os valores mostrados forem durações.

GRÁFICO DE COLUNAS

A ideia é expressar informações individualizadas, e representadas por barras cuja altura representa a frequência nas categorias. Vejamos o exemplo a seguir, representando em barras o número de cópias de jornais (em milhares de exemplares) em alguns países.

GRÁFICO EM SETORES

É utilizado quando se deseja mostrar partes do total, conforme ocorre em produções, vendas e orçamentos de países e etc.

HISTOGRAMA

Quando as classes são intervalos reais, a interpretação da distribuição de frequências em um sistema de eixos é feita por um tipo de gráfico chamado Histograma.

Voltando ao exemplo 2:

O Histograma referente à tabela é

POLÍGONO DE FREQUÊNCIA

O polígono de frequência é obtido unindo-se os pontos médios da parte superior de cada retângulo do histograma com segmentos de reta. É importante notar que tanto o histograma quanto o polígono de frequência indicam a frequência absoluta de cada classe.

Voltando ao exemplo 2 temos:

O gráfico em linhas representativo de uma distribuição de frequências acumuladas é chamado polígono de frequências acumuladas ou ogiva de Galton. No caso de dados agrupados em intervalos de classe, os pontos do gráfico são os pontos correspondentes aos limites superiores das classes das bases superiores dos retângulos.

CARTOGRAMA

Um cartograma é um mapa que mostra informação quantitativa mantendo um certo grau de precisão geográfica das unidades espaciais mapeadas.

PICTOGRAMA

É comum em jornais e revistas ilustrar os vários tipos de gráficos com figuras relacionadas ao assunto, tornando-os mais atraentes. Esses são os pictogramas.

MEDIDAS DE CENTRALIDADE: MÉDIA ARITMÉTICA, MÉDIA ARITMÉTICA PONDERADA, MEDIANA, MODA

Para apresentar os conceitos a seguir, vamos considerar um grupo de 10 estudantes com as seguintes idades:

12, 13, 14, 14, 14, 15, 15, 16, 16, 17.

MÉDIA ARITMÉTICA E MÉDIA ARITMÉTICA PONDERADA

Seja x uma variável quantitativa e x1, x2, x3, …, xn os valores assumidos por essa variável. A média aritmética (x) de x é igual a soma de todos os valores assumidos pela variável dividida pelo número de valores, ou seja,

PROPRIEDADES DA MÉDIA

  1. Ao adicionarmos um mesmo valor a cada um dos valores assumidos pela variável, a média aritmética fica adicionada desse valor.
  2. Ao multiplicarmos cada um dos valores assumidos pela variável por um mesmo valor, a média aritmética fica multiplicada por esse valor.

Seja x uma variável quantitativa e x1, x2, x3, …, xk os valores assumidos por essa variável, com frequências absolutas respectivamente iguais a n1, n2, n3, …, nk. A média aritmética (x) desses valores é igual à soma de cada um os valores assumidos pela variável multiplicado pela sua frequência dividida pela soma das frequências, ou seja,

A média aritmética é muito influenciada por valores discrepantes (“outliers”).

MEDIANA

Seja x1 ≤ x2 ≤ x3 ≤…≤ xn os valores ordenados assumidos pela variável quantitativa x. A mediana (Me) é dada por:

Dessa forma, a mediana é tal que a quantidade de valores menores ou iguais à mediana é igual à quantidade de valores maiores ou iguais à mediana.

A mediana é uma medida de centralidade menos sensível a valores discrepantes.

Exemplo: No nosso exemplo a mediana é x5+x6/2 = 14+15/2 = 14,5.

MODA

A moda de um conjunto é o valor que ocorre mais vezes ou de maior frequência simples (absoluta ou relativa) numa distribuição de frequências.

No nosso exemplo a moda é igual a 14.

A moda pode também não existir ou não ser única.

Exemplo: 0, 1, 1, 2, 2, 3 tem modas 1 e 2 (bimodal).

MEDIDAS DE DISPERSÃO: DESVIO MÉDIO, VARIÂNCIA, DESVIO PADRÃO

Considere uma turma de 5 alunos em  que todos tiraram nota 5 e outra com a mesma quantidade de alunos com as seguintes notas: 1, 3, 5, 7 e 9. Essas duas turmas têm a mesma média aritmética e a mesma mediana que é 5. Mas a dispersão dos valores é completamente diferente e pode ser calculado.

DESVIO MÉDIO ABSOLUTO (DMA)

O desvio em relação à média aritmética é a diferença entre cada valor e a média aritmética.

δi = xi – x

A soma de todos os desvios em relação à média aritmética é sempre nula.

O desvio médio absoluto (DMA) é a média aritmética dos desvios em módulo.

O desvio médio absoluto da segunda turma do nosso exemplo é DMA = 4+1+0+1+4/5 = 2.

VARIÂNCIA POPULACIONAL

variância populacional (σ²) é a média aritmética da soma dos quadrados dos desvios em relação à média de um conjunto de números.

Outra fórmula para o cálculo da variância populacional é:

PROPRIEDADES DA VARIÂNCIA

Se adicionarmos um mesmo valor a cada um dos valores assumidos pela variável, a variância não se altera.

Se multiplicarmos cada um dos valores assumidos pela variável por um mesmo valor, a variância fica multiplicada pelo quadrado desse valor.

Se a variância for calculada sobre uma amostra em vez de sobre toda a população, teremos então a chamada variância amostral que é dada por:

DESVIO PADRÃO POPULACIONAL

desvio padrão populacional (σ) é a média quadrática dos desvios em relação à média de um conjunto de números ou a raiz quadrada da variância.

Outra fórmula para o cálculo do desvio padrão populacional é:

Se os dados forem agrupados em intervalos de classe, então o quadrado de cada desvio deve ser multiplicado pela sua frequência absoluta (ni) ou relativa (fi).

PROPRIEDADES DO DESVIO PADRÃO

Se adicionarmos um mesmo valor a cada um dos valores assumidos pela variável, o desvio padrão não se altera.

Se multiplicarmos cada um dos valores assumidos pela variável por um mesmo valor, o desvio padrão fica multiplicado por esse valor.

Observação: Se o desvio padrão for calculado sobre uma amostra em vez de sobre toda a população, teremos então o chamado desvio padrão amostral que é dado por:

Ou para dados agrupados por 

A razão entre o desvio padrão amostral e o populacional é √n/n-1 chamado fator de correção de Bessel.

Se os valores se distribuem de acordo com uma distribuição normal (unimodal, gaussiana, simétrica, de afunilamento médio) podemos dizer que:

  • 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão;
  • 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão;
  • 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.

Esta informação é conhecida como a regra dos “68 – 95 – 99,7”.

Fonte: Wikipédia

Exemplo: Sejam 10 estudantes com as seguintes idades: 13, 13, 14, 14, 14, 14, 15, 15, 15, 16.  

O desvio padrão populacional é 

CURSO EEAR 2023

ESA 2022

de R$ 838,80 por R$ 478,80 em até 12x de:

R$ 39,90/MÊS

SOBRE O CURSO:

SOBRE O CURSO:

SOBRE O CURSO:

Precisando
de ajuda?

Olá ProAluno!
Em que posso te ajudar?