Aula 1 - Introdução a Estatística
Ao praticar a atividade científica, o pesquisador se depara com situações onde ele deve analisar e entender um conjunto de dados referente ao seu objeto de estudo. Assim, ele terá que manipular os dados para obter informações, compará-las com outros resultados, ou ainda, julgar sua adequação a alguma teoria. A estatística surge então como uma ferramenta que auxilia o pesquisador neste trabalho, fornecendo metodologias adequadas de coleta, redução, análise e modelagem dos dados.
Diante do exposto, podemos entender a estatística como a ciência que se ocupa com as técnicas de coleta, organização, análise e interpretação de dados, tendo um modelo por referência.
Conceitos básicos
Entende-se por população ao conjunto de elementos que têm uma determinada característica em comum. Uma população pode ser finita quando esta possui um número limitado (ou enumerável) de indivíduos, ou infinita, quando não conseguimos enumerar os seus elementos, uma vez que temos um número ilimitado de indivíduos.
Exemplos
- Alunos matriculados na UFLA no 1º sem/2022 (POPULAÇÃO FINITA)
- Peças produzidas por lote (POPULAÇÃO FINITA)
- Plantas de uma espécie de Pinus (POPULAÇÃO INFINITA)
- Clientes potenciais de uma empresa (POPULAÇÃO INFINITA)
Em complemento, quando coletamos informações de todos os elementos de uma população finita, dizemos que foi realizado um censo. Adotaremos, na disciplina, a notação N para representar a quantidade de elementos em uma população finita.
Amostra
Uma amostra corresponde a um subconjunto ou uma parte da população. A notação que representa o número de elementos de uma amostra é n. Na verdade, a grande maioria dos trabalhos de pesquisa é realizado através de amostras. Alguns dos motivos que levam os pesquisadores a trabalharem com amostras são
- uma população infinita só pode ser estudada através de amostras
- as populações finitas muito grandes também devem ser estudadas por meio de amostras
- redução de tempo e custo da pesquisa
- o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda a população.
Variáveis
Quando realizamos um levantamento de dados, temos o interesse em conhecer ou avaliar uma determinada característica da população, como por exemplo, o peso, o diâmetro, o número de defeitos por peça, a produtividade de madeira de uma espécie de Pinus, a escolaridade dos indivíduos de uma comunidade, dentre outras. Essas características são chamadas de variáveis e visam descrever a população sob estudo. As variáveis podem ser classificadas em
- Qualitativas: Correspondem a atributos ou categorias. Elas são subdivididas em nominais quando suas categorias não são passíveis de ordenação, e ordinais, no caso de existir uma ordenação natural para seus atributos. Para as variáveis qualitativas nominais usaremos VQN e para as ordinais, usaremos VQO.
Exemplos:
- Sexo (Masculino, Feminino) – VQN
- Substâncias Químicas (Ácidos, Bases, Hidrocarbonetos, etc) - VQN
- Tipos de Linguagem de programação (Java, PHP, R, Delphi, MATLAB dentre outros) – VQN
- Escolaridade (Fundamental, Médio e Superior) – VQO
- Classe Social: (Alta, Média e Baixa) - VQO
- Quantitativas: Correspondem a números resultantes de contagens ou medidas. Quando se trata de contagens a variável é dita discreta (sendo representada por números inteiros não-negativos). No caso de medidas, a variável é classificada como contínua (sendo que seus valores podem ser representados por quaisquer números reais). Para as variáveis quantitativas discretas usaremos VQD e para as contínuas, usaremos VQC.
Exemplos:
- Número de peças com defeito – VQD
- Temperatura – VQC
- Diâmetro de barras de aço – VQC.
Esta classificação é extremamente importante na análise de dados, uma vez que, o tipo de variável a ser trabalhada é um ponto de partida para se determinar os métodos de análise mais apropriados ou mesmo válidos.