O que é uma regressão linear simples?
A regressão linear simples se aplica a estatísticas e ajuda a descrever os dados (x, y) que parecem ter uma relação linear, permitindo alguma previsão de y se x for conhecido. Esses dados geralmente são plotados em gráficos de dispersão e a fórmula para a regressão linear cria uma linha que melhor se encaixa em todos os pontos, desde que eles realmente tenham uma correlação linear. Ele não se encaixa exatamente em todos os pontos, mas deve ser uma linha em que a soma dos quadrados da diferença entre dados reais e dados esperados (resíduos) cria o número mais baixo, que é frequentemente chamado de linha ou linha de melhor ajuste dos mínimos quadrados. A equação da linha para dados de amostra e dados da população é a seguinte: ŷ = b
Qualquer pessoa familiarizada com álgebra pode observar a semelhança dessa linha com y = mx + b e, na verdadee ou m. A razão para esse rearranjo é que se torna elegantemente fácil adicionar termos adicionais com recursos como expoentes que podem descrever diferentes formas não lineares de relacionamento.
As fórmulas para obter uma linha de regressão linear simples são relativamente complexas e pesadas, e a maioria das pessoas não gasta muito tempo escrevendo isso porque leva muito tempo para serem concluídos. Em vez disso, vários programas, como para o Excel® ou para muitos tipos de calculadoras científicas, podem facilmente calcular uma linha de mínimos quadrados. A linha é apropriada apenas para previsão se houver evidência clara de uma forte correlação entre os conjuntos de dados (x, y). Uma calculadora gerará uma linha, independentemente de fazer sentido usá -la.
Ao mesmo tempo, é gerada uma equação simples da linha de regressão linear, as pessoas devem observar o nível de correlação. Isso significa avaliar r, o correlCoeficiente de ação, contra uma tabela de valores para determinar se existe correlação linear. Além disso, avaliar os dados, plotando -os como um gráfico de dispersão, é uma boa maneira de ter um sentido se os dados têm um relacionamento linear.
O que pode ser feito com uma linha de regressão linear simples, desde que tenha uma correlação linear, é que os valores podem ser substituídos em x, para obter um valor previsto para ŷ. Esta previsão tem seus limites. Os dados presentes, principalmente se forem apenas uma amostra, podem ter uma correlação linear agora, mas pode não ter mais tarde com o material de amostra adicional adicionado.
alternadamente, uma amostra inteira pode compartilhar uma correlação, enquanto uma população inteira não. A previsão é, portanto, limitada, e ir muito além dos valores de dados disponíveis é chamado de extrapolação e não é incentivado. Além disso, as pessoas souberem que, se não houver correlação linear, a melhor estimativa de X é a média de todos os dados Y.
Essencialmente, a regressão linear simples é um t útilOOL que pode, com discrição, ser usado para prever valores ŷ com base em um valor x. Quase sempre é ensinado com a idéia de correlação linear, pois determinar a utilidade de uma linha de regressão requer análise de r. Felizmente com muitos programas técnicos modernos, as pessoas podem gráfica gráficos de dispersão, adicionar linhas de regressão e determinar o coeficiente de correlação R com algumas entradas.