2011年11月25日 星期五

[統計學]Linear Regression: Prediction(線性迴歸:預測)

迴歸(Regression):就是從已知的一個或多個變數來預測另一個變數。
相關(Correlation):是用來測量二變數間「方向」和「程度」之間的關係。
1.方向的關係,是指這種關係是正或負。
2.程度的關係,指的是規模或強度的關係。


正相關(Positive Relationships):表示變數間有直接關係。X↑、Y↑。


負相關(Negative Relationships):X↑、Y↓。


完全相關(Perfect Relationships):不論是正或負的關係存在時,所有的點都會落在迴歸線上。


不完全相關(Imperfect Relationships):不論是正或負的關係存在時,所有的點都不會落在迴歸線上。


無相關(No Relationship):二變數間沒有辦法找出相關的線。


相關係數(Correlation Coefficient):
1.值是從-1 到 +1 。
2.「+」「-」表示關係間的方向。
3.量度表示關係的強度(弱,中等,強)。


完全正相關:(1)
正相關:(1)、(2)、(3)
無相關:(4)
完全負相關:(6)
負相關:(5)、(6)


預測(Prediction):
估計值的過程,從一個已知變數的值,去推估另一變數的值。

Correlation(關係)≠Causation(因果):
1.有關係不代表有因果關係。
2.已知X、Y之間有相關,所以可以用已知的X來預測Y,但並不表示X的改變,造成Y的改變。

變數間發生的順序,是會造成影響的:
舉例:假設X變量組成的治療方法,如藥物的劑量,而Y變量表示老鼠在迷宮的表現。
1.直至藥被使用前,X無法影響Y
2.但如果老鼠在跑完迷宮後才接受藥物的劑量,則劑量不能影響到老鼠的表現。

The Regression Line迴歸線:
如果用變數X去預測Y,則此線稱為用X預測Y的迴歸線。

The Process of Prediction預測程序:
1.決定迴歸線
2.利用迴歸線去預估數值

















沒有留言:

張貼留言