Μάθετε ποια είναι η απλή γραμμική παλινδρόμηση και πώς λειτουργεί

Μια Βασική Στατιστική Προσέγγιση για την Ανάλυση Ποσοτικών Δεδομένων

Ευγενική παραχώρηση Colin Broug, Φωτογράφος. © 10 Ιουνίου 2010 Stock.xchng

Τα μοντέλα γραμμικής παλινδρόμησης χρησιμοποιούνται για να δείξουν ή να προβλέψουν τη σχέση μεταξύ δύο μεταβλητών ή παραγόντων . Ο παράγοντας που προβλέπεται (ο παράγοντας για τον οποίο λύνεται η εξίσωση) ονομάζεται εξαρτημένη μεταβλητή. Οι παράγοντες που χρησιμοποιούνται για την πρόβλεψη της τιμής της εξαρτώμενης μεταβλητής ονομάζονται ανεξάρτητες μεταβλητές.

Τα καλά δεδομένα δεν δίνουν πάντα την πλήρη ιστορία. Η ανάλυση παλινδρόμησης χρησιμοποιείται συνήθως στην έρευνα καθώς διαπιστώνει ότι υπάρχει συσχέτιση μεταξύ των μεταβλητών.

Αλλά η συσχέτιση δεν είναι η ίδια με την αιτιώδη συνάφεια . Ακόμα και μια γραμμή σε μια απλή γραμμική παλινδρόμηση που ταιριάζει με τα σημεία δεδομένων καλά δεν μπορεί να πει κάτι οριστικό για μια σχέση αιτίας-και-αποτελέσματος.

Σε απλή γραμμική παλινδρόμηση, κάθε παρατήρηση αποτελείται από δύο τιμές. Μία τιμή είναι για την εξαρτώμενη μεταβλητή και μία τιμή είναι για την ανεξάρτητη μεταβλητή.

Απλό μοντέλο γραμμικής παλινδρόμησης

Το απλό μοντέλο γραμμικής παλινδρόμησης αναπαρίσταται ως εξής: y = ( β 0 + β 1 + Ε

Με μαθηματική σύμβαση, οι δύο παράγοντες που εμπλέκονται σε μια απλή ανάλυση γραμμικής παλινδρόμησης ορίζονται ως x και y .

Η εξίσωση που περιγράφει το πώς το y σχετίζεται με το x είναι γνωστό ως το μοντέλο παλινδρόμησης . Το μοντέλο γραμμικής παλινδρόμησης περιέχει επίσης έναν όρο σφάλματος που αντιπροσωπεύεται από το Ε ή το ελληνικό γράμμα epsilon. Ο όρος σφάλματος χρησιμοποιείται για να υπολογίσει τη μεταβλητότητα στο y που δεν μπορεί να εξηγηθεί από τη γραμμική σχέση μεταξύ x και y .

Υπάρχουν επίσης παράμετροι που αντιπροσωπεύουν τον πληθυσμό που μελετάται. Αυτές οι παράμετροι του μοντέλου που αντιπροσωπεύονται από ( β 0+ β 1 x ).

Απλό μοντέλο γραμμικής παλινδρόμησης

Η απλή εξίσωση γραμμικής παλινδρόμησης αναπαρίσταται ως εξής: Ε ( γ ) = ( β 0 + β 1 x ).

Η απλή εξίσωση γραμμικής παλινδρόμησης καταγράφεται ως ευθεία γραμμή.

( β 0 είναι η διασταύρωση y της γραμμής παλινδρόμησης.

β 1 είναι η κλίση.

Ε ( y ) είναι η μέση ή αναμενόμενη τιμή του y για μια δεδομένη τιμή του x .

Μια γραμμή παλινδρόμησης μπορεί να δείξει μια θετική γραμμική σχέση, μια αρνητική γραμμική σχέση, ή καμία σχέση. Εάν η γραφική παράσταση σε μια απλή γραμμική παλινδρόμηση είναι επίπεδη (χωρίς κλίση), δεν υπάρχει σχέση μεταξύ των δύο μεταβλητών. Εάν η γραμμή παλινδρόμησης κλίνει προς τα πάνω με το κάτω άκρο της γραμμής στο σημείο παρατήρησης y (άξονας) του γραφήματος και το άνω άκρο της γραμμής που εκτείνεται προς τα πάνω στο πεδίο γραφήματος, μακριά από το σημείο διασταύρωσης x (άξονας) υπάρχει θετική γραμμική σχέση . Εάν η γραμμή παλινδρόμησης κλίνει προς τα κάτω με το ανώτερο άκρο της γραμμής στο σημείο παρατήρησης y (άξονας) του γραφήματος και το κατώτερο άκρο της γραμμής που εκτείνεται προς τα κάτω στο πεδίο γραφήματος προς την διασταύρωση x (άξονας) υπάρχει αρνητική γραμμική σχέση.

Εκτιμημένη εξίσωση γραμμικής παλινδρόμησης

Εάν οι παράμετροι του πληθυσμού ήταν γνωστές, η απλή εξίσωση γραμμικής παλινδρόμησης (που φαίνεται παρακάτω) θα μπορούσε να χρησιμοποιηθεί για τον υπολογισμό της μέσης τιμής του y για μια γνωστή τιμή του x .

Ε ( γ ) = ( β0 + β ).

Ωστόσο, στην πράξη, οι τιμές των παραμέτρων δεν είναι γνωστές και πρέπει να εκτιμηθούν χρησιμοποιώντας δεδομένα από ένα δείγμα του πληθυσμού. Οι παράμετροι του πληθυσμού εκτιμώνται χρησιμοποιώντας στατιστικά δείγματα . Οι στατιστικές δειγματοληψίας αντιπροσωπεύονται από b 0 + b 1. Όταν οι στατιστικές δειγματοληψίας αντικαθιστούν τις παραμέτρους του πληθυσμού, σχηματίζεται η εκτιμώμενη εξίσωση παλινδρόμησης.

Η εκτιμώμενη εξίσωση παλινδρόμησης φαίνεται παρακάτω.

( ŷ ) = ( β0 + β

( ŷ ) προφέρεται και καπέλο .

Το γράφημα της εκτιμώμενης απλής εξίσωσης παλινδρόμησης καλείται η εκτιμώμενη γραμμή παλινδρόμησης.

Η b 0 είναι η διασταύρωση y.

Το b 1 είναι η κλίση.

Η ŷ ) είναι η εκτιμώμενη τιμή του y για μια δεδομένη τιμή του x .

Σημαντική σημείωση: Η ανάλυση παλινδρόμησης δεν χρησιμοποιείται για την ερμηνεία των σχέσεων αιτίου-αποτελέσματος μεταξύ μεταβλητών. Ωστόσο, η ανάλυση παλινδρόμησης μπορεί να υποδεικνύει τον τρόπο με τον οποίο σχετίζονται οι μεταβλητές ή σε ποιο βαθμό οι μεταβλητές συνδέονται μεταξύ τους.

Με τον τρόπο αυτό, η ανάλυση παλινδρόμησης τείνει να καταστήσει σημαντικές σχέσεις που δικαιολογούν έναν εμπεριστατωμένο ερευνητή να κοιτάζει πιο προσεκτικά .

Επίσης γνωστό ως: αμφίπλευρη παλινδρόμηση, ανάλυση παλινδρόμησης

Παραδείγματα: Η μέθοδος των τεσσάρων τετραγώνων είναι μια στατιστική διαδικασία για τη χρήση δεδομένων δείγματος για να βρεθεί η τιμή της εκτιμώμενης εξίσωσης παλινδρόμησης. Η μέθοδος των ελαχίστων τετραγώνων προτάθηκε από τον Carl Friedrich Gauss, ο οποίος γεννήθηκε το 1777 και πέθανε το 1855. Η μέθοδος των ελαχίστων τετραγώνων εξακολουθεί να χρησιμοποιείται ευρέως.

Πηγές:

Anderson, DR, Sweeney, DJ, και Williams, ΤΑ (2003). Στοιχεία Στατιστικής για Επιχειρήσεις και Οικονομικά (3η έκδοση) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Επεξήγηση: Ανάλυση παλινδρόμησης. MIT News.

McIntyre, L. (1994). Χρησιμοποιώντας δεδομένα τσιγάρων για μια εισαγωγή στην πολλαπλή παλινδρόμηση. Εφημερίδα της Στατιστικής Εκπαίδευσης, 2 (1).

Mendenhall, W. και Sincich, Τ. (1992). Στατιστικές για τη Μηχανική και τις Επιστήμες (3η έκδοση), Νέα Υόρκη, ΝΥ: Dellen Publishing Co.

Panchenko, Δ. 18.443 Στατιστικές για Εφαρμογές, Φθινόπωρο 2006, Τμήμα 14, Απλή γραμμική παλινδρόμηση. (Ινστιτούτο Τεχνολογίας της Μασαχουσέτης: MIT OpenCourseWare)