Μια Βασική Στατιστική Προσέγγιση για την Ανάλυση Ποσοτικών Δεδομένων
Τα μοντέλα γραμμικής παλινδρόμησης χρησιμοποιούνται για να δείξουν ή να προβλέψουν τη σχέση μεταξύ δύο μεταβλητών ή παραγόντων . Ο παράγοντας που προβλέπεται (ο παράγοντας για τον οποίο λύνεται η εξίσωση) ονομάζεται εξαρτημένη μεταβλητή. Οι παράγοντες που χρησιμοποιούνται για την πρόβλεψη της τιμής της εξαρτώμενης μεταβλητής ονομάζονται ανεξάρτητες μεταβλητές.
Τα καλά δεδομένα δεν δίνουν πάντα την πλήρη ιστορία. Η ανάλυση παλινδρόμησης χρησιμοποιείται συνήθως στην έρευνα καθώς διαπιστώνει ότι υπάρχει συσχέτιση μεταξύ των μεταβλητών.
Αλλά η συσχέτιση δεν είναι η ίδια με την αιτιώδη συνάφεια . Ακόμα και μια γραμμή σε μια απλή γραμμική παλινδρόμηση που ταιριάζει με τα σημεία δεδομένων καλά δεν μπορεί να πει κάτι οριστικό για μια σχέση αιτίας-και-αποτελέσματος.
Σε απλή γραμμική παλινδρόμηση, κάθε παρατήρηση αποτελείται από δύο τιμές. Μία τιμή είναι για την εξαρτώμενη μεταβλητή και μία τιμή είναι για την ανεξάρτητη μεταβλητή.
- Απλή ανάλυση γραμμικής παλινδρόμησης Η απλούστερη μορφή μιας ανάλυσης παλινδρόμησης χρησιμοποιεί σε εξαρτημένη μεταβλητή και μία ανεξάρτητη μεταβλητή. Σε αυτό το απλό μοντέλο , μια ευθεία γραμμή προσεγγίζει τη σχέση μεταξύ της εξαρτημένης μεταβλητής και της ανεξάρτητης μεταβλητής.
- Ανάλυση πολλαπλής παλινδρόμησης Όταν χρησιμοποιούνται δύο ή περισσότερες ανεξάρτητες μεταβλητές στην ανάλυση παλινδρόμησης, το μοντέλο δεν είναι πλέον απλό γραμμικό.
Απλό μοντέλο γραμμικής παλινδρόμησης
Το απλό μοντέλο γραμμικής παλινδρόμησης αναπαρίσταται ως εξής: y = ( β 0 + β 1 + Ε
Με μαθηματική σύμβαση, οι δύο παράγοντες που εμπλέκονται σε μια απλή ανάλυση γραμμικής παλινδρόμησης ορίζονται ως x και y .
Η εξίσωση που περιγράφει το πώς το y σχετίζεται με το x είναι γνωστό ως το μοντέλο παλινδρόμησης . Το μοντέλο γραμμικής παλινδρόμησης περιέχει επίσης έναν όρο σφάλματος που αντιπροσωπεύεται από το Ε ή το ελληνικό γράμμα epsilon. Ο όρος σφάλματος χρησιμοποιείται για να υπολογίσει τη μεταβλητότητα στο y που δεν μπορεί να εξηγηθεί από τη γραμμική σχέση μεταξύ x και y .
Υπάρχουν επίσης παράμετροι που αντιπροσωπεύουν τον πληθυσμό που μελετάται. Αυτές οι παράμετροι του μοντέλου που αντιπροσωπεύονται από ( β 0+ β 1 x ).
Απλό μοντέλο γραμμικής παλινδρόμησης
Η απλή εξίσωση γραμμικής παλινδρόμησης αναπαρίσταται ως εξής: Ε ( γ ) = ( β 0 + β 1 x ).
Η απλή εξίσωση γραμμικής παλινδρόμησης καταγράφεται ως ευθεία γραμμή.
( β 0 είναι η διασταύρωση y της γραμμής παλινδρόμησης.
β 1 είναι η κλίση.
Ε ( y ) είναι η μέση ή αναμενόμενη τιμή του y για μια δεδομένη τιμή του x .
Μια γραμμή παλινδρόμησης μπορεί να δείξει μια θετική γραμμική σχέση, μια αρνητική γραμμική σχέση, ή καμία σχέση. Εάν η γραφική παράσταση σε μια απλή γραμμική παλινδρόμηση είναι επίπεδη (χωρίς κλίση), δεν υπάρχει σχέση μεταξύ των δύο μεταβλητών. Εάν η γραμμή παλινδρόμησης κλίνει προς τα πάνω με το κάτω άκρο της γραμμής στο σημείο παρατήρησης y (άξονας) του γραφήματος και το άνω άκρο της γραμμής που εκτείνεται προς τα πάνω στο πεδίο γραφήματος, μακριά από το σημείο διασταύρωσης x (άξονας) υπάρχει θετική γραμμική σχέση . Εάν η γραμμή παλινδρόμησης κλίνει προς τα κάτω με το ανώτερο άκρο της γραμμής στο σημείο παρατήρησης y (άξονας) του γραφήματος και το κατώτερο άκρο της γραμμής που εκτείνεται προς τα κάτω στο πεδίο γραφήματος προς την διασταύρωση x (άξονας) υπάρχει αρνητική γραμμική σχέση.
Εκτιμημένη εξίσωση γραμμικής παλινδρόμησης
Εάν οι παράμετροι του πληθυσμού ήταν γνωστές, η απλή εξίσωση γραμμικής παλινδρόμησης (που φαίνεται παρακάτω) θα μπορούσε να χρησιμοποιηθεί για τον υπολογισμό της μέσης τιμής του y για μια γνωστή τιμή του x .
Ε ( γ ) = ( β0 + β 1χ ).
Ωστόσο, στην πράξη, οι τιμές των παραμέτρων δεν είναι γνωστές και πρέπει να εκτιμηθούν χρησιμοποιώντας δεδομένα από ένα δείγμα του πληθυσμού. Οι παράμετροι του πληθυσμού εκτιμώνται χρησιμοποιώντας στατιστικά δείγματα . Οι στατιστικές δειγματοληψίας αντιπροσωπεύονται από b 0 + b 1. Όταν οι στατιστικές δειγματοληψίας αντικαθιστούν τις παραμέτρους του πληθυσμού, σχηματίζεται η εκτιμώμενη εξίσωση παλινδρόμησης.
Η εκτιμώμενη εξίσωση παλινδρόμησης φαίνεται παρακάτω.
( ŷ ) = ( β0 + β 1χ
( ŷ ) προφέρεται και καπέλο .
Το γράφημα της εκτιμώμενης απλής εξίσωσης παλινδρόμησης καλείται η εκτιμώμενη γραμμή παλινδρόμησης.
Η b 0 είναι η διασταύρωση y.
Το b 1 είναι η κλίση.
Η ŷ ) είναι η εκτιμώμενη τιμή του y για μια δεδομένη τιμή του x .
Σημαντική σημείωση: Η ανάλυση παλινδρόμησης δεν χρησιμοποιείται για την ερμηνεία των σχέσεων αιτίου-αποτελέσματος μεταξύ μεταβλητών. Ωστόσο, η ανάλυση παλινδρόμησης μπορεί να υποδεικνύει τον τρόπο με τον οποίο σχετίζονται οι μεταβλητές ή σε ποιο βαθμό οι μεταβλητές συνδέονται μεταξύ τους.
Με τον τρόπο αυτό, η ανάλυση παλινδρόμησης τείνει να καταστήσει σημαντικές σχέσεις που δικαιολογούν έναν εμπεριστατωμένο ερευνητή να κοιτάζει πιο προσεκτικά .
Επίσης γνωστό ως: αμφίπλευρη παλινδρόμηση, ανάλυση παλινδρόμησης
Παραδείγματα: Η μέθοδος των τεσσάρων τετραγώνων είναι μια στατιστική διαδικασία για τη χρήση δεδομένων δείγματος για να βρεθεί η τιμή της εκτιμώμενης εξίσωσης παλινδρόμησης. Η μέθοδος των ελαχίστων τετραγώνων προτάθηκε από τον Carl Friedrich Gauss, ο οποίος γεννήθηκε το 1777 και πέθανε το 1855. Η μέθοδος των ελαχίστων τετραγώνων εξακολουθεί να χρησιμοποιείται ευρέως.
Πηγές:
Anderson, DR, Sweeney, DJ, και Williams, ΤΑ (2003). Στοιχεία Στατιστικής για Επιχειρήσεις και Οικονομικά (3η έκδοση) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Επεξήγηση: Ανάλυση παλινδρόμησης. MIT News.
McIntyre, L. (1994). Χρησιμοποιώντας δεδομένα τσιγάρων για μια εισαγωγή στην πολλαπλή παλινδρόμηση. Εφημερίδα της Στατιστικής Εκπαίδευσης, 2 (1).
Mendenhall, W. και Sincich, Τ. (1992). Στατιστικές για τη Μηχανική και τις Επιστήμες (3η έκδοση), Νέα Υόρκη, ΝΥ: Dellen Publishing Co.
Panchenko, Δ. 18.443 Στατιστικές για Εφαρμογές, Φθινόπωρο 2006, Τμήμα 14, Απλή γραμμική παλινδρόμηση. (Ινστιτούτο Τεχνολογίας της Μασαχουσέτης: MIT OpenCourseWare)