Perkiraan, atau perkiraan- metode ilmiah yang terdiri dari mengganti beberapa benda dengan benda lain, dalam satu atau lain hal mendekati aslinya, tetapi lebih sederhana.

Pendekatan memungkinkan Anda mempelajari karakteristik numerik dan sifat kualitatif suatu objek, mereduksi masalah menjadi mempelajari objek yang lebih sederhana atau lebih nyaman (misalnya, objek yang karakteristiknya mudah dihitung atau propertinya sudah diketahui). Dalam teori bilangan, pendekatan Diophantine dipelajari, khususnya pendekatan bilangan irasional dengan bilangan rasional. Dalam geometri, perkiraan kurva dengan garis putus-putus dipertimbangkan. Beberapa cabang matematika pada dasarnya seluruhnya dikhususkan untuk aproksimasi, misalnya teori aproksimasi fungsi, metode analisis numerik.

Dalam arti kiasan digunakan dalam filsafat sebagai metode perkiraan, indikasi yang bersifat perkiraan dan non-final. Misalnya, dalam pengertian ini, istilah “perkiraan” secara aktif digunakan oleh Søren Kierkegaard (1813-1855) dalam “The Final Unscientific Afterword…”

Jika fungsi tersebut hanya digunakan untuk interpolasi, maka cukup dengan memperkirakan titik-titik tersebut dengan polinomial, katakanlah, derajat kelima:

Situasinya jauh lebih rumit jika data alam di atas dijadikan sebagai titik acuan untuk mengidentifikasi hukum perubahan dengan kondisi batas yang diketahui. Misalnya: dan . Di sini kualitas hasilnya tergantung pada profesionalisme peneliti. Dalam hal ini, hukum yang paling tepat adalah:

Untuk pemilihan parameter persamaan yang optimal, biasanya digunakan metode kuadrat terkecil.

Metode kuadrat terkecil (LSM,Bahasa inggrisBiasa Paling sedikit Kotak , O.L.S. ) - metode matematika yang digunakan untuk menyelesaikan berbagai masalah, berdasarkan pada minimalisasi jumlah kuadrat fungsi tertentu dari variabel yang diinginkan. Ini dapat digunakan untuk "menyelesaikan" sistem persamaan yang ditentukan secara berlebihan (ketika jumlah persamaan melebihi jumlah persamaan yang tidak diketahui), untuk menemukan solusi dalam kasus sistem persamaan nonlinier biasa (tidak ditentukan secara berlebihan), untuk memperkirakan nilai titik dengan beberapa fungsi. OLS adalah salah satu metode dasar analisis regresi untuk memperkirakan parameter model regresi yang tidak diketahui dari data sampel.

Jika suatu besaran fisis tertentu bergantung pada besaran lain, maka ketergantungan tersebut dapat dipelajari dengan mengukur y pada nilai x yang berbeda. Dari hasil pengukuran diperoleh sejumlah nilai:

x 1, x 2, ..., x i, ..., x n;

kamu 1 , kamu 2 , ..., kamu aku , ... , kamu n .

Berdasarkan data percobaan tersebut, dimungkinkan untuk membuat grafik ketergantungan y = ƒ(x). Kurva yang dihasilkan memungkinkan untuk menilai bentuk fungsi ƒ(x). Namun, koefisien konstanta yang masuk ke dalam fungsi ini masih belum diketahui. Mereka dapat ditentukan dengan menggunakan metode kuadrat terkecil. Titik percobaan biasanya tidak terletak tepat pada kurva. Metode kuadrat terkecil mensyaratkan jumlah kuadrat simpangan titik-titik percobaan dari kurva, yaitu. 2 adalah yang terkecil.

Dalam praktiknya, metode ini paling sering (dan paling sederhana) digunakan dalam kasus hubungan linier, yaitu. Kapan

kamu = kx atau kamu = a + bx.

Ketergantungan linier tersebar luas dalam fisika. Dan meskipun hubungannya nonlinier, mereka biasanya mencoba membuat grafik untuk mendapatkan garis lurus. Misalnya, jika indeks bias kaca n diasumsikan berhubungan dengan panjang gelombang cahaya λ melalui hubungan n = a + b/λ 2, maka ketergantungan n pada λ -2 diplot pada grafik.

Pertimbangkan ketergantungannya kamu = kx(garis lurus yang melalui titik asal). Mari kita buat nilai φ - jumlah kuadrat deviasi titik-titik kita dari garis lurus

.

Nilai φ selalu positif dan semakin kecil semakin dekat titik kita dengan garis lurus. Metode kuadrat terkecil menyatakan bahwa nilai k harus dipilih sedemikian rupa sehingga φ mempunyai nilai minimum

atau (19)

Perhitungan menunjukkan bahwa error root-mean-square dalam menentukan nilai k adalah sama dengan

, (20) dimana n adalah banyaknya pengukuran.

Sekarang mari kita pertimbangkan kasus yang sedikit lebih sulit, ketika poin harus memenuhi rumus kamu = a + bx(garis lurus yang tidak melalui titik asal).

Tugasnya adalah mencari nilai terbaik a dan b dari himpunan nilai x i, y i yang tersedia.

Mari kita buat kembali bentuk kuadrat φ, sama dengan jumlah simpangan kuadrat titik x i, y i dari garis lurus

dan carilah nilai a dan b yang mempunyai nilai minimum φ

;

.

Solusi bersama dari persamaan ini memberikan

(21)

Kesalahan akar rata-rata kuadrat penentuan a dan b adalah sama

(23)

. (24)

Saat memproses hasil pengukuran menggunakan metode ini, akan lebih mudah untuk meringkas semua data dalam tabel di mana semua jumlah yang termasuk dalam rumus (19)–(24) telah dihitung sebelumnya. Bentuk tabel tersebut diberikan pada contoh di bawah ini.

Contoh 1. Persamaan dasar dinamika gerak rotasi ε = M/J (garis lurus yang melalui titik asal) dipelajari. Pada nilai momen M yang berbeda, percepatan sudut suatu benda diukur. Hal ini diperlukan untuk menentukan momen inersia suatu benda. Hasil pengukuran momen gaya dan percepatan sudut tercantum pada kolom kedua dan ketiga tabel 5.

Tabel 5

Dengan menggunakan rumus (19) kita menentukan:

.

Untuk menentukan akar rata-rata kesalahan kuadrat, kita menggunakan rumus (20)

0.005775 kg-1 · M -2 .

Menurut rumus (18) yang kita miliki

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m 2 .

Setelah menetapkan reliabilitas P = 0,95, dengan menggunakan tabel koefisien Student untuk n = 5, kita menemukan t = 2,78 dan menentukan kesalahan absolut J = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2 .

Mari kita tulis hasilnya dalam bentuk:

J = (3,0 ± 0,2) kg m 2 ;

Contoh 2. Mari kita hitung koefisien suhu hambatan logam menggunakan metode kuadrat terkecil. Resistansi bergantung secara linier pada suhu

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Suku bebas menentukan hambatan R 0 pada suhu 0 ° C, dan kemiringannya adalah hasil kali koefisien suhu dan hambatan R 0 .

Hasil pengukuran dan perhitungan disajikan pada tabel ( lihat tabel 6).

Tabel 6

(r - bt - a) 2 .10 -6

Dengan menggunakan rumus (21), (22) kita tentukan

R 0 = ¯R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm .

Mari kita temukan kesalahan dalam definisi α. Karena , maka menurut rumus (18) kita mempunyai:

.

Menggunakan rumus (23), (24) yang kita miliki

;

0.014126 Ohm.

Setelah menetapkan reliabilitas ke P = 0,95, dengan menggunakan tabel koefisien Student untuk n = 6, kita menemukan t = 2,57 dan menentukan kesalahan absolut Δα = 2,57 0,000132 = 0,000338 memanggil -1 .

= (23 ± 4) 10 -4 memanggil-1 pada P = 0,95.

Contoh 3. Jari-jari kelengkungan lensa harus ditentukan menggunakan cincin Newton. Jari-jari cincin Newton r m diukur dan jumlah cincin m ditentukan. Jari-jari cincin Newton berhubungan dengan jari-jari kelengkungan lensa R dan nomor cincin melalui persamaan

r 2 m = mλR - 2d 0 R,

di mana d 0 adalah ketebalan celah antara lensa dan pelat bidang sejajar (atau deformasi lensa),

λ adalah panjang gelombang cahaya datang.

= (600 ± 6) nm; r 2 m = kamu; m = x; λR = b; -2d 0 R = a,

maka persamaannya akan berbentuk kamu = a + bx.

Hasil pengukuran dan perhitungan dimasukkan ke dalam tabel 7.

Tabel 7

kamu = r 2, 10 -2 mm 2

y - bx - a, 10 -4

(y - bx - a) 2 , 10 -6

Kami menghitung:

1. a dan b menurut rumus (21), (22).

a = ¯r 2 - b¯m = (0,208548333 - 0,0594957 3,5) = 0,0003133 mm 2 .

2. Hitung kesalahan akar rata-rata kuadrat untuk nilai b dan a menggunakan rumus (23), (24)

3. Dengan reliabilitas P = 0,95, dengan menggunakan tabel koefisien Student untuk n = 6, kita menemukan t = 2,57 dan menentukan kesalahan absolut

Δb = 2,57 · 0,000211179 = 6·10 -4 mm 2 ;

Δa = 2,57 0,000822424 = 3 10 -3 mm 2 .

4. Catat hasilnya

b = (595 ± 6) 10 -4 mm 2 pada P = 0,95;

a = (0,3 ± 3)·10 -3 mm 2 pada P = 0,95;

Dari hasil percobaan yang diperoleh, maka dalam kesalahan percobaan ini, garis lurus r 2 m = ƒ(m) melalui titik asal koordinat, karena jika kesalahan nilai suatu parameter ternyata sebanding dengan atau melebihi nilai parameter, berarti kemungkinan besar nilai sebenarnya dari parameter tersebut adalah nol.

Dalam kondisi percobaan ini, nilai a tidak menarik. Oleh karena itu, kami tidak akan menanganinya lagi.

5. Hitung jari-jari kelengkungan lensa:

R = b / λ = 594,5 / 6 = 99,1 mm.

6. Karena kesalahan sistematik diberikan untuk panjang gelombang, mari kita hitung juga kesalahan sistematik untuk R menggunakan rumus (16), dengan mengambil kesalahan sistematik dari besaran b kesalahan acaknya b.

Kita tuliskan hasil akhir R = (99 ± 2) mmε ≈ 3% pada P = 0,95.

Yang paling banyak diterapkan dalam berbagai bidang ilmu pengetahuan dan kegiatan praktis. Bisa fisika, kimia, biologi, ekonomi, sosiologi, psikologi, dan lain sebagainya. Atas kehendak takdir, saya sering kali harus berurusan dengan perekonomian, oleh karena itu hari ini saya akan mengatur untuk Anda perjalanan ke negara menakjubkan bernama Ekonometrika=) ...Bagaimana bisa kamu tidak menginginkannya?! Di sana sangat bagus – Anda hanya perlu mengambil keputusan! ...Tetapi yang mungkin Anda inginkan adalah mempelajari cara memecahkan masalah metode kuadrat terkecil. Dan terutama pembaca yang rajin akan belajar menyelesaikannya tidak hanya secara akurat, tetapi juga SANGAT CEPAT ;-) Tapi pertama-tama pernyataan umum mengenai permasalahan tersebut+ contoh terlampir:

Mari kita pelajari indikator-indikator dalam suatu mata pelajaran tertentu yang memiliki ekspresi kuantitatif. Pada saat yang sama, ada banyak alasan untuk percaya bahwa indikator bergantung pada indikatornya. Asumsi ini dapat berupa hipotesis ilmiah atau berdasarkan akal sehat dasar. Namun, mari kita kesampingkan ilmu pengetahuan dan jelajahi area yang lebih menarik, yaitu toko kelontong. Mari kita nyatakan dengan:

– area ritel toko kelontong, m2,
– omset tahunan toko kelontong, juta rubel.

Jelas sekali bahwa semakin besar area toko, dalam banyak kasus, omzetnya akan semakin besar.

Misalkan setelah melakukan observasi/eksperimen/perhitungan/menari dengan rebana kita mempunyai data numerik:

Dengan toko kelontong, saya pikir semuanya jelas: - ini adalah area toko pertama, - omset tahunannya, - area toko ke-2, - omset tahunannya, dll. Omong-omong, sama sekali tidak perlu memiliki akses ke materi rahasia - penilaian omset perdagangan yang cukup akurat dapat diperoleh melalui statistik matematika. Namun, jangan sampai teralihkan, kursus spionase komersial sudah berbayar =)

Data tabel juga dapat ditulis dalam bentuk titik-titik dan digambarkan dalam bentuk yang sudah dikenal sistem kartesius .

Mari kita jawab pertanyaan penting: Berapa banyak poin yang dibutuhkan untuk penelitian kualitatif?

Lebih besar lebih baik. Set minimum yang dapat diterima terdiri dari 5-6 poin. Selain itu, jika jumlah datanya kecil, hasil yang “anomali” tidak dapat dimasukkan ke dalam sampel. Jadi, misalnya, sebuah toko elit kecil bisa mendapatkan penghasilan yang jauh lebih besar daripada “rekan-rekannya”, sehingga mendistorsi pola umum yang perlu Anda temukan!

Sederhananya, kita perlu memilih suatu fungsi, jadwal yang melewati sedekat mungkin dengan titik-titik tersebut . Fungsi ini disebut memperkirakan (perkiraan - perkiraan) atau fungsi teoritis . Secara umum, “pesaing” yang jelas segera muncul di sini - polinomial tingkat tinggi, yang grafiknya melewati SEMUA titik. Namun opsi ini rumit dan seringkali salah. (karena grafik akan “berputar” sepanjang waktu dan tidak mencerminkan tren utama).

Dengan demikian, fungsi yang dicari harus cukup sederhana dan pada saat yang sama mencerminkan ketergantungan secara memadai. Seperti yang Anda duga, salah satu metode untuk menemukan fungsi tersebut disebut metode kuadrat terkecil. Pertama, mari kita lihat esensinya secara umum. Misalkan beberapa fungsi mendekati data eksperimen:


Bagaimana cara mengevaluasi keakuratan perkiraan ini? Mari kita hitung juga perbedaan (deviasi) antara nilai eksperimen dan nilai fungsional (kami mempelajari gambarnya). Pikiran pertama yang terlintas dalam pikiran adalah memperkirakan seberapa besar jumlahnya, namun masalahnya adalah perbedaannya bisa negatif (Misalnya, ) dan penyimpangan-penyimpangan akibat penjumlahan tersebut akan saling meniadakan. Oleh karena itu, sebagai perkiraan keakuratan perkiraan, perlu diambil jumlahnya modul penyimpangan:

atau runtuh: (jika ada yang tidak tahu: – ini adalah ikon penjumlahan, dan – variabel tambahan “penghitung”, yang mengambil nilai dari 1 hingga ).

Dengan memperkirakan titik-titik eksperimen dengan fungsi yang berbeda, kita akan memperoleh nilai yang berbeda, dan tentunya, jika jumlah ini lebih kecil, fungsi tersebut lebih akurat.

Metode seperti itu ada dan disebut metode modulus terkecil. Namun, dalam praktiknya, hal ini menjadi lebih luas metode kuadrat terkecil, di mana kemungkinan nilai negatif dihilangkan bukan dengan modul, tetapi dengan mengkuadratkan deviasi:

, setelah itu upaya diarahkan untuk memilih fungsi sedemikian rupa sehingga jumlah simpangan kuadrat adalah sekecil mungkin. Sebenarnya dari sinilah nama metode tersebut berasal.

Dan sekarang kita kembali ke poin penting lainnya: seperti disebutkan di atas, fungsi yang dipilih seharusnya cukup sederhana - tetapi ada juga banyak fungsi seperti itu: linier , hiperbolis, eksponensial, logaritma, kuadrat dll. Dan tentunya di sini saya ingin langsung “mengurangi bidang kegiatan”. Kelas fungsi manakah yang harus saya pilih untuk penelitian? Teknik primitif namun efektif:

– Cara termudah adalah dengan menggambarkan titik pada gambar dan menganalisis lokasinya. Jika mereka cenderung berjalan dalam garis lurus, maka Anda harus mencarinya persamaan suatu garis dengan nilai optimal dan . Dengan kata lain, tugasnya adalah mencari koefisien TERSEBUT sehingga jumlah simpangan kuadratnya paling kecil.

Jika titik-titiknya letaknya, misalnya sepanjang hiperbola, maka jelaslah bahwa fungsi linier akan memberikan perkiraan yang buruk. Dalam hal ini, kami mencari koefisien yang paling “menguntungkan” untuk persamaan hiperbola – yang memberikan jumlah kuadrat minimum .

Sekarang perhatikan bahwa dalam kedua kasus yang sedang kita bicarakan fungsi dua variabel, yang argumennya parameter ketergantungan yang dicari:

Dan pada dasarnya kita perlu memecahkan masalah standar - temukan fungsi minimum dua variabel.

Mari kita ingat contoh kita: misalkan titik "penyimpanan" cenderung terletak pada garis lurus dan ada banyak alasan untuk meyakini hal itu ketergantungan linier omset dari ruang ritel. Mari kita cari koefisien TERSEBUT “a” dan “menjadi” sehingga merupakan jumlah deviasi kuadrat adalah yang terkecil. Semuanya seperti biasa - pertama Turunan parsial orde pertama. Berdasarkan aturan linearitas Anda dapat membedakannya tepat di bawah ikon penjumlahan:

Jika Anda ingin menggunakan informasi ini untuk esai atau makalah, saya akan sangat berterima kasih atas tautan dalam daftar sumber; Anda akan menemukan perhitungan terperinci seperti itu di beberapa tempat:

Mari buat sistem standar:

Kami mengurangi setiap persamaan dengan "dua" dan, sebagai tambahan, "memecah" jumlahnya:

Catatan : menganalisis secara mandiri mengapa “a” dan “be” dapat dikeluarkan dari ikon penjumlahan. Ngomong-ngomong, secara formal ini bisa dilakukan dengan penjumlahan

Mari kita menulis ulang sistem dalam bentuk “terapan”:

setelah itu algoritma untuk memecahkan masalah kita mulai muncul:

Tahukah kita koordinat titik-titik tersebut? Kita tahu. Jumlah bisakah kita menemukannya? Dengan mudah. Mari kita buat yang paling sederhana sistem dua persamaan linear dalam dua hal yang tidak diketahui(“a” dan “menjadi”). Kami memecahkan sistem, misalnya, metode Cramer, sebagai hasilnya kita memperoleh titik stasioner. Memeriksa kondisi cukup untuk ekstrem, kita dapat memverifikasi bahwa pada titik ini fungsinya mencapai dengan tepat minimum. Pemeriksaan tersebut melibatkan perhitungan tambahan dan oleh karena itu kami akan meninggalkannya di belakang layar (jika perlu, bingkai yang hilang dapat dilihat). Kami menarik kesimpulan akhir:

Fungsi jalan terbaik (setidaknya dibandingkan dengan fungsi linier lainnya) mendekatkan titik percobaan . Secara kasar, grafiknya mendekati titik-titik ini. Dalam tradisi ekonometrika fungsi perkiraan yang dihasilkan juga disebut persamaan regresi linier berpasangan .

Masalah yang sedang dipertimbangkan sangat penting secara praktis. Dalam contoh situasi kita, Persamaan. memungkinkan Anda memprediksi perputaran perdagangan apa ("Igrek") toko akan memiliki nilai tertentu dari area penjualan (satu atau lain arti dari "x"). Ya, ramalan yang dihasilkan hanya berupa ramalan, namun dalam banyak kasus ternyata cukup akurat.

Saya akan menganalisis satu soal saja dengan bilangan “nyata”, karena tidak ada kesulitan di dalamnya - semua perhitungan berada pada level kurikulum sekolah kelas 7-8. Dalam 95 persen kasus, Anda akan diminta untuk mencari fungsi linier saja, tetapi di akhir artikel saya akan menunjukkan bahwa tidak sulit lagi mencari persamaan hiperbola optimal, eksponensial, dan beberapa fungsi lainnya.

Faktanya, yang tersisa hanyalah mendistribusikan barang yang dijanjikan - sehingga Anda dapat belajar memecahkan contoh-contoh tersebut tidak hanya secara akurat, tetapi juga dengan cepat. Kami mempelajari standar dengan cermat:

Tugas

Dari hasil mempelajari hubungan antara dua indikator, diperoleh pasangan angka sebagai berikut:

Dengan menggunakan metode kuadrat terkecil, temukan fungsi linier yang paling mendekati fungsi empiris (berpengalaman) data. Buatlah gambar untuk membuat titik-titik percobaan dan grafik fungsi aproksimasi dalam sistem koordinat persegi panjang Cartesian . Temukan jumlah deviasi kuadrat antara nilai empiris dan teoritis. Cari tahu apakah fiturnya lebih baik (dari sudut pandang metode kuadrat terkecil) mendekatkan titik percobaan.

Harap dicatat bahwa arti “x” adalah wajar, dan ini memiliki arti makna yang khas, yang akan saya bicarakan nanti; tapi tentu saja bisa juga pecahan. Selain itu, bergantung pada konten tugas tertentu, nilai "X" dan "permainan" bisa negatif seluruhnya atau sebagian. Ya, kami telah diberi tugas yang “tak berwajah”, dan kami memulainya larutan:

Kami menemukan koefisien fungsi optimal sebagai solusi sistem:

Agar pencatatan lebih ringkas maka variabel “counter” dapat dihilangkan, karena sudah jelas bahwa penjumlahan dilakukan dari 1 sampai .

Lebih mudah untuk menghitung jumlah yang diperlukan dalam bentuk tabel:


Penghitungan dapat dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa kesalahan; tonton video singkatnya:

Jadi, kita mendapatkan yang berikut ini sistem:

Di sini Anda dapat mengalikan persamaan kedua dengan 3 dan kurangi suku ke-2 dari persamaan ke-1 dengan suku. Tapi ini adalah keberuntungan - dalam praktiknya, sistem seringkali bukan sebuah anugerah, dan dalam kasus seperti itu sistem menyelamatkan metode Cramer:
, yang berarti sistem memiliki solusi unik.

Mari kita periksa. Saya memahami bahwa Anda tidak menginginkannya, tetapi mengapa melewatkan kesalahan yang tidak dapat dilewatkan sama sekali? Mari kita substitusikan solusi yang ditemukan ke ruas kiri setiap persamaan sistem:

Ruas kanan persamaan yang bersesuaian diperoleh, yang berarti sistem diselesaikan dengan benar.

Jadi, fungsi aproksimasi yang diinginkan: – dari semua fungsi linier Dialah yang paling mendekati data eksperimen.

Berbeda dengan lurus ketergantungan omset toko terhadap luasnya, ketergantungan yang ditemukan adalah balik (prinsip “semakin banyak, semakin sedikit”), dan fakta ini langsung terungkap dari sisi negatifnya lereng. Fungsi memberitahu kita bahwa dengan kenaikan suatu indikator tertentu sebesar 1 satuan, maka nilai indikator terikatnya menurun rata-rata sebesar 0,65 unit. Seperti kata pepatah, semakin tinggi harga soba, semakin sedikit penjualannya.

Untuk memplot grafik fungsi aproksimasi, kita mencari dua nilainya:

dan jalankan gambarnya:


Garis lurus yang dibangun disebut garis tren (yaitu garis tren linier, yaitu pada kasus umum, suatu tren belum tentu berupa garis lurus). Semua orang pasti familiar dengan ungkapan “menjadi tren”, dan menurut saya istilah ini tidak memerlukan komentar tambahan.

Mari kita hitung jumlah simpangan kuadrat antara nilai empiris dan teoritis. Secara geometris, ini adalah jumlah kuadrat panjang segmen “raspberry”. (dua di antaranya sangat kecil sehingga tidak terlihat).

Mari kita rangkum perhitungannya dalam sebuah tabel:


Sekali lagi, ini dapat dilakukan secara manual; untuk berjaga-jaga, saya akan memberikan contoh untuk poin pertama:

tetapi jauh lebih efektif melakukannya dengan cara yang sudah diketahui:

Kami ulangi sekali lagi: Apa arti dari hasil yang diperoleh? Dari semua fungsi linier fungsi kamu indikatornya paling kecil, yaitu dalam keluarganya merupakan perkiraan terbaik. Dan di sini, omong-omong, pertanyaan terakhir dari masalah ini bukanlah suatu kebetulan: bagaimana jika fungsi eksponensial yang diusulkan apakah lebih baik mendekatkan titik percobaan?

Mari kita cari jumlah simpangan kuadrat yang sesuai - untuk membedakannya, saya akan menyatakannya dengan huruf "epsilon". Tekniknya sama persis:


Dan sekali lagi, untuk berjaga-jaga, perhitungan untuk poin pertama:

Di Excel kami menggunakan fungsi standar pengalaman (sintaks dapat ditemukan di Bantuan Excel).

Kesimpulan: , yang berarti bahwa fungsi eksponensial mendekati titik-titik eksperimen lebih buruk daripada garis lurus .

Namun di sini perlu dicatat bahwa yang “lebih buruk” adalah belum berarti, apa yang salah. Sekarang saya telah membuat grafik dari fungsi eksponensial ini - dan grafik tersebut juga mendekati titik - sedemikian rupa sehingga tanpa penelitian analitis sulit untuk mengatakan fungsi mana yang lebih akurat.

Ini menyimpulkan solusinya, dan saya kembali ke pertanyaan tentang nilai alami dari argumen tersebut. Dalam berbagai penelitian, biasanya ekonomi atau sosiologi, “X” alami digunakan untuk menghitung bulan, tahun, atau interval waktu lain yang setara. Misalnya saja permasalahan berikut ini.

Metode kuadrat terkecil adalah salah satu yang paling umum dan paling berkembang karena sifatnya kesederhanaan dan efisiensi metode untuk memperkirakan parameter linier. Pada saat yang sama, ketika menggunakannya, beberapa kehati-hatian harus diperhatikan, karena model yang dibangun dengan menggunakannya mungkin tidak memenuhi sejumlah persyaratan untuk kualitas parameternya dan, sebagai akibatnya, tidak mencerminkan pola pengembangan proses dengan “baik”. cukup.

Mari kita perhatikan prosedur untuk memperkirakan parameter model ekonometrik linier menggunakan metode kuadrat terkecil secara lebih rinci. Model seperti itu secara umum dapat direpresentasikan dengan persamaan (1.2):

yt = a 0 + a 1 x 1 t +...+ an x ​​nt + ε t.

Data awal saat memperkirakan parameter a 0 , a 1 ,..., a n adalah vektor nilai variabel terikat kamu= (y 1 , y 2 , ... , y T)" dan matriks nilai variabel bebas

di mana kolom pertama, terdiri dari satuan, sesuai dengan koefisien model.

Metode kuadrat terkecil mendapatkan namanya berdasarkan prinsip dasar bahwa estimasi parameter yang diperoleh berdasarkan metode tersebut harus memenuhi: jumlah kuadrat kesalahan model harus minimal.

Contoh penyelesaian masalah dengan metode kuadrat terkecil

Contoh 2.1. Perusahaan perdagangan ini memiliki jaringan 12 toko, informasi kegiatannya disajikan pada Tabel. 2.1.

Manajemen perusahaan ingin mengetahui bagaimana jumlah tahunan bergantung pada ruang ritel toko.

Tabel 2.1

Nomor toko

Omset tahunan, juta rubel.

Area ritel, ribuan m2

Solusi kuadrat terkecil. Mari kita tunjukkan omset tahunan toko ke-th, juta rubel; — luas retail toko ke-th, ribuan m2.

Gambar.2.1. Plot sebar misalnya 2.1

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.1).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omset tahunan bergantung positif pada ruang ritel (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk sambungan fungsional yang paling cocok adalah linier.

Informasi untuk perhitungan selanjutnya disajikan pada tabel. 2.2. Dengan menggunakan metode kuadrat terkecil, kami memperkirakan parameter model ekonometrik satu faktor linier

Tabel 2.2

Dengan demikian,

Oleh karena itu, dengan peningkatan ruang ritel sebesar 1.000 m2, semua hal lain dianggap sama, omset tahunan rata-rata meningkat sebesar 67,8871 juta rubel.

Contoh 2.2. Manajemen perusahaan memperhatikan bahwa omzet tahunan tidak hanya bergantung pada area penjualan toko (lihat contoh 2.1), tetapi juga pada rata-rata jumlah pengunjung. Informasi yang relevan disajikan dalam tabel. 2.3.

Tabel 2.3

Larutan. Mari kita nyatakan jumlah rata-rata pengunjung toko ke-th per hari, ribuan orang.

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.2).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omzet tahunan bergantung positif pada jumlah rata-rata pengunjung per hari (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk ketergantungan fungsional adalah linier.

Beras. 2.2. Plot sebar misalnya 2.2

Tabel 2.4

Secara umum, parameter model ekonometrik dua faktor perlu ditentukan

yt = a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Informasi yang diperlukan untuk perhitungan lebih lanjut disajikan pada tabel. 2.4.

Mari kita perkirakan parameter model ekonometrik dua faktor linier menggunakan metode kuadrat terkecil.

Dengan demikian,

Perkiraan koefisien =61,6583 menunjukkan bahwa, jika hal-hal lain dianggap sama, dengan peningkatan ruang ritel sebesar 1.000 m 2, omset tahunan akan meningkat rata-rata 61,6583 juta rubel.

Metode kuadrat terkecil

Di pelajaran terakhir topik ini, kita akan berkenalan dengan aplikasi paling terkenal FNP, yang banyak diterapkan dalam berbagai bidang ilmu pengetahuan dan kegiatan praktis. Bisa fisika, kimia, biologi, ekonomi, sosiologi, psikologi, dan lain sebagainya. Atas kehendak takdir, saya sering kali harus berurusan dengan perekonomian, oleh karena itu hari ini saya akan mengatur untuk Anda perjalanan ke negara menakjubkan bernama Ekonometrika=) ...Bagaimana bisa kamu tidak menginginkannya?! Di sana sangat bagus – Anda hanya perlu mengambil keputusan! ...Tetapi yang mungkin Anda inginkan adalah mempelajari cara memecahkan masalah metode kuadrat terkecil. Dan terutama pembaca yang rajin akan belajar menyelesaikannya tidak hanya secara akurat, tetapi juga SANGAT CEPAT ;-) Tapi pertama-tama pernyataan umum mengenai permasalahan tersebut+ contoh terlampir:

Mari kita pelajari indikator-indikator dalam suatu mata pelajaran tertentu yang memiliki ekspresi kuantitatif. Pada saat yang sama, ada banyak alasan untuk percaya bahwa indikator bergantung pada indikatornya. Asumsi ini dapat berupa hipotesis ilmiah atau berdasarkan akal sehat dasar. Namun, mari kita kesampingkan ilmu pengetahuan dan jelajahi area yang lebih menarik, yaitu toko kelontong. Mari kita nyatakan dengan:

– area ritel toko kelontong, m2,
– omset tahunan toko kelontong, juta rubel.

Jelas sekali bahwa semakin besar area toko, dalam banyak kasus, omzetnya akan semakin besar.

Misalkan setelah melakukan observasi/eksperimen/perhitungan/menari dengan rebana kita mempunyai data numerik:

Dengan toko kelontong, saya pikir semuanya jelas: - ini adalah area toko pertama, - omset tahunannya, - area toko ke-2, - omset tahunannya, dll. Omong-omong, sama sekali tidak perlu memiliki akses ke materi rahasia - penilaian omset perdagangan yang cukup akurat dapat diperoleh melalui statistik matematika. Namun, jangan sampai teralihkan, kursus spionase komersial sudah berbayar =)

Data tabel juga dapat ditulis dalam bentuk titik-titik dan digambarkan dalam bentuk yang sudah dikenal sistem kartesius .

Mari kita jawab pertanyaan penting: Berapa banyak poin yang dibutuhkan untuk penelitian kualitatif?

Lebih besar lebih baik. Set minimum yang dapat diterima terdiri dari 5-6 poin. Selain itu, jika jumlah datanya kecil, hasil yang “anomali” tidak dapat dimasukkan ke dalam sampel. Jadi, misalnya, sebuah toko elit kecil bisa mendapatkan penghasilan yang jauh lebih besar daripada “rekan-rekannya”, sehingga mendistorsi pola umum yang perlu Anda temukan!



Sederhananya, kita perlu memilih suatu fungsi, jadwal yang melewati sedekat mungkin dengan titik-titik tersebut . Fungsi ini disebut memperkirakan (perkiraan - perkiraan) atau fungsi teoritis . Secara umum, “pesaing” yang jelas segera muncul di sini - polinomial tingkat tinggi, yang grafiknya melewati SEMUA titik. Namun opsi ini rumit dan seringkali salah. (karena grafik akan “berputar” sepanjang waktu dan tidak mencerminkan tren utama).

Dengan demikian, fungsi yang dicari harus cukup sederhana dan pada saat yang sama mencerminkan ketergantungan secara memadai. Seperti yang Anda duga, salah satu metode untuk menemukan fungsi tersebut disebut metode kuadrat terkecil. Pertama, mari kita lihat esensinya secara umum. Misalkan beberapa fungsi mendekati data eksperimen:


Bagaimana cara mengevaluasi keakuratan perkiraan ini? Mari kita hitung juga perbedaan (deviasi) antara nilai eksperimen dan nilai fungsional (kami mempelajari gambarnya). Pikiran pertama yang terlintas dalam pikiran adalah memperkirakan seberapa besar jumlahnya, namun masalahnya adalah perbedaannya bisa negatif (Misalnya, ) dan penyimpangan-penyimpangan akibat penjumlahan tersebut akan saling meniadakan. Oleh karena itu, sebagai perkiraan keakuratan perkiraan, perlu diambil jumlahnya modul penyimpangan:

atau runtuh: (kalau-kalau ada yang tidak tahu: adalah ikon penjumlahan, dan – variabel “penghitung” tambahan, yang mengambil nilai dari 1 hingga ) .

Dengan memperkirakan titik-titik eksperimen dengan fungsi yang berbeda, kita akan memperoleh nilai yang berbeda, dan tentunya, jika jumlah ini lebih kecil, fungsi tersebut lebih akurat.

Metode seperti itu ada dan disebut metode modulus terkecil. Namun, dalam praktiknya, hal ini menjadi lebih luas metode kuadrat terkecil, di mana kemungkinan nilai negatif dihilangkan bukan dengan modul, tetapi dengan mengkuadratkan deviasi:



, setelah itu upaya diarahkan untuk memilih fungsi sedemikian rupa sehingga jumlah simpangan kuadrat adalah sekecil mungkin. Sebenarnya dari sinilah nama metode tersebut berasal.

Dan sekarang kita kembali ke poin penting lainnya: seperti disebutkan di atas, fungsi yang dipilih seharusnya cukup sederhana - tetapi ada juga banyak fungsi seperti itu: linier , hiperbolis , eksponensial , logaritma , kuadrat dll. Dan tentunya di sini saya ingin langsung “mengurangi bidang kegiatan”. Kelas fungsi manakah yang harus saya pilih untuk penelitian? Teknik primitif namun efektif:

– Cara termudah adalah dengan menggambarkan titik pada gambar dan menganalisis lokasinya. Jika mereka cenderung berjalan dalam garis lurus, maka Anda harus mencarinya persamaan suatu garis dengan nilai optimal dan . Dengan kata lain, tugasnya adalah mencari koefisien TERSEBUT sehingga jumlah simpangan kuadratnya paling kecil.

Jika titik-titiknya letaknya, misalnya sepanjang hiperbola, maka jelaslah bahwa fungsi linier akan memberikan perkiraan yang buruk. Dalam hal ini, kami mencari koefisien yang paling “menguntungkan” untuk persamaan hiperbola – yang memberikan jumlah kuadrat minimum .

Sekarang perhatikan bahwa dalam kedua kasus yang sedang kita bicarakan fungsi dua variabel, yang argumennya parameter ketergantungan yang dicari:

Dan pada dasarnya kita perlu memecahkan masalah standar - temukan fungsi minimum dua variabel.

Mari kita ingat contoh kita: misalkan titik "penyimpanan" cenderung terletak pada garis lurus dan ada banyak alasan untuk meyakini hal itu ketergantungan linier omset dari ruang ritel. Mari kita cari koefisien TERSEBUT “a” dan “menjadi” sehingga merupakan jumlah deviasi kuadrat adalah yang terkecil. Semuanya seperti biasa - pertama Turunan parsial orde pertama. Berdasarkan aturan linearitas Anda dapat membedakannya tepat di bawah ikon penjumlahan:

Jika Anda ingin menggunakan informasi ini untuk esai atau makalah, saya akan sangat berterima kasih atas tautan dalam daftar sumber; Anda akan menemukan perhitungan terperinci seperti itu di beberapa tempat:

Mari buat sistem standar:

Kami mengurangi setiap persamaan dengan "dua" dan, sebagai tambahan, "memecah" jumlahnya:

Catatan : menganalisis secara mandiri mengapa “a” dan “be” dapat dikeluarkan dari ikon penjumlahan. Ngomong-ngomong, secara formal ini bisa dilakukan dengan penjumlahan

Mari kita menulis ulang sistem dalam bentuk “terapan”:

setelah itu algoritma untuk memecahkan masalah kita mulai muncul:

Tahukah kita koordinat titik-titik tersebut? Kita tahu. Jumlah bisakah kita menemukannya? Dengan mudah. Mari kita buat yang paling sederhana sistem dua persamaan linear dalam dua hal yang tidak diketahui(“a” dan “menjadi”). Kami memecahkan sistem, misalnya, metode Cramer, sebagai hasilnya kita memperoleh titik stasioner. Memeriksa kondisi cukup untuk ekstrem, kita dapat memverifikasi bahwa pada titik ini fungsinya mencapai dengan tepat minimum. Pemeriksaan tersebut melibatkan perhitungan tambahan dan oleh karena itu kami akan meninggalkannya di belakang layar (jika perlu, bingkai yang hilang dapat dilihatDi Sini ) . Kami menarik kesimpulan akhir:

Fungsi jalan terbaik (setidaknya dibandingkan dengan fungsi linier lainnya) mendekatkan titik percobaan . Secara kasar, grafiknya mendekati titik-titik ini. Dalam tradisi ekonometrika fungsi perkiraan yang dihasilkan juga disebut persamaan regresi linier berpasangan .

Masalah yang sedang dipertimbangkan sangat penting secara praktis. Dalam contoh situasi kita, Persamaan. memungkinkan Anda memprediksi perputaran perdagangan apa ("Igrek") toko akan memiliki nilai tertentu dari area penjualan (satu atau lain arti dari "x"). Ya, ramalan yang dihasilkan hanya berupa ramalan, namun dalam banyak kasus ternyata cukup akurat.

Saya akan menganalisis satu soal saja dengan bilangan “nyata”, karena tidak ada kesulitan di dalamnya - semua perhitungan berada pada level kurikulum sekolah kelas 7-8. Dalam 95 persen kasus, Anda akan diminta untuk mencari fungsi linier saja, tetapi di akhir artikel saya akan menunjukkan bahwa tidak sulit lagi mencari persamaan hiperbola optimal, eksponensial, dan beberapa fungsi lainnya.

Faktanya, yang tersisa hanyalah mendistribusikan barang yang dijanjikan - sehingga Anda dapat belajar memecahkan contoh-contoh tersebut tidak hanya secara akurat, tetapi juga dengan cepat. Kami mempelajari standar dengan cermat:

Tugas

Dari hasil mempelajari hubungan antara dua indikator, diperoleh pasangan angka sebagai berikut:

Dengan menggunakan metode kuadrat terkecil, temukan fungsi linier yang paling mendekati fungsi empiris (berpengalaman) data. Buatlah gambar untuk membuat titik-titik percobaan dan grafik fungsi aproksimasi dalam sistem koordinat persegi panjang Cartesian . Temukan jumlah deviasi kuadrat antara nilai empiris dan teoritis. Cari tahu apakah fiturnya lebih baik (dari sudut pandang metode kuadrat terkecil) mendekatkan titik percobaan.

Harap dicatat bahwa arti “x” adalah wajar, dan ini memiliki arti makna yang khas, yang akan saya bicarakan nanti; tapi tentu saja bisa juga pecahan. Selain itu, bergantung pada konten tugas tertentu, nilai "X" dan "permainan" bisa negatif seluruhnya atau sebagian. Ya, kami telah diberi tugas yang “tak berwajah”, dan kami memulainya larutan:

Kami menemukan koefisien fungsi optimal sebagai solusi sistem:

Agar pencatatan lebih ringkas maka variabel “counter” dapat dihilangkan, karena sudah jelas bahwa penjumlahan dilakukan dari 1 sampai .

Lebih mudah untuk menghitung jumlah yang diperlukan dalam bentuk tabel:


Penghitungan dapat dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa kesalahan; tonton video singkatnya:

Jadi, kita mendapatkan yang berikut ini sistem:

Di sini Anda dapat mengalikan persamaan kedua dengan 3 dan kurangi suku ke-2 dari persamaan ke-1 dengan suku. Tapi ini adalah keberuntungan - dalam praktiknya, sistem seringkali bukan sebuah anugerah, dan dalam kasus seperti itu sistem menyelamatkan metode Cramer:
, yang berarti sistem memiliki solusi unik.

Mari kita periksa. Saya memahami bahwa Anda tidak menginginkannya, tetapi mengapa melewatkan kesalahan yang tidak dapat dilewatkan sama sekali? Mari kita substitusikan solusi yang ditemukan ke ruas kiri setiap persamaan sistem:

Ruas kanan persamaan yang bersesuaian diperoleh, yang berarti sistem diselesaikan dengan benar.

Jadi, fungsi aproksimasi yang diinginkan: – dari semua fungsi linier Dialah yang paling mendekati data eksperimen.

Berbeda dengan lurus ketergantungan omset toko terhadap luasnya, ketergantungan yang ditemukan adalah balik (prinsip “semakin banyak, semakin sedikit”), dan fakta ini langsung terungkap dari sisi negatifnya lereng. Fungsi memberitahu kita bahwa dengan kenaikan suatu indikator tertentu sebesar 1 satuan, maka nilai indikator terikatnya menurun rata-rata sebesar 0,65 unit. Seperti kata pepatah, semakin tinggi harga soba, semakin sedikit penjualannya.

Untuk memplot grafik fungsi aproksimasi, kita mencari dua nilainya:

dan jalankan gambarnya:

Garis lurus yang dibangun disebut garis tren (yaitu garis tren linier, yaitu pada kasus umum, suatu tren belum tentu berupa garis lurus). Semua orang pasti familiar dengan ungkapan “menjadi tren”, dan menurut saya istilah ini tidak memerlukan komentar tambahan.

Mari kita hitung jumlah simpangan kuadrat antara nilai empiris dan teoritis. Secara geometris, ini adalah jumlah kuadrat panjang segmen “raspberry”. (dua di antaranya sangat kecil sehingga tidak terlihat).

Mari kita rangkum perhitungannya dalam sebuah tabel:


Sekali lagi, ini dapat dilakukan secara manual; untuk berjaga-jaga, saya akan memberikan contoh untuk poin pertama:

tetapi jauh lebih efektif melakukannya dengan cara yang sudah diketahui:

Kami ulangi sekali lagi: Apa arti dari hasil yang diperoleh? Dari semua fungsi linier fungsi kamu indikatornya paling kecil, yaitu dalam keluarganya merupakan perkiraan terbaik. Dan di sini, omong-omong, pertanyaan terakhir dari masalah ini bukanlah suatu kebetulan: bagaimana jika fungsi eksponensial yang diusulkan apakah lebih baik mendekatkan titik percobaan?

Mari kita cari jumlah simpangan kuadrat yang sesuai - untuk membedakannya, saya akan menyatakannya dengan huruf "epsilon". Tekniknya sama persis:


Dan sekali lagi, untuk berjaga-jaga, perhitungan untuk poin pertama:

Di Excel kami menggunakan fungsi standar pengalaman (sintaks dapat ditemukan di Bantuan Excel).

Kesimpulan: , yang berarti bahwa fungsi eksponensial mendekati titik-titik eksperimen lebih buruk daripada garis lurus .

Namun di sini perlu dicatat bahwa yang “lebih buruk” adalah belum berarti, apa yang salah. Sekarang saya telah membuat grafik dari fungsi eksponensial ini - dan grafik tersebut juga mendekati titik - sedemikian rupa sehingga tanpa penelitian analitis sulit untuk mengatakan fungsi mana yang lebih akurat.

Ini menyimpulkan solusinya, dan saya kembali ke pertanyaan tentang nilai alami dari argumen tersebut. Dalam berbagai penelitian, biasanya ekonomi atau sosiologi, “X” alami digunakan untuk menghitung bulan, tahun, atau interval waktu lain yang setara. Misalnya saja masalah berikut ini:

Data berikut tersedia mengenai omset ritel toko untuk paruh pertama tahun ini:

Dengan menggunakan perataan garis lurus analitis, tentukan volume omzet untuk bulan Juli.

Ya, tidak masalah: kita memberi nomor pada bulan 1, 2, 3, 4, 5, 6 dan menggunakan algoritma biasa, sebagai hasilnya kita mendapatkan persamaan - satu-satunya hal adalah ketika sampai pada waktu, mereka biasanya menggunakan huruf “te” (walaupun ini tidak penting). Persamaan yang dihasilkan menunjukkan bahwa pada semester pertama tahun ini omzet perdagangan meningkat rata-rata sebesar 27,74 satuan. per bulan. Mari kita dapatkan ramalan cuaca untuk bulan Juli (bulan no.7): d.e.

Dan ada banyak sekali tugas seperti ini. Bagi yang berkeinginan bisa menggunakan layanan tambahan yaitu my Kalkulator Excel (versi demo), yang memecahkan masalah yang dianalisis hampir seketika! Versi kerja dari program ini tersedia sebagai gantinya atau untuk biaya simbolis.

Di akhir pelajaran, informasi singkat tentang menemukan beberapa jenis dependensi lainnya. Sebenarnya tidak banyak yang bisa diceritakan, karena pendekatan fundamental dan algoritma solusinya tetap sama.

Misalkan susunan titik-titik percobaan menyerupai hiperbola. Kemudian, untuk mencari koefisien hiperbola terbaik, Anda perlu mencari fungsi minimum - siapa pun dapat melakukan perhitungan mendetail dan sampai pada sistem serupa:

Dari segi teknis formal diperoleh dari sistem “linier”. (mari kita nyatakan dengan tanda bintang) mengganti "x" dengan . Nah, bagaimana dengan jumlahnya? hitung, lalu ke koefisien optimal “a” dan “be” dekat.

Jika ada alasan untuk percaya bahwa poinnya terletak di sepanjang kurva logaritma, kemudian untuk mencari nilai optimal kita mencari nilai minimum dari fungsi tersebut . Secara formal, pada sistem (*) perlu diganti dengan:

Saat melakukan perhitungan di Excel, gunakan fungsi tersebut LN. Saya akui bahwa tidak akan terlalu sulit bagi saya untuk membuat kalkulator untuk setiap kasus yang sedang dipertimbangkan, namun akan lebih baik jika Anda “memprogram” perhitungannya sendiri. Video pelajaran untuk membantu.

Dengan ketergantungan eksponensial, situasinya menjadi sedikit lebih rumit. Untuk mereduksi persoalan menjadi kasus linier, kita ambil fungsi logaritma dan gunakan sifat-sifat logaritma:

Sekarang, dengan membandingkan fungsi yang dihasilkan dengan fungsi linier, kita sampai pada kesimpulan bahwa dalam sistem (*) harus diganti dengan , dan – oleh . Untuk kenyamanan, mari kita nyatakan:

Harap dicatat bahwa sistem diselesaikan sehubungan dengan dan, oleh karena itu, setelah menemukan akar-akarnya, Anda tidak boleh lupa untuk mencari koefisien itu sendiri.

Untuk mendekatkan titik percobaan parabola optimal , harus ditemukan fungsi minimum tiga variabel . Setelah melakukan tindakan standar, kami mendapatkan yang "berfungsi" berikut sistem:

Ya tentu saja jumlahnya lebih banyak di sini, namun tidak ada kesulitan sama sekali saat menggunakan aplikasi favorit Anda. Dan terakhir, saya akan memberi tahu Anda cara cepat melakukan pemeriksaan menggunakan Excel dan membuat garis tren yang diinginkan: buat plot sebar, pilih salah satu titik dengan mouse dan klik kanan pilih opsi "Tambahkan garis tren". Selanjutnya, pilih jenis grafik dan pada tab "Pilihan" aktifkan opsi "Tunjukkan persamaan pada diagram". OKE

Seperti biasa, saya ingin mengakhiri artikel dengan kalimat yang indah, dan saya hampir mengetik “Jadilah tren!” Tapi dia berubah pikiran seiring berjalannya waktu. Dan bukan karena itu distereotipkan. Saya tidak tahu bagaimana keadaannya bagi siapa pun, tetapi saya tidak terlalu ingin mengikuti tren Amerika dan terutama Eropa yang dipromosikan =) Oleh karena itu, saya berharap Anda masing-masing tetap pada jalur Anda sendiri!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metode kuadrat terkecil adalah salah satu yang paling umum dan paling berkembang karena sifatnya kesederhanaan dan efisiensi metode untuk memperkirakan parameter model ekonometrik linier. Pada saat yang sama, ketika menggunakannya, beberapa kehati-hatian harus diperhatikan, karena model yang dibangun dengan menggunakannya mungkin tidak memenuhi sejumlah persyaratan untuk kualitas parameternya dan, sebagai akibatnya, tidak mencerminkan pola pengembangan proses dengan “baik”. cukup.

Mari kita perhatikan prosedur untuk memperkirakan parameter model ekonometrik linier menggunakan metode kuadrat terkecil secara lebih rinci. Model seperti itu secara umum dapat direpresentasikan dengan persamaan (1.2):

yt = a 0 + a 1 x 1t +...+ an x ​​nt + ε t.

Data awal saat memperkirakan parameter a 0 , a 1 ,..., a n adalah vektor nilai variabel terikat kamu= (y 1 , y 2 , ... , y T)" dan matriks nilai variabel bebas

di mana kolom pertama, terdiri dari satuan, sesuai dengan koefisien model.

Metode kuadrat terkecil mendapatkan namanya berdasarkan prinsip dasar bahwa estimasi parameter yang diperoleh berdasarkan metode tersebut harus memenuhi: jumlah kuadrat kesalahan model harus minimal.

Contoh penyelesaian masalah dengan metode kuadrat terkecil

Contoh 2.1. Perusahaan perdagangan ini memiliki jaringan 12 toko, informasi kegiatannya disajikan pada Tabel. 2.1.

Manajemen perusahaan ingin mengetahui seberapa besar omset tahunan bergantung pada ruang ritel toko.

Tabel 2.1

Nomor toko Omset tahunan, juta rubel. Area ritel, ribuan m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Solusi kuadrat terkecil. Mari kita tunjukkan omset tahunan toko ke-th, juta rubel; - luas retail toko ke-th, ribuan m2.

Gambar.2.1. Plot sebar misalnya 2.1

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.1).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omset tahunan bergantung positif pada ruang ritel (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk sambungan fungsional yang paling cocok adalah linier.

Informasi untuk perhitungan selanjutnya disajikan pada tabel. 2.2. Dengan menggunakan metode kuadrat terkecil, kami memperkirakan parameter model ekonometrik satu faktor linier

Tabel 2.2

T kamu t x 1t kamu 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Rata-rata 68,29 0,89

Dengan demikian,

Oleh karena itu, dengan peningkatan ruang ritel sebesar 1.000 m2, semua hal lain dianggap sama, omset tahunan rata-rata meningkat sebesar 67,8871 juta rubel.

Contoh 2.2. Manajemen perusahaan memperhatikan bahwa omzet tahunan tidak hanya bergantung pada area penjualan toko (lihat contoh 2.1), tetapi juga pada rata-rata jumlah pengunjung. Informasi yang relevan disajikan dalam tabel. 2.3.

Tabel 2.3

Larutan. Mari kita nyatakan - jumlah rata-rata pengunjung toko ke-th per hari, ribuan orang.

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.2).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omzet tahunan bergantung positif pada jumlah rata-rata pengunjung per hari (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk ketergantungan fungsional adalah linier.

Beras. 2.2. Plot sebar misalnya 2.2

Tabel 2.4

T x 2t x 2t 2 kamu t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Rata-rata 10,65

Secara umum, parameter model ekonometrik dua faktor perlu ditentukan

yt = a 0 + a 1 x 1t + a 2 x 2t + ε t

Informasi yang diperlukan untuk perhitungan lebih lanjut disajikan pada tabel. 2.4.

Mari kita perkirakan parameter model ekonometrik dua faktor linier menggunakan metode kuadrat terkecil.

Dengan demikian,

Perkiraan koefisien =61,6583 menunjukkan bahwa, jika hal-hal lain dianggap sama, dengan peningkatan ruang ritel sebesar 1.000 m 2, omset tahunan akan meningkat rata-rata 61,6583 juta rubel.

Perkiraan koefisien = 2,2748 menunjukkan hal lain dianggap sama dengan peningkatan rata-rata jumlah pengunjung per 1.000 orang. per hari, omset tahunan akan meningkat rata-rata 2,2748 juta rubel.

Contoh 2.3. Menggunakan informasi yang disajikan dalam tabel. 2.2 dan 2.4, perkirakan parameter model ekonometrik satu faktor

di mana nilai pusat dari omset tahunan toko ke-th, juta rubel; - nilai terpusat dari rata-rata jumlah pengunjung harian toko ke-t, ribuan orang. (lihat contoh 2.1-2.2).

Larutan. Informasi tambahan yang diperlukan untuk perhitungan disajikan dalam tabel. 2.5.

Tabel 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Jumlah 48,4344 431,0566

Dengan menggunakan rumus (2.35), kita peroleh

Dengan demikian,

http://www.cleverstudents.ru/articles/mnk.html

Contoh.

Data eksperimen tentang nilai variabel X Dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, suatu fungsi diperoleh

Menggunakan metode kuadrat terkecil, perkirakan data ini dengan ketergantungan linier y=kapak+b(temukan parameter A Dan B). Cari tahu mana di antara dua garis yang lebih baik (dalam pengertian metode kuadrat terkecil) yang menyelaraskan data eksperimen. Buatlah gambar.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kemudahan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka. Saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai pada baris ke-2 untuk setiap angka Saya.

Nilai di kolom terakhir tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk mencari koefisien A Dan B. Kami mengganti nilai yang sesuai dari kolom terakhir tabel ke dalamnya:

Karena itu, kamu = 0,165x+2,184- perkiraan garis lurus yang diinginkan.

Masih mencari tahu garis yang mana kamu = 0,165x+2,184 atau lebih mendekati data aslinya, yaitu membuat estimasi menggunakan metode kuadrat terkecil.

Bukti.

Sehingga ketika ditemukan A Dan B fungsi mengambil nilai terkecil, pada titik ini diperlukan matriks berbentuk kuadrat dari diferensial orde kedua untuk fungsi tersebut adalah positif pasti. Mari kita tunjukkan.

Diferensial orde kedua berbentuk:

Itu adalah

Oleh karena itu, matriks berbentuk kuadrat mempunyai bentuk

dan nilai elemen tidak bergantung pada A Dan B.

Mari kita tunjukkan bahwa matriks tersebut pasti positif. Untuk melakukan ini, sudut minor harus positif.

Minor sudut orde pertama . Ketimpangannya sangat ketat, karena poinnya

Contoh.

Data eksperimen tentang nilai variabel X Dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, suatu fungsi diperoleh

Menggunakan metode kuadrat terkecil, perkirakan data ini dengan ketergantungan linier y=kapak+b(temukan parameter A Dan B). Cari tahu mana di antara dua garis yang lebih baik (dalam pengertian metode kuadrat terkecil) yang menyelaraskan data eksperimen. Buatlah gambar.

Inti dari metode kuadrat terkecil (LSM).

Tugasnya adalah menemukan koefisien ketergantungan linier di mana fungsi dua variabel berada A Dan B mengambil nilai terkecil. Artinya, diberikan A Dan B jumlah simpangan kuadrat data eksperimen dari garis lurus yang ditemukan akan menjadi yang terkecil. Inilah inti dari metode kuadrat terkecil.

Jadi, penyelesaian contohnya adalah mencari titik ekstrem dari suatu fungsi dua variabel.

Menurunkan rumus untuk mencari koefisien.

Sebuah sistem dua persamaan dengan dua hal yang tidak diketahui dikompilasi dan diselesaikan. Menemukan turunan parsial suatu fungsi oleh variabel A Dan B, kita menyamakan turunan ini dengan nol.

Kami menyelesaikan sistem persamaan yang dihasilkan menggunakan metode apa pun (misalnya dengan metode substitusi atau metode Cramer) dan mendapatkan rumus mencari koefisien menggunakan metode kuadrat terkecil (LSM).

Diberikan A Dan B fungsi mengambil nilai terkecil. Bukti dari fakta ini diberikan di bawah dalam teks di akhir halaman.

Itulah keseluruhan metode kuadrat terkecil. Rumus untuk mencari parameter A berisi jumlah,,, dan parameter N- jumlah data eksperimen. Kami menyarankan untuk menghitung nilai jumlah ini secara terpisah. Koefisien B ditemukan setelah perhitungan A.

Saatnya mengingat contoh aslinya.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kemudahan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka. Saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai pada baris ke-2 untuk setiap angka Saya.

Nilai di kolom terakhir tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk mencari koefisien A Dan B. Kami mengganti nilai yang sesuai dari kolom terakhir tabel ke dalamnya:

Karena itu, kamu = 0,165x+2,184- perkiraan garis lurus yang diinginkan.

Masih mencari tahu garis yang mana kamu = 0,165x+2,184 atau lebih mendekati data aslinya, yaitu membuat estimasi menggunakan metode kuadrat terkecil.

Estimasi kesalahan metode kuadrat terkecil.

Untuk melakukan ini, Anda perlu menghitung jumlah deviasi kuadrat dari data asli dari garis-garis ini Dan , nilai yang lebih kecil menunjukkan garis yang lebih mendekati data asli dalam pengertian metode kuadrat terkecil.

Sejak , maka lurus kamu = 0,165x+2,184 lebih mendekati data aslinya.

Ilustrasi grafis metode kuadrat terkecil (LS).

Semuanya terlihat jelas di grafik. Garis merah adalah garis lurus yang ditemukan kamu = 0,165x+2,184, garis biru adalah , titik merah muda adalah data asli.

Dalam praktiknya, ketika memodelkan berbagai proses - khususnya, ekonomi, fisik, teknis, sosial - metode tertentu untuk menghitung perkiraan nilai fungsi dari nilai yang diketahui pada titik tetap tertentu banyak digunakan.

Masalah perkiraan fungsi seperti ini sering muncul:

    ketika membuat rumus perkiraan untuk menghitung nilai besaran karakteristik dari proses yang diteliti menggunakan data tabel yang diperoleh sebagai hasil percobaan;

    dalam integrasi numerik, diferensiasi, penyelesaian persamaan diferensial, dll;

    jika perlu, hitung nilai fungsi pada titik tengah interval yang dipertimbangkan;

    ketika menentukan nilai besaran karakteristik suatu proses di luar interval yang dipertimbangkan, khususnya ketika meramalkan.

Jika, untuk memodelkan proses tertentu yang ditentukan oleh tabel, kita membangun sebuah fungsi yang kira-kira menggambarkan proses ini berdasarkan metode kuadrat terkecil, maka itu akan disebut fungsi aproksimasi (regresi), dan tugas membangun fungsi aproksimasi itu sendiri akan disebut masalah perkiraan.

Artikel ini membahas tentang kemampuan paket MS Excel untuk menyelesaikan masalah jenis ini, selain itu juga memberikan metode dan teknik untuk membangun (membuat) regresi untuk fungsi tabulasi (yang merupakan dasar analisis regresi).

Excel memiliki dua opsi untuk membuat regresi.

    Menambahkan regresi (garis tren) yang dipilih ke diagram yang dibuat berdasarkan tabel data untuk karakteristik proses yang diteliti (hanya tersedia jika diagram telah dibuat);

    Menggunakan fungsi statistik bawaan pada lembar kerja Excel, memungkinkan Anda memperoleh regresi (garis tren) langsung dari tabel data sumber.

Menambahkan garis tren ke grafik

Untuk tabel data yang menjelaskan suatu proses dan diwakili oleh diagram, Excel memiliki alat analisis regresi efektif yang memungkinkan Anda untuk:

    membangun berdasarkan metode kuadrat terkecil dan menambahkan lima jenis regresi ke diagram, yang memodelkan proses yang diteliti dengan berbagai tingkat akurasi;

    tambahkan persamaan regresi yang dibangun ke diagram;

    menentukan tingkat kesesuaian regresi yang dipilih dengan data yang ditampilkan pada grafik.

Berdasarkan data grafik, Excel memungkinkan Anda memperoleh jenis regresi linier, polinomial, logaritmik, pangkat, eksponensial, yang ditentukan oleh persamaan:

kamu = kamu(x)

dimana x adalah variabel bebas yang sering mengambil nilai barisan bilangan asli (1; 2; 3; ...) dan menghasilkan, misalnya, hitungan mundur waktu dari proses yang diteliti (karakteristik).

1 . Regresi linier baik untuk memodelkan karakteristik yang nilainya naik atau turun dengan laju yang konstan. Ini adalah model yang paling sederhana untuk dibangun untuk proses yang sedang dipelajari. Itu dibangun sesuai dengan persamaan:

kamu = mx + b

dimana m adalah garis singgung kemiringan regresi linier terhadap sumbu x; b - koordinat titik potong regresi linier dengan sumbu ordinat.

2 . Garis tren polinomial berguna untuk menggambarkan karakteristik yang memiliki beberapa titik ekstrem yang berbeda (maksimum dan minimum). Pilihan derajat polinomial ditentukan oleh jumlah ekstrem dari karakteristik yang diteliti. Jadi, polinomial derajat kedua dapat menggambarkan suatu proses yang hanya memiliki satu maksimum atau minimum; polinomial derajat ketiga - tidak lebih dari dua ekstrem; polinomial derajat keempat - tidak lebih dari tiga ekstrem, dll.

Dalam hal ini, garis tren dibangun sesuai dengan persamaan:

kamu = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

dimana koefisien c0, c1, c2,... c6 adalah konstanta yang nilainya ditentukan selama konstruksi.

3 . Garis tren logaritmik berhasil digunakan ketika memodelkan karakteristik yang nilainya awalnya berubah dengan cepat dan kemudian stabil secara bertahap.

y = c ln(x) + b

4 . Garis tren hukum pangkat memberikan hasil yang baik jika nilai hubungan yang diteliti dicirikan oleh perubahan laju pertumbuhan yang konstan. Contoh ketergantungan tersebut adalah grafik gerak dipercepat beraturan sebuah mobil. Jika terdapat nilai nol atau negatif pada data, Anda tidak dapat menggunakan garis tren pangkat.

Dibangun sesuai dengan persamaan:

kamu = cxb

dimana koefisien b, c adalah konstanta.

5 . Garis tren eksponensial harus digunakan ketika laju perubahan data terus meningkat. Untuk data yang mengandung nilai nol atau negatif, pendekatan jenis ini juga tidak berlaku.

Dibangun sesuai dengan persamaan:

y = c ebx

dimana koefisien b, c adalah konstanta.

Saat memilih garis tren, Excel secara otomatis menghitung nilai R2, yang mencirikan keandalan perkiraan: semakin dekat nilai R2 ke satu, semakin andal garis tren tersebut mendekati proses yang sedang dipelajari. Jika perlu, nilai R2 selalu dapat ditampilkan pada grafik.

Ditentukan dengan rumus:

Untuk menambahkan garis tren ke rangkaian data:

    mengaktifkan bagan berdasarkan serangkaian data, yaitu klik di dalam area bagan. Item Diagram akan muncul di menu utama;

    setelah mengklik item ini, sebuah menu akan muncul di layar di mana Anda harus memilih perintah Tambahkan garis tren.

Tindakan yang sama dapat dengan mudah diterapkan dengan menggerakkan penunjuk tetikus ke grafik yang sesuai dengan salah satu rangkaian data dan mengklik kanan; Di menu konteks yang muncul, pilih perintah Tambahkan garis tren. Kotak dialog Trendline akan muncul di layar dengan tab Type terbuka (Gbr. 1).

Setelah ini Anda perlu:

Pilih tipe garis tren yang diperlukan pada tab Type (tipe Linear dipilih secara default). Untuk tipe Polinomial, pada kolom Derajat, tentukan derajat polinomial yang dipilih.

1 . Bidang Seri yang dibangun mencantumkan semua seri data dalam bagan yang dimaksud. Untuk menambahkan garis tren ke seri data tertentu, pilih namanya di bidang Seri yang dibangun.

Jika perlu, dengan membuka tab Parameter (Gbr. 2), Anda dapat mengatur parameter berikut untuk garis tren:

    ubah nama garis tren di bidang Nama kurva perkiraan (dihaluskan).

    atur jumlah periode (maju atau mundur) untuk perkiraan di bidang Prakiraan;

    menampilkan persamaan garis tren di area diagram, yang mana Anda harus mengaktifkan kotak centang tampilkan persamaan pada diagram;

    tampilkan nilai keandalan perkiraan R2 di area diagram, yang mana Anda harus mengaktifkan kotak centang Tempatkan nilai keandalan perkiraan pada diagram (R^2);

    atur titik perpotongan garis tren dengan sumbu Y, yang mana Anda harus mengaktifkan kotak centang untuk perpotongan kurva dengan sumbu Y pada suatu titik;

    Klik tombol OK untuk menutup kotak dialog.

Untuk mulai mengedit garis tren yang sudah digambar, ada tiga cara:

    gunakan perintah Selected trend line dari menu Format, setelah sebelumnya memilih garis tren;

    pilih perintah Format garis tren dari menu konteks, yang dipanggil dengan mengklik kanan pada garis tren;

    klik dua kali pada garis tren.

Kotak dialog Format Garis Tren akan muncul di layar (Gbr. 3), berisi tiga tab: Tampilan, Jenis, Parameter, dan konten dari dua tab terakhir sepenuhnya bertepatan dengan tab serupa pada kotak dialog Garis Tren (Gbr. 1 -2). Pada tab View, Anda dapat mengatur jenis garis, warna dan ketebalannya.

Untuk menghapus garis tren yang sudah digambar, pilih garis tren yang akan dihapus dan tekan tombol Hapus.

Keuntungan dari alat analisis regresi yang dipertimbangkan adalah:

    relatif mudahnya membuat garis tren pada grafik tanpa membuat tabel data untuknya;

    daftar jenis garis tren yang diusulkan cukup luas, dan daftar ini mencakup jenis regresi yang paling umum digunakan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan sejumlah langkah maju dan mundur secara sewenang-wenang (dalam batas akal sehat);

    kemampuan memperoleh persamaan garis tren dalam bentuk analitis;

    kemungkinan, jika perlu, untuk memperoleh penilaian atas keandalan perkiraan.

Kerugiannya antara lain sebagai berikut:

    konstruksi garis tren hanya dilakukan jika terdapat diagram yang dibangun di atas serangkaian data;

    proses menghasilkan rangkaian data untuk karakteristik yang diteliti berdasarkan persamaan garis tren yang diperoleh agak berantakan: persamaan regresi yang diperlukan diperbarui dengan setiap perubahan nilai rangkaian data asli, tetapi hanya dalam area grafik , sedangkan rangkaian data yang dibentuk berdasarkan persamaan garis lama, trennya tetap tidak berubah;

    Dalam laporan PivotChart, mengubah tampilan bagan atau laporan PivotTable terkait tidak mempertahankan garis tren yang ada, artinya sebelum Anda menggambar garis tren atau memformat laporan PivotChart, Anda harus memastikan bahwa tata letak laporan memenuhi persyaratan yang diperlukan.

Garis tren dapat digunakan untuk melengkapi rangkaian data yang disajikan pada bagan seperti grafik, histogram, bagan area datar yang tidak terstandarisasi, bagan batang, bagan sebar, bagan gelembung, dan bagan saham.

Anda tidak dapat menambahkan garis tren ke rangkaian data dalam diagram 3D, normalisasi, radar, lingkaran, dan donat.

Menggunakan fungsi bawaan Excel

Excel juga memiliki alat analisis regresi untuk merencanakan garis tren di luar area grafik. Ada sejumlah fungsi lembar kerja statistik yang bisa Anda gunakan untuk tujuan ini, namun semuanya hanya memungkinkan Anda membuat regresi linier atau eksponensial.

Excel memiliki beberapa fungsi untuk membangun regresi linier, khususnya:

    KECENDERUNGAN;

  • LERENG dan POTONG.

Serta beberapa fungsi untuk membangun garis tren eksponensial, khususnya:

    LGRFPRIBL.

Perlu diperhatikan bahwa teknik pembuatan regresi menggunakan fungsi TREND dan GROWTH hampir sama. Hal yang sama juga berlaku pada pasangan fungsi LINEST dan LGRFPRIBL. Untuk keempat fungsi ini, pembuatan tabel nilai menggunakan fitur Excel seperti rumus array, yang agak mengacaukan proses pembuatan regresi. Perhatikan juga bahwa konstruksi regresi linier, menurut pendapat kami, paling mudah dilakukan dengan menggunakan fungsi SLOPE dan INTERCEPT, di mana fungsi pertama menentukan kemiringan regresi linier, dan fungsi kedua menentukan segmen yang dicegat oleh regresi pada sumbu y.

Keuntungan alat fungsi bawaan untuk analisis regresi adalah:

    proses yang cukup sederhana dan seragam untuk menghasilkan rangkaian data dari karakteristik yang diteliti untuk semua fungsi statistik bawaan yang menentukan garis tren;

    metodologi standar untuk membangun garis tren berdasarkan seri data yang dihasilkan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan jumlah langkah maju atau mundur yang diperlukan.

Kerugiannya termasuk fakta bahwa Excel tidak memiliki fungsi bawaan untuk membuat jenis garis tren lainnya (kecuali linier dan eksponensial). Keadaan ini seringkali tidak memungkinkan untuk memilih model yang cukup akurat dari proses yang diteliti, serta memperoleh perkiraan yang mendekati kenyataan. Selain itu, saat menggunakan fungsi TREND dan GROWTH, persamaan garis tren tidak diketahui.

Perlu dicatat bahwa penulis tidak bermaksud menyajikan analisis regresi dengan tingkat kelengkapan apa pun. Tugas utamanya adalah menunjukkan, dengan menggunakan contoh spesifik, kemampuan paket Excel saat memecahkan masalah perkiraan; mendemonstrasikan alat efektif apa yang dimiliki Excel untuk membuat regresi dan perkiraan; mengilustrasikan bagaimana masalah tersebut dapat diselesaikan dengan relatif mudah bahkan oleh pengguna yang tidak memiliki pengetahuan luas tentang analisis regresi.

Contoh pemecahan masalah tertentu

Mari kita lihat pemecahan masalah tertentu menggunakan alat Excel yang terdaftar.

Masalah 1

Dengan tabel data keuntungan suatu usaha angkutan motor tahun 1995-2002. Anda perlu melakukan hal berikut:

    Buatlah diagram.

    Tambahkan garis tren linier dan polinomial (kuadrat dan kubik) ke grafik.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004.

    Buatlah perkiraan keuntungan perusahaan untuk tahun 2003 dan 2004.

Solusi dari masalah tersebut

    Dalam rentang sel A4:C11 lembar kerja Excel, masukkan lembar kerja yang ditunjukkan pada Gambar. 4.

    Setelah memilih rentang sel B4:C11, kami membuat diagram.

    Kami mengaktifkan diagram yang dibuat dan, sesuai dengan metode yang dijelaskan di atas, setelah memilih jenis garis tren di kotak dialog Garis Tren (lihat Gambar 1), kami secara bergantian menambahkan garis tren linier, kuadrat, dan kubik ke diagram. Di kotak dialog yang sama, buka tab Parameter (lihat Gambar 2), di bidang Nama kurva perkiraan (dihaluskan), masukkan nama tren yang ditambahkan, dan di bidang Perkiraan maju untuk: periode, atur nilai 2, karena direncanakan membuat perkiraan keuntungan untuk dua tahun ke depan. Untuk menampilkan persamaan regresi dan nilai reliabilitas aproksimasi R2 pada area diagram, aktifkan kotak centang tampilkan persamaan di layar dan tempatkan nilai reliabilitas aproksimasi (R^2) pada diagram. Untuk persepsi visual yang lebih baik, kami mengubah jenis, warna dan ketebalan garis tren yang dibuat, untuk itu kami menggunakan tab Tampilan pada kotak dialog Format Garis Tren (lihat Gambar 3). Diagram yang dihasilkan dengan garis tren tambahan ditunjukkan pada Gambar. 5.

    Memperoleh data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004. Mari kita gunakan persamaan garis tren yang disajikan pada Gambar. 5. Untuk melakukan ini, dalam sel rentang D3:F3, masukkan informasi teks tentang jenis garis tren yang dipilih: Tren linier, Tren kuadrat, Tren kubik. Selanjutnya, masukkan rumus regresi linier di sel D4 dan, dengan menggunakan penanda isian, salin rumus ini dengan referensi relatif ke rentang sel D5:D13. Perlu dicatat bahwa setiap sel dengan rumus regresi linier dari rentang sel D4:D13 memiliki argumen sel yang sesuai dari rentang A4:A13. Demikian pula, untuk regresi kuadratik, isikan rentang sel E4:E13, dan untuk regresi kubik, isikan rentang sel F4:F13. Dengan demikian, perkiraan laba perusahaan untuk tahun 2003 dan 2004 telah disusun. menggunakan tiga tren. Tabel nilai yang dihasilkan ditunjukkan pada Gambar. 6.

Masalah 2

    Buatlah diagram.

    Tambahkan garis tren logaritmik, pangkat, dan eksponensial ke grafik.

    Turunkan persamaan garis tren yang diperoleh, serta nilai reliabilitas dari pendekatan R2 untuk masing-masing garis tersebut.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel laba perusahaan untuk setiap garis tren tahun 1995-2002.

    Buatlah perkiraan laba perusahaan untuk tahun 2003 dan 2004 dengan menggunakan garis tren berikut.

Solusi dari masalah tersebut

Mengikuti metodologi yang diberikan dalam menyelesaikan masalah 1, kita memperoleh diagram dengan garis tren logaritmik, pangkat, dan eksponensial ditambahkan ke dalamnya (Gbr. 7). Selanjutnya, dengan menggunakan persamaan garis tren yang diperoleh, kita mengisi tabel nilai laba perusahaan, termasuk nilai prediksi untuk tahun 2003 dan 2004. (Gbr. 8).

Pada Gambar. 5 dan gambar. terlihat bahwa model dengan tren logaritmik memiliki nilai reliabilitas aproksimasi yang paling rendah

R2 = 0,8659

Nilai R2 tertinggi sesuai dengan model dengan tren polinomial: kuadrat (R2 = 0,9263) dan kubik (R2 = 0,933).

Masalah 3

Dengan tabel data laba suatu usaha angkutan motor tahun 1995-2002 yang diberikan pada tugas 1, maka perlu dilakukan langkah-langkah sebagai berikut.

    Dapatkan seri data untuk garis tren linier dan eksponensial menggunakan fungsi TREND dan GROW.

    Dengan menggunakan fungsi TREND dan GROWTH, buatlah perkiraan laba perusahaan untuk tahun 2003 dan 2004.

    Buatlah diagram untuk data asli dan rangkaian data yang dihasilkan.

Solusi dari masalah tersebut

Mari kita gunakan lembar kerja untuk Soal 1 (lihat Gambar 4). Mari kita mulai dengan fungsi TREND:

    pilih rentang sel D4:D11, yang harus diisi dengan nilai fungsi TREND yang sesuai dengan data laba perusahaan yang diketahui;

    Panggil perintah Fungsi dari menu Sisipkan. Pada kotak dialog Function Wizard yang muncul, pilih fungsi TREND dari kategori Statistik, lalu klik tombol OK. Operasi yang sama dapat dilakukan dengan mengklik tombol (Sisipkan Fungsi) pada toolbar standar.

    Pada kotak dialog Argumen Fungsi yang muncul, masukkan rentang sel C4:C11 di bidang Known_values_y; di bidang Known_values_x - rentang sel B4:B11;

    Untuk membuat rumus yang dimasukkan menjadi rumus array, gunakan kombinasi tombol ++ .

Rumus yang kita masukkan pada formula bar akan terlihat seperti: =(TREND(C4:C11,B4:B11)).

Hasilnya, rentang sel D4:D11 diisi dengan nilai fungsi TREND yang sesuai (Gbr. 9).

Membuat perkiraan laba perusahaan untuk tahun 2003 dan 2004. diperlukan:

    pilih rentang sel D12:D13 di mana nilai prediksi fungsi TREND akan dimasukkan.

    panggil fungsi TREND dan di kotak dialog Argumen Fungsi yang muncul, masukkan di bidang Diketahui_nilai_y - rentang sel C4:C11; di bidang Known_values_x - rentang sel B4:B11; dan di bidang New_values_x - rentang sel B12:B13.

    ubah rumus ini menjadi rumus array menggunakan kombinasi tombol Ctrl + Shift + Enter.

    Rumus yang dimasukkan akan terlihat seperti: =(TREND(C4:C11;B4:B11;B12:B13)), dan rentang sel D12:D13 akan diisi dengan nilai prediksi fungsi TREND (lihat Gambar. 9).

Seri data diisi dengan cara yang sama menggunakan fungsi GROWTH, yang digunakan dalam analisis dependensi nonlinier dan bekerja dengan cara yang persis sama seperti TREND liniernya.

Gambar 10 menunjukkan tabel dalam mode tampilan rumus.

Untuk data awal dan rangkaian data yang diperoleh, diagramnya ditunjukkan pada Gambar. sebelas.

Masalah 4

Dengan tabel data penerimaan permohonan jasa oleh dinas pengiriman suatu perusahaan angkutan motor untuk periode tanggal 1 sampai dengan tanggal 11 bulan berjalan, perlu dilakukan tindakan sebagai berikut.

    Dapatkan rangkaian data untuk regresi linier: menggunakan fungsi SLOPE dan INTERCEPT; menggunakan fungsi LINEST.

    Dapatkan serangkaian data untuk regresi eksponensial menggunakan fungsi LGRFPRIBL.

    Dengan menggunakan fungsi di atas, buat perkiraan penerimaan aplikasi ke layanan pengiriman untuk periode tanggal 12 hingga 14 bulan berjalan.

    Buat diagram untuk seri data asli dan yang diterima.

Solusi dari masalah tersebut

Perhatikan bahwa, tidak seperti fungsi TREND dan GROWTH, tidak ada satu pun fungsi yang tercantum di atas (SLOPE, INTERCEPT, LINEST, LGRFPRIB) yang merupakan regresi. Fungsi-fungsi ini hanya memainkan peran pendukung, menentukan parameter regresi yang diperlukan.

Untuk regresi linier dan eksponensial yang dibangun menggunakan fungsi SLOPE, INTERCEPT, LINEST, LGRFPRIB, kemunculan persamaannya selalu diketahui, berbeda dengan regresi linier dan eksponensial yang berhubungan dengan fungsi TREND dan GROWTH.

1 . Mari kita buat regresi linier dengan persamaan:

kamu = mx+b

menggunakan fungsi SLOPE dan INTERCEPT, dengan kemiringan regresi m ditentukan oleh fungsi SLOPE, dan suku bebas b oleh fungsi INTERCEPT.

Untuk melakukan ini, kami melakukan tindakan berikut:

    masukkan tabel asli ke dalam cell range A4:B14;

    nilai parameter m akan ditentukan di sel C19. Pilih fungsi Kemiringan dari kategori Statistik; masukkan rentang sel B4:B14 di bidang nilai_yang diketahui dan rentang sel A4:A14 di bidang nilai_yang diketahui_x. Rumusnya akan dimasukkan pada sel C19: =SLOPE(B4:B14,A4:A14);

    Dengan menggunakan teknik serupa, nilai parameter b di sel D19 ditentukan. Dan isinya akan terlihat seperti: =SEGMENT(B4:B14,A4:A14). Jadi, nilai parameter m dan b yang diperlukan untuk membuat regresi linier masing-masing akan disimpan di sel C19, D19;

    Selanjutnya masukkan rumus regresi linier pada sel C4 dengan bentuk: =$C*A4+$D. Dalam rumus ini, sel C19 dan D19 ditulis dengan referensi absolut (alamat sel tidak boleh berubah selama kemungkinan penyalinan). Tanda referensi absolut $ dapat diketik dari keyboard atau menggunakan tombol F4, setelah menempatkan kursor pada alamat sel. Dengan menggunakan gagang isian, salin rumus ini ke dalam rentang sel C4:C17. Kami memperoleh seri data yang diperlukan (Gbr. 12). Karena jumlah permintaan adalah bilangan bulat, Anda harus mengatur format angka dengan jumlah desimal ke 0 pada tab Angka di jendela Format Sel.

2 . Sekarang mari kita buat regresi linier yang diberikan oleh persamaan:

kamu = mx+b

menggunakan fungsi LINEST.

Untuk ini:

    Masukkan fungsi LINEST sebagai rumus array pada cell range C20:D20: =(LINEST(B4:B14,A4:A14)). Hasilnya, kita memperoleh nilai parameter m di sel C20, dan nilai parameter b di sel D20;

    masukkan rumus di sel D4: =$C*A4+$D;

    salin rumus ini menggunakan penanda isian ke dalam rentang sel D4:D17 dan dapatkan seri data yang diinginkan.

3 . Kami membangun regresi eksponensial dengan persamaan:

menggunakan fungsi LGRFPRIBL dilakukan dengan cara yang sama:

    Pada cell range C21:D21 kita masukkan fungsi LGRFPRIBL sebagai rumus array: =( LGRFPRIBL (B4:B14,A4:A14)). Dalam hal ini, nilai parameter m akan ditentukan di sel C21, dan nilai parameter b akan ditentukan di sel D21;

    rumusnya dimasukkan ke dalam sel E4: =$D*$C^A4;

    menggunakan penanda isian, rumus ini disalin ke rentang sel E4:E17, tempat rangkaian data untuk regresi eksponensial akan ditempatkan (lihat Gambar 12).

Pada Gambar. Gambar 13 menunjukkan tabel di mana Anda dapat melihat fungsi yang kami gunakan dengan rentang sel yang diperlukan, serta rumusnya.

Besarnya R 2 ditelepon koefisien determinasi.

Tugas membangun ketergantungan regresi adalah mencari vektor koefisien m model (1) di mana koefisien R mengambil nilai maksimum.

Untuk menilai signifikansi R digunakan uji F Fisher yang dihitung dengan menggunakan rumus

Di mana N- ukuran sampel (jumlah percobaan);

k adalah jumlah koefisien model.

Jika F melebihi beberapa nilai kritis untuk data tersebut N Dan k dan probabilitas kepercayaan diterima, maka nilai R dianggap signifikan. Tabel nilai kritis F diberikan dalam buku referensi statistik matematika.

Dengan demikian, signifikansi R tidak hanya ditentukan oleh nilainya, tetapi juga oleh rasio antara jumlah percobaan dan jumlah koefisien (parameter) model. Memang benar, rasio korelasi n=2 untuk model linier sederhana sama dengan 1 (satu garis lurus selalu dapat ditarik melalui 2 titik pada sebuah bidang). Namun, jika data eksperimen adalah variabel acak, nilai R seperti itu harus dipercaya dengan sangat hati-hati. Biasanya, untuk mendapatkan R yang signifikan dan regresi yang andal, mereka berupaya memastikan bahwa jumlah eksperimen secara signifikan melebihi jumlah koefisien model (n>k).

Untuk membangun model regresi linier, Anda memerlukan:

1) siapkan daftar n baris dan m kolom yang berisi data eksperimen (kolom berisi nilai keluaran Y harus menjadi yang pertama atau terakhir dalam daftar); Sebagai contoh, mari kita ambil data dari tugas sebelumnya, tambahkan kolom bernama “Nomor Periode.”, beri nomor pada nomor periode dari 1 hingga 12. (ini akan menjadi nilainya X)

2) masuk ke menu Data/Analisis Data/Regresi

Jika item "Analisis Data" di menu "Alat" tidak ada, maka Anda harus membuka item "Add-In" di menu yang sama dan mencentang kotak "Paket Analisis".

3) di kotak dialog "Regresi", atur:

· interval masukan Y;

· interval masukan X;

· interval keluaran - sel kiri atas interval di mana hasil perhitungan akan ditempatkan (disarankan untuk menempatkannya pada lembar kerja baru);

4) klik "OK" dan analisis hasilnya.