Кореляційний аналіз урожайності зернових культур
СОДЕРЖАНИЕ: Основи аналізу простої лінійної та нелінійної кореляції, аналіз регресії і оцінка тісноти зв’язку. Аналіз урожайності зернових культур методом множинної кореляції. Особливості використання непараметричних методів визначення тісноти кореляційного зв’язку.КАБІНЕТ МІНІСТРІВ УКРАЇНИ
Національний університет біоресурсів і природокористування України
Кафедра статистики та економічного аналізу
Курсова роботаз статистики на тему:
«Кореляційний аналіз урожайності зернових культур»
Київ – 2009
План курсової роботи
Вступ
Розділ 1. Аналіз простої лінійної кореляції
1.1 Теоретичні основи аналізу простої лінійної кореляції
1.2 Аналіз регресії
1.2 Оцінка тісноти зв’язку
Розділ 2. Аналіз простої нелінійної кореляції
2.1 Теоретичні основи аналізу нелінійної кореляції
2.2 Аналіз регресії та оцінка тісноти зв’язку
Розділ 3. Аналіз урожайності зерновиз культур методом множинної кореляції
3.1 Теоретичні основи множинної кореляції
3.2 Аналіз регресії
3.3 Оцінка тісноти зв’язку
Розділ 4. Непараметрична кореляція
Висновки
Список використаної літератури
ВСТУП
Зернові культури мають найвищу питому вагу в структурі посівних площ і валових зборів сільськогосподарських культур. Це пояснюється їх винятковим значенням та різнобічним використанням. Але зараз ми бачимо як різко скорочуються посівні площі. Для порівняння, в 1985 р. під посівами сільськогосподарських культур було зайнято 32656 тис. га, а в 1995 р. – лише 30963 тис. га. Також скорочуються площі з яких було зібрано урожай зернових в 1985 р. 16064 тис. га, а в 1995 р. – 13963 тис. га.
Розвиток та підвищення економічної ефективності зернового господарства є необхідна умова не тільки забезпечення населення продуктами харчування, а й підвищення ефективності виробництва інших видів продукції сільського господарства.
Концепція розвитку зернового господарства України передбачає суттєве збільшення виробництва зерна на основі неухильного підвищення урожайності зернових культур, структурної перебудови зернового господарства з метою забезпечення внутрішніх потреб у зернових та перетворення України з імпортера в експортера зерна.
Інтенсифікація сільського виробництва, яка здійснювалась головним чином шляхом хімізації, меліорації та механізації, несла значне зменшення ручної праці. Поряд з цим інтенсифікація виробництва, а з нею і великі витрати ресурсів, зумовили цілий ряд негативних явищ у землеробстві, які насамперед привели до погіршення структури земельних ресурсів, посилення ерозійних процесів, зниження родючості ґрунту в усіх його проявах, забруднення агрохімікатами, пестицидами, тощо. Тому сьогодні як ніколи нам потрібно бережно відноситись до землі. Вводити нові технології тільки тоді, коли ми впевнені, що не зробимо гірше. Інтенсивне і надмірне зрошення приводить до розчинення у підґрунті солей лужних металів, які внаслідок зрошення поступають у грунт і засолюють його.
Урожайність зернових культур в 1995 році знизилась на 10,8 ц/га в порівнянні з 1985 роком (35,1 ц/га), і становила 24,3 ц/га.
Основним шляхом збільшення валових зборів продукції рослинництва є підвищення врожайності сільськогосподарських культур, яке можливо досягти тільки при впровадженні інтенсивних технологій.
У зв’язку з тим, що на результат сільського господарства впливає багато факторів, керівник або спеціаліст сільськогосподарського підприємства повинен вчасно виявляти та правильно аналізувати статистичну інформацію про залежність результату від факторів і є ціллю цієї роботи.
Отже метою курсового проекту показати взаємозв’язок і залежність урожайності зернових культур, від кількості внесених органічних добрив і якості ґрунтів. Кількісне відображення взаємозв’язку через систему показників являється завданням курсового проекту.
Розділ 1. Аналіз простої лінійної кореляції
1.1 Теоретичні основи аналізу простої лінійної кореляції
Важливим завданням статистики є розробка методів вивчення економічних, біологічних, технічних закономірностей, яким підпорядковане виробництво, їх кількісної та якісної сторін. Із цією метою широко використовують кількісні методи статистико-економічного аналізу, зокрема кореляційний. За допомогою кореляційного методу взаємозв’язок між явищами фіксують аналітично у вигляді математичних виразів, які відображають взаємозв’язки факторних і результативних ознак.
Кореляційний метод широко використовують в економічному аналізі різних галузей народного господарства; успішно він застосовується і в сільському господарстві.
Кореляційний метод дозволяє одержати кількісні характеристики ступеня зв’язку між двома або кількома ознаками, а тому дає більш розширене уявлення про зв’язок між ними. Водночас, слід відзначити, що кореляційний метод не встановлює причинних зв’язків між досліджуваними явищами, а констатує їх наявність чи відсутність.
Щоб зрозуміти суть явищ, необхідно розкрити їх взаємозв’язки, кількісно виміряти вплив тих чи інших об’єктивних та суб’єктивних факторів. До того ж будь-яке суспільне явище не можна усвідомити і зрозуміти без обґрунтування його зв’язків з іншими явищами або окремими їх ознаками. Ці зв’язки досить різноманітні. Причому одні ознаки виступають у ролі факторів, які діють на інші, зумовлюючи їх зміни, інші – в ролі результатів дії цих факторів. Перші з них називають факторними ознаками, другі – результативними.
Досить значна різноманітність зв’язків суспільних явищ потребує групування у певні типи та форми за їх істотними рисами і властивостями, тобто класифікації. У статистиці в основу класифікації зв’язків покладено принцип відмінності і подібності їх за такими особливостями: напрям, ступінь тісноти, аналітичний вираз, одиничність і множинність факторів та наслідків. Виходячи з цього розрізняють зв’язки функціональні (повні) і кореляційні (нерівні); прямі та обернені; прямолінійні і криволінійні; однофакторні і багатофакторні (множинні).
Кореляція – це залежність між випадковими величинами, що не має суворого функціонального характеру, при якій зміна однієї випадкової величини зумовлює зміну математичного очікування іншої.
Кореляційний зв’язок – це такий зв’язок між ознаками суспільно-економічних явищ, при якому на величину результативної ознаки, крім факторної, впливають багато інших ознак, що діють у різних напрямах одночасно або послідовно. Кореляційний зв’язок виявити лише у вигляді загальної тенденції при масовому зіставлення факторів. Його особливістю є те, що кожному значенні факторної ознаки відповідає не одне певне значення результативної, а ціла їх сукупність.
Кореляційний аналіз (кореляційний метод) – метод дослідження взаємозалежності ознак у генеральній сукупності, які є випадковими величинами з нормальним характером розподілу. Кореляційний аналіз вирішує такі завдання:
оцінку параметрів нормально розподіленої генеральної сукупності (генеральних середніх, дисперсій, парних коефіцієнтів кореляції, множинних і окремих коефіцієнтів кореляції);
перевірку істотності оцінюваних параметрів та одержання інтервальних оцінок для визначення істотних серед них;
виявлення структури взаємозалежності ознак.
Крім завдань існує декілька передумов кореляційного аналізу:
чітке уявлення про причинно-наслідкові зв’язки досліджуваних ознак;
достатня варіація досліджуваних ознак, оскільки без варіації не можна виявити зв’язків;
однорідність досліджуваної сукупності;
ознаки повинні мати кількісний або числовий вираз, навіть для атрибутивних ознак.
Вивчення взаємозв’язків кореляційного типу має велике значення, особливо при аналізі явищ, які складаються під впливом значної кількості факторів.
За математичними особливостями кореляційні залежності можуть бути додатними і від’ємними, прямолінійними та криволінійними, простими і множинними.
За формою кореляційна залежність буває прямолінійною і криволінійною, а за напрямом – прямою (додатною) та оберненою (від’ємною). Коли визначається зв’язок між двома ознаками, кореляція називається простою (парною); якщо ж ознака розглядається як результат впливу кількох факторів – множинною.
Під прямолінійним розуміють зв’язок, який описується рівнянням прямої лінії. Криволінійним називають зв’язок, що описується рівнянням будь-якої кривої лінії (парабола, гіпербола, логарифмічна крива та ін.).
Прямим називають такий зв’язок, при якому зі збільшенням (чи зменшенням) факторної ознаки збільшується (чи зменшується) результативна.
Оберненим називають зв’язок, при якому значення результативної ознаки змінюється в протилежному напрямі щодо зміни значень факторної: зі збільшенням останньої значення результативної ознаки зменшується і навпаки.
Залежно від форми звязку між факторною і результативною ознаками вибирають тип математичного рівняння, за допомогою якого визначають характеристики кореляційного аналізу. Прямолінійну форму звязку визначають рівнянням прямої лінії
,
де ух — теоретичні (обчислені за рівнянням регресії) значення результативної ознаки;
а0 — початок відліку, або значення yx при умові, що х = 0 ;
а1 — коефіцієнт регресії (коефіцієнт пропорційності), який показує, як змінюється ух при кожній зміні х на одиницю;
х — значення факторної ознаки.
При прямому звязку між корелюючими ознаками коефіцієнт регресії має додатне значення, при зворотному — відємне.
Параметри а0 і а1 рівняння регресії обчислюють способом найменших квадратів. Суть цього способу в знаходженні таких параметрів рівняння звязку, при яких залишкова сума квадратів відхилень фактичних значень результативної ознаки (y ) від її теоретичних (обчислених за рівнянням звязку) значень (yх ) буде мінімальною
(у - yх)2 =min.
Спосіб найменших квадратів зводиться до складання і розвязання системи двох рівнянь з двома невідомими:
S y = na0 + a1 S x;
S xy = a0 S x + a1 S x2,
де n — кількість спостережень.
Розвязавши що систему рівнянь, дістанемо
; .
Підставивши у рівняння регресії конкретні значення x , дістанемо теоретичні рівні надою у кожному господарстві.
1.2 Aналіз регресії
Таблиця 1. Вихідні і розрахункові дані для обчислення параметрів рівняння зв’язку між урожайністю зернових культур та внесеними мінеральними добривами
№ п/п |
Урожайність зернових, ц | Внесено добрив, ц д.р. | Розрахункові величини | ||||
Y | X2 | X22 | Y2 | X2*Y | Y(x) | (Y-Yx)2 | |
1 | 20,33 | 1,84 | 3,39 | 413,31 | 37,41 | 22,53 | 4,85 |
2 | 26,46 | 2,65 | 7,02 | 700,13 | 70,12 | 29,65 | 10,20 |
3 | 23,40 | 1,93 | 3,72 | 547,56 | 45,16 | 23,32 | 0,01 |
4 | 26,37 | 2,24 | 5,02 | 695,38 | 59,07 | 26,05 | 0,10 |
5 | 18,60 | 1,61 | 2,59 | 345,96 | 29,95 | 20,51 | 3,65 |
6 | 32,03 | 2,70 | 7,29 | 1025,92 | 86,48 | 30,09 | 3,75 |
7 | 31,17 | 2,27 | 5,15 | 971,57 | 70,76 | 26,31 | 23,59 |
8 | 22,77 | 1,96 | 3,84 | 518,47 | 44,63 | 23,59 | 0,67 |
9 | 19,82 | 1,60 | 2,56 | 392,83 | 31,71 | 20,42 | 0,36 |
10 | 25,08 | 2,50 | 6,25 | 629,01 | 62,70 | 28,33 | 10,59 |
11 | 16,72 | 1,01 | 1,02 | 279,56 | 16,89 | 15,24 | 2,20 |
12 | 30,83 | 2,00 | 4,00 | 950,49 | 61,66 | 23,94 | 47,48 |
13 | 28,83 | 2,10 | 4,41 | 831,17 | 60,54 | 24,82 | 16,09 |
14 | 20,37 | 1,77 | 3,13 | 414,94 | 36,05 | 21,92 | 2,40 |
15 | 23,68 | 2,05 | 4,20 | 560,74 | 48,54 | 24,38 | 0,49 |
16 | 20,00 | 1,63 | 2,66 | 400,00 | 32,60 | 20,69 | 0,47 |
17 | 30,08 | 2,80 | 7,84 | 904,81 | 84,22 | 30,97 | 0,79 |
18 | 19,98 | 1,70 | 2,89 | 399,20 | 33,97 | 21,30 | 1,75 |
19 | 23,65 | 2,05 | 4,20 | 559,32 | 48,48 | 24,38 | 0,53 |
20 | 20,00 | 1,76 | 3,10 | 400,00 | 35,20 | 21,83 | 3,35 |
Разом | 480,17 | 40,17 | 84,29 | 11940,36 | 996,14 | 480,28 | 133,33 |
Середне | 24,01 | 2,01 | 4,21 | 597,02 | 49,81 | 24,01 | 6,67 |
За формулами вказаними вище розрахуємо коефіцієнти a0 та a1 :
Отже, рівняння кореляційного зв’язку між урожайністю зернових культур та внесеними мінеральними добривами має такий вигляд:
Економічний зміст цього рівняння такий: коефіцієнт регресії (a1 ) показує, що в досліджуваній сукупності господарств зі збільшенням внесення мінеральних добрив на 1ц, урожайність зростає в середньому на 8,79 ц. Параметр a0 , як вільний член рівняння має тільки розрахункове значення і не інтерпретується.
Таблиця 2. Вихідні і розрахункові дані для обчислення параметрів рівняння зв’язку між урожайністю зернових культур та якістю ґрунту
№ | Урожайність зернових, ц | Якість грунту, балів | Розрахункові величини | ||||
Y | X1 | X12 | Y2 | X1*Y | Y(x) | (Y-Yx)2 | |
1 | 20,33 | 58 | 3364,00 | 413,31 | 1179,14 | 21,49 | 1,35 |
2 | 26,46 | 82 | 6724,00 | 700,13 | 2169,72 | 29,32 | 8,16 |
3 | 23,40 | 70 | 4900,00 | 547,56 | 1638,00 | 25,41 | 4,02 |
4 | 26,37 | 80 | 6400,00 | 695,38 | 2109,60 | 28,67 | 5,27 |
5 | 18,60 | 52 | 2704,00 | 345,96 | 967,20 | 19,54 | 0,88 |
6 | 32,03 | 80 | 6400,00 | 1025,92 | 2562,40 | 28,67 | 11,32 |
7 | 31,17 | 80 | 6400,00 | 971,57 | 2493,60 | 28,67 | 6,28 |
8 | 22,77 | 48 | 2304,00 | 518,47 | 1092,96 | 18,23 | 20,58 |
9 | 19,82 | 59 | 3481,00 | 392,83 | 1169,38 | 21,82 | 4,00 |
10 | 25,08 | 72 | 5184,00 | 629,01 | 1805,76 | 26,06 | 0,95 |
11 | 16,72 | 46 | 2116,00 | 279,56 | 769,12 | 17,58 | 0,74 |
12 | 30,83 | 75 | 5625,00 | 950,49 | 2312,25 | 27,04 | 14,40 |
13 | 28,83 | 69 | 4761,00 | 831,17 | 1989,27 | 25,08 | 14,07 |
14 | 20,37 | 48 | 2304,00 | 414,94 | 977,76 | 18,23 | 4,57 |
15 | 23,68 | 71 | 5041,00 | 560,74 | 1681,28 | 25,73 | 4,21 |
16 | 20,00 | 58 | 3364,00 | 400,00 | 1160,00 | 21,49 | 2,23 |
17 | 30,08 | 81 | 6561,00 | 904,81 | 2436,48 | 28,99 | 1,19 |
18 | 19,98 | 58 | 3364,00 | 399,20 | 1158,84 | 21,49 | 2,29 |
19 | 23,65 | 71 | 5041,00 | 559,32 | 1679,15 | 25,73 | 4,33 |
20 | 20,00 | 57 | 3249,00 | 400,00 | 1140,00 | 21,17 | 1,36 |
Разом | 480,17 | 1315,00 | 89287,00 | 11940,36 | 32491,91 | 480,39 | 112,20 |
Середне | 24,01 | 65,75 | 4464,35 | 597,02 | 1624,60 | 24,02 | 5,61 |
За формулами вказаними вище розрахуємо коефіцієнти a0 та a1 :
Отже, рівняння кореляційного зв’язку між урожайністю зернових культур та якістю ґрунту має такий вигляд:
Економічний зміст цього рівняння такий: коефіцієнт регресії (a1 ) показує, що в досліджуваній сукупності господарств зі збільшенням якості ґрунту на 1 бал, урожайність зростає в середньому на 2,585 ц. Параметр a0 , як вільний член рівняння має тільки розрахункове значення і не інтерпретується.
Таблиця 3. Вихідні і розрахункові дані для обчислення показників варіації
№ п/п | Урожайність зернових, ц | Середні величини | |
Х-Хср | (Х-Хср)2 | ||
1 | 2 | 3 | 4 |
1 | 20,33 | 3,68 | 13,53 |
2 | 26,46 | 2,45 | 6,01 |
3 | 23,40 | 0,61 | 0,37 |
4 | 26,37 | 2,36 | 5,58 |
5 | 18,60 | 5,41 | 29,25 |
6 | 32,03 | 8,02 | 64,34 |
7 | 31,17 | 7,16 | 51,29 |
8 | 22,77 | 1,24 | 1,53 |
9 | 19,82 | 4,19 | 17,54 |
10 | 25,08 | 1,07 | 1,15 |
11 | 16,72 | 7,29 | 53,12 |
12 | 30,83 | 6,82 | 46,53 |
13 | 28,83 | 4,82 | 23,25 |
14 | 20,37 | 3,64 | 13,24 |
15 | 23,68 | 0,33 | 0,11 |
16 | 20,00 | 4,01 | 16,07 |
17 | 30,08 | 6,07 | 36,86 |
18 | 19,98 | 4,03 | 16,23 |
19 | 23,65 | 0,36 | 0,13 |
20 | 20,00 | 4,01 | 16,07 |
480,17 | 77,57 | 412,20 |
1.3 Оцінка тісноти зв’язку
Показниками щільності зв’язку при кореляції є коефіцієнт кореляції і коефіцієнт детермінації.
Коефіцієнти кореляції використовують для вимірювання щільності зв’язку між двома досліджуваними ознаками без урахування їх взаємодії з іншими ознаками.
У нашому випадку коефіцієнти кореляції дорівнюватимуть
1) між урожайністю зернових культур та кількістю внесених добрив:
2) між урожайністю зернових культур та якістю ґрунту:
Обчислені парні коефіцієнти кореляції показують, що урожайність зернових культур перебуває у щільному зв’язку як з кількістю внесених мінеральних добрив (0,8297), так і з якістю ґрунту (0,8528).
Коефіцієнт детермінації показує, яка частка варіації досліджуваного результативного показника зумовлена впливом факторa, включеного у рівняння регресії.
Коефіцієнт детермінації визначається за формулою:
Розділ 2. Аналіз простої нелінійної кореляції
2.1 Теоретичні основи аналізу нелінійної кореляції
Як зазначалося, при прямолінійній залежності спостерігається рівномірне збільшення (зменшення) результативної ознаки під впливом відповідної зміни факторної ознаки. В статистичній практиці трапляються і більш складні зв’язки, коли із зміною аргументу змінюється не тільки функція, а і її приріст.
Нелінійні форми зв’язку різні. В статистичному аналізі найчастіше використовують параболічну і гіперболічну форми зв’язку.
Якщо криволінійна залежність має форму параболи другого порядку, зв’язок виражають таким рівнянням:
де ух – теоретичні значення результативної ознаки; а0, а1, а2 – параметри рівняння; х – значення факторної ознаки.
Параметри а0, а1 і а2 визначають складанням і розв’язанням системи трьох рівнянь:
Щоб спростити розв’язання рівнянь, замість значень х введемо відхилення від середньої (х – х). Тоді рівняння матимуть такий вигляд:
Оскільки і дорівнюють нулю, то після відповідних спрощень дістанемо:
Тісноту зв’язку при криволінійних формах залежності визначають за індексом кореляції (кореляційного відношення):
де - між групова дисперсія; - загальна дисперсія.
Індекс кореляції змінюється в межах від 0 до +1, тобто завжди є додатною величиною. Він показує, яку частку у загальному середньоквадратичному відхиленні результативної ознаки становить середньоквадратичне відхилення факторної ознаки.
У статистичній практиці найчастіше використовують такі формули для обчислення індексу кореляції:
Індекс кореляції можна використовувати і для визначення тісноти зв’язку при прямолінійній залежності. В цьому разі абсолютна величина індексу кореляції збігається с лінійним коефіцієнтом кореляції. Якщо зв’язок криволінійний, то і r . Математично встановлено, що коли різниця між індексом кореляції і коефіцієнтом кореляції не перевищує 0,1, то гіпотезу про прямолінійність зв’язку можна вважати доведеною.
2.2 Аналіз регресії
Таблиця 5. Вихідні розрахункові дані для нелінійного кореляційного аналізу залежності урожайності зернових культур від якості ґрунту
№ з/п | Урожайність зернових, ц у | Якість грунту, балів х1 | Розрахункові данні | |||||
у | х | х-хср | (х-хср)2 | y(х-хср) | y(х-хср)2 | (x-xcp)4 | у(х) | |
1 | 20,33 | 58 | -7,75 | 60,06 | -157,56 | 1221,07 | 3607,50 | 21,59 |
2 | 26,46 | 82 | 16,25 | 264,06 | 429,98 | 6987,09 | 69729,00 | 29,15 |
3 | 23,40 | 70 | 4,25 | 18,06 | 99,45 | 422,66 | 326,25 | 25,55 |
4 | 26,37 | 80 | 14,25 | 203,06 | 375,77 | 5354,76 | 41234,38 | 28,57 |
5 | 18,60 | 52 | -13,75 | 189,06 | -255,75 | 3516,56 | 35744,63 | 19,46 |
6 | 32,03 | 80 | 14,25 | 203,06 | 456,43 | 6504,09 | 41234,38 | 28,57 |
7 | 31,17 | 80 | 14,25 | 203,06 | 444,17 | 6329,46 | 41234,38 | 28,57 |
8 | 22,77 | 48 | -17,75 | 315,06 | -404,17 | 7173,97 | 99264,38 | 18,00 |
9 | 19,82 | 59 | -6,75 | 45,56 | -133,79 | 903,05 | 2075,94 | 21,93 |
10 | 25,08 | 72 | 6,25 | 39,06 | 156,75 | 979,69 | 1525,88 | 26,18 |
11 | 16,72 | 46 | -19,75 | 390,06 | -330,22 | 6521,85 | 152148,75 | 17,25 |
12 | 30,83 | 75 | 9,25 | 85,56 | 285,18 | 2637,89 | 7320,94 | 27,10 |
13 | 28,83 | 69 | 3,25 | 10,56 | 93,70 | 304,52 | 111,57 | 25,24 |
14 | 20,37 | 48 | -17,75 | 315,06 | -361,57 | 6417,82 | 99264,38 | 18,00 |
15 | 23,68 | 71 | 5,25 | 27,56 | 124,32 | 652,68 | 759,69 | 25,87 |
16 | 20,00 | 58 | -7,75 | 60,06 | -155,00 | 1201,25 | 3607,50 | 21,59 |
17 | 30,08 | 81 | 15,25 | 232,56 | 458,72 | 6995,48 | 54085,32 | 28,86 |
18 | 19,98 | 58 | -7,75 | 60,06 | -154,85 | 1200,05 | 3607,50 | 21,59 |
19 | 23,65 | 71 | 5,25 | 27,56 | 124,16 | 651,85 | 759,69 | 25,87 |
20 | 20,00 | 57 | -8,75 | 76,56 | -175,00 | 1531,25 | 5861,82 | 21,24 |
Разом | 480,17 | 1 315,00 | 0,00 | 2825,75 | 920,73 | 67507,05 | 663503,89 | 480,17 |
Сер | 24,0085 | 65,75 | - | 141,29 | 46,04 | 3375,35 | 33175,19 | 24,01 |
Підставимо дані з таблиці 5 у систему рівнянь, та отримуємо таку систему рівнянь :
Знайдемо параметри:
а1=0,326
а2=-0,0013
а0=24,192
Отже, рівняння параболи другого порядку, що характеризує залежність урожайності зернових культур від якості ґрунту, матиме такий вигляд:
На відміну від прямолінійної залежності коефіцієнти регресії криволінійного зв’язку не можна інтерпретувати однозначно, оскільки швидкість зміни результативної ознаки при різних значеннях факторної ознаки не однакова. У нашому прикладі параметр а1=0,326 показує приріст урожайності залежно від якості ґрунту, а параметр а2=-0,0013 характеризує зниження урожайності.
Знайдемо індекс кореляції:
Таблиця 6. Вихідні розрахункові дані для нелінійного кореляційного аналізу залежності урожайності зернових культур від внесення мінеральних добрив
№ з/п | Урожайність зернових, ц у | Внесено мінеральних добртв, ц д. р. х2 | Розрахункові данні | |||||
у | х | х-хср | (х-хср)2 | y(х-хср) | y(х-хср)2 | (x-xcp)4 | у(х) | |
1 | 20,33 | 1,84 | -0,17 | 0,03 | -3,43 | 0,58 | 0,0008 | 22,63 |
2 | 26,46 | 2,65 | 0,64 | 0,41 | 16,97 | 10,89 | 0,1694 | 29,50 |
3 | 23,40 | 1,93 | -0,08 | 0,01 | -1,84 | 0,14 | 0,0000 | 23,43 |
4 | 26,37 | 2,24 | 0,23 | 0,05 | 6,10 | 1,41 | 0,0029 | 26,12 |
5 | 18,60 | 1,61 | -0,40 | 0,16 | -7,41 | 2,95 | 0,0252 | 20,52 |
6 | 32,03 | 2,70 | 0,69 | 0,48 | 22,15 | 15,32 | 0,2286 | 29,89 |
7 | 31,17 | 2,27 | 0,26 | 0,07 | 8,15 | 2,13 | 0,0047 | 26,38 |
8 | 22,77 | 1,96 | -0,05 | 0,00 | -1,10 | 0,05 | 0,0000 | 23,70 |
9 | 19,82 | 1,60 | -0,41 | 0,17 | -8,10 | 3,31 | 0,0278 | 20,43 |
10 | 25,08 | 2,50 | 0,49 | 0,24 | 12,33 | 6,06 | 0,0584 | 28,29 |
11 | 16,72 | 1,01 | -1,00 | 1,00 | -16,69 | 16,67 | 0,9940 | 14,71 |
12 | 30,83 | 2,00 | -0,01 | 0,00 | -0,26 | 0,00 | 0,0000 | 24,05 |
13 | 28,83 | 2,10 | 0,09 | 0,01 | 2,64 | 0,24 | 0,0001 | 24,92 |
14 | 20,37 | 1,77 | -0,24 | 0,06 | -4,86 | 1,16 | 0,0032 | 21,99 |
15 | 23,68 | 2,05 | 0,04 | 0,00 | 0,98 | 0,04 | 0,0000 | 24,49 |
16 | 20,00 | 1,63 | -0,38 | 0,14 | -7,57 | 2,87 | 0,0205 | 20,71 |
17 | 30,08 | 2,80 | 0,79 | 0,63 | 23,81 | 18,84 | 0,3925 | 30,68 |
18 | 19,98 | 1,70 | -0,31 | 0,10 | -6,16 | 1,90 | 0,0091 | 21,35 |
19 | 23,65 | 2,05 | 0,04 | 0,00 | 0,98 | 0,04 | 0,0000 | 24,49 |
20 | 20,00 | 1,76 | -0,25 | 0,06 | -4,97 | 1,24 | 0,0038 | 21,90 |
Разом | 480,17 | 40,17 | 0,00 | 3,61 | 31,72 | 85,84 | 1,9410 | 480,17 |
Сер | 24,0085 | 2,0085 | - | 0,18 | 1,59 | 4,29 | 0,0971 | 24,01 |
Підставимо дані з таблиці 5 у систему рівнянь, та отримуємо таку систему рівнянь :
Знайдемо параметри:
а1=8,787
а2=-0,645
а0=24,125
Отже, рівняння параболи другого порядку, що характеризує залежність урожайності зернових культур від якості ґрунту, матиме такий вигляд:
Параметр а1=8,787 показує приріст урожайності залежно від кількості внесених мінеральних добрив, а параметр а2=-0,645 характеризує зниження урожайності.
Знайдемо індекс кореляції:
кореляція регресія урожайність зерновий
Розділ 3. Аналіз урожайності зернових культур методом множинної кореляції
3.1. Теоретичні основи множинної кореляції
В практиці економічного аналізу частіше доводиться вивчати явища, які складаються під впливом не одного, а багатьох різних факторів, кожний х яких окремо може не справляти вирішального впливу. Спільний же вплив факторів іноді виявляється досить сильним, щоб за їх змінами можна було робити висновки про величину показника досліджуваного явища. Методи вимірювання кореляційного зв’язку одночасно між двома , трьома і більше корельованими ознаками становлять вчення про множинну кореляцію.
У моделях множинної кореляції залежна змінна Y розглядається як функція кількох (в загальному випадку) незалежних змінних .
Множинне кореляційне рівняння встановлює зв’язок між досліджуваними ознаками і дає змогу вирахувати очікувані значення результативної ознаки під дією включених в аналіз ознак-факторів, пов’язаних із даним рівнянням.
При вивченні множинного кореляційного зв’язку результативної ознаки із двома факторними аналітичне рівняння регресії має вигляд:
Параметри а 0, а 1 і а 2 розраховують за такою системою нормальних рівнянь:
В даному розділі досліджуватиметься залежність між продуктивністю корів, витратами корів та виходом телят.
На прикладі вихідної інформацію про надій на корову, витрати кормів на корову та вихід телят на корову, представленої у таблиці 16, розглянемо послідовність здійснення обчислювальних операцій, пов’язаних з дослідженням кореляційного аналізу.
3.2 Аналіз регресії
Таблиця 4. Вихідні і розрахункові дані для множинної кореляції
№ господарства | Урожайність зернових, ц у | Якість ґрунту, балів х1 | Внесено мінеральних добрив, ц д. р. х2 | Розрахункові величини | |||||||
y | |||||||||||
1 | 20,33 | 58 | 1,84 | 413,31 | 3364 | 3,39 | 1179,14 | 37,41 | 106,72 | 21,73 | 472,16 |
2 | 26,46 | 82 | 2,65 | 700,13 | 6724 | 7,02 | 2169,72 | 70,12 | 217,30 | 29,90 | 894,29 |
3 | 23,40 | 70 | 1,93 | 547,56 | 4900 | 3,72 | 1638,00 | 45,16 | 135,10 | 24,59 | 604,91 |
4 | 26,37 | 80 | 2,24 | 695,38 | 6400 | 5,02 | 2109,60 | 59,07 | 179,20 | 27,89 | 778,10 |
5 | 18,60 | 52 | 1,61 | 345,96 | 2704 | 2,59 | 967,20 | 29,95 | 83,72 | 19,58 | 383,33 |
6 | 32,03 | 80 | 2,70 | 1 025,92 | 6400 | 7,29 | 2562,40 | 86,48 | 216,00 | 29,68 | 880,85 |
7 | 31,17 | 80 | 2,27 | 971,57 | 6400 | 5,15 | 2493,60 | 70,76 | 181,60 | 28,01 | 784,61 |
8 | 22,77 | 48 | 1,96 | 518,47 | 2304 | 3,84 | 1092,96 | 44,63 | 94,08 | 20,10 | 403,92 |
9 | 19,82 | 59 | 1,60 | 392,83 | 3481 | 2,56 | 1169,38 | 31,71 | 94,40 | 21,01 | 441,33 |
10 | 25,08 | 72 | 2,50 | 629,01 | 5184 | 6,25 | 1805,76 | 62,70 | 180,00 | 27,23 | 741,24 |
11 | 16,72 | 46 | 1,01 | 279,56 | 2116 | 1,02 | 769,12 | 16,89 | 46,46 | 15,99 | 255,77 |
12 | 30,83 | 75 | 2,00 | 950,49 | 5625 | 4,00 | 2312,25 | 61,66 | 150,00 | 25,91 | 671,58 |
13 | 28,83 | 69 | 2,10 | 831,17 | 4761 | 4,41 | 1989,27 | 60,54 | 144,90 | 25,04 | 627,24 |
14 | 20,37 | 48 | 1,77 | 414,94 | 2304 | 3,13 | 977,76 | 36,05 | 84,96 | 19,36 | 374,84 |
15 | 23,68 | 71 | 2,05 | 560,74 | 5041 | 4,20 | 1681,28 | 48,54 | 145,55 | 25,27 | 638,58 |
16 | 20,00 | 58 | 1,63 | 400,00 | 3364 | 2,66 | 1160,00 | 32,60 | 94,54 | 20,91 | 437,42 |
17 | 30,08 | 81 | 2,80 | 904,81 | 6561 | 7,84 | 2436,48 | 84,22 | 226,80 | 30,28 | 916,69 |
18 | 19,98 | 58 | 1,70 | 399,20 | 3364 | 2,89 | 1158,84 | 33,97 | 98,60 | 21,19 | 448,85 |
19 | 23,65 | 71 | 2,05 | 559,32 | 5041 | 4,20 | 1679,15 | 48,48 | 145,55 | 25,27 | 638,58 |
20 | 20,00 | 57 | 1,76 | 400,00 | 3249 | 3,10 | 1140,00 | 35,20 | 100,32 | 21,21 | 449,83 |
Разом | 480,17 | 1315 | 40,17 | 11 940,36 | 89287 | 84,29 | 32491,91 | 996,14 | 2725,80 | 480,16 | 11844,09 |
Сер. | 24,01 | 65,75 | 2,01 | 597,02 | 4464,35 | 4,21 | 1624,60 | 49,81 | 136,29 | 24,01 | 592,20 |
У загальному вигляді формула лінійного рівняння множинної регресії така:
Оскільки у нашому випадку лише дві факторних ознаки то формула має вигляд:
Параметри рівняння множинної регресії обчислюють способом найменших квадратів розв’язанням системи рівнянь
Обчисливши цю систему отримуємо:
ц
ц
ц
Формула має вигляд:
Параметри а 1 і а 2 показують пропорцію впливу даних чинників x1 та x2 на результат y при умові, що всі інші чинники еліміновані (зафіксовані на постійному рівні).
Параметр а 1 (0,2097) показує, що при збільшенні якості ґрунту на 1 бал, урожайність зернових культур збільшиться на 0,2097ц, не залежно від внесення мінеральних добрив.
Параметр а 2 (2,428) показує, при збільшенні внесення мінеральних добрив на 1 ц, урожайність зернових культур збільшиться на 2,428 ц, незалежно від якості ґрунту.
Параметр а 0 (2,428) не має економічної інтерпретації. Він відображає вплив випадкових факторів, не врахованих в даному дослідженні.
3.3 Оцінка тісноти зв’язку
Показниками щільності зв’язку при множинній кореляції є парні, часткові і множинні (сукупні) коефіцієнти кореляції і множинний коефіцієнт детермінації.
Парні коефіцієнти кореляції використовують для вимірювання щільності зв’язку між двома досліджуваними ознаками без урахування їх взаємодії з іншими ознаками.
У нашому випадку коефіцієнти кореляції дорівнюватимуть
1) між урожайністю зернових культур та кількістю внесених добрив:
2) між урожайністю зернових культур та якістю ґрунту:
3) між кількістю внесених мінеральних добрив та якістю ґрунту
Обчислені парні коефіцієнти кореляції показують, що урожайність зернових культур перебуває у щільному зв’язку як з кількістю внесених мінеральних добрив (0,8297), так і з якістю ґрунту (0,8528). Існує також залежність між внесених мінеральних добрив та якістю ґрунту (0,843).
Часткові коефіцієнти кореляції характеризують щільність зв’язку результативної ознаки з однією факторною ознакою при умові, що інші факторні ознаки перебувають на постійному рівні.
Частковий коефіцієнти кореляції між ознаками y та x1 без урахування впливу ознаки x 2 визначають за формулою:
У нашому випадку частковий коефіцієнт кореляції між урожайністю зернових культур та кількістю внесених мінеральних добрив становитиме
частковий коефіцієнт кореляції між урожайністю зернових культур надоєм молока та якістю ґрунту становитиме
Додатні знаки перед частковими коефіцієнтами кореляції свідчать про пряму залежність між досліджуваними ознаками.
Коефіцієнт множинної детермінації показує, яка частка варіації досліджуваного результативного показника зумовлена впливом факторів, включених у рівняння множинної регресії. Він може мати значення від 0 до +1. Чим ближчий коефіцієнт множинної детермінації до одиниці, тим більше варіація результативного показника характеризується впливом відібраних факторів.
Коефіцієнт множинної детермінації визначається за формулою:
Коефіцієнт множинної детермінації показує, що 76,5% варіювання урожайності зернових культур у досліджуваних господарствах зумовлене включеними у кореляційну модель факторами: внесення мінеральних добрив та якість ґрунту. Решта коливання урожайності зернових культур (23,5%) зумовлена іншими, не включеними в кореляційну модель факторами.
Основним показником щільності зв’язку при множинній кореляції є коефіцієнт множинної (сукупної) кореляції, який може мати значення від 0 до +1. Формула його обчислення має такий вигляд:
Розділ 4. Непараметрична кореляція
Непараметричні методи визначення тісноти кореляційного зв’язку використовують, якщо характер розподілу досліджувальної сукупності невідомий. Особливістю цих методів є те, що коефіцієнт кореляції між ознаками визначають не за кількісними значеннями варіантів ознак, а за допомогою порівняння їх рангів. Під рангом розуміють порядковий номер відповідної одиниці сукупності у ранжируваному ряду. Чим менша розбіжність між порядковими номерами порівнюваних ознак, тим тісніший зв’язок між ними.
Непараметричні критерії використовують для вимірювання тісноти зв’язку якісних ознак, які не мають кількісного виразу, але їх можна ранжирувати. З непараметричних критеріїв тісноти зв’язку найчастіше застосовують коефіцієнт кореляції рангів і коефіцієнт Фехнера.
Коефіцієнт кореляції рангів обчислюють за формулою Спірмена:
де d – різниця між рангами елементів сукупності за першою і другою ознаками; n – кількість спостережень.
Коефіцієнт кореляції рангів може мати значення від 0 до +1 і від 0 до -1. Якщо обидва ряди рангів повністю збігаються, то d2=0 і коефіцієнт кореляції дорівнює +1. При повному зворотному зв’язку, коли ранги розташовані у зворотному порядку, коефіцієнт кореляції дорівнює -1.
Коефіцієнт Фехнера застосовують для оцінки тісноти зв’язку порівнянням знаків відхилень варіантів факторної і результативної ознак від середніх. Його визначають за такою формулою:
де З – кількість збігів; Н – кількість незбігів знаків у відхиленнях від середніх.
Коефіцієнт Фехнера змінюється від 0 до +1 і від 0 до -1. Якщо він дорівнює +1, то це означає, що повністю узгоджена пряма мінливість, при 0 – мінливість повністю не узгоджується, а при -1 – повна зворотна узгодженість мінливості. Слід мати на увазі, що коефіцієнт Фехнера враховує тільки напрям варіації і не враховує її величину, в зв’язку з чим оцінка тісноти зв’язку є приблизною.
Таблиця 7. Вихідні розрахункові дані для обчислення коефіцієнта рангової кореляції (формула Спірмена)
№ з/п | Якість грунту, балів х1 | Внесено мінеральних добртв, ц д. р. х2 | Різниця рангів | Квадрат різниці |
R(x) | R(y) | d | d2 | |
1 | 6 | 8 | 2 | 4 |
2 | 20 | 18 | -2 | 4 |
3 | 11 | 9 | -2 | 4 |
4 | 16 | 15 | -1 | 1 |
5 | 4 | 3 | -1 | 1 |
6 | 17 | 19 | 2 | 4 |
7 | 18 | 16 | -2 | 4 |
8 | 2 | 10 | 8 | 64 |
9 | 9 | 2 | -7 | 49 |
10 | 14 | 17 | 3 | 9 |
11 | 1 | 1 | 0 | 0 |
12 | 15 | 11 | -4 | 16 |
13 | 10 | 14 | 4 | 16 |
14 | 3 | 7 | 4 | 16 |
15 | 12 | 12 | 0 | 0 |
16 | 7 | 4 | -3 | 9 |
17 | 19 | 20 | 1 | 1 |
18 | 8 | 5 | -3 | 9 |
19 | 13 | 13 | 0 | 0 |
20 | 5 | 6 | 1 | 1 |
Разом | 210 | 210 | 0 | 212 |
Підставивши дані таблиці 7 у формулу Спірмена дістанемо:
Обчислений коефіцієнт кореляції рангів свідчить про прямий тісний зв’язок між якістю ґрунту та кількістю внесених мінеральних добрив.
Таблиця 8. Розрахунок коефіцієнта Фехнера для х1
№ з/п | Урожайність зернових, ц у | Якість грунту, балів х1 | Знаки відхилення за ознаками | Збіг знаків | ||
Факторною | Результативною | Так | Ні | |||
y | x | х-хср | у-уср | З | Н | |
1 | 20,33 | 58 | - | - | З | |
2 | 26,46 | 82 | + | + | З | |
3 | 23,40 | 70 | + | - | Н | |
4 | 26,37 | 80 | + | + | З | |
5 | 18,60 | 52 | - | - | З | |
6 | 32,03 | 80 | + | + | З | |
7 | 31,17 | 80 | + | + | З | |
8 | 22,77 | 48 | - | - | З | |
9 | 19,82 | 59 | - | - | З | |
10 | 25,08 | 72 | + | + | З | |
11 | 16,72 | 46 | - | - | З | |
12 | 30,83 | 75 | + | + | З | |
13 | 28,83 | 69 | + | + | З | |
14 | 20,37 | 48 | - | - | З | |
15 | 23,68 | 71 | + | - | Н | |
16 | 20,00 | 58 | - | - | З | |
17 | 30,08 | 81 | + | + | З | |
18 | 19,98 | 58 | - | - | З | |
19 | 23,65 | 71 | + | - | Н | |
20 | 20,00 | 57 | - | - | З | |
Разом | 480,17 | 1 315,00 | - | - | 17 | 3 |
Сер | 24,0085 | 65,75 | - | - | - | - |
Підставивши дані таблиці 8 у формулу Фехнера, матимемо:
Обчислений коефіцієнт свідчить про помітний прямий зв’язок урожайністю зернових культур та якістю ґрунту.
Таблиця 9. Розрахунок коефіцієнта Фехнера для х2
№ з/п | Урожайність зернових, ц у | Внесено мінеральних добртв, ц д. р. х2 | Знаки відхилення за ознаками | Збіг знаків | ||
Факторною | Результативною | Так | Ні | |||
y | x | х-хср | у-уср | З | Н | |
1 | 20,33 | 1,84 | - | - | З | |
2 | 26,46 | 2,65 | + | + | З | |
3 | 23,40 | 1,93 | - | - | З | |
4 | 26,37 | 2,24 | + | + | З | |
5 | 18,60 | 1,61 | - | - | З | |
6 | 32,03 | 2,70 | + | + | З | |
7 | 31,17 | 2,27 | + | + | З | |
8 | 22,77 | 1,96 | - | - | З | |
9 | 19,82 | 1,60 | - | - | З | |
10 | 25,08 | 2,50 | + | + | З | |
11 | 16,72 | 1,01 | - | - | З | |
12 | 30,83 | 2,00 | - | + | Н | |
13 | 28,83 | 2,10 | + | + | З | |
14 | 20,37 | 1,77 | - | - | З | |
15 | 23,68 | 2,05 | + | - | Н | |
16 | 20,00 | 1,63 | - | - | З | |
17 | 30,08 | 2,80 | + | + | З | |
18 | 19,98 | 1,70 | - | - | З | |
19 | 23,65 | 2,05 | + | - | Н | |
20 | 20,00 | 1,76 | - | - | З | |
Разом | 480,17 | 40,17 | - | - | 17 | 3 |
Сер | 24,0085 | 2,0085 | - | - | - | - |
Підставивши дані таблиці 9 у формулу Фехнера, матимемо:
Обчислений коефіцієнт свідчить про помітний прямий зв’язок урожайністю зернових культур та кількістю внесених мінеральних добрив.
Висновк и
Дослідивши задану сукупність господарств за їх результативними ознаками ми можемо зробити такі висновки.
Проведені розрахунки парної кореляції дозволяють нам висновити, що: зі збільшенням внесення мінеральних добрив на 1ц, урожайність зростає в середньому на 8,79 ц; а також зі збільшенням якості ґрунту на 1 бал, урожайність зростає в середньому на 2,585 ц.
Провівши розрахунки множинної кореляції ми бачимо, що врожайність залежить від внесення органічних добрив та якістю ґрунту на 76,5 %. Решта коливання урожайності зернових культур (23,5%) зумовлена іншими, не включеними в кореляційну модель факторами.
На основі проведених розрахунків можна зробити висновок, що урожайність тісно пов’язана з кількістю внесених органічних добрив та якістю ґрунту.
Список використаної літератури
1. Вашків П.Г., Пастер П.І., Сторожук В.П., Ткач Є.І. Теорія статистики: Навч. посібник. – К.: Либідь, 2001. – 320 с.
2. Горкавий В.К. Статистика: Підручник. – К.: Вища школа, – 415 с.
3. Опря А.Т. Статистика: (з програмованою формою контролю знань). – К.: Урожай, 1996 – 448 с.
4. Чекотовський Е.В. Основи статистики сільського господарства: Навч. посібник. — К.: КНЕУ, 2001. — 432 с.