Образование и доход
Начинающий исследователь Василий однажды читал научную статью, где изучалась связь активности хомячков (в часах в среднем в течение суток) и их массы. Там приводился следующий график:

Точками здесь обозначены отдельные хомячки, а прямая построена так, что она лежит как можно ближе к точкам. Прямая имеет уравнение y=40-2,5x, из чего авторы исследования сделали вывод, что увеличение активности на час в среднем уменьшает массу хомячка на 2,5 грамма.
Василий решил использовать эту технику, чтобы оценить влияние образования людей на на их доход. Для этого он опросил 1000 человек, спрашивая у каждого, сколько тот зарабатывает (переменная Income) и каков его последний на данный момент уровень образования (переменная Education). Переменная Education для каждого человека принимает одно из 5 значений:

Построив рядом с полученными точками прямую так же, как было сделано в исследовании, которое он читал, Василий обнаружил, что ее уравнение имеет вид Income=−10+20*Education (это уравнение прямой, самой близкой к точкам на графике), то есть каждая ступень образования в среднем увеличивает доход на 20 тысяч рублей в месяц.
Исследование, проведенное Василием, не свободно от недостатков. Вам нужно высказать содержательную критику по следующим пунктам:
а) ( 3 балла) Кодируя уровень образования цифрами от 1 до 5, Василий неявно предполагает очень специфическую форму зависимости дохода от образования. Объясните, какую форму зависимости предполагает Василий, почему так лучше не делать и как ему стоило бы правильно учесть образование в своей модели?
б) ( 3 балла) Во-вторых, Василий не учел все факторы, которые могут влиять на доход. Какие? Предложите, как надо было организовать исследование, чтобы корректно измерить влияние образования на доход.
а) Василий предполагает линейную форму зависимости.
Такой подход неудачен, поскольку нет оснований предполагать, что рост образования на одну ступень всегда одинаково (линейно) увеличивает доход.
Чтобы избавиться от этого недостатка, нужно либо рассматривать не уровни, а количество лет, которое человек отучился, либо вычислять уровни по данным.
б) На доход влияют, например, такие факторы: личные характеристики, пол, возраст, специальность, место жительства и т. д.
Учесть их можно одним из двух способов:
Способ 1. Взять выборку из людей с одинаковыми «прочими» характеристиками (схожего возраста, профессии и так далее) и сравнивать для них влияние образования на доход.
Способ 2. Построить модель, в которую одновременно будут входить все интересующие нас факторы.