От zero1975 Ответить на сообщение
К Alexeich Ответить по почте
Дата 07.07.2022 00:24:30 Найти в дереве
Рубрики Современность; Версия для печати

Re: мне приходилось...

>>Вы разницу между количественной репрезентативностью и структурной - понимаете?

>Предположим что нет. Говорите прямо, что хотите сказать.

Полагаю, вы меня прекрасно поняли (тем более, что это не первое сообщение на тему), но ладно. Я фразу про структурную репрезентативность написал в ответ на вот это ваши слова: "ученых они опросили, по-видимому, 20 человек ... Но это вполне релевантная выборка".

Поясняю:
Если быть уверенным в том, что из всей совокупности исследуемая выборка взята заведомо случайным образом, то можно делать обоснованные выводы о её репрезентативности - можно даже посчитать вероятности получения ошибок для разных их величин (ЕМНИП, достаточно знать характеристики распределения в выборке, объём всей совокупности и объём выборки). Но это - лишь количественная репрезентативность. На практике говорить о ней имеет смысл лишь в каких то специфических случаях, т.к. обычно ошибки, связанные с количественной репрезентативностью ничтожны в сравнении со структурными.

Проблема структурной репрезентативности - это как раз проблема "случайного" характера выборки по отношению ко всей совокупности. Это проблема появления фильтров, искажающих случайный отбор. Эти фильтры бывают очевидными: например, когда я возьму агропробы на краях поля, чтобы не топтать посевы - я явным образом нарушу структурную репрезентативность выборки (она будет представлять лишь состояние посевов вдоль дороги). Это вполне понятное искажение и оно легко обходится методикой взятия проб. Но даже для мест взятия выборки, есть и неявные структурные искажения - например, когда в исследование не попадает какая-то отличающаяся область, о существовании которой мы не знаем. Или наоборот - она попадает в исследование и составляет в отобранной пробе слишком большую часть. Таким фильтром может быть и время - когда исследование, проведённое за один-два сезона, не позволяет охватить всё разнообразие климатических условий.
Фильтр может быть связан и с оборудованием: у меня, например, был случай, когда тензоаппаратура выходила из строя при высоких вибрациях - вполне себе фильтр, искажающий структуру выборки.

В вашем случае, я вижу минимум два фильтра - это формирование базы данных телефонных номеров (кто и как её получал, не отражает ли она чей то круг общения, чью-то клиентуру или сделанный другим образом неслучайный отбор) и фильтр, связанный с желанием или нежеланием вести беседу на специфические темы (об этом я раньше написал достаточно).

В таких ситуациях количественная репрезентативность, о которой вы говорили - просто теряет смысл. Неважно, каков объём выборки, если она получена неслучайным образом (а эта "неслучайность" может быть вовсе не очевидной). Гипотезу о "случайности" сделанной выборки, о её репрезентативности по отношению к совопукности - надо доказывать. И это - настоящая головная при исследовании, т.к. для того, чтобы определить наличие или отсутствие описанных выше "фильтров", чтобы оценить их влияние - надо знать характеристики всей совокупности. Получается замкнутый круг.

И когда вы говорите, что в трёх "независимых" исследованиях получены настолько близкие цифры (84%, 85% и 86%) - мне становится грустно. Простите, но я не верю в возможность проведения исследования с такой феноменальной точностью. Не говоря о том, что сам исследуемый параметр константой отнюдь не является. Поэтому для меня такое совпадение - не признак точности, а явный, вопиющий признак либо подлога, либо неумышленного искажения (например, проведение исследования на одной и той же базе телефонных номеров).