От Андрей
К Alexeich
Дата 20.08.2023 17:40:21
Рубрики Современность;

Re: Ход наступления...

>>>Лостармор нашел некрологов в 100 раз меньше на две буквы алфавита.
>>А сколько в нем букв и используемых в качестве первой буквы фамилии?
>
>Первые 2 буквы дают ок. 10% от всей выборки.

Не совсем.

По украинским фамилиям найти данных не удалось, но в русском фамилии на С встречаются в 2 раза чаще чем на А. Я имею в виду, что в списке 250 наиболее распространенных русских фамилий Е.В. Балановской, фамилий на С - 25, а фамилий на А - 12.

Фамилии на С это 30 человек из 1000, а фамилии на А это 9 чел на 1000, фамилии на Б это 14,12 чел на 1000. Итого А-Б не дотягивают по частотности до С. Т.е. учет фамилий только на С даст увеличение списка в 2+ раза.

Приходите к нам с мечом, не пожалеете.

От tarasv
К Андрей (20.08.2023 17:40:21)
Дата 20.08.2023 22:59:28

Re: Ход наступления...

>>Первые 2 буквы дают ок. 10% от всей выборки.
>Не совсем.
>По украинским фамилиям найти данных не удалось, но в русском фамилии на С встречаются в 2 раза чаще чем на А.

Частоты носителей по первой букве в первой сотне самых распространенных украинских фамилий

К 21.8%
М 11.6%
П 11.3%
Б 7.8%
Т 7.3%
Ш 6.3%
С 5.3%

Начинающихся на букву А в первой сотне вообще нет. Б много, потому что Бойко и Бондаренко в первой пятерке плюс их вариации. Лучше было бы первых 250-300. Но сайт с числами носителей фамилий по данным украинской паспортной системы поменяли и теперь он показывает только первую сотню и карту распространенности для одной.

Орфографический словарь читал - не помогает :)

От Андрей
К tarasv (20.08.2023 22:59:28)
Дата 21.08.2023 18:19:10

Судя по всему...

> Частоты носителей по первой букве в первой сотне самых распространенных украинских фамилий

>К 21.8%
>М 11.6%
>П 11.3%
>Б 7.8%
>Т 7.3%
>Ш 6.3%
>С 5.3%

Это все же промилле, а не проценты.

Самая распространенная фамилия на Украине, это Мельник почти 300 тыс. носителей. Данные взяты отсюда
https://xn--80aqaane8c.com/ukraina Правда какое-то странное распределение, отдельно считаются мужские и женские фамилии (Новикова и Новиков, и т.д.).

Приходите к нам с мечом, не пожалеете.

От talex
К Андрей (21.08.2023 18:19:10)
Дата 23.08.2023 01:06:30

Re: Судя по

тут больше
https://forebears.io/ukraine/surnames

От Андрей
К tarasv (20.08.2023 22:59:28)
Дата 21.08.2023 17:51:29

Re: Ход наступления...

>>>Первые 2 буквы дают ок. 10% от всей выборки.
>>Не совсем.
>>По украинским фамилиям найти данных не удалось, но в русском фамилии на С встречаются в 2 раза чаще чем на А.
>
> Частоты носителей по первой букве в первой сотне самых распространенных украинских фамилий

>К 21.8%
>М 11.6%
>П 11.3%
>Б 7.8%
>Т 7.3%
>Ш 6.3%
>С 5.3%

А это точно проценты, а не промилле, т.е. 21,8 чел на 1000 чел населения?

> Начинающихся на букву А в первой сотне вообще нет. Б много, потому что Бойко и Бондаренко в первой пятерке плюс их вариации. Лучше было бы первых 250-300. Но сайт с числами носителей фамилий по данным украинской паспортной системы поменяли и теперь он показывает только первую сотню и карту распространенности для одной.

Печально.

У меня поиск по частотности украинских фамилий выдает сайты с результатами русских фамилий.(

>Орфографический словарь читал - не помогает :)
Приходите к нам с мечом, не пожалеете.

От tarasv
К Андрей (21.08.2023 17:51:29)
Дата 22.08.2023 00:49:13

Re: Ход наступления...

>А это точно проценты, а не промилле, т.е. 21,8 чел на 1000 чел населения?

Проценты конечно. Букв то всего 3 десятка, равномерное распределение будет 3% на каждую.

Орфографический словарь читал - не помогает :)

От Андрей
К tarasv (22.08.2023 00:49:13)
Дата 22.08.2023 19:06:24

Re: Ход наступления...

> Проценты конечно. Букв то всего 3 десятка, равномерное распределение будет 3% на каждую.

Разумеется это не так. Хотя бы потому, что распределение не равномерное.

>Орфографический словарь читал - не помогает :)
Приходите к нам с мечом, не пожалеете.

От Elliot
К Андрей (22.08.2023 19:06:24)
Дата 22.08.2023 22:29:23

Re: Ход наступления...

>> Проценты конечно. Букв то всего 3 десятка, равномерное распределение будет 3% на каждую.
>
>Разумеется это не так. Хотя бы потому, что распределение не равномерное.

Разумеется, это так. Хотя бы потому, что при неравномерном распределении самая частотная буква не может дать менее этих самых 3%. Математика против, увы.

P.S.: С тем, что 22%% строго меньше 3% вы спорить, надеюсь, не будете?