-
Notifications
You must be signed in to change notification settings - Fork 1.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
added russian first/second name order normalization (second name first) #1147
added russian first/second name order normalization (second name first) #1147
Conversation
LGTM. |
Привычный и стандартный видъ въ русскомъ языкѣ — Имя [Отчество] Фамилія. Фамилія на первомъ мѣстѣ — совѣтско-канцелярскій видъ. |
Мне больше нравится Имя Фамилия, чем Фамилия Имя, но поменять местами потом не трудно, сейчас разнобой портит качество данных. |
Если честно, не вижу ничего ужасного в разнобое. ( И -- да, лично я бы предпочел подписываться как Имя Фамилия ; мораль -- эстетика, как зопа -- у всех есть, и у каждого своя ) зы. хотя решение красивое, чо уж |
|
Strictly speaking, both points here are arguable. First, in a sense we are trying here to impress some bureaucrats. (Let us not forget that the ultimate goal here get these people out of jail, not so much to express ourselves -- albeit that admittedly is fun.) Next, formally speaking nobody talks here about changing the signature, right? The signature files are, as far as I know, let untouched. This proposal is merely about representing the data, what is, to my knowledge, a gray area -- especially since even the question of jurisdiction regarding this Letter is probably something closer to the area of expertise of a lawyer, but not of a programmer. Finally, it does not look like an unbearable problem to make a fairly exhaustive list of well-known Cyrillic names, even if the proposed website is not a definitive source for it. ( And I must admit that the technical side of the proposal looks rather bright to me -- despite that the idea itself looks a little ill-posed. ) However, I am with you on the conclusion that it probably won't worth doing -- and yes, if the plan is to share this with the rest of the world, then all the remarks from the referenced article are indeed quite relevant. ( And very similar points, shall I humbly note as an off-topic, would be largely true about a (postal) address. ) |
Как вариант, распарсить список (если это и впрямь так просто, как считает @gf-mse ), собрать в базу, а отображаемую таблицу сделать динамической (оригинал, ФИО, ИОФ, ...). Пусть журналисты и другие посетители выбирают представление на свой вкус. С сортировкой то же самое. |
@gf-mse не считает, что это просто -- скорее, он это делал ( для другого языка, 7-8 лет назад ; это были объемы, меньшие, чем неявно имеются в виду в указанной статье, но большие, чем число подписантов на сегодня: речь буквально шла о населении небольшого города ) и обоснованно полагает, что в этом нет ничего невозможного. Также мне кажется, что это излишнее усложнение проекта ) Ну то есть у нас есть хорошо если полчаса-час в неделю, чтобы этим всем заниматься ( я сейчас трачу больше, но я в недлинном отпуске ), и мне кажется значительно более продуктивным потратить время на то, чтобы найти хорошие англоязычные эквиваленты русскоязычных ссылок -- так, чтобы мы могли предложить англоговорящим коллегам поучаствовать ( #2114 ) |
Спасибо всем за участие. Мы решили не делать нормализацию, так как считаем, что это избыточно, и имена должны остаться в том виде, в котором их записали владельцы. |
Мотивация:
Список в произвольном формате выглядит неопрятно
У кого-то Фамилия Имя, у кого-то Имя Фамилия:
Было бы не плохо постараться привести всё ко всем привычному и стандартному виду Фамилия Имя. Так человек привыкший работать с документами или просто случайный прохожий, увидев наш список не будет шокирован разнообразием.
Предложение:
Взять список всех известных имен.
Для каждого подписавшегося проверять, не попадает ли левая часть его подписи (где должна находиться Фамилия) в список.
Если да - менять местами.
Сразу замечу что особо редкие имена или имена написанные латиницей будут пропускаться без изменений.
Таким образом верхний пример будет приведен к виду:
Список имен взят с сайта searchnames.ru