Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

added russian first/second name order normalization (second name first) #1147

Closed
wants to merge 2 commits into from

Conversation

dbl0null
Copy link

Мотивация:

Список в произвольном формате выглядит неопрятно
У кого-то Фамилия Имя, у кого-то Имя Фамилия:

| 1    | Щербаков Дмитрий                   | Программист г. Тула                     |
| 2    | Vasiliy Vyatkin                    | Frontend-developer, Fastdev AB          |
| 3    | Дмитрий Кошелев                    | Fullstack WEB разработчик               |
| 4    | Ермаков Данила                     | Backend Developer, Moneywall            |

Было бы не плохо постараться привести всё ко всем привычному и стандартному виду Фамилия Имя. Так человек привыкший работать с документами или просто случайный прохожий, увидев наш список не будет шокирован разнообразием.

Предложение:

Взять список всех известных имен.
Для каждого подписавшегося проверять, не попадает ли левая часть его подписи (где должна находиться Фамилия) в список.
Если да - менять местами.

Сразу замечу что особо редкие имена или имена написанные латиницей будут пропускаться без изменений.

Таким образом верхний пример будет приведен к виду:

| 1    | Щербаков Дмитрий                   | Программист г. Тула                     |
| 2    | Vasiliy Vyatkin                    | Frontend-developer, Fastdev AB          |
| 3    | Кошелев Дмитрий                    | Fullstack WEB разработчик               |
| 4    | Ермаков Данила                     | Backend Developer, Moneywall            |

Список имен взят с сайта searchnames.ru

@hookzof hookzof added the enhancement New feature or request label Sep 19, 2019
@lemenkov
Copy link
Contributor

LGTM.

@steils
Copy link
Contributor

steils commented Sep 19, 2019

Привычный и стандартный видъ въ русскомъ языкѣ — Имя [Отчество] Фамилія. Фамилія на первомъ мѣстѣ — совѣтско-канцелярскій видъ.

@Fewald
Copy link
Contributor

Fewald commented Sep 19, 2019

Мне больше нравится Имя Фамилия, чем Фамилия Имя, но поменять местами потом не трудно, сейчас разнобой портит качество данных.

@gf-mse
Copy link
Contributor

gf-mse commented Sep 20, 2019

Если честно, не вижу ничего ужасного в разнобое. ( И -- да, лично я бы предпочел подписываться как Имя Фамилия ; мораль -- эстетика, как зопа -- у всех есть, и у каждого своя )

зы. хотя решение красивое, чо уж

@bruno-gelb
Copy link
Contributor

bruno-gelb commented Sep 20, 2019

  1. there's no need for that. "Some soviet-minded bureaucrat would dislike" is not a suitable motivation to change a way person signed himself / herself (you have no right at all to change that, actually), and it's definitely not a suitable motivation for any technical action.
  2. suggested implementation is based on some random list of names from some random website. Is this your first day in software development? If so, I strongly recommend you to read Falsehoods Programmers Believe About Names first.

@gf-mse
Copy link
Contributor

gf-mse commented Sep 20, 2019

1. there's no need for that. _"Some bureaucrat would dislike that"_ is not a suitable motivation to change a way person signed himself / herself (you have no right at all to change that, actually).

2. suggested implementation is based on some random list of names from some random website. Is this your first day in software development? If so, I strongly recommend you to read [Falsehoods Programmers Believe About Names](https://www.kalzumeus.com/2010/06/17/falsehoods-programmers-believe-about-names/) first.

Strictly speaking, both points here are arguable.

First, in a sense we are trying here to impress some bureaucrats. (Let us not forget that the ultimate goal here get these people out of jail, not so much to express ourselves -- albeit that admittedly is fun.)

Next, formally speaking nobody talks here about changing the signature, right? The signature files are, as far as I know, let untouched. This proposal is merely about representing the data, what is, to my knowledge, a gray area -- especially since even the question of jurisdiction regarding this Letter is probably something closer to the area of expertise of a lawyer, but not of a programmer.

Finally, it does not look like an unbearable problem to make a fairly exhaustive list of well-known Cyrillic names, even if the proposed website is not a definitive source for it. ( And I must admit that the technical side of the proposal looks rather bright to me -- despite that the idea itself looks a little ill-posed. )

However, I am with you on the conclusion that it probably won't worth doing -- and yes, if the plan is to share this with the rest of the world, then all the remarks from the referenced article are indeed quite relevant. ( And very similar points, shall I humbly note as an off-topic, would be largely true about a (postal) address. )

@roadkell
Copy link
Contributor

Как вариант, распарсить список (если это и впрямь так просто, как считает @gf-mse ), собрать в базу, а отображаемую таблицу сделать динамической (оригинал, ФИО, ИОФ, ...). Пусть журналисты и другие посетители выбирают представление на свой вкус. С сортировкой то же самое.

@gf-mse
Copy link
Contributor

gf-mse commented Sep 21, 2019

@gf-mse не считает, что это просто -- скорее, он это делал ( для другого языка, 7-8 лет назад ; это были объемы, меньшие, чем неявно имеются в виду в указанной статье, но большие, чем число подписантов на сегодня: речь буквально шла о населении небольшого города ) и обоснованно полагает, что в этом нет ничего невозможного.

Также мне кажется, что это излишнее усложнение проекта )

Ну то есть у нас есть хорошо если полчаса-час в неделю, чтобы этим всем заниматься ( я сейчас трачу больше, но я в недлинном отпуске ), и мне кажется значительно более продуктивным потратить время на то, чтобы найти хорошие англоязычные эквиваленты русскоязычных ссылок -- так, чтобы мы могли предложить англоговорящим коллегам поучаствовать ( #2114 )

@gf-mse gf-mse mentioned this pull request Sep 21, 2019
@loalexandra
Copy link
Collaborator

Спасибо всем за участие.

Мы решили не делать нормализацию, так как считаем, что это избыточно, и имена должны остаться в том виде, в котором их записали владельцы.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

Successfully merging this pull request may close these issues.

9 participants