-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
переименования аффиксов #201
Comments
Соответственно, NF₀ -> NF.0 ?
То есть обычного Abl не остается, только диалектный?
Мне не очень нравится использование кириллицы в тегах. Технически работать пока что будет, но отчего-то не нравится.
Наверное, Dur1.sag , без .dial? |
Переименовал пока как есть |
С аблативом ошиблась - есть обычный ДАң, а есть диалектный нАң. |
Вера, хорошо бы точка в условных обозначениях (а зачем она?) отличалась от точки, обозначающей кумуляцию
|
Да, это интересный вопрос, надо подумать. Точка - чтобы различать два
слова. Не всякий почленит, если Pressh написать без точки.
|
Стало совсем непонятно. Есть обычный ДАң, поссессивный нАң, диалектный обычный нАң и диалектный посессивный нАң?
Это можно.
Это нельзя. Как лучше? |
пн, 3 мая 2021 г. в 18:29, Phil Krylov ***@***.***>:
С аблативом ошиблась - есть обычный ДАң, а есть диалектный нАң.
Стало совсем непонятно. Есть обычный ДАң, поссессивный нАң, диалектный
обычный нАң и диалектный посессивный нАң?
Нет, посессивный один.
NF₀ -> NF0 тогда уж, без точки. Но лучше просто NF - объединить с
вариантом Ып под одним тегом, как *и* и *ир*, допустим.
Это можно.
Опять же, в поиске хорошо бы оставить 2 варианта, а в самом парсере один -
если так можно.
Это нельзя.
Как лучше?
Лучше, конечно, как можно - как нельзя все равно нельзя.
|
ок
Можно - оставить отдельно NF0 и NF и в парсере, и в поиске, либо объединить их и в парсере, и в поиске. |
Ну давайте попробуем объединить.
В таблице аффиксов вижу странное:
- All.dial СА | САрЫ
- All.dial1 (н)САрЫ
- All.dial2 (н)СА
-
Надо или сделать один All.dial, или, что лучше, All.dial1 СА | (н) СА +
All.dial2 САрЫ | (н)САрЫ.
|
Да, еще в позиции 13 не Pl₂ ЛАр, а просто Pl.
|
И почему-то Perf0 уехал в слот 5, хотя он должен быть в одном слоте с
обычным Perf.
|
Еще заметила: в таблице поиска нумерация слотов начинается с 0, а должна с
1 (т.к. 0 - это основа).
И хорошо бы уменьшить количество личных окончаний: т.к. варианты mix
совпадают либо с br, либо с full, лучше их убрать, а выбор варианта описать
правилами (mix = 1sg.br + др.лица в полных формах). В реальности во многих
формах первое лицо варьирует, поэтому получается лишняя омонимия (одно и то
же слово типа парғазың получает 2 разбора, в одном из которых 2sg.mix, в
другом - 2sg(.full)). Могу убрать из таблицы формы mix, если все согласны,
что можно без них.
|
Да, я согласна
|
Так, сейчас все вышесказанное сделано, кроме окончаний серии mix. |
Решили выбрать для дополнительных форм цифру 1, некумулятивную точку убрать. Убрать цифру 3 из глосс частиц в конце словоформы, потому что это их дефолтное место (аналогично Pl вместо Pl2). И еще некоторые мелочи. Таким образом, надо переназвать следующее: |
И еще Abl.arch -> AblArch |
Это сейчас так и надо исправить.
Это тоже уже пора. Зачеркнула в таблице окончания .mix.
Нашла в письмах такое предложение: Imp.1.Incl заменить на ImpIncl, Imp.1pl.Incl заменить на ImpIncl.Pl. Исправила в таблице. Еще в некоторый момент переименовали Affirm в Vis (визибилитив), поправила название позиции 18 в таблице. |
Вернула вид (Ы)м (вместо м) показателю 1sg.br, т.к. если убрать серию mix, формы типа парарым 'уйду' анализироваться не будут. |
не sg, а pl? |
Да, pl конечно.
|
Нуждается в обновлении ограничение 20, перестали разбираться: |
В правиле 20 все верно написано: "Cмешанный набор форм (1sg.br + др.лица в полных формах) присоединяется к аффиксам: Pres чА ..." и т.д. Надо научить парсер склеивать парадигму из указанных форм. |
Не стал учить, просто переименовал 1sg.mix в 1sg.br, а остальные .mix - без .mix, а правила оставил старые. |
По старым правилам часто выходило два разбора: через full (которые непомечены) и через mix. Если сейчас не будет по 2 одинаковых разбора выдаваться, то ладно. |
не надо ли тогда претерит лишить I?
|
В текущем описании нет ни претерита, ни I. Поясни конкретнее, что имеется в
виду?
… не надо ли тогда претерит лишить I?
|
прошедшее на -ды
…Пятница, 27 мая 2022, 0:05 +03:00 от veramal ***@***.***>:
В текущем описании нет ни претерита, ни I. Поясни конкретнее, что имеется в
виду?
|
Можно закрывать? |
Нет, т.к. проблема двух разборов не исччезла, а усугубилась - теперь они
совершенно одинаковые:
килчебіс <https://khakas.altaica.ru/grammar/#>
*v* килерге ‛приходить’ кил
--0̸------чА----------ПЫс---
--NF------Pres----------1pl---
*v* килерге ‛приходить’ кил
--0̸------чА----------ПЫс---
--NF------Pres----------1pl---
|
Поправил, дубли убрались |
Хорошо. |
Убилось лишнее по дороге: 1pl.br ПЫс был ошибочно зачеркнут, в результате сейчас не разбираются полдыбыс и ползабыс. В документе исправила. Поправь в корпусе, пожалуйста. |
И чего его предлагается лишить?
пт, 27 мая 2022 г. в 00:06, adybo ***@***.***>:
…
прошедшее на -ды
>Пятница, 27 мая 2022, 0:05 +03:00 от veramal ***@***.***>:
>
> В текущем описании нет ни претерита, ни I. Поясни конкретнее, что
имеется в
>виду?
>
>
>> не надо ли тогда претерит лишить I?
>>
>>
>> >Четверг, 26 мая 2022, 16:37 +03:00 от veramal ***@***.***>:
>> >
>> >
>> >Вернула вид (Ы)м (вместо м) показателю 1sg.br, т.к. если убрать серию
>> mix, формы типа парарым 'уйду' анализироваться не будут.
>> >Зачеркнула также 1sg.br ПЫс, поскольку он совпадает с 1sg ПЫс, а мы
>> теперь хотим помечать краткую серию окончаний только в тех случаях,
когда
>> показатели отличаются от полной серии.
>> >—
>> >Reply to this email directly, view it on GitHub , or unsubscribe .
>> >You are receiving this because you commented. Message ID:
>> <tuffnatty/suddenly/issues/201/1138588841 @ github . com>
>>
>>
>> --
>> Anna Dybo
>> Отправлено из Почты Mail.ru
>>
>>
>> —
>> Reply to this email directly, view it on GitHub
>> <
#201 (comment)
>,
>> or unsubscribe
>> <
https://github.com/notifications/unsubscribe-auth/AD4VB4UG46S3ZFWCMOMIBG3VL7Q6FANCNFSM434QBIUA
>
>> .
>> You are receiving this because you authored the thread.Message ID:
>> ***@***.***>
>>
>
><
https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail
>
>Без
>вирусов. www.avast.ru
><
https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail
>
><#DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>—
>Reply to this email directly, view it on GitHub , or unsubscribe .
>You are receiving this because you commented. Message ID:
<tuffnatty/suddenly/issues/201/1139052670 @ github . com>
--
Anna Dybo
Отправлено из Почты Mail.ru
—
Reply to this email directly, view it on GitHub
<#201 (comment)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/AD4VB4VED2ALUPFZT3WWKSLVL7RUDANCNFSM434QBIUA>
.
You are receiving this because you authored the thread.Message ID:
***@***.***>
|
Проблема с окончаниями 1pl перенесена в топик #224. Отслаьное вроде решилось |
Нужно переименовать некоторые аффиксы - в документе, в парсере и таблице поиска.
Общие принципы:
Список будет пополняться, пока такой.
Abl₂ тЫн > Abl.arch
Abl₁ ДАң > Abl.dial
Acc₁ НЫ, Acc₂ Н - в парсере это все Acc без доп.знаков, в таблице должно быть так же. Аналогично диалектные варианты Acc.dial₁ ТЫ, Acc.dial₂ Т
All.dial САрЫ | СА, All.dial₁ (н)САрЫ, All.dial₂ (н)СА - надо разбить на 2 кучи All.dial САрЫ | (н)САрЫ и All.dial СА | (н)СА. Можно их назвать их All.dial1 и All.dial2, но только не подстрочными цифрами.
Conv.pas.dial / Convпас А.бАс > Cv.kac Абас (без подстрочных и точки)
Convₚ (Ы)п > Cv.п
Conv.a А > Cv.a
Pres2.dial.kac чадыр | чады > Pres2.kac
Pres.dial.kyz тур | ту > Pres.kyz
Pres.dial.sh чар > Pres.sh
Dur₁.dial.kac Ат > Dur1.kac Ат (не подстрочная цифра)
Dur₁.dial.sag ит > Dur₁.dial.sag ит (не подстрочная цифра)
Dur1ᵢ и, Dur1ᵢᵣ ир > в идеале надо бы в парсере объединить в Dur1, в поиске оставить возможность искать по отдельности. Но т.к. объединены Iter АдЫ | АдЫр, Pres2 чАдЫр | чАдЫ, Fut Ар | А и др., пусть и Dur1 будет такой же.
The text was updated successfully, but these errors were encountered: