Монгольский корпус

О создании монгольского корпуса на 80 млн словоупотреблений сообщает агентство Синьхуа.

Китайские лингвисты создали корпус монгольских языков на 80 млн слов. Работы проводили учёные Академии общественных наук Внутренней Монголии (автономия на севере КНР).

Работа заняла около десяти лет, за это время было собрано более 4 тысяч часов записей разговорной речи и ещё столько — официально-деловой. Все данные оцифрованы и позволяют осуществлять полнотекстовый поиск.

В корпус попали не только записи на монгольском языке, бытующем в Китае, но также записи, сделанные в Монголии и России. В России записывали носителей бурятского и калмыцкого языков, относящихся к монгольской языковой семье. Всего было охвачено 6725 информантов.

Работы по развитию корпуса будут продолжены, в том числе за счёт привлечения материалов на ещё не охваченных языках — эвенкийском и орочонском.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *