Статья посвящена описанию корпусных ресурсов по языкам России и их использованию в лингвистических исследованиях. Языковое разнообразие РФ весьма значительно – в настоящее время насчитывается 155 языков России. Многие из них находятся под угрозой исчезновения, что делает особенно актуальной задачу создания корпусов – инструмента, позволяющего сохранять языки и языковые данные. В рамках данной работы был проведён опрос среди сотрудников Института языкознания РАН и других лингвистов, собраны сведения о 73 корпусных ресурсах, представляющих различные языки России и их диалекты. Выборка охватывает как крупные языки, так и языки с небольшим числом носителей, включая бесписьменные языки. В статье подробно рассматриваются параметры, по которым могут различаться корпуса, приводятся примеры исследований, проведённых на основе материалов корпусов. Обсуждаются организационные аспекты создания и поддержания корпусных ресурсов, которые не только играют важную роль в сохранении языкового разнообразия России, но и представляют собой ценный инструмент для решения различных исследовательских задач, а также для создания других языковых ресурсов. Статья основана на научном сообщении, с которым А.А. Кибрик выступил на заседании Президиума РАН 9 апреля 2024 г.
Индексирование
Scopus
Crossref
Высшая аттестационная комиссия
При Министерстве образования и науки Российской Федерации