Сегодня 13 мая 2025 года / 10 ^oC, 758 мм.

Студентам

Расписание занятий Библиотека Студенческая жизнь Спорт Психологическая помощь Проектная деятельность Для лиц с ОВЗ

Преподавателям и сотрудникам

Телефонный справочник Переход на новые ФГОС Каталог ИТ-услуг Профком Эффективный контракт

Выпускникам и партнёрам

Официальные документы Часто задаваемые вопросы Дополнительные курсы Бесплатная юридическая консультация

English Deutsch

А А А

Подсказка

Уважаемые преподаватели и сотрудники!

На этой странице Вы можете разместить учебные материалы и документы.

Размещаемые здесь материалы и документы являются либо персональными, либо кафедральными, либо институтскими и не контролируются (в отличие от УМК) управлением образовательной деятельностью.

Здесь Вы можете размещать то, что считаете нужным для своей работы.

Подробнее...

Персональные документы

Михайлов Дмитрий Владимирович

Персональная страница пользователя...
Вернуться к списку преподавателей...

Файлы учебных материалов / ДЕМО

Название документа	Описание	Размер
Check_documents_for_including_to_reference_corpus	Анализ документов тематического корпуса на предмет включения в состав референтного на основе встречаемости слов из аннотаций статей по заданной предметной области. В основе анализа лежит сравнение значений 5-го и (факультативно) 10-го процентилей по минимуму из элементов массива долей ненулевых значений Term Frequency (TF), вычисляемых относительно разных документов корпуса по фразам в составе каждой аннотации коллекции. Реализация на Python 2.7.	36784 КБ
Reference_corpus_formation_and_its_qualitative_estimation_using_short_texts	Оценивание качества формирования референтного текстового корпуса на основе коллекции коротких текстов. Реализация на Python 2.7 и (частично) на Python 3.10.	38884 КБ
essays_coherence_estimating_ruSciBERT	Применение нейросетевых моделей BERT для анализа смысловой связности коротких текстов. Блокнот Jupyter Notebook и результаты экспериментов.	15 КБ
experiments_1_BERT_abstracts_extension_with_semantic_coherence_maximization_for_collection	Расширение аннотаций научных статей предложениями их вводных и заключительных частей с максимизацией смысловой связности коллекции в целом (вариант без учёта и фиксации промежуточных шагов расширения исходной аннотации). Реализация на Python 3.10 — блокноты Jupyter Notebook и результаты экспериментов.	434 КБ
experiments_BERT_abstracts_extension_and_reduction_for_standard_similarity_estimation	Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей для последующего взаимного ранжирования по близости смысловому эталону (вариант с возможностью удаления предложений из аннотации). Реализация на Python 3.10 + блокнот Jupyter Notebook и результаты экспериментов.	138 КБ
experiments_BERT_abstracts_extension_with_semantic_coherence_maximization_for_collection	Расширение аннотаций научных статей предложениями их вводных и заключительных частей с максимизацией смысловой связности коллекции в целом. Реализация на Python 3.10 — блокноты Jupyter Notebook и результаты экспериментов.	347 КБ
experiments_BERT_standard_similarity	Применение нейросетевых моделей BERT для ранжирования коротких текстов по близости эталону на основе оценки взаимного сходства их смыслов. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов.	219 КБ
experiments_BERT_standard_similarity_with_abstracts_extension	Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей при взаимном ранжировании по близости смысловому эталону. Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов.	569 КБ
experiments_BERT_standard_similarity_with_training	Применение нейросетевых моделей BERT для ранжирования текстов аннотаций и рефератов научных статей по близости эталону на основе оценки взаимного сходства их смыслов - вариант с дообучением модели ruSciBERT для задач анализа смысловой близости отдельных предложений (Sentence Similarity) и текстов (Textual Similarity). Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов.	886 КБ
experiments_abstracts_extension_scirus-tiny	Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей для последующего взаимного ранжирования по близости смысловому эталону (все варианты расширения, языковая модель sci-rus-tiny). Реализация на Python 3.10 + блокнот Jupyter Notebook и результаты экспериментов.	742 КБ
experiments_bert_abstracts_similarity	Применение нейросетевых моделей BERT для анализа смысловой близости рефератов научных статей при отборе в референтный корпус. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов.	26 КБ