На этой странице Вы можете разместить учебные материалы и документы.
Размещаемые здесь материалы и документы являются либо персональными, либо кафедральными, либо институтскими и не контролируются (в отличие от УМК) управлением образовательной деятельностью.
Здесь Вы можете размещать то, что считаете нужным для своей работы.
Михайлов Дмитрий Владимирович |
Персональная страница пользователя... Вернуться к списку преподавателей... |
Название документа | Описание | Размер |
---|---|---|
![]() |
Анализ документов тематического корпуса на предмет включения в состав референтного на основе встречаемости слов из аннотаций статей по заданной предметной области. В основе анализа лежит сравнение значений 5-го и (факультативно) 10-го процентилей по минимуму из элементов массива долей ненулевых значений Term Frequency (TF), вычисляемых относительно разных документов корпуса по фразам в составе каждой аннотации коллекции. Реализация на Python 2.7. | 36784 КБ |
![]() |
Оценивание качества формирования референтного текстового корпуса на основе коллекции коротких текстов. Реализация на Python 2.7 и (частично) на Python 3.10. | 38884 КБ |
![]() |
Применение нейросетевых моделей BERT для анализа смысловой связности коротких текстов. Блокнот Jupyter Notebook и результаты экспериментов. | 15 КБ |
![]() |
Расширение аннотаций научных статей предложениями их вводных и заключительных частей с максимизацией смысловой связности коллекции в целом (вариант без учёта и фиксации промежуточных шагов расширения исходной аннотации). Реализация на Python 3.10 — блокноты Jupyter Notebook и результаты экспериментов. | 434 КБ |
![]() |
Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей для последующего взаимного ранжирования по близости смысловому эталону (вариант с возможностью удаления предложений из аннотации). Реализация на Python 3.10 + блокнот Jupyter Notebook и результаты экспериментов. | 138 КБ |
![]() |
Расширение аннотаций научных статей предложениями их вводных и заключительных частей с максимизацией смысловой связности коллекции в целом. Реализация на Python 3.10 — блокноты Jupyter Notebook и результаты экспериментов. | 347 КБ |
![]() |
Применение нейросетевых моделей BERT для ранжирования коротких текстов по близости эталону на основе оценки взаимного сходства их смыслов. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. | 219 КБ |
![]() |
Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей при взаимном ранжировании по близости смысловому эталону. Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. | 569 КБ |
![]() |
Применение нейросетевых моделей BERT для ранжирования текстов аннотаций и рефератов научных статей по близости эталону на основе оценки взаимного сходства их смыслов - вариант с дообучением модели ruSciBERT для задач анализа смысловой близости отдельных предложений (Sentence Similarity) и текстов (Textual Similarity). Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. | 886 КБ |
![]() |
Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей для последующего взаимного ранжирования по близости смысловому эталону (все варианты расширения, языковая модель sci-rus-tiny). Реализация на Python 3.10 + блокнот Jupyter Notebook и результаты экспериментов. | 742 КБ |
![]() |
Применение нейросетевых моделей BERT для анализа смысловой близости рефератов научных статей при отборе в референтный корпус. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. | 26 КБ |