Подсказка

Уважаемые преподаватели и сотрудники!

На этой странице Вы можете разместить учебные материалы и документы.

Размещаемые здесь материалы и документы являются либо персональными, либо кафедральными, либо институтскими и не контролируются (в отличие от УМК) управлением образовательной деятельностью.

Здесь Вы можете размещать то, что считаете нужным для своей работы.

Подробнее...

Персональные документы

Михайлов Дмитрий Владимирович

Персональная страница пользователя...
Вернуться к списку преподавателей...
Файлы учебных материалов / ДЕМО
Название документа Описание Размер
Check_documents_for_including_to_reference_corpus Анализ документов тематического корпуса на предмет включения в состав референтного на основе встречаемости слов из аннотаций статей по заданной предметной области. В основе анализа лежит сравнение значений 5-го и (факультативно) 10-го процентилей по минимуму из элементов массива долей ненулевых значений Term Frequency (TF), вычисляемых относительно разных документов корпуса по фразам в составе каждой аннотации коллекции. Реализация на Python 2.7. 36784 КБ
Reference_corpus_formation_and_its_qualitative_estimation_using_short_texts Оценивание качества формирования референтного текстового корпуса на основе коллекции коротких текстов. Реализация на Python 2.7 и (частично) на Python 3.10. 38884 КБ
essays_coherence_estimating_ruSciBERT Применение нейросетевых моделей BERT для анализа смысловой связности коротких текстов. Блокнот Jupyter Notebook и результаты экспериментов. 15 КБ
experiments_BERT_standard_similarity Применение нейросетевых моделей BERT для ранжирования коротких текстов по близости эталону на основе оценки взаимного сходства их смыслов. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. 219 КБ
experiments_BERT_standard_similarity_with_abstracts_extension Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей при взаимном ранжировании по близости смысловому эталону. Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. 569 КБ
experiments_BERT_standard_similarity_with_training Применение нейросетевых моделей BERT для ранжирования текстов аннотаций и рефератов научных статей по близости эталону на основе оценки взаимного сходства их смыслов - вариант с дообучением модели ruSciBERT для задач анализа смысловой близости отдельных предложений (Sentence Similarity) и текстов (Textual Similarity). Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. 886 КБ
experiments_bert_abstracts_similarity Применение нейросетевых моделей BERT для анализа смысловой близости рефератов научных статей при отборе в референтный корпус. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. 26 КБ