На этой странице Вы можете разместить учебные материалы и документы.
Размещаемые здесь материалы и документы являются либо персональными, либо кафедральными, либо институтскими и не контролируются (в отличие от УМК) управлением образовательной деятельностью.
Здесь Вы можете размещать то, что считаете нужным для своей работы.
Михайлов Дмитрий Владимирович |
Персональная страница пользователя... Вернуться к списку преподавателей... |
Название документа | Описание | Размер |
---|---|---|
Check_documents_for_including_to_reference_corpus | Анализ документов тематического корпуса на предмет включения в состав референтного на основе встречаемости слов из аннотаций статей по заданной предметной области. В основе анализа лежит сравнение значений 5-го и (факультативно) 10-го процентилей по минимуму из элементов массива долей ненулевых значений Term Frequency (TF), вычисляемых относительно разных документов корпуса по фразам в составе каждой аннотации коллекции. Реализация на Python 2.7. | 36784 КБ |
Reference_corpus_formation_and_its_qualitative_estimation_using_short_texts | Оценивание качества формирования референтного текстового корпуса на основе коллекции коротких текстов. Реализация на Python 2.7 и (частично) на Python 3.10. | 38884 КБ |
essays_coherence_estimating_ruSciBERT | Применение нейросетевых моделей BERT для анализа смысловой связности коротких текстов. Блокнот Jupyter Notebook и результаты экспериментов. | 15 КБ |
experiments_BERT_standard_similarity | Применение нейросетевых моделей BERT для ранжирования коротких текстов по близости эталону на основе оценки взаимного сходства их смыслов. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. | 219 КБ |
experiments_BERT_standard_similarity_with_abstracts_extension | Расширение аннотаций научных статей заданной коллекции предложениями их вводных и заключительных частей при взаимном ранжировании по близости смысловому эталону. Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. | 569 КБ |
experiments_BERT_standard_similarity_with_training | Применение нейросетевых моделей BERT для ранжирования текстов аннотаций и рефератов научных статей по близости эталону на основе оценки взаимного сходства их смыслов - вариант с дообучением модели ruSciBERT для задач анализа смысловой близости отдельных предложений (Sentence Similarity) и текстов (Textual Similarity). Реализация на Python 3.10 + блокноты Jupyter Notebook и результаты экспериментов. | 886 КБ |
experiments_bert_abstracts_similarity | Применение нейросетевых моделей BERT для анализа смысловой близости рефератов научных статей при отборе в референтный корпус. Реализация на Python 3.10 + Jupyter Notebook и результаты экспериментов. | 26 КБ |