Каковы могут быть причины того, что при автоматической рубрикации документ был отнесен к "лишним рубрикам"?
Какие факторы являются усложняющими или делающими невозможным применение методов машинного обучения для автоматической рубрикации текстов?
Если число документов, правильно отнесенных системой к рубрике, разделить на число документов, реально имеющих отношение к этой рубрике, то получится...
В коллекции 200 документов, из них 125 относятся к рубрике ЭКОНОМИКА. Система отнесла к этой рубрике 100 документов. При проверке выяснилось, что 70 документов отнесены к этой рубрике правильно, а остальные 30 — ошибочно. Чему равна полнота системы в данном эксперименте?
В коллекции 200 документов, из них 125 относятся к рубрике ЭКОНОМИКА. Система отнесла к этой рубрике 100 документов. При проверке выяснилось, что 70 документов отнесены к этой рубрике правильно, а остальные 30 — ошибочно. Чему равна точность системы в данном эксперименте?
Если число документов, правильно отнесенных системой к рубрике, разделить на общее число документов, отнесенных системой к рубрике, то получится...
Как называется следующая гипотеза: "Для эффективного использования компьютерного словаря в приложениях автоматической обработки текстов такие словари должны быть очень большой величины"?
Какие методы машинного обучения используются в задаче рубрикации текстов?
Какие компоненты онтологии могут быть организованы в таксономии по включению?
Какие операции могут быть применены к любой базе знаний?