Профилирование - это разумное ограничение предъявляемой посетителю информации
с целью выделения более важного для него содержания. Задача, стоящая перед авторами, заключается
в разработке нового метода профилирования пользователей Интернет-порталов и реализации этого метода
в виде веб-сервера документов, "предугадывающего" предпочтения посетителя.
На основе ряда признаков из всех понятий онтологии выделяются наиболее общие,
называемые тематиками. Каждому понятию онтологии сопоставляем вектор, каждая координата которого
характеризует близость понятия к одной из тематик. На основе совокупности векторов понятий,
упомянутых в документе, строится вектор, характеризующий близость всего документа к каждой из тематик,
называемый профилем документа. Каждый посетитель обладает набором интересов, и его тоже можно описать
подобным вектором, называемым профилем посетителя. Однако если профиль документа является статичным,
вектор интересов посетителя постоянно корректируется с просмотром новых документов и изменением интересов
пользователя со временем. Наконец, чтобы понять, какие документы более интересны пользователю на текущий момент,
необходимо соотнести профиль пользователя с профилями документов. Степень соответствия документа
интересам пользователя определяется углом между этими двумя векторами и их длинами. Неплохой оценкой
близости является скалярное произведение векторов.
Ключевые слова: профилирование пользователей, Semantic Web, семантические сети,векторная модель информационного поиска.