Работа поиска

Тексты, придуманные людьми имеют одинаковое строение. Компьютеры могут понять смысл текста и выделять в нём ключевые слова. Для этого нужно взять обычный текст, поместить его в окно анализатора текста, программа начнёт подсчитывать, количество раз повторяющего слова и выведет всё в таблицу, в окне появляются 10 часто встречаемых слов, их можно задать поисковой системе в качестве запроса.

 
Главной идеей словарного ИПС, является словарь слов, в каждом из которого будет храниться список документов, в которых это слово взято.
 
Есть два алгоритма работы ИПС – с использованием дескрипторов - документы переводятся на дексрипторный язык, который состоит из слов и символов, и ИПС обрабатывает уже в этой форме, такой подход более затратен, но и более продуктивен
и с использованием ключевых слов – используются только те слова, которые встречаются в документе.
 
Семантика – это изучение значений. Это позволяет выделят полезную информацию из документов, если компьютер понимает семантику документа, значит он понимает смысл документа.
 
Семантические технологии Web явялются хорошим способом представления данных в Интернет, это своеобразная база данных, которая связана с хранением документов Интернет. Семантические технологии используют правила, логику.