Язык запросов

Результатом поиска является список документов, которые содержат слова или фразу. Необходимо иметь ввиду, что:

Булевые оператопы

Для поиска Пример Результат
Оба термина на одной и тойже странице банкротство and несостоятельность
ИЛИ
банкротство & несостоятельность
Документы содержащие оба слова “банкротство” и “несостоятельность
Любое из слов банкротство OR несостоятельность
ИЛИ
банкротство | несостоятельность
Документы содержащие слово “банкротство” или слово “несостоятельность
Первый термин без второго банкротство and not банк
ИЛИ
банкротство & ! банк
Документы содержащие слово “банкротство”, но не содержащие слова “банк
Документы не имеющие заданого свойства not @size = 100
—ИЛИ—
! @size = 100
Файлы рамера не равного 100 байт
Оба термина в документе, находящиеся близко друг от друга судья NEAR инстанции
—ИЛИ—
судья ~ инстанции
Документы со словом “судья” рядом со словом “инстанции

 

Wildcards

Что ищем Пример Результат
Слова с одинаковым префиксом банкрот* Страницы со словами, имеющими префикс “банкрот,” такими как “банкрот,” “банкротство”, “банкротить” и т.п.
Слова во всех словоформах (только для английских слов) fly** Страницы со словом fly во всех словоформах: “fly,” “flying,” “flown,” “flew,” и т.д

Векторные запросы

Осуществляется поиск документов по заданным словам или фразам. При этом,

Что ищем Пример Результат
Документы, содержащие определенные слова банкрот, банк Документы, которые наиболее соответствуют заданным словам

Документы, содержащие префиксы, слова или фразы с заданными весами

банкрот*, банк[50], московский[10], "государственная пошлина"[400]

Документы, содержащие слова с префиксом "банкрот", слова "банк", "московский" и фразу "государственная пошлина". Документы с большими весами будут иметь более высокий ранг.

Поиск по свойствам документа

Поиск документов осуществляется по свойствам файла-документа, таким как размер файла, дата его создания, автору и т.д. и т.п.

Существует два типа таких запросов:

Свойства документов

В запросе свойства документов предваряются или символом @, или символом # character. Используйте @ для сравнительных запросов, и # для запросов с использованием регулярных выражений.

Если не указано ни одно из свойств, подразумевается свойство @contents.

Для всех документов определены следующие свойства:

Свойство Описание
All Слова и фразы в любом свойстве документа
Contents Слова и фразы в теле документа
Filename Имя файла
Size Размер файла
Write Дата-врямя последней модификации файла

Есть также свойства, соответствующие html-документам и документам, созданным в Микрософт Офис:

Свойство Описание
DocTitle Название документа
DocSubject Тема документа
DocAuthor Автор документа
DocKeywords Ключевые слова документа
DocComments Коментарии документа

Полный список свойст в разделе Список свойств документов.

Значения свойств

Чтот ищем Пример результаты
Определенное значение @DocAuthor = Иванов Иван Автор документа “Иванов Иван”
Значения имеющие определенный префикс #DocAuthor иван* Документы, имя автора которых начинается с “Иван
Файлы определенных расширений #filename *.|(exe|,dll|,sys|) Файлы с расширениями .exe, .dll, или .sys
Файлы модифицированные после определенной даты @write > 96/2/14 10:00:00 Файлы, модифицированные после 10:00 GMT 14 февраля 1996

 

Регулярные выражения

Примеры запросов

Пример Результаты
@size > 1000000 Документы размера больше 1-го миллиона байт
@write > 95/12/23 Страницы, модифицированные после заданной даты
государственная пошлина Документы, содержащие фразу “государственная пошлина”
"государственная пошлина" Тоже что и выше
@contents государственная пошлина Тоже что и выше
банкрот and @size > 1000000 Страницы, содержащие слово “банкрот” и больше 1000000 байт по размеру
#filename *.avi Все видео файлы
@docauthor = Иванов Иван Документы заданного автора
@size < 100 & #filename *.gif Графические файлы (.GIF) размера меньше 100 байт

Список свойств

Friendly Name Property
A_HRef Текст элемента HTML href.
Access Время последнего доступа к файлу.
All Поиск по любому свойству документа.
Attrib Атрибуты файла. Документированы в Win32 SDK.
ClassId Идентификатор класса объекта (class ID of object), например WordPerfect, Word.
Characterization Абстракт (резюме) документа.
Contents Основное тело документа.
Create Время создания документа.
Directory Физический путь к файлу, без имени файла.
DocAppName Название приложения, в котором документ был создан.
DocAuthor Автор документа.
DocByteCount Число байт в документе.
DocCategory Тип или категория документа (например, мемо, план-график, отчет).
DocCharCount Число символов в документе.
DocComments Комментарии к документу.
DocCompany Название организации, для которой это документ создавался.
DocCreatedTm Время создания документа.
DocEditTime Полное время, потраченное на создание документа
DocKeywords Ключевые слова.
DocLastAuthor Последний пользователь, редактировавший файл.
DocLastPrinted Врямя последней распечатки документа.
DocLastSavedTm Время последнего сохранения файла.
DocLineCount Число строк в документе.
DocPageCount Число страниц документа.
DocParaCount Число параграфов в документе
DocRevNumber Версия документа
DocSubject Тема документа
DocTitle Название документа.
DocWordCount Число слов в документе
FileIndex Уникальный идентификатор (UID) файла .
FileName Имя файла.
HitCount Число совпадений (слов совпадающих с запросом) в файле.
HtmlHRef Текст HTML-тэга HREF.
HtmlHeading1 Текст HTML-тэга H1.
HtmlHeading2 Текст HTML-тэга H2.
HtmlHeading3 Текст HTML-тэга H3.
HtmlHeading4 Текст HTML-тэга H4.
HtmlHeading5 Текст HTML-тэга H5.
HtmlHeading6 Текст HTML-тэга H6.
Img_Alt Подпись к картинке.
Path Полный физический путь к документу, включая название файла.
Rank Ранг документа по отношению к запросу в диапазоне от 0 до 1000. Большее число сответствует лучшему совпадению.
RankVector Ранг индивидульных терминов в векторном запросе.
ShortFileName Короткое, ДОСовское (8.3) имя файла.
Size Размер файла в байтах.
VPath Виртуальный путь к файлу, включая имя файла.
Write Время последней записи файла на диск.