Интеграция систем полнотекстового поиска с применением библиотеки Lucene при разработке корпоративных систем

Компания PNN Soft разрабатывает различные программные решения для полнотекстового поиска на базе библиотеки Lucene.

Полнотекстовой поиск интегрируется компанией PNN как в свои программные решения, так и в системы, поставляемые другим компаниям.

Полнотекстовый поиск включает в себя такие возможности: 

  • Кроссплатформенность – совместимость с основными программными языками и платформами;
  • Инкрементное индексирование – требующее операции слияния сегментов (возможно параллельно с поиском);
  • Булевый поиск, поиск по фразам, нечёткий поиск;
  • Возможность группировки, ранжирования и сортировки результатов поиска;
  • Стемминг - позволяет склонять и разбирать слова в поисковом запросе для более корректного поиска; 
  • Анализаторы для ряда языков, включая русский и украинский;
  • Поддержка неограниченного количества дополнительных полей для документов;
  • Поиск в текстовых документах и возможность индексации базы данных;
  • Возможность параллельного поиска по нескольким индексам с объединением результатов. 

Полнотекстовый поиск - автоматизированный поиск по различным типам документов, при котором в качестве поискового образа документа используется его полный текст или существенные части текста.

Механизмы библиотеки Lucene заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. Это существенно уменьшает количество времени на поиск. Для каждого документа возможно хранение большого количества метаинформации о документе параллельно с самим текстом, что необходимо для дальнейшего анализа с результатами поиска. 

Компания PNN имеет многолетний опыт разработки программного обеспечения в разных областях бизнеса.