Компания PNN Soft разрабатывает различные программные решения для полнотекстового поиска на базе библиотеки Lucene
Полнотекстовой поиск интегрируется компанией PNN как в свои программные решения, так и в системы, поставляемые другим компаниям.
Полнотекстовый поиск включает в себя такие возможности:
- Кроссплатформенность – совместимость с основными программными языками и платформами;
- Инкрементное индексирование – требующее операции слияния сегментов (возможно параллельно с поиском);
- Булевый поиск, поиск по фразам, нечёткий поиск;
- Возможность группировки, ранжирования и сортировки результатов поиска;
- Стемминг — позволяет склонять и разбирать слова в поисковом запросе для более корректного поиска;
- Анализаторы для ряда языков, включая русский и украинский;
- Поддержка неограниченного количества дополнительных полей для документов;
- Поиск в текстовых документах и возможность индексации базы данных;
- Возможность параллельного поиска по нескольким индексам с объединением результатов.
Полнотекстовый поиск — автоматизированный поиск по различным типам документов, при котором в качестве поискового образа документа используется его полный текст или существенные части текста.
Механизмы библиотеки Lucene заранее формируют для поиска так называемый полнотекстовый индекс — словарь, в котором перечислены все слова и указано, в каких местах они встречаются. Это существенно уменьшает количество времени на поиск. Для каждого документа возможно хранение большого количества метаинформации о документе параллельно с самим текстом, что необходимо для дальнейшего анализа с результатами поиска.
Компания PNN имеет многолетний опыт разработки программного обеспечения в разных областях бизнеса.