Apache Lucene – свободная библиотека для высокоскоростного полнотекстового поиска, написанная на Java. Может быть использована для поиска в Интернете и при решении различных задач вычислительной лингвистики. Например, Apache Lucene используется как компонент в децентрализованной поисковой системе YaCy (свободное программное обеспечение).
Основные возможности Apache Lucene
- свыше 95 Гб в час на современном оборудовании;
- требуется малый объем RAM – «heap» всего 1 Мб;
- размер индекса примерно 20-30 % от размера исходного текста.
- ранжированный поиск – лучшие результаты показываются первыми;
- множество мощных типов запросов: запрос фразы, запросы wildcard, поиск интервалов и т. д.;
- поиск, основанный на «полях» (таких как заголовок, автор, текст);
- возможность сортировать по различным полям;
- multiple index поиск с возможностью объединения результатов;
- возможность одновременного поиска и обновления индекса.
- исходный код полностью написан на Java;
- наличие портов на другие языки программирования.
Порты Apache Lucene на другие языки
Apache Lucene портирована на другие языки программирования:
Ссылки