Download List

Descripción del Proyecto

Sherlock Holmes is a modular system for gathering and indexing textual and image
data, and searching in it. The most popular application is, of course,
indexing of Web pages ranging from small Web sites to whole top-level
domains, but other data sources, parsers, and user interfaces can be
added easily.

System Requirements

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from page, and the downloads themselves may not be hosted on OSDN.

2005-02-22 17:42

La licencia ha cambiado de propiedad de la GPL, por lo que el programa ya no se limita a 100.000 documentos. Apoyo para la compresión de la transparencia ha sido añadido, y el cubo de archivo y los índices generalmente reducido en un 30%. El indexador ahora asigna los textos tienen enlaces a las páginas y el servidor de búsqueda puede buscar por ellos. El programa ha sido muy optimizada y ampliarse. Muchas otras características de menor importancia también se han añadido.
Tags: Major feature enhancements
The license has been changed from proprietary to
the GPL, so the program is no longer limited to
100,000 documents. Support for transparent
compression was added, and the bucket-file and the
indices typically shrink by 30%. The indexer now
assigns link texts to the pages and the search
server can search by them. The program has been
heavily optimized and scaled up. Many other minor
features have also been added.

2004-02-10 15:59

Un built-in de código abierto PDF analizador fue añadido.
Tags: Minor feature enhancements
A built-in open source PDF parser was added.

2004-01-22 03:06

Detección de idioma, derivados y lematización, diccionarios de sinonimia, un corrector ortográfico, y la búsqueda según el tipo de archivo se añadió en la versión 2.4. Recopilación de prioridad, una tabla de servidores equivalente (para evitar duplicados), la búsqueda de palabras depende del contexto, la manipulación de la etiqueta NOARCHIVE, y explicar el modo para el Q-factor que se añadió en la versión 2.5. Una interfaz para los analizadores externos (Postscript, MS Word), soporte para Unicode ligaduras, buscando en URLs y nombres de archivo, y una mejor tipificación de los delitos de los documentos que se añadieron en la versión 2.6. "@" Puede ser indexado como una palabra. Optimizaciones de velocidad se hicieron muchos.
Tags: Major feature enhancements
Language detection, stemming and lemmatization,
synonymic dictionaries, a spelling checker, and
searching according to file type were added in
version 2.4. Priority gathering, a table of
equivalent servers (to avoid duplicates),
searching of context-dependent words, handling of
the NOARCHIVE tag, and explain mode for the
Q-factor were added in version 2.5. An interface
to external parsers (Postscript, MS Word), support
for Unicode ligatures, searching in URLs and
filenames, and better penalization of documents
were added in version 2.6. "@" can be indexed as a
word. Many speed optimizations were made.

2002-12-17 17:16

Entre un montón de pequeñas mejoras y correcciones de errores, esta versión ofrece un nuevo y cerca de Matcher utiliza las bibliotecas compartidas para reducir el tamaño de los archivos binarios instalados. Además, una herramienta para la recuperación de bases de datos roto ha sido añadido.
Tags: Minor feature enhancements
Among lots of minor enhancements and bugfixes, this version features a new near matcher and uses shared libraries to reduce the size of the binaries installed. Also, a tool for recovering broken databases has been added.

2002-09-25 03:57

Tags: Initial freshmeat announcement

Project Resources