Arch Search Engine 1.15

Licença: Grátis ‎Tamanho do arquivo: 31.07 MB
‎Classificação dos utilizadores: 3.5/5 - ‎2 ‎votos

Sobre Arch Search Engine

Arch é uma extensão de código aberto do Apache Nutch (um popular, altamente escalável motor de pesquisa geral) para pesquisa intranet. Não está feliz com o seu motor de busca corporativo? Não é surpresa, poucas pessoas são. Tanto quanto sabemos, não existem motores intranet que funcionem, bem como a pesquisa global da Google na Web. Há uma razão fundamental para isso: os algoritmos utilizados pela Google na Web global (ou similares) não funcionam tão bem em intranets pela falta de dados estatísticos. Arch (finalmente!) resolve este problema. Usa um método novo para fornecer resultados de pesquisa de alta precisão que funcionam muito bem. Não acredita? Estão incluídas ferramentas de avaliação de testes cegos. Pode implementar o Arch e comparar o seu desempenho com o seu atual motor de busca e/ou Google (na parte pública do seu site) usando uma metodologia de teste cega. Além da excelente qualidade de pesquisa, a Arch tem muitas características críticas para ambientes corporativos: - Segurança de nível de documento. Os utilizadores só podem encontrar documentos que estão autorizados a ver. - Atualizações de índices baratos. Arch é capaz de manter os índices atualizados e evitar recrawling regular do site completo. - 24 horas por dia, 7 horas por dia. Há sempre um índice de trabalho disponível, mesmo que um rastreio falhe. - Suporte para indexação simultânea e pesquisa de vários web sites, com capacidade de pesquisar e administrar qualquer site separadamente, se necessário. A adição dinâmica e a remoção de web sites é fácil. - Um diretório de site gerado automaticamente. - Suporte de baixo custo uma vez implantado. - Interface dupla (PHP e Java) para fácil implementação e personalização. - Pesquisa frontal "out da caixa". - Um conjunto extenso e extensível de parsers para analisar uma variedade de formatos de ficheiros: HTML, PHP, PDF, MS Office, Open Office, etc. - Uma arquitetura modular, baseada em plugins que pode ser facilmente personalizada e estendida. - O código de origem está incluído. - Alto desempenho e escalabilidade. O Arco pode funcionar em clusters de computador para indexar conjuntos de dados muito grandes.