pydocrawl descarrega automaticamente ficheiros pdf, ps e doc a partir de sites. Deve ser dada uma URL inicial e uma lista de palavras. Ferramenta de mineração de informação multi-lida (colheita) escrita inteiramente em Python. A versão 0.1 funciona com sucesso em Linux e Cygwin.
história da versão
- Versão r20040925_v1 postado em 2004-09-24
Várias correções e atualizações - Versão r20040925_v1 postado em 2004-09-24
Detalhes do programa
- Categoria: Rede & Internet > Outros
- Editor: pydocrawl.sf.net
- Licença: Grátis
- Preço: N/A
- Versão: 20040925
- Plataforma: windows