Uma coleção de scripts python para criar e manusear um corpus XML (uma grande coleção de texto para fins linguísticos) a partir de um depósito de dados original da Wikipedia. Inclui um parser baseado em expressão regular para o idioma de marcação MediaWiki.
história da versão
- Versão 0.1 postado em 2008-04-01
Várias correções e atualizações - Versão 0.1 postado em 2008-04-01
Detalhes do programa
- Categoria: Educação > Outros
- Editor: wikipedia2xml.sf.net
- Licença: Grátis
- Preço: N/A
- Versão: 0.1
- Plataforma: windows