wikipedia2XML 0.1

Licença: Grátis ‎Tamanho do arquivo: N/A
‎Classificação dos utilizadores: 3.0/5 - ‎1 ‎votos

Uma coleção de scripts python para criar e manusear um corpus XML (uma grande coleção de texto para fins linguísticos) a partir de um depósito de dados original da Wikipedia. Inclui um parser baseado em expressão regular para o idioma de marcação MediaWiki.

história da versão

  • Versão 0.1 postado em 2008-04-01
    Várias correções e atualizações
  • Versão 0.1 postado em 2008-04-01

Detalhes do programa