wikipedia2XML 0.1

ใบ อนุญาต: ฟรี ‎ขนาดแฟ้ม: N/A
‎คะแนนจากผู้ใช้: 3.0/5 - ‎1 ‎โหวต

เกี่ยวกับ wikipedia2XML

คอลเลกชันของสคริปต์งูหลามเพื่อสร้างและจัดการ corpus XML (คอลเลกชันขนาดใหญ่ของข้อความเพื่อวัตถุประสงค์ทางภาษา) จากการถ่ายโอนข้อมูลสํารองฐานข้อมูลวิกิพีเดียเดิม มันมีตัวแยกวิเคราะห์นิพจน์ปกติสําหรับภาษามาร์กอัปมีเดียวิกิ