intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo khoa học: "Unsupervised Learning of Arabic Stemming using a Parallel Corpus"

Chia sẻ: Nhung Nhung | Ngày: | Loại File: PDF | Số trang:8

32
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

This paper presents an unsupervised learning approach to building a non-English (Arabic) stemmer. The stemming model is based on statistical machine translation and it uses an English stemmer and a small (10K sentences) parallel corpus as its sole training resources. No parallel text is needed after the training phase. Monolingual, unannotated text can be used to further improve the stemmer by allowing it to adapt to a desired domain or genre.

Chủ đề:
Lưu

Nội dung Text: Báo cáo khoa học: "Unsupervised Learning of Arabic Stemming using a Parallel Corpus"

ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2