intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo khoa học: "Extracting and Classifying Urdu Multiword Expressions"

Chia sẻ: Hongdo_1 Hongdo_1 | Ngày: | Loại File: PDF | Số trang:6

52
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

This paper describes a method for automatically extracting and classifying multiword expressions (MWEs) for Urdu on the basis of a relatively small unannotated corpus (around 8.12 million tokens). The MWEs are extracted by an unsupervised method and classified into two distinct classes, namely locations and person names. The classification is based on simple heuristics that take the co-occurrence of MWEs with distinct postpositions into account.

Chủ đề:
Lưu

Nội dung Text: Báo cáo khoa học: "Extracting and Classifying Urdu Multiword Expressions"

ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2