ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
N
TR T N Ệ ƯỚNG NG
KHÓA LUN TT NGHIỆP ĐẠI HC H CHÍNH QUY
Ngành: Công Ngh Thông Tin
À NỘ - 2013
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
N
TR T N Ệ ƯỚNG NG
KHÓA LUN TT NGHIỆP ĐẠI HC H CHÍNH QUY
Ngành: Công Ngh Thông Tin
Cán b ng dn: TS. Phan Xuân Hiếu
VIETNAM NATIONAL UNIVERSITY, HANOI
UNIVERSITY OF ENGINEERING AND TECHNOLOGY
Nguyen Xuan Hung
ADVERTISING-ORIENTED CONCEPT
EXTRACTION
Major: Information Technology
Supervisor:Dr. Phan Xuan Hieu
HA NOI - 2013
TR T N Ệ ƯỚNG NG
N
Khóa QH-2009-I/CQ, ngành công ngh thông tin
Tóm tt Khóa lun tt nghip:
Trưc s phát trin mnh m ca thông tin trên thế giới cũng như Việt Nam, vic
qu ng c o tr n int rn t đã trở thành lĩnh vực nghiên cu quan trng. s n ph m củ
c c lĩnh vực ngày càng xu t hiện nhi u tr n th trư ng và đư c giới thiệu trong c c ài
o. Tuy nhiên, c ch gọi c ng m t loại s n ph m lại kh c nh u như: viết t t sở th ch
v ng mi n đ c t nh s n ph m.. o đ khi tạo t kh cho m t s n ph m g p nhi u
kh khăn v kh ng iết n c o nhi u iến thể liệu c tư ng tự s n ph m đ kh ng
o hạn chế v m t th i gi n kĩ thu t n n khóa lu n này s x l th liệu t p
trung nghi n cứu phư ng ph p t m nh t ri ng c nghĩ li n qu n tr n i
c nh củ t đ xu t hiện. H th ng s dng m h nh n om n xing đ yphư ng
ph p đ nh ch s ng u nhi n x y ựng i c nh cho t ng t thành m i vector. u đ
s so s nh c c v ctor với nh u để t m r đ tư ng tự r i s p xếp đư r c c nh m t
đ ng nghĩa và c nghĩ li n qu n.
T khóa: n om n xing đ ng nghĩ qu ng c o kh i niệm tr ch chọn.
ADVERTISING-ORIENTED CONCEPT EXTRACTION
Nguyen Xuan Hung
QH-2009-I/CQ course, information technology faculty
Abtract thesis:
Prior to the development of powerful information in the world as well as
Vietnam, the advertising on the internet has become important research areas. Number
of products of fields is increasingly appearing in the market and presented in the
article. However, by calling back a kind of different products, such as abbreviations,
preferences, regions, product features... Therefore when creating keywords for a
product difficult because it does not know how many variants, is there not a similar
product measurements.
This thesis focused on methods of finding proper nouns synonymous in the
context of freedom appear. Systems using Random Indexing model, which is a method
of indexing random, constructed from sound context for each vector. Then comparing
with each other to find a vector of similarity, and then sort the groups given synonyms.
Keywords: Random Indexing, synonyms, advertising, concept, extraction.