
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
N
TR T N Ệ ƯỚNG NG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
À NỘ - 2013

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
N
TR T N Ệ ƯỚNG NG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
Cán bộ hướng dẫn: TS. Phan Xuân Hiếu

VIETNAM NATIONAL UNIVERSITY, HANOI
UNIVERSITY OF ENGINEERING AND TECHNOLOGY
Nguyen Xuan Hung
ADVERTISING-ORIENTED CONCEPT
EXTRACTION
Major: Information Technology
Supervisor:Dr. Phan Xuan Hieu
HA NOI - 2013

TR T N Ệ ƯỚNG NG
N
Khóa QH-2009-I/CQ, ngành công nghệ thông tin
Tóm tắt Khóa luận tốt nghiệp:
Trước sự phát triển mạnh m của thông tin trên thế giới cũng như Việt Nam, việc
qu ng c o tr n int rn t đã trở thành lĩnh vực nghiên cứu quan trọng. s n ph m củ
c c lĩnh vực ngày càng xu t hiện nhi u tr n th trư ng và đư c giới thiệu trong c c ài
o. Tuy nhiên, c ch gọi c ng m t loại s n ph m lại kh c nh u như: viết t t sở th ch
v ng mi n đ c t nh s n ph m.. o đ khi tạo t kh cho m t s n ph m g p nhi u
kh khăn v kh ng iết n c o nhi u iến thể liệu c tư ng tự s n ph m đ kh ng
o hạn chế v m t th i gi n và kĩ thu t n n khóa lu n này s x l th liệu t p
trung nghi n cứu phư ng ph p t m nh t ri ng c nghĩ li n qu n ự tr n i
c nh củ t đ xu t hiện. Hệ th ng s dụng m h nh n om n xing đ y là phư ng
ph p đ nh ch s ng u nhi n x y ựng i c nh cho t ng t thành m i vector. u đ
s so s nh c c v ctor với nh u để t m r đ tư ng tự r i s p xếp đư r c c nh m t
đ ng nghĩa và c nghĩ li n qu n.
Từ khóa: n om n xing đ ng nghĩ qu ng c o kh i niệm tr ch chọn.

ADVERTISING-ORIENTED CONCEPT EXTRACTION
Nguyen Xuan Hung
QH-2009-I/CQ course, information technology faculty
Abtract thesis:
Prior to the development of powerful information in the world as well as
Vietnam, the advertising on the internet has become important research areas. Number
of products of fields is increasingly appearing in the market and presented in the
article. However, by calling back a kind of different products, such as abbreviations,
preferences, regions, product features... Therefore when creating keywords for a
product difficult because it does not know how many variants, is there not a similar
product measurements.
This thesis focused on methods of finding proper nouns synonymous in the
context of freedom appear. Systems using Random Indexing model, which is a method
of indexing random, constructed from sound context for each vector. Then comparing
with each other to find a vector of similarity, and then sort the groups given synonyms.
Keywords: Random Indexing, synonyms, advertising, concept, extraction.

