Tóm tắt Luận án Tiến sĩ: Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp thành phố Hồ Chí Minh)
lượt xem 5
download
Tóm tắt Luận án Tiến sĩ "Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp thành phố Hồ Chí Minh)" được nghiên cứu với mục tiêu: Xây dựng quy trình khai thác thông tin giá từ dữ liệu lớn; Nghiên cứu ứng dụng mô hình hồi quy Hedonic để điều chỉnh sự thay đổi chất lượng hàng hóa hoặc trường hợp hàng hóa không còn xuất hiện trên thị trường phục vụ tính chỉ số giá tiêu dùng.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Tóm tắt Luận án Tiến sĩ: Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp thành phố Hồ Chí Minh)
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH Nguyễn Thanh Bình KHAI THÁC DỮ LIỆU LỚN TRONG VIỆC TÍNH CHỈ SỐ GIÁ TIÊU DÙNG Ở VIỆT NAM (TRƯỜNG HỢP THÀNH PHỐ HỒ CHÍ MINH) TÓM TẮT LUẬN ÁN TIẾN SĨ TP. Hồ Chí Minh – năm 2023
- BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH Nguyễn Thanh Bình KHAI THÁC DỮ LIỆU LỚN TRONG VIỆC TÍNH CHỈ SỐ GIÁ TIÊU DÙNG Ở VIỆT NAM (TRƯỜNG HỢP THÀNH PHỐ HỒ CHÍ MINH) Chuyên ngành: Thống kê Mã số: 9460201 TÓM TẮT LUẬN ÁN TIẾN SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Hà Văn Sơn TS. Lê Thị Thanh Loan TP. Hồ Chí Minh – năm 2023
- Công trình được hoàn thành tại: Trường Đại học Kinh tế Thành phố Hồ Chí Minh. Người hướng dẫn khoa học: Phản biện 1:........................................................................................... ………………………………………………………………………... Phản biện 2: .......................................................................................... ………………………………………………………………………... Phản biện 3: .......................................................................................... ………………………………………………………………………... Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp trường họp tại: Vào lúc ….. giờ ….. ngày ….. tháng ….. năm ….. Có thể tìm hiểu luận án tại thư viện:
- 1 CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU 1.1. Lý do chọn đề tài Chỉ số giá tiêu dùng được xem là một trong những chỉ số kinh tế quan trọng nhất do các cơ quan thống kê quốc gia công bố (Berry et al., 2019). Các cơ quan thống kê quốc gia thường chọn mẫu các hàng hóa và dịch vụ đại diện mà người dân tiêu dùng nhiều nhất để tính chỉ số giá tiêu dùng. Việc thu thập thông tin giá theo phương pháp truyền thống thông qua các cuộc điều tra như hiện nay cũng có một số bất cập như chi phí thực hiện điều tra và việc tiến hành ngày càng trở lên khó khăn hơn, việc gia tăng số lượng chuỗi cửa hàng làm cho thời gian thu thập kéo dài hơn, tỷ lệ trả lời ngày càng giảm (Crystal et al., 2019), còn sai số chọn mẫu và sai số phi chọn mẫu do chất lượng thông tin thu thập được phụ thuộc vào kỹ năng thu thập thông tin cũng như tính trung thực của điều tra viên. Chỉ số giá tiêu dùng ở Việt Nam do Tổng cục Thống kê tiến hành thu thập thông tin, tính toán và công bố. Mặc dù hệ thống thông tin thống kê về giá tiêu dùng được triển khai theo thông lệ quốc tế và ngày càng hoàn thiện nhưng cũng còn một số tồn tại tương tự như thực trạng tính chỉ số giá tiêu dùng của các nước trên thế giới. Cùng với xu hướng ngày càng phát triển của nền kinh tế số trên thế giới, các giao dịch mua bán, giới thiệu sản phẩm trực tiếp trên internet ngày càng phổ biến sẽ tạo ra nguồn dữ liệu về giá vô cùng lớn và phong phú. Nguồn dữ liệu lớn này có thể giúp thu thập thông tin giá kịp thời hơn, mặt hàng đa dạng hơn, tần suất thu thập cao hơn (Crystal et al., 2019). Dự án tỷ giá do Viện Công nghệ Massachusetts nghiên cứu là một trong những dự án đi đầu trong việc khai thác
- 2 nguồn dữ liệu lớn này. Kết quả nghiên cứu đã chứng minh rằng dữ liệu chi tiết về giá bán lẻ có thể được thu thập từ xa với chi phí thấp hơn đáng kể so với thu thập bằng phương pháp truyền thống (Cavallo and Rigobon, 2016). Nhận thức được những ưu điểm của nguồn dữ liệu lớn này, các quốc gia đã bắt đầu triển khai nghiên cứu thực nghiệm và ứng dụng dữ liệu lớn để tính toán chỉ số giá tiêu dùng cho thống kê chính thức, các nghiên cứu điển hình như: Na Uy (Manik and Albarda, 2015), Anh (Naynor et al., 2015), Bỉ (Van Loon and Roels, 2018), Pháp, Thụy Điển và Hà Lan (Jens, 2019), Hoa Kỳ (Crystal et al., 2019). Nhận thức được tầm quan trọng của công nghệ thông tin – truyền thông và đặc biệt là dữ liệu lớn, ngày 10 tháng 5 năm 2018 Thủ tướng Chính phủ ban hành Quyết định số 501/QĐ-TTg phê duyệt đề án ứng dụng công nghệ thông tin – truyền thông trong Hệ thống thống kê nhà nước giai đoạn 2017 – 2025, tầm nhìn đến năm 2030 đề ra mục tiêu: “Ứng dụng công nghệ dữ liệu lớn để hiện đại hóa, giảm chi phí, nâng cao chất lượng và tăng cường khả năng dự báo đối với một số chỉ tiêu thống kê trong các lĩnh vực thống kê giá” (Thủ tướng Chính phủ, 2018). Đánh giá được tầm quan trọng và những tiềm năng to lớn của dữ liệu lớn, Tổng cục Thống kê đã có một số định hướng hoạt động như thành lập tổ công tác về dữ liệu lớn, bổ sung thêm nội dung "Nghiên cứu ứng dụng dữ liệu lớn vào chương trình phát triển ứng dụng công nghệ thông tin của Tổng cục Thống kê", xây dựng đề án ứng dụng dữ liệu lớn trong Thống kê Nhà nước (Nguyễn Bích Lâm, 2016).
- 3 Nghiên cứu giải pháp sử dụng nguồn dữ liệu lớn để tính chỉ số giá tiêu dùng ở Việt Nam là một việc rất cần thiết và phù hợp với xu hướng của thế giới nên tác giả chọn chủ đề: “Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam (trường hợp Thành phố Hồ Chí Minh)” làm nghiên cứu cho luận án này. 1.2. Mục tiêu nghiên cứu Mục tiêu 1: xây dựng quy trình khai thác thông tin giá từ dữ liệu lớn; mục tiêu 2: xây dựng quy trình và kỹ thuật tính toán chỉ số giá tiêu dùng từ khai thác dữ liệu lớn; mục tiêu 3: nghiên cứu ứng dụng mô hình hồi quy Hedonic để điều chỉnh sự thay đổi chất lượng hàng hóa hoặc trường hợp hàng hóa không còn xuất hiện trên thị trường phục vụ tính chỉ số giá tiêu dùng; mục tiêu 4: phân tích tính phù hợp của ứng dụng mô hình Hedonic để điều chỉnh sự thay đổi; mục tiêu 5: hàm ý chính sách để triển khai thực thi trong việc tính toán chỉ số giá tiêu dùng từ khai thác dữ liệu lớn. 1.3. Câu hỏi nghiên cứu Câu hỏi nghiên cứu 1: Quy trình thu thập giá từ các trang web trực tuyến như thế nào? Câu hỏi nghiên cứu 2: Quy trình và kỹ thuật tính toán chỉ số giá tiêu dùng từ khai thác dữ liệu lớn ra sao? Câu hỏi nghiên cứu 3: Có thể ứng dụng mô hình hồi quy Hedonic dựa trên dữ liệu lớn để điều chỉnh sự thay đổi của chất lượng hàng hóa hoặc trường hợp hàng hóa không còn xuất hiện trên thị trường không?
- 4 Câu hỏi nghiên cứu 4: Tổng hợp chỉ số giá tiêu dùng từ nguồn dữ liệu lớn đã thu thập với sự ứng dụng mô hình hồi quy Hedonic dựa trên dữ liệu lớn có phù hợp không? Câu hỏi nghiên cứu 5: Các hàm ý nghiên cứu nào để có thể triển khai thành công công tác thu thập giá trực tuyến phục vụ việc tính toán chỉ số giá tiêu dùng ở Việt Nam? 1.4. Đối tượng nghiên cứu và phạm vi nghiên cứu Đối tượng nghiên cứu: Dữ liệu lớn, chỉ số giá tiêu dùng và mô hình hồi quy Hedonic. Phạm vi nghiên cứu: Về phạm vi không gian, đề tài triển khai tính toán chỉ số giá tiêu dùng tại Thành phố Hồ Chí Minh; về hàng hóa ứng dụng mô hình hồi quy Hedonic dựa trên dữ liệu lớn được thực hiện đối với máy tính xách tay; về mặt thời gian: Số liệu về giá được thu thập và tổng hợp trong năm 2017 và năm 2018. 1.5. Phương pháp nghiên cứu Để thực hiện mục tiêu nghiên cứu, luận án được tác giả triển khai theo hướng sử dụng phương pháp hỗn hợp, sử dụng đồng thời nghiên cứu định tính và nghiên cứu định lượng. Phương pháp định tính được thực hiện qua các hình thức thảo luận nhóm, phỏng vấn trực diện, hội thảo khoa học nằm xác định sự cần thiết và các giải pháp để có thể triển khai được việc thu thập dữ liệu lớn phục vụ tính toán chỉ số giá tiêu dùng; bổ sung các yếu tố tác động đến giá máy tính xách tay. Phương pháp nghiên cứu định lượng: Dựa vào nghiên cứu định tính, một mô hình các yếu tố tác động đến giá máy tính xách tay được xây dựng và nghiên cứu thu thập dữ liệu từ trang web bán máy
- 5 tính xách tay trực tuyến gồm 974 loại máy tính xách tay với các thông tin chi tiết như giá bán, cấu hình, trọng lượng, thương hiệu. Từ các nghiên cứu trước và tổng hợp ý kiến chuyên gia, tác giả chọn sử dụng mô hình tuyến tính logarit (LogLin) cho nghiên cứu này và ước tính được thực hiện bằng phương pháp OLS. Các kiểm định được thực hiện cho mô hình là kiểm định t, kiểm định F, sử dụng hệ số xác định R2 để đánh giá sự phù hợp của mô hình, sử dụng nhân tử phóng đại phương sai để kiểm định hiện tượng đa cộng tuyến, kiểm định White để kiểm định hiện tượng phương sai thay đổi. 1.6. Nguồn dữ liệu Luận án sử dụng nguồn thông tin giá của tất cả các mặt hàng thu thập được từ 29 trang web chính thức có phép của Bộ Thông tin và Truyền thông, đây là những trang web bán hàng lớn và có uy tín ở Việt Nam. 1.7. Đóng góp của luận án Về mặt lý thuyết: Xây dựng phương pháp tiếp cận mới trong việc thu thập thông tin thống kê, một trong những bước quan trọng nhất trong quá trình bảy bước sản xuất thông tin thống kê. Về mặt thực tiễn: Phương pháp thu thập thông tin theo dữ liệu lớn sẽ giúp cải thiện chất lượng dữ liệu đầu vào; xây dựng được quy trình khai thác thông tin giá từ dữ liệu lớn, cụ thể là các trang web bán hàng trực tuyến ở Việt Nam; xây dựng được quy trình và kỹ thuật tính toán chỉ số giá tiêu dùng từ dữ liệu lớn; xây dựng được mô hình hồi quy Hedonic để điều chỉnh sự thay đổi của chất lượng hàng hóa dựa trên dữ liệu lớn.
- 6 CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ TỔNG QUAN CÁC NGHIÊN CỨU TRƯỚC CÓ LIÊN QUAN ĐẾN ĐỀ TÀI 2.1. Cơ sở lý thuyết về giá và chỉ số giá "Chỉ số giá tiêu dùng là chỉ tiêu tương đối (tính bằng %) phản ánh xu hướng và mức độ biến động giá theo thời gian của các mặt hàng trong rổ hàng hóa và dịch vụ tiêu dùng đại diện" (Tổng cục Thống kê, 2018). “Quyền số để tính chỉ số giá tiêu dùng là cơ cấu chi tiêu các nhóm mặt hàng trong tổng chi tiêu của hộ gia đình được tổng hợp từ kết quả điều tra mức sống dân cư và dùng cố định khoảng 5 năm” (Tổng cục Thống kê, 2018). Để tính chỉ số giá tiêu dùng, các cơ quan thống kê quốc gia phải thu thập dữ liệu giá cả và số lượng cho nhiều loại hàng hóa và dịch vụ. Ngoài ra, để ước tính sự thay đổi giá so với thời kỳ gốc (có sử dụng quyền số hay còn gọi là trọng số), các cơ quan thống kê quốc gia phải thu thập được dữ liệu về cơ cấu chi tiêu của hộ gia đình. Thông thường dữ liệu này được thực hiện bởi cuộc điều tra khảo sát mức sống dân cư mà hầu hết các cơ quan thống kê quốc gia đều thực hiện trong các khoảng thời gian không đều đặn (Beegle et al., 2016). Hiện nay, chỉ số giá tiêu dùng được thu thập, tổng hợp và công bố ở 196 nền kinh tế. Trong đó có 37 nền kinh tế tiên tiến, chiếm tỷ trọng 19% và 159 nền kinh tế mới nổi và đang phát triển, chiếm tỷ trọng 81% (Berry et al., 2019). Ở Việt Nam, để có thể tính và công bố được chỉ số giá tiêu dùng hàng tháng, quí, năm như hiện nay, ngành thống kê thực hiện cuộc điều tra giá tiêu dùng (Tổng cục Thống kê, 2015). Từ phương án điều tra của Tổng cục Thống kê và thực tiễn thu thập thông tin giá tại địa phương, dựa vào nghiên cứu
- 7 của Berry và cộng sự (2019) đưa ra các tiêu chí để đánh giá tính hợp lý của chỉ số giá tiêu dùng, có thể thấy phương pháp tính chỉ số giá tiêu dùng của Việt Nam phù hợp với thông lệ quốc tế tốt nhất như tần suất cập nhật quyền số chỉ số giá tiêu dùng được thực hiện 5 năm một lần; về tính kịp thời của việc công bố số liệu, chỉ số giá tiêu dùng của Việt Nam được công bố vào ngày 29 hàng tháng; Việt Nam đang sử dụng bảng phân loại Coicop phù hợp theo khuyến cáo của các tổ chức quốc tế. 2.2. Cơ sở lý thuyết về dữ liệu lớn Daas và cộng sự (2023) định nghĩa “dữ liệu lớn thường là các tập dữ liệu (cực kỳ lớn) có thể chứa cả dữ liệu có cấu trúc và không cấu trúc và khi được phân tích bằng máy tính, có thể khám phá các mô hình, xu hướng và mối liên hệ liên quan đến hành vi và tương tác của các đơn vị được bao gồm”. Struijs và cộng sự (2014) cho rằng dữ liệu lớn là một chủ đề rất đa dạng và rộng rãi để nghiên cứu. Sự ra đời của dữ liệu lớn trên nhiều lĩnh vực đã tạo ra một loạt các đổi mới mang tính đột phá mà các cơ quan thống kê quốc gia không được đứng ngoài do vai trò của họ là nhà cung cấp dữ liệu chính và là cơ quan có thẩm quyền về thống kê chính thức. Letouzé và Jütting (2014) lập luận rằng “tham gia dữ liệu lớn không phải là vấn đề kỹ thuật mà là nghĩa vụ chính trị”. Daas và cộng sự (2023) đã tổng hợp tổng cộng có 44 lĩnh vực thống kê dựa trên dữ liệu lớn, trong đó sáu lĩnh vực đã được công bố chính thức, những lĩnh vực còn lại đều có tính chất thử nghiệm và đã được sản xuất một lần hoặc thường xuyên hơn. Trong sáu lĩnh vực này thì thống kê giá được xếp lên hàng đầu và là lĩnh vực duy nhất có trên năm quốc gia sử dụng cho thống kê
- 8 chính thức. Hiện nay, hầu hết các nước trên thế giới đều đã triển khai nghiên cứu và ứng dụng dữ liệu lớn phục vụ cho công tác thống kê giá. Cụ thể như Na Uy (Manik and Albarda, 2015), Anh (Naynor et al., 2015), Bỉ (Van Loon and Roels, 2018), Pháp, Thụy Điển và Hà Lan (Jens, 2019), Hoa Kỳ (Crystal et al., 2019), Úc (ESCAP, 2020), New Zealand (Statistics New Zealand, 2017), Nhật Bản (Statistics Bureau of Japan, 2019), Malaysia (Mustapa, 2020), Philippines, Indonesia (Bernal et al., 2021). 2.3. Cơ sở lý thuyết mô hình hồi quy Hedonic Chỉ số giá tiêu dùng đo lường sự thay đổi trung bình về giá theo thời gian của hàng hóa và dịch vụ tiêu dùng bằng cách thu thập giá của một mẫu đại diện các mặt hàng tiêu dùng tại các điểm bán lẻ. Một vấn đề cơ bản đối với hàng hóa và dịch vụ trong mẫu chỉ số giá tiêu dùng là đặc điểm của chúng, không chỉ giá cả, thay đổi theo thời gian khi các điểm bán lẻ giới thiệu các phiên bản mới của mặt hàng và ngừng các phiên bản cũ hơn. Phiên bản mới của mặt hàng này có thể mang lại những lợi ích bổ sung hoặc, trong một số trường hợp, giảm bớt lợi ích. Sự thay đổi về lợi ích này là sự thay đổi về chất lượng. Để đo lường sự thay đổi giá một cách chính xác, chỉ số giá tiêu dùng phải phân biệt và loại bỏ phần thay đổi giá do sự thay đổi về chất lượng này. ILO (2014) hướng dẫn các phương pháp xử lý là so sánh trực tiếp, điều chỉnh sự thay đổi về số lượng và gán giá. Phương pháp so sánh trực tiếp chỉ được sử dụng khi sản phẩm mới rất giống với cái cũ mà nó có thể được giả định là có giá cơ sở tương tự. Phương pháp điều chỉnh sự thay đổi về số lượng được sử dụng khi hàng hóa chỉ có sự thay đổi về kích thước vĩnh viễn trong một
- 9 sản phẩm (yêu cầu các yếu tố khác về chất lượng không đổi). Ngoài ra, phương pháp gán giá và giải pháp chỉ số giá tiêu dùng truyền thống cho vấn đề này là tạm thời loại bỏ một mục khỏi mẫu khi chất lượng của nó thay đổi cũng thường được sử dụng. Mặc dù phương pháp này đôi khi được chấp nhận nhưng nó làm sai lệch chỉ số giá tiêu dùng nếu những thay đổi về giá của phiên bản mới khác một cách có hệ thống với những thay đổi về giá của hàng hóa không thay đổi. Do đó, trong những trường hợp mà hàng hóa và dịch vụ có sự thay đổi nhiều về chất lượng thì sử dụng phương pháp hồi quy Hedonic là phù hợp. Điều chỉnh chất lượng Hedonic là một trong những kỹ thuật mà chỉ số giá tiêu dùng sử dụng để giải thích cho việc thay đổi chất lượng sản phẩm trong một số mẫu mặt hàng chỉ số giá tiêu dùng. Chỉ số giá tiêu dùng sử dụng các điều chỉnh chất lượng Hedonic trong các danh mục mặt hàng có xu hướng trải qua mức độ thay đổi chất lượng cao do thay đổi theo mùa, như trong các mặt hàng may mặc, hoặc do những cải tiến đổi mới và thay đổi công nghệ, như trong thiết bị tiêu dùng và điện tử. Kết quả cuộc khảo sát chung của IMF-OECD được thực hiện vào tháng 8 năm 2017 đưa ra cái nhìn về cách điều chỉnh chất lượng được xử lý trong chỉ số giá. Tổng cộng có 43 quốc gia đã trả lời bảng câu hỏi về việc điều chỉnh chất lượng. Theo bảng câu hỏi chung của IMF-OECD, sáu nền kinh tế trong số 43 quốc gia (14%) không điều chỉnh chất lượng khi thực hiện thay thế sản phẩm mới. Có 27 quốc gia (63%) sử dụng các phương pháp khác nhau tùy theo sản phẩm và tám nền kinh tế sử dụng chỉ một phương pháp điều chỉnh chất lượng trong mọi trường hợp (Berry et al., 2019). Các phương pháp được sử
- 10 dụng phổ biến nhất để điều chỉnh chất lượng cho chỉ số giá tiêu dùng là overlap, hồi quy Hedonic và điều chỉnh chất lượng phán đoán. Như vậy mô hình hồi quy Hedonic được khá nhiều quốc gia lựa chọn khi thực hiện điều chỉnh chất lượng hàng hóa và dịch vụ. Wells và Restieaux (2014) đã tổng hợp việc sử dụng điều chỉnh sự thay đổi của chất lượng Hedonic trong việc tính toán chỉ số giá tiêu dùng ở các nước thì cả tám quốc gia nghiên cứu đều có sử dụng hồi quy Hedonic để điều chỉnh sự thay đổi về chất lượng sản phẩm là Úc, Canada, New Zealand, Hoa Kỳ, Đức, Thụy Điển, Anh, Thụy Sĩ. Trong phần tổng quan năm quốc gia tính toán chỉ số giá tiêu dùng thì chỉ có Nam Phi không thực hiện điều chỉnh chất lượng hàng hóa, còn lại 4 quốc gia là Hoa Kỳ, Anh, Úc, Nhật Bản đều có sử dụng mô hình hồi quy Hedonic để điều chỉnh chất lượng hàng hóa trong thống kê chính thức. Phần phân tích ở trên đã cho thấy được sự cần thiết của việc ứng dụng mô hình hồi quy Hedonic trong tính toán chỉ số giá tiêu dùng. 2.4. Tổng quan các nghiên cứu trước có liên quan đến đề tài Luận án đã tổng quan được 29 nghiên cứu quốc tế và trong nước có liên quan đến đề tài. Trong đó có 11 nghiên cứu quốc tế sử dụng dữ liệu lớn tính chỉ số giá tiêu dùng: Cavallo (2013), Naylor và cộng sự 2015), Aparicio và Bertolloto (2016), Haoyang Wu và cộng sự (2017), Harchaoui và Janssen (2018), Konny (2020), Juszczak (2021), Haqqoni và Pramana (2022), Benedetti và cộng sự (2022), Del Prado et al. (2023), Seitaro Tanimichi and Takuya Shibata (2023). Về các nghiên cứu trong nước có liên quan đến chỉ số giá, luận án đã tổng quan được 9 nghiên cứu: Văn Thị Loan (1998), Bùi
- 11 Duy Phú (2006), Nguyễn Thị Liên (2008), Đinh Thị Bảo Linh (2009), Đỗ Thị Ngọc và cộng sự (2014), Đỗ Thị Ngọc (2014), Vũ Thị Thu Thủy (2015), Vũ Thị Thu Thủy (2018), Nguyễn Văn Thụy và Nguyễn Công Hoan (2018). Ngoài ra, nghiên cứu cũng đã tổng quan được 9 nghiên cứu quốc tế liên quan đến điều chỉnh chất lượng máy tính trong chỉ số giá tiêu dùng: Berndt và Griliphes (1990), Nelson và cộng sự (1994), Berndt et al. (1995), Baker (1997), Konijn và cộng sự (2003), Parkhomenko A. et al. (2017), Zafar and Himpens (2019), Shkolnyi (2021), Gören và Arslan (2023). 2.5. Khoảng trống trong nghiên cứu Dựa trên phân tích chuyên đề của những tài liệu khoa học liên quan đến khai thác dữ liệu lớn để tính chỉ số giá tiêu dùng, tác giả nhận thấy một số khoảng trống còn tồn tại như sau: Đầu tiên là còn những bất cập trong việc thu thập, tính toán chỉ số giá tiêu dùng theo phương pháp truyền thống trên thế giới (Crystal et al., 2019) và trong bối cảnh Việt Nam cũng tương tự, các nghiên cứu liên quan đến việc sử dụng dữ liệu lớn để tính chỉ số giá tiêu dùng ở Việt Nam còn nhiều hạn chế. Ngoài ra, việc điều chỉnh chất lượng hàng hóa là nội dung rất quan trọng trong quá trình tính toán chỉ số giá tiêu dùng do yêu cầu cơ bản nhất của chỉ số giá tiêu dùng là các hàng hóa và dịch vụ trong rỗ hàng hóa không được thay đổi chất lượng, quy cách theo khoảng thời gian nghiên cứu. Mô hình hồi quy Hedonic là một trong những phương pháp thích hợp để điều chỉnh chất lượng hàng hóa được lựa chọn khi hàng hóa có nhiều đặc tính cấu thành. Ở Việt Nam, mô hình hồi quy Hedonic chưa được nghiên cứu đưa vào quy trình tính toán chỉ số giá tiêu dùng.
- 12 CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU VÀ QUY TRÌNH NGHIÊN CỨU 3.1. Quy trình nghiên cứu Để thực hiện mục tiêu nghiên cứu, luận án được tác giả triển khai theo hướng sử dụng phương pháp hỗn hợp, sử dụng đồng thời nghiên cứu định tính và nghiên cứu định lượng. Quy trình nghiên cứu được xây dựng từ việc tổng hợp các lý thuyết và các nghiên cứu thực nghiệm có liên quan đến đề tài, thông qua khảo sát chuyên gia để xây dựng quy trình thu thập thông tin từ dữ liệu lớn và xây dựng các yếu tố tác động đến giá máy tính xách tay đến giai đoạn tính toán chỉ số giá tiêu dùng, thảo luận, đề xuất giải pháp triển khai. 3.2. Nghiên cứu định tính Luận án thực hiện nghiên cứu định tính qua hình thức phỏng vấn trực diện và hội thảo nhằm các mục đích lấy ý kiến của chuyên gia về việc có cần thiết sử dụng dữ liệu lớn trong thống kê chính thức, đặc biệt là thống kê giá; thu thập thêm thông tin về các đặc điểm tác động đến giá máy tính xách tay trong thực tế sau khi đã tổng quan các nghiên cứu trước; điều chỉnh và hoàn thiện quy trình thu thập thông tin từ nguồn dữ liệu lớn; phân tích những khó khăn, bất cập và đề xuất những giải pháp ứng dụng khai thác dữ liệu lớn tại Việt Nam. 3.3. Phương pháp khai thác dữ liệu lớn Luận án đã xây dựng được quy trình thu thập thông tin từ nguồn dữ liệu lớn gồm 12 bước.
- 13 Hình 3.1. Quy trình thu thập thông tin từ khai thác dữ liệu lớn Nguồn: Tác giả xây dựng 3.4. Phương pháp tính chỉ số giá tiêu dùng từ dữ liệu lớn Hình 3.2. Quy trình sử dụng dữ liệu lớn trong tính toán CPI Nguồn: Tác giả xây dựng
- 14 Chỉ số giá tiêu dùng được thu thập từ dữ liệu lớn được tính toán qua 4 bước. Ngoài ra nghiên cứu cũng tiến hành tính toán chỉ số giá tiêu dùng bằng cách kết hợp với thông tin giá thu được bằng phương pháp truyền thống (kết hợp 1 và kết hợp 2). Cụ thể 2 cách tính kết hợp như sau: Cách tính kết hợp 1, xem kết quả tính toán chỉ số giá tiêu dùng được thu thập từ dữ liệu lớn đại diện cho khu vực thành thị. Chỉ số giá tiêu dùng chung được tổng hợp từ chỉ số giá tiêu dùng dữ liệu lớn với quyền số là tỷ trọng chi tiêu của khu vực thành thị và chỉ số giá tiêu dùng truyền thống (khu vực nông thôn) với quyền số là tỷ trọng chi tiêu của khu vực nông thôn (quyền số này là cố định, 5 năm mới thay đổi 1 lần). Cách tính kết hợp 2, xem kết quả tính toán chỉ số giá tiêu dùng được thu thập từ dữ liệu lớn đại diện cho khối doanh nghiệp. Chỉ số giá tiêu dùng truyền thống đại diện cho khối cá thể vì phần lớn mạng lưới được thu thập từ các chợ truyền thống. Chỉ số giá tiêu dùng chung được tổng hợp từ chỉ số giá tiêu dùng dữ liệu lớn với quyền số là tỷ trọng doanh thu bán lẻ của khối doanh nghiệp và chỉ số giá tiêu dùng truyền thống với quyền số là tỷ trọng doanh thu bán lẻ của khối cá thể. Quyền số này có thể tính toán được hàng tháng từ doanh thu tổng mức bán lẻ chia theo từng nhóm mặt hàng. Chỉ số giá tiêu dùng của thành phố được tính từ chỉ số của các nhóm hàng tương ứng giữa hai khối là thu thập trực tuyến và thu thập theo phương pháp truyền thống. Quyền số ngang được sử dụng để tính chỉ số giá cả thành phố theo các nhóm hàng từ cấp 4 đến cấp 1 và chỉ số chung. Quyền số
- 15 ngang là tỷ trọng tổng mức bán lẻ trên địa bàn Thành phố Hồ Chí Minh của hai khối doanh nghiệp và cá thể phân theo các nhóm hàng. 3.5. Xây dựng mô hình Hedonic: Trường hợp giá máy tính xách tay Dựa trên các mô hình nghiên cứu trước về máy tính để bàn và máy tính xách tay của các tác giả như Ernst R. Berndt và cộng sự (1995), Paul Chwelos (2003), Zafar và Himpens (2019) và đặc điểm của mặt hàng máy tính xách tay theo các góp ý của chuyên gia cho phù hợp với các công nghệ mới hiện nay, mô hình đề xuất cho nghiên cứu này là mô hình ước lượng dạng ln - lin và phương pháp ước lượng là phương pháp bình phương nhỏ nhất OLS - Ordinary Least Squares. Phần mềm hỗ trợ phân tích hồi quy và thống kê mô tả là stata. Mô hình nghiên cứu các yếu tố tác động đến giá máy tính xách tay với các biến: Biến phụ thuộc: giá máy tính xách tay; Biến độc lập: Biến loại bộ xử lý trung tâm CPU; biến tốc độ xử lý của CPU; biến loại bộ nhớ tạm thời; biến dung lượng bộ nhớ tạm thời; biến loại ổ cứng; biến dung lượng ổ cứng SDD hoặc m2.sata; biến dung lượng ổ cứng HDD; biến màn hình có chức năng cảm ứng; biến màn hình có chức năng lật xoay; biến màn hình 4K; biến màn hình Ultrasharp; biến kích thước màn hình; biến dung lượng pin máy tính xách tay; biến máy tính xách tay có chức năng pin thông minh; biến trọng lượng máy tính xách tay; biến máy tính xách tay có DVD; biến thương hiệu máy tính xách tay.
- 16 CHƯƠNG 4: KẾT QUẢ VÀ THẢO LUẬN 4.1. Tổng quan về Thành phố Hồ Chí Minh Theo số liệu niên giám thống kê năm 2022 của Tổng cục Thống kê, so với cả nước, Thành phố Hồ Chí Minh có diện tích 2.095,4 km2, chiếm 0,6% và có dân số 9.389,7 nghìn người, chiếm 9,4% (Tổng cục Thống kê, 2022). Thành phố Hồ Chí Minh là một trong những tỉnh, thành thuộc vùng kinh tế trọng điểm phía Nam, là trung tâm kinh tế, đầu tàu kinh tế của cả nước, luôn có tốc độ tăng trưởng kinh tế cao hơn tốc độ tăng trưởng kinh tế của cả nước. Thành phố Hồ Chí Minh là địa phương có hoạt động kinh tế năng động, sáng tạo nhất, luôn đi đầu trong cả nước về phát triển kinh tế. Phát triển kinh tế với tốc độ tăng trưởng luôn ở mức cao đã góp phần lớn tạo ra mức đóng góp GDP cao cho cả nước. Tỷ trọng GRDP của Thành phố chiếm gần 23% GDP của cả nước và thu ngân sách của Thành phố đóng góp trên 30% trong tổng thu ngân sách cả nước; về doanh nghiệp, số lượng doanh nghiệp trên địa bàn Thành phố đang hoạt động chiếm khoảng 38% tổng số doanh nghiệp cả nước. 4.2. Tình hình hoạt động thương mại điện tử tại Thành phố Hồ Chí Minh Theo kết quả điều tra điều tra thương mại điện tử, năm 2019 Thành phố Hồ Chí Minh có 65,5% hộ gia đình sử dụng phương tiện thanh toán, cao hơn 22,9 điểm phần trăm so với năm 2018 (năm 2018, tỷ lệ hộ gia đình sử dụng phương tiện thanh toán là 42,6%); tỉ lệ số doanh nghiệp có trang web chiếm 35,7%; 86,9% doanh nghiệp thực hiện đặt hàng hoặc nhận đơn hàng qua các phương tiện điện tử.
- 17 Tỉ lệ siêu thị, trung tâm thương mại chấp nhận thẻ thanh toán là 100% từ năm 2017 đến nay. 4.3. Số lượng trang web và số lượng mặt hàng thu thập Tổng cộng có 246.069 mặt hàng được thu thập trên 29 trang web được thu thập, mã hóa đưa vào tính toán chỉ số giá tiêu dùng. Trang web có số lượng mặt hàng lớn nhất là yes24.vn với 56.334 mặt hàng. Đây là trang web bán rất nhiều loại nhóm hàng như kim khí điện máy, máy vi tính, điện thoại di động, mỹ phẩm, thời trang nam nữ, giày dép, dây nịt, đồ chơi trẻ em, đồ dùng cho mẹ và bé, gia dụng, đồ dùng nhà bếp, đồ dùng, dụng cụ thể thao, đồ trang sức, trang trí nội thất. Trang web có số lượng mặt hàng ít nhất là foodandy.vn với 36 mặt hàng. Đây là trang web bán thịt bò, cừu, cá hồi. Để xây dựng mô hình hồi quy Hedonic cho máy tính xách tay, luận án đã thu thập dữ liệu từ trang web bán máy tính xách tay trực tuyến (https://laptopxachtayshop.com) gồm 974 loại máy tính xách tay với mức giá bán, cấu hình, trọng lượng, nhãn hiệu khác nhau. 4.4. Kết quả mô hình hồi quy Hedonic cho sản phẩm máy tính xách tay Kết quả nghiên cứu mô hình hồi quy Hedonic các yếu tố tác động đến giá máy tính xách tay cho thấy, giá máy tính xách tay chịu ảnh hưởng của các yếu tố: (1) Loại bộ xử lý trung tâm (CPU), (2) loại bộ nhớ tạm thời (RAM), (3) dung lượng bộ nhớ, (4) loại ổ cứng, (5) loại màn hình, (6) kích thước màn hình, (7) loại pin, (8) trọng lượng máy và (9) thương hiệu. Đối chiếu với các nghiên cứu trước cho thấy, về các yếu tố ảnh hưởng đến giá máy tính xách tay của nghiên cứu này tương đồng với nghiên cứu của Baker (1997), Paul
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt Luận án Tiến sĩ Kinh tế: An ninh tài chính cho thị trường tài chính Việt Nam trong điều kiện hội nhập kinh tế quốc tế
25 p | 303 | 51
-
Tóm tắt Luận án Tiến sĩ Giáo dục học: Phát triển tư duy vật lý cho học sinh thông qua phương pháp mô hình với sự hỗ trợ của máy tính trong dạy học chương động lực học chất điểm vật lý lớp 10 trung học phổ thông
219 p | 288 | 35
-
Tóm tắt Luận án Tiến sĩ Kinh tế: Chiến lược Marketing đối với hàng mây tre đan xuất khẩu Việt Nam
27 p | 179 | 18
-
Tóm tắt Luận án Tiến sĩ Luật học: Hợp đồng dịch vụ logistics theo pháp luật Việt Nam hiện nay
27 p | 266 | 17
-
Tóm tắt Luận án Tiến sĩ Y học: Nghiên cứu điều kiện lao động, sức khoẻ và bệnh tật của thuyền viên tàu viễn dương tại 2 công ty vận tải biển Việt Nam năm 2011 - 2012
14 p | 269 | 16
-
Tóm tắt Luận án Tiến sĩ Triết học: Giáo dục Tư tưởng Hồ Chí Minh về đạo đức cho sinh viên trường Đại học Cảnh sát nhân dân hiện nay
26 p | 154 | 12
-
Tóm tắt luận án Tiến sĩ Kỹ thuật: Nghiên cứu tính toán ứng suất trong nền đất các công trình giao thông
28 p | 222 | 11
-
Tóm tắt Luận án Tiến sĩ Kinh tế Quốc tế: Rào cản phi thuế quan của Hoa Kỳ đối với xuất khẩu hàng thủy sản Việt Nam
28 p | 175 | 9
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển kinh tế biển Kiên Giang trong tiến trình hội nhập kinh tế quốc tế
27 p | 53 | 8
-
Tóm tắt Luận án Tiến sĩ Luật học: Các tội xâm phạm tình dục trẻ em trên địa bàn miền Tây Nam bộ: Tình hình, nguyên nhân và phòng ngừa
27 p | 198 | 8
-
Tóm tắt Luận án Tiến sĩ Xã hội học: Vai trò của các tổ chức chính trị xã hội cấp cơ sở trong việc đảm bảo an sinh xã hội cho cư dân nông thôn: Nghiên cứu trường hợp tại 2 xã
28 p | 148 | 7
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phản ứng của nhà đầu tư với thông báo đăng ký giao dịch cổ phiếu của người nội bộ, người liên quan và cổ đông lớn nước ngoài nghiên cứu trên thị trường chứng khoán Việt Nam
32 p | 183 | 6
-
Tóm tắt Luận án Tiến sĩ Luật học: Quản lý nhà nước đối với giảng viên các trường Đại học công lập ở Việt Nam hiện nay
26 p | 135 | 5
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các yếu tố ảnh hưởng đến xuất khẩu đồ gỗ Việt Nam thông qua mô hình hấp dẫn thương mại
28 p | 16 | 4
-
Tóm tắt Luận án Tiến sĩ Ngôn ngữ học: Phương tiện biểu hiện nghĩa tình thái ở hành động hỏi tiếng Anh và tiếng Việt
27 p | 119 | 4
-
Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu cơ sở khoa học và khả năng di chuyển của tôm càng xanh (M. rosenbergii) áp dụng cho đường di cư qua đập Phước Hòa
27 p | 8 | 4
-
Tóm tắt luận án Tiến sĩ Kinh tế: Các nhân tố ảnh hưởng đến cấu trúc kỳ hạn nợ phương pháp tiếp cận hồi quy phân vị và phân rã Oaxaca – Blinder
28 p | 27 | 3
-
Tóm tắt luận án Tiến sĩ Kinh tế: Phát triển sản xuất chè nguyên liệu bền vững trên địa bàn tỉnh Phú Thọ các nhân tố tác động đến việc công bố thông tin kế toán môi trường tại các doanh nghiệp nuôi trồng thủy sản Việt Nam
25 p | 170 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn