intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tài liệu giảng dạy Lịch sử khoa học máy tính

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:43

4
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tài liệu giảng dạy "Lịch sử khoa học máy tính" trình bày quá trình hình thành và phát triển của khoa học máy tính từ những nền móng đầu tiên đến các bước tiến vượt bậc trong kỷ nguyên số. Nội dung giúp người học hiểu rõ vai trò của các nhà tiên phong, cột mốc công nghệ quan trọng và tác động của CNTT đến xã hội hiện đại.

Chủ đề:
Lưu

Nội dung Text: Tài liệu giảng dạy Lịch sử khoa học máy tính

  1. lOMoARcPSD|42620215 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN ---------- ThS. Lê Thị Xinh TÀI LIỆU GIẢNG DẠY LỊCH SỬ KHOA HỌC MÁY TÍNH Bình Định, năm 2022 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  2. lOMoARcPSD|42620215 MỞ ĐẦU Học phần Lịch sử Khoa học máy tính trang bị cho người học những hiểu biết cơ bản về lịch sử ra đời và sự phát triển của các thế hệ máy tính; cung cấp những kiến thức về các lĩnh vực nghiên cứu và một số nhân vật tiêu biểu trong lịch sử Khoa học máy tính. Đồng thời, giúp người học hình thành kỹ năng liên hệ và kết nối về mặt lịch sử với các nội dung trong chương trình Tin học bậc Trung học phổ thông. Nội dung tài liệu gồm có 3 chương: Chương 1. Lịch sử tính toán: Trong chương 1, chúng tôi trình bày các nội dung về lịch sử tính toán thời kỳ cổ đại; những cơ sở tính toán cơ bản như đại số Boole, máy phân tích Babbage, máy Turing, định lý Shanon, nguyên lý Von Neuman; lịch sử phát triển các ngôn ngữ lập trình thông dụng và một số hướng phát triển tính toán hiện đại như Trí tuệ nhân tạo, Điện toán đám mây, Big Data, Internet of Things (IoT). Chương 2. Lịch sử máy tính điện tử và mạng máy tính: Trong chương này, chúng tôi trình bày lịch sử hình thành và phát triển của các thế hệ máy tính; lịch sử hình thành và phát triển mạng máy tính. Chương 3. Một số công ty công nghệ hàng đầu: Trong chương cuối, chúng tôi giới thiệu lịch sử hình thành và đặc điểm của một số công ty công nghệ hàng đầu thế giới về khoa học máy tính như IBM, Microsoft, Oracle, Yahoo, Google, Apple. Tập thể tác giả mong nhận được sự đóng góp ý kiến của quý thầy cô giáo và bạn đọc để tài liệu được hoàn thiện hơn. Tập thể tác giả 1 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  3. lOMoARcPSD|42620215 DANH MỤC TỪ VIẾT TẮT AI Artificial Intelligence APARNET Advanced Research Projects Agency Network ARP Address Resolution Protocol CPU Central Processing Unit DARPA Defense Advanced Research Projects Agency DEC Digital Equipment Corporation EDSAC Electronic Delay Storage Automatic Calculator EDVAC Electronic Discrete Variable Automatic Computer ENIAC Electronic Numerical Integrator and Calculator FTP File Transfer Protocol HTTP Hyper Text Transfer Protocol HTTPS Secure HTTP HTML HyperText Markup Language IAS Institute for Advanced Study IaaS Infrastructure as a Service IBM International Business Machines IC Integrated Circuits ICMP Internet Control Message Protocol IMP Interface Message Processor IoT Internet of Things LAN Local Area Network MILNET Military Network MSN Microsoft Network NCP Network Control Program PaaS Platform as a Service PC Personal Computer) PDP Programmed Data Processor PHP Hypertext Preprocessor POP3 Post Office Protocol 3 RSI Relational Software Inc 2 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  4. lOMoARcPSD|42620215 SaaS Software as a Service SDL Software Development Laboratories SMTP Simple Mail Transfer Protocol SNMP Simple Network Management Protocol SRI Stanford Research Institute TCN Trước Công Nguyên TCP/IP Transmission Control Protocol/Internet Protocol UCLA University California ULSI Ultra Large Scale Integration UNIVAC UNIVersal Automatic Computer URL Uniform Resource Locators VLSI Very Large Scale Integrated WAN Wide Area Network WWW World Wide Web W3C World Wide Web Consortium 3 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  5. lOMoARcPSD|42620215 MỤC LỤC MỞ ĐẦU....................................................................................................................... 1 DANH MỤC TỪ VIẾT TẮT ...................................................................................... 2 CHƢƠNG 1. LỊCH SỬ TÍNH TOÁN ....................................................................... 6 1.1. Thời kỳ cổ đại ............................................................................................................6 1.1.1. Toán học Babylon...................................................................................................6 1.1.2. Toán học Ai cập cổ đại ..........................................................................................6 1.1.3. Toán học Ấn Độ cổ đại ...........................................................................................7 1.1.4. Toán học Hy lạp cổ đại ..........................................................................................8 1.1.5. Toán học Trung Quốc cổ đại..................................................................................8 1.2. Những cơ sở tính toán cơ bản ...................................................................................8 1.2.1. Boole .......................................................................................................................8 1.2.2. Babbage ..................................................................................................................9 1.2.3. Máy Turing .............................................................................................................9 1.2.4. Định lý Shannon ...................................................................................................10 1.2.5. Nguyên lý Von Neumann ......................................................................................10 1.3. Các ngôn ngữ lập trình ...........................................................................................11 1.4. Một số hướng phát triển tính toán hiện đại ............................................................13 1.4.1. Trí tuệ nhân taọ ....................................................................................................13 1.4.2. Điện toán đám mây ..............................................................................................16 1.4.3. Big Data ...............................................................................................................18 1.4.4. IoT ........................................................................................................................21 CHƢƠNG 2. LỊCH SỬ MÁY TÍNH ĐIỆN TỬ VÀ MẠNG MÁY TÍNH ........... 24 2.1. Lịch sử các thế hệ máy tính .....................................................................................24 2.1.1. Thế hệ thứ nhất (1940 – 1955): ............................................................................24 2.1.2. Thế hệ thứ hai (1955-1965) ..................................................................................25 2.1.3. Thế hệ thứ ba (1965-1975) ...................................................................................26 2.1.4. Thế hệ thứ tư (1975-1985)....................................................................................27 2.1.5. Thế hệ thứ năm (từ năm 1985 đến nay) ...............................................................28 2.1.6. Thế hệ tương lai ...................................................................................................29 2.2. Mạng máy tính .........................................................................................................29 2.2.1. Mạng ARPANET ..................................................................................................29 2.2.2. Giao thức TCP/IP .................................................................................................30 2.2.3. Internet .................................................................................................................32 4 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  6. lOMoARcPSD|42620215 2.2.4. World Wide Web ...................................................................................................33 2.2.5. Trình duyệt Web ...................................................................................................34 CHƢƠNG 3. MỘT SỐ CÔNG TY CÔNG NGHỆ HÀNG ĐẦU ......................... 36 3.1. IBM ..........................................................................................................................36 3.2. Microsoft .................................................................................................................36 3.3. Oracle ......................................................................................................................38 3.4. Yahoo .......................................................................................................................38 3.5. Google .....................................................................................................................39 3.6. Apple ........................................................................................................................40 TÀI LIỆU THAM KHẢO ........................................................................................ 42 5 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  7. lOMoARcPSD|42620215 CHƢƠNG 1. LỊCH SỬ TÍNH TOÁN 1.1. Thời kỳ cổ đại 1.1.1. Toán học Babylon Các nhà toán học hiện đại đã có sự kế thừa những kiến thức toán học và thiên văn học từ nền văn minh toán học Babylon đến những nền văn minh sau đó. Tư liệu phong phú về nền toán học Babylon cổ đại được nghiên cứu dựa trên 400 tấm nêm được tìm thấy vào thế kỷ XIX. Toán học Babylon cổ đại được đặc trưng bởi những kiến thức toán học cụ thể để phục vụ cho đời sống xã hội của vùng Lưỡng Hà cổ đại. Đây là nền văn minh được phát triển bởi cư dân dọc hai bờ sông Euphrates và Tigris với trung tâm văn hóa là thành cổ Babylon có lịch sử phát triển cách đây khoảng 5000 năm cho đến thời kỳ Hy Lạp hóa. Di sản nền toán học Babylon để lại là những tấm nêm được làm bằng đất sét, được làm cứng bằng cách phơi nắng. Giải mã những tấm nêm, các nhà toán học hiện đại đã khám phá ra những chữ số trong hệ cơ số 60 cùng những bảng nhân, tương tự như bản cửu chương ngày nay. Đây là đóng góp lớn nhất của toán học Babylon cổ đại cho nền văn minh của nhân loại. Do đó mà ngày nay ta sử dụng 60 giây trong một phút, 60 phút trong một giờ và 360 (60 × 6) độ trong một vòng tròn. 1.1.2. Toán học Ai cập cổ đại Nền toán học Ai Cập cổ đại đã đạt được nhiều thành tựu. Đầu tiên là hệ thống chữ số nằm trong hệ thống chữ tượng hình. Người Ai Cập cổ đại đã dùng hệ thống số thập phân để kí hiệu cho các số đếm. Có 7 kí hiệu cho các vị trí của từng hàng trong một dãy kí tự và cách đọc cũng từ trái sang phải như cách đọc thông thường ngày nay. Chữ số hàng đơn vị là số nét gạch đứng. Ba số 1, 2, 3 được kí hiệu bởi "|", "||", "|||". Từ số 4 đến số 8 thì được viết trên hai dòng: dòng trên có số nét bằng hoặc nhiều hơn dòng dưới 1 đơn vị. Chẳng hạn để kí hiệu số 7 thì dòng trên sẽ có 4 gạch, dòng dưới có 3 gạch. Riêng số 9 được viết trên 3 dòng, mỗi dòng 3 gạch. Số 4 hay 5 còn có thể biểu diễn bằng 4 hay 5 gạch trên cùng dòng. Chữ số hàng chục kí hiệu bởi một cái cổng hình parabol, chữ số hàng trăm là một cuộn dây và cách viết trên 1, 2 hay 3 dòng giống như cách viết hàng đơn vị. Chữ số hàng nghìn là cây sen. Lần lượt chữ số hàng vạn, hàng 10 vạn và hàng triệu được kí hiệu bởi ngón tay, con ếch và vị thần giơ cao tay. Mỗi chữ số từ hàng nghìn đều viết trên 1 dòng. Từ đó, người Ai Cập cổ đại biểu diễn được mọi số đếm nhỏ hơn 10 triệu. Chẳng hạn để viết số 2132 thì từ trái sang phải: 2 cây sen, 1 cuộn dây, 3 cái cổng, 2 nét gạch. Cũng từ hệ thống kí hiệu chữ số, người Ai Cập cổ đại đã tìm ra cách kí hiệu phân số mà ngày nay ta gọi là phân số Ai Cập. Đó là những phân số mà tử số bằng 1 - là dạng phân số cơ bản nhất. Những văn tự được tìm thấy có niên đại cách đây 3600 năm cho thấy người Ai Cập cổ đại đã biết cách làm các phép toán cộng, trừ, nhân, chia đối với những phân số Ai Cập. 6 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  8. lOMoARcPSD|42620215 Toán học Ai Cập cổ đại cũng như nhiều nền văn minh khác đã nhắc đến định lý Pythagore với những bộ số Pythagore là chiều dài ba cạnh của những tam giác vuông có các cạnh đều là số đếm, như bộ (3, 4, 5). Họ có hệ thống công thức tính diện tích hay thể tích của nhiều hình và đã có những hiểu biết về hình học giải tích. Họ đã quan tâm đến việc tìm số Pi sao cho gần đúng nhất và đã tính đúng số Pi chính xác với sai số nhỏ hơn 1%. Người Ai Cập cổ đại đã biết đến hợp số, số nguyên tố, trung bình cộng, trung bình nhân, cấp số cộng, cấp số nhân. Họ cũng biết đến số hoàn hảo và sàng Eratosthenes (là một thuật giải cổ xưa để tìm các số nguyên tố nhỏ hơn 100. Thuật toán này do nhà toán học cổ Hy Lạp là Eratosthenes phát minh ra.). 1.1.3. Toán học Ấn Độ cổ đại Nền văn minh Ấn Độ cổ đại là một trong những nền văn minh lớn của nhân loại. Những thành tựu toán học của Ấn Độ cổ đại để lại dấu ấn lớn cho nhân loại. Khởi đầu là sự phát triển của nền văn minh Thung lũng Indus, khoảng năm 2600 – năm 1900 trước Công nguyên (TCN)... Tuy không có một tài liệu toán học nào được tìm thấy ở giai đoạn này nhưng những quy tắc hình học chặt chẽ đã được sử dụng khi xây dựng các thành phố ở đây, chứng tỏ cư dân nền văn minh này đã có những hiểu biết nhất định về hình học. Từ thời Vệ Đà, thế kỷ IX (TCN), các nhà toán học ở đây đã tính đúng giá trị của số Pi chính xác đến hai chữ số thập phân. Một trong những văn bản toán học xa xưa nhất được tìm thấy của nền toán học Ấn Độ cổ đại chính là kinh Sulba, xuất hiện khoảng thế kỷ VIII đến thế kỷ V (TCN). Phần phụ lục của kinh đã nêu một số quy tắc đơn giản để xây dựng bàn thờ, với những hình cơ bản trong hình học như hình vuông, hình chữ nhật, hình bình hành, …. Tư liệu cho thấy, các nhà toán học giai đoạn này đã biết tới số nguyên tố, số vô tỷ, tính căn bậc hai chính xác đến 5 chữ số thập phân, tính căn bậc ba của một số thập phân hay đưa ra được những bộ ba số Pythagore cùng việc phát biểu và chứng minh định lý này. Kinh Sulba cũng nhắc đến việc giải các phương trình bậc hai, phương trình tuyến tính. Thế kỷ thứ V (TCN), bộ ngữ pháp tiếng Phạn ra đời, với những công thức được ký hiệu tương tự như trong toán học, với những phép biến đổi cùng ngôn ngữ hình thức, giống như ngôn ngữ mà máy tính ngày nay sử dụng. Khoảng thế kỷ III đến thế kỷ I (TCN), công trình của Pingala1 đưa ra ý tưởng về dãy Fibonaci. Các nhà toán học Jaina (thế kỷ IV đến thế kỷ II TCN) đã có những nghiên cứu toán học về dãy số, cấp số, công thức lũy thừa, hàm số mũ, định lý cho phương trình bậc ba, bậc bốn. Họ cũng tìm ra công thức logarit, lý thuyết tập hợp với hoán vị, tổ hợp. Đóng góp lớn nhất của nền toán học Ấn Độ cổ đại là việc tạo ra hệ cơ số 10. Từ thế kỷ thứ VI, bộ chữ này được truyền bá ra ngoài nhưng phải đợi đến khi nó được truyền bá sang Châu Âu thì mới được sử dụng rộng rãi, thay hệ chữ số La Mã và trở thành ký hiệu ghi số được sử dụng thống nhất như ngày nay. 1 Nhà toán học Ấn Độ sống ở giai đoạn từ năm 450 đến năm 200 TCN 7 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  9. lOMoARcPSD|42620215 1.1.4. Toán học Hy lạp cổ đại Toán học Hy Lạp cổ đại là toán học được viết bằng tiếng Hy Lạp trong giai đoạn khoảng từ năm 600 TCN đến năm 30 TCN. Trong đó, từ sau năm 332 TCN, Ai Cập thuộc Hy Lạp, do đó toán học thời Hy Lạp cổ đại có sự kế thừa và giao lưu văn hóa giữa các nền văn minh. Thời kỳ này được gọi là Hy Lạp hóa, các nhà toán học Hy Lạp ở khắp vùng Địa Trung Hải có sự thống nhất về văn hóa và ngôn ngữ. Đồng thời, những tài liệu bằng tiếng Ai Cập được dịch sang tiếng Hy Lạp để kế thừa. Trong thời kỳ Hy Lạp hóa, các nhà toán học đã sử dụng thư từ hay gặp gỡ nhau để trao đổi, học hỏi, tạo ra một cộng đồng những người làm toán không đơn lẻ như những thời kỳ trước, góp phần làm cho toán học phát triển nhanh hơn. Nhiều thành tựu của toán học của người Ai Cập, Ấn Độ, Babylon đã được các nhà toán học Hy Lạp tiếp thu, kế thừa trong quá trình học hỏi ở những vùng này. Các nhà toán học cổ Hy Lạp đã tạo nên một giai đoạn phát triển toán học rực rỡ trong lịch sử phát triển toán học của nhân loại, với những tên tuổi lớn tạo nền móng cho sự phát triển của toán học. Có thể kể đến những nhà toán học lớn Archimedes, Euclid, Aristotle, Platon, Pythagore, Thales, Heron, ... Đặc điểm nổi bật của toán học giai đoạn này là một số tính chất toán học đã biết một cách đơn lẻ trước đó thì nay được quy nạp, chứng minh chặt chẽ bằng lập luận, để trở thành những định lý hay công thức tổng quát. Chẳng hạn, ở các nền văn minh trước đã xuất hiện các bộ ba Pythagore nhưng đến giai đoạn này, các nhà toán học đã phát biểu và chứng minh thành một định lý mang tính tổng quát cho mọi tam giác vuông. Hay Euclid đã đặt nền móng cho việc ra đời của hình học. Cũng chính ông đã xây dựng thuật toán tìm ước số chung của hai số đếm bất kỳ trong số học. Trong thời kỳ này, Aristotle đã đặt cơ sở cho logic học, tạo cơ sở lý luận trong khoa học, còn Hipparchus thì đặt nền móng cho lượng giác. Thời kỳ này cũng đạt được một số tiến bộ về đại số, giải tích... Một đặc điểm nữa là toán học thời kỳ này có xu hướng hình học hóa, nghĩa là những bài toán ở lĩnh vực khác như số học, đại số thì đều được tìm cách giải bằng hình học. 1.1.5. Toán học Trung Quốc cổ đại Toán học ở Trung Quốc bắt đầu phát triển vào thế kỷ 11 TCN. Trung Quốc phát minh các số rất lớn, số âm, số thập phân, hệ thập phân, hệ nhị phân, đại số, hình học và lượng giác. Các nhà toán học Trung Quốc cổ đại đã có những tiến bộ trong phát triển thuật toán. Kiến thức về tam giác Pascal được chứng minh đã tồn tại ở Trung Quốc hàng thế kỷ trước khi Pascal ra đời. 1.2. Những cơ sở tính toán cơ bản 1.2.1. Boole Đại số Boole được đặt tên theo George Boole (1815–1864) - một nhà toán học người Anh. Đại số Boole làm việc với các đại lượng chỉ có hai trạng thái và có thể thể hiện hệ 8 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  10. lOMoARcPSD|42620215 thống số nhị phân, hoặc các mức điện thế trong mạch điện logic. Do đó đại số Boole có nhiều ứng dụng trong kỹ thuật điện và khoa học máy tính, cũng như trong logic toán học. Đại số Boole là một cấu trúc đại số có các tính chất cơ bản của cả các phép toán trên tập hợp và các phép toán logic. Cụ thể, các phép toán trên tập hợp được quan tâm là phép giao, phép hợp, phép bù; và các phép toán logic là Và (And), Hoặc (Or), Phủ định (Not). 1.2.2. Babbage Charles Babbage là một bác học người Anh, đã nghiên cứu rất nhiều lĩnh vực trong đó có toán học, kỹ thuật, kinh tế, chính trị, mật mã và khoa học máy tính. Ông được xem là người phát minh ra máy tính cơ học đầu tiên. Năm 1822, Babbage đã tạo một mô hình Máy sai phân (Difference Engine). Mặc dù đó là một mô hình cơ khí cồng kềnh, nhưng bộ nhớ dữ liệu và bộ nhớ chương trình đã được tách biệt; vận hành theo bảng hướng dẫn; bộ phận điều khiển có thể thực hiện các bước nhảy có điều kiện và có một bộ điều khiển vào/ra (Input/Output) riêng biệt. Máy phân tích (Analytical Engine) của Babbage ra đời năm 1823, được coi là máy tính lập trình đầu tiên trên thế giới; được thiết kế để thực hiện các phép toán theo lệnh điều khiển; bao gồm các „ngăn xếp‟ có thể lưu giữ được các con số có bốn mươi chữ số và có „trung tâm xử lý‟. Các kết quả sau mỗi lần tính toán được trả lại ngăn xếp, được lưu trữ để đưa vào trung tâm xử lý phục vụ cho quá trình tiếp theo. Đây là một mô hình sơ khai về các bộ nhớ và bộ xử lý của máy tính. Hình 1.1. Mô phỏng Máy phân tích (Analytical Engine) 1.2.3. Máy Turing Alan Mathison Turing (1912 - 1954) là một nhà toán học người Anh đã đưa ra một thiết bị tính đơn giản gọi là máy Turing. Về lý thuyết, mọi quá trình tính toán đều có thể mô phỏng lại trên máy Turning. Máy Turning gồm có: 9 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  11. lOMoARcPSD|42620215 - Một bộ điều khiển trạng thái hữu hạn (finite control), trong đó có các trạng thái đặc biệt như trạng thái khởi đầu và trạng thái kết thúc. - Một băng ghi (tape) chứa tín hiệu trong các ô. - Một đầu đọc (head) và ghi có thể di chuyển theo 2 chiều trái hoặc phải một đơn vị. Hình 1.2. Sơ đồ máy Turing Ðầu đọc/ghi mang chức năng thông tin nối giữa Bộ điều khiển hữu hạn và băng ghi. Bộ kiểm soát vận hành theo từng bước riêng biệt; mỗi bước nó thực hiện 2 chức năng tùy thuộc vào trạng thái hiện tại của nó và tín hiệu hiện tại của băng: 1. Ðặt bộ điều khiển ở trạng thái ban đầu q1, băng trắng và đầu đọc/ghi chỉ vào ô khởi đầu. 2. Nếu: (a) trạng thái hiện tại q1 trùng với trạng thái kết thúc q0 thì máy sẽ dừng. (b) ngược lại, trạng thái q1 sẽ chuyển qua q2, đầu đọc dịch chuyển sang phải hoặc trái một đơn vị. Máy hoàn thành xong một bước tính toán và sẵn sàng cho bước tiếp theo. 1.2.4. Định lý Shannon Vào năm 1948, nhà toán học Shannon - người được xem là cha đẻ của kỷ nguyên thông tin, đã trình bày công thức về thông lượng kênh (channel capacity), được gọi là Định lý Shannon. Định lý Shannon định nghĩa thông lượng kênh (ký hiệu C) như tốc độ bit (R) lớn nhất mà chúng ta có thể thông tin qua kênh đó mà thông tin không bị méo. Thông lượng kênh được xác định: C = W log2 (1 + S/N) Với W là băng thông của kênh thông tin, có đơn vị đo là [Hz], S là công suất của tín hiệu được truyền đi, có đơn vị [W], N là công suất của nhiễu, cũng có đơn vị đo [W]. C có đơn vị [bit/giây] hay [b/s]. 1.2.5. Nguyên lý Von Neumann Năm 1946, John Von Neumann (1903 - 1957) – nhà toán học nguời Mỹ đã đề ra một nguyên lý máy tính hoạt động theo một chương trình được lưu trữ và truy nhập theo địa chỉ. Nội dung nguyên lý Von Neumann gồm: 10 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  12. lOMoARcPSD|42620215  Máy tính có thể hoạt động theo một chương trình đã được lưu trữ. Theo Von Neumann, chúng ta có thể tập hợp các lệnh cho máy thực hiện theo một chương trình được thiết kế và coi đó như một tập dữ liệu. Dữ liệu này được cài vào trong máy và được truyền bằng xung điện. Ðây là một cuộc cách mạng mới cho máy tính nhằm tăng tốc độ tính toán vào thời đó vì trước kia máy chỉ có thể nhận được các lệnh từ băng giấy hoặc bìa đục lỗ và nạp vào bằng tay. Nếu gặp bài toán lặp lại nhiều lần thì cũng tiếp tục bằng cách nạp lại một cách thủ công như vậy gây hạn chế trong quá trình tính toán.  Bộ nhớ được địa chỉ hóa Mỗi dữ liệu đều có một địa chỉ của vùng nhớ chứa số liệu đó. Như vậy để truy nhập dữ liệu ta chỉ cần xác định địa chỉ của nó trên bộ nhớ.  Bộ đếm của chương trình Nếu mỗi câu lệnh phải dùng một vùng nhớ để chứa địa chỉ của câu lệnh tiếp theo thì không gian bộ nhớ sẽ bị thu hẹp. Ðể khắc phục hạn chế này, máy được gắn một thanh ghi để chỉ ra vị trí của lệnh tiếp theo cần được thực hiện và nội dung của nó tự động được tăng lên mỗi lần lệnh được truy cập. Muốn đổi thứ tự lệnh ta chỉ cần thay đổi nội dung thanh ghi bằng một địa chỉ của lệnh cần được thực hiện tiếp. 1.3. Các ngôn ngữ lập trình Ngôn ngữ lập trình là ngôn ngữ được dùng để diễn tả các thuật toán sao cho máy tính có thể hiểu và thực hiện được. Một số ngôn ngữ lập trình được sử dụng phổ biến hiện nay được thể hiện trong Hình 1.3. Ngôn ngữ lập trình được chia làm 3 loại:  Ngôn ngữ máy  Hợp ngữ  Ngôn ngữ bậc cao (là ngôn ngữ được các lập trình viên sử dụng chủ yếu) Hình 1.3. Một số Ngôn ngữ lập trình phổ biến Với tốc độ phát triển chóng mặt của công nghệ thông tin, theo thống kê của Wikipedia, trên thế giới hiện nay có hơn 700 ngôn ngữ lập trình. Tuy nhiên, con số đó vẫn chưa có dấu hiệu ngừng tăng trong tương lai. Một số ngôn ngữ lập trình được sử dụng nhiều nhất hiện nay: 11 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  13. lOMoARcPSD|42620215  Ngôn ngữ lập trình Java James Gosling, Mike Sheridan, và Patrick Naughton là những người đầu tiên tham gia dự án phát triển ngôn ngữ Java vào tháng 6 năm 1991, lúc đó đội của họ có tên là Green team và đang làm việc cho tập đoàn Netscape. Mục tiêu ban đầu của dự án là tạo ra một ngôn ngữ chạy trên các thiết bị điện tử như tivi hay các đầu thu phát (set-top boxes). Tên đầu tiên họ đặt cho ngôn ngữ này là “Greentalk” do James Gosling đưa ra. Sau đó nó được đổi tên là Oak2 và được phát triển như một phần của dự án Green. Cho mãi tới năm 1995, Oak đã được đổi tên thành Java bởi vì cái tên Oak đã được đăng ký trước đó bởi một công ty tên Oak Technologies. Đây là một trong những ngôn ngữ lập trình phổ biến nhất trên thế giới (trong đó có Việt Nam), được xem như tiêu chuẩn của mọi lập trình viên. Java là một loại ngôn ngữ lập trình ưu việt trên nhiều nền tảng khác nhau. Một đoạn code Java có thể phù hợp với bất cứ nền tảng nào như Linux, Window, Mac OS,.. mà không cần viết lại. Java có thể hỗ trợ lập trình các phần mềm dành cho desktop, website, ứng dụng trên hệ điều hành Android, lập trình game,…  Ngôn ngữ lập trình C Ngôn ngữ lập trình C là một loại ngôn ngữ biên dịch (compiled language) được phát triển vào năm 1972 tại phòng thí nghiệm Bell của tập đoàn AT&T3, do Brian W. Kernighan và Dennis Ritchie phát triển. Ngôn ngữ C có lịch sử phát triển lâu đời nhưng C vẫn là một ngôn ngữ lập trình được sử dụng phổ biến, nó được sử dụng trong hầu hết các hệ thống máy tính Ngôn ngữ C thuộc ngôn ngữ bậc cao mà con người có thể dễ dàng hiểu được nội dung mô tả trong nó, do đó chúng ta cần phải biên dịch ngôn ngữ này sang ngôn ngữ mà máy tính có thể hiểu khi chạy chương trình. Mã chương trình được tạo ra sau khi biên dịch từ mã nguồn của C được cho là nhỏ gọn và có hiệu suất xử lý tốt. Ngôn ngữ C là ngôn ngữ lập trình có tính logic cao, được dùng để lập trình các phần mềm và ứng dụng cơ bản. Có thể dễ dàng tạo ra được những game đơn giản (cờ vua, caro,..) trên nền tảng ngôn ngữ C.  Ngôn ngữ lập trình Python Python được phát triển bởi Guido van Rossum vào năm 1991, nhằm giao tiếp với hệ điều hành có tên Amoeba. Python có thể chạy được hầu hết các hệ điều hành phổ biến như Windows, Linux, Mac OS. Python không những được sử dụng trên máy tính mà còn có thể chạy trên nền tảng iOS và Android. Python là ngôn ngữ có cú pháp đơn giản, dễ hiểu. So với các ngôn ngữ khác có yêu cầu nghiêm ngặt từ các dấu chấm phẩy cuối câu như C hay Java, thì Python được cho là có ngữ 2 Tên một loại cây rất phổ biến ở các nước như Mỹ, Đức, Romania, … 3 Một công ty viễn thông đa quốc gia có trụ sở tại tại Texas, Mỹ 12 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  14. lOMoARcPSD|42620215 pháp khá đơn giản, chỉ cần sử dụng indent (các dấu thụt lùi) để hoàn thành câu lệnh. Do dễ học, dễ hiểu nên Python nên là ưu tiên hàng đầu trong danh sách những ngôn ngữ mà người mới bắt đầu nên học. Python đặc biệt có ưu thế trong lĩnh vực phân tích dữ liệu và trí tuệ nhân tạo, Python được tích hợp các thư viện mở phong phú. Trong đó nổi tiếng nhất có thể kể đến thư viện Tensorflow dành cho phân tích dữ liệu; SciPy là một thư viện lập trình machine learning (học máy); thư viện NumPy hỗ trợ người dùng các thao tác tính toán mảng đa chiều với kích thước lớn.  Ngôn ngữ lập trình PHP PHP (Hypertext Preprocessor) là ngôn ngữ được phát triển từ năm 1994 bởi Rasmus Lerdorf và cho đến nay đã được nhiều người sử dụng để phát triển các ứng dụng phần mềm thông qua lập trình web. Ưu điểm của ngôn ngữ lập trình PHP là cú pháp đơn giản, tốc độ xử lý nhanh, tính cộng đồng cao. Chính vì vậy mà lập trình PHP được sử dụng chủ yếu để thiết kế web. Có thể sử dụng ngôn ngữ lập trình PHP để tạo ra các blog cá nhân hoặc những website lớn vì ngôn ngữ này có nhiều framework được xây dựng từ các mã nguồn mở như Wordpress, OpenCart. Đây cũng là một ngôn ngữ không quá khó cho người mới bắt đầu, nên đối với những người mới đến lĩnh vực web thì PHP sẽ là lựa chọn đúng đắn. 1.4. Một số hƣớng phát triển tính toán hiện đại 1.4.1. Trí tuệ nhân taọ Trong kỷ nguyên công nghiệp 4.0, “Trí tuệ nhân tạo” là yếu tố không thể không nhắc đến. Ngày nay, trí tuệ nhân tạo (Artificial Intelligence - AI) được coi là một trong những ngành công nghệ quan trọng hàng đầu, giúp con người giải quyết nhiều vấn đề trong cuộc sống. Lĩnh vực này đang thu hút sự quan tâm rất lớn trên toàn cầu nhờ vào những cải tiến với những tính năng hiện đại và nổi trội. AI là một ngành thuộc lĩnh vực khoa học máy tính (Computer science). Là trí tuệ do con người lập trình tạo nên với mục tiêu giúp máy tính có thể tự động hóa các hành vi thông minh như con người. Cụ thể, AI giúp máy tính có được những trí tuệ của con người như biết lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết học và tự thích nghi, … Công nghệ AI tạo ra máy móc và hệ thống thông minh thông qua việc sử dụng các mô hình, kỹ thuật và công nghệ liên quan, giúp thực hiện các công việc yêu cầu trí thông minh của con người. Nhìn chung, đây là một lĩnh vực rất rộng, bao gồm các yếu tố tâm lý học, khoa học máy tính và kỹ thuật. Một số ví dụ phổ biến về AI có thể kể đến như ô tô tự lái, phần mềm dịch thuật tự động, trợ lý ảo trên điện thoại hay đối thủ ảo trong các trò chơi,.... 13 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  15. lOMoARcPSD|42620215 Công nghệ AI được chia làm 4 loại chính:  Loại 1: Công nghệ AI phản ứng. Công nghệ AI phản ứng có khả năng phân tích những động thái khả thi nhất của chính mình và của đối thủ, từ đó, đưa ra được giải pháp tối ưu nhất. Một ví dụ là Deep Blue, chương trình tự động chơi cờ vua của IBM đã đánh bại kì thủ thế giới Garry Kasparov vào những năm 1990. Công nghệ AI của Deep Blue có thể xác định các nước cờ và dự đoán những bước đi tiếp theo. Tuy nhiên, nó không thể sử dụng những kinh nghiệm trong quá khứ để tiếp tục huấn luyện trong tương lai.  Loại 2: Công nghệ AI với bộ nhớ hạn chế Các hệ thống AI này có thể sử dụng những kinh nghiệm trong quá khứ để đưa ra các quyết định trong tương lai. Một số chức năng ra quyết định này có mặt trong các loại thiết bị không người lái như xe, máy bay hoặc tàu ngầm. Kết hợp các cảm biến môi trường xung quanh, công nghệ AI loại này có thể dự đoán được tình huống và đưa ra những bước hành động tối ưu cho thiết bị. Sau đó chúng sẽ được sử dụng để đưa ra hành động trong bước tiếp theo. Ví dụ, đối với xe không người lái, nhiều cảm biến được trang bị xung quanh xe và ở đầu xe để tính toán khoảng cách với các xe phía trước, công nghệ AI sẽ dự đoán khả năng xảy ra va chạm, từ đó điều chỉnh tốc độ xe phù hợp để giữ an toàn cho xe.  Loại 3: Lý thuyết AI Lý thuyết AI có thể học hỏi cũng như tự suy nghĩ, sau đó áp dụng những gì học được để thực hiện một thao tác cụ thể. Hiện nay, loại công nghệ AI này vẫn chưa trở thành một phương án khả thi.  Loại 4: Tự nhận thức Hệ thống AI có ý thức và hành xử như con người. Chúng thậm chí còn có cảm xúc và hiểu được cảm xúc của những người khác. Tất nhiên, loại công nghệ AI này vẫn chưa khả thi. Ứng dụng trí tuệ nhân tạo trong đời sống:  Trong ngành y tế Những ứng dụng của AI trong y học mang lại cho con người những giá trị đáng kinh ngạc. Có thể kể đến một số ứng dụng như sau: - AI trong ra quyết định lâm sàng: Với sự phát triển nhanh chóng của công nghệ, lượng thông tin mới từ các công trình nghiên cứu ngày càng nhiều và nhanh hơn. Hiện nay, lượng thông tin y khoa đã tăng gấp đôi cứ sau 3 năm. Giải pháp duy nhất để có thể tiếp cận và sử dụng khối lượng thông tin khổng lồ trong lĩnh vực y tế đó là sử dụng công nghệ AI. IBM Watson là một trong những hệ thống hàng đầu hỗ trợ chăm sóc sức khỏe bằng AI, giúp các bác sĩ đưa ra quyết định hiệu quả. Với khả năng học máy và khả năng xử lý ngôn ngữ tự nhiên, hệ thống này giúp các bác 14 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  16. lOMoARcPSD|42620215 sĩ xem xét hồ sơ sức khoẻ điện tử của bệnh nhân và cập nhật thông tin hướng dẫn điều trị từ các công trình nghiên cứu y khoa. - AI trong chẩn đoán: Lỗi chẩn đoán là một mối đe dọa nghiêm trọng đối với chất lượng và an toàn trong chăm sóc sức khỏe. Tại Mỹ, ước tính tỷ lệ lỗi chẩn đoán là 5,08% tương đương 12 triệu người mỗi năm. Khoảng một nửa trong số các lỗi này là có khả năng gây hại. Công nghệ AI đã được sử dụng để cải thiện chất lượng chẩn đoán, đặc biệt là trong chẩn đoán hình ảnh X quang. - AI trong robots y học: Các ứng dụng của công nghệ AI trong y tế cũng bao gồm robot và thiết bị y tế hỗ trợ. Ví dụ, robot điện thoại có thể tạo điều kiện giao tiếp giữa bệnh nhân với các chuyên gia y tế; Robot cũng có thể được sử dụng trong phẫu thuật với tư cách là trợ lý bác sĩ phẫu thuật, hệ thống phẫu thuật da Vinci là một trong những robot phẫu thuật được sử dụng phổ biến nhất.  Trong ngành giáo dục Việc vận dụng AI trong các thao tác dạy và học, các trò chơi, phần mềm giáo dục giúp cải thiện và nâng cao trình độ học tập của người học. Ngoài ra, AI trong giáo dục còn có khả năng theo dõi sự tiến bộ của người học để giáo viên có thể biết và điều chỉnh cách dạy học sao cho hợp lý.  Trong ngành tài chính ngân hàng Các ngân hàng, tổ chức tài chính đang sử dụng AI trong việc xử lí các hoạt động tài chính, đầu tư và cổ phiếu, quản lí tài sản,… AI có thể giúp con người trong việc xử lí các giao dịch, giúp ngân hàng hỗ trợ khách hàng tốt hơn, cung cấp các giải pháp nhanh chóng hoặc nhận diện gương mặt của chủ tài khoản,…  Trong ngành dịch vụ Công nghệ AI có khả năng nắm bắt được những thông tin về các hoạt động sử dụng dịch vụ của khách hàng thông qua việc thu thập và phân tích dữ liệu để từ đó đưa ra các giải pháp tối ưu, hiệu quả và phù hợp với nhu cầu sử dụng của họ. Điều này giúp ngành dịch vụ có thể hoạt động tốt hơn và mang lại những trải nghiệm thú vị, mới mẻ hơn cho người dùng. Chatbot chính là ví dụ điển hình cho ứng dụng này.  Trong ngành truyền thông Đối với ngành truyền thông, AI ra đời đã mang lại sự thay đổi lớn cho ngành trong việc tiếp cận các mục tiêu, đối tượng khách hàng tiềm năng. Dựa trên việc phân tích về nhân khẩu học, thói quen hoạt động trực tuyến hay những nội dung quảng cáo khách hàng quan tâm để điều chỉnh thời gian và không gian cung cấp quảng cáo sao cho phù hợp. 15 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  17. lOMoARcPSD|42620215  Trong ngành sản xuất - Phát hiện lỗi trong dây chuyền sản xuất Ngày nay, nhiều dây chuyền lắp ráp không có quy trình hoặc các giải pháp công nghệ để xác định lỗi. Ngay cả khi những lỗi đó rất cơ bản, chúng vẫn đòi hỏi các kỹ sư lành nghề và các thuật toán để phân tích, tìm kiếm và phát hiện ra các điểm sai sót. Phần lớn các hoạt động trên vẫn không thể thường xuyên cập nhật thông tin mới, dẫn đến việc kiểm tra còn nhiều sai sót. Vì vậy, nhân viên vẫn phải tiến hành bước kiểm tra thủ công sau đó. Bằng cách ứng dụng khả năng tự học của AI vào quy trình sản xuất, các nhà sản xuất có thể dần loại bỏ quy trình kiểm tra chất lượng bằng con người, từ đó tiết kiệm được nhiều thời gian làm việc. Hệ thống còn giúp phát hiện lỗi sớm trong quá trình sản xuất, do đó có thể giảm thiểu thiệt hại đáng kể. - Đảm bảo chất lượng Trong nhiều lĩnh vực sản xuất công nghiệp, hoạt động sản xuất đòi hỏi sự chính xác đến từng chi tiết nhỏ nhất. Vấn đề này từng là bài toán khó đối với nhiều doanh nghiệp, nay đã có thể giải quyết một cách dễ dàng với các công nghệ thông minh như AI hoặc máy học. Trước đây, đảm bảo chất lượng là một công việc thủ công, tập trung các kỹ sư có tay nghề cao để đảm bảo rằng các thiết bị điện tử và vi xử lý được sản xuất chính xác. Ngày nay, các thuật toán xử lý hình ảnh có thể tự động xác nhận một sản phẩm đã được sản xuất hoàn thiện hay chưa. Bằng cách cài đặt camera tại các điểm quan trọng dọc theo quy trình sản xuất, việc kiểm soát chất lượng này có thể diễn ra tự động và theo thời gian thực. - Hỗ trợ tổng hợp và phân tích dữ liệu Ngày nay, phần lớn thiết bị mà các nhà sản xuất sử dụng sẽ gửi một lượng dữ liệu khổng lồ lên ứng dụng điện toán đám mây. Các thông tin này có xu hướng bị bỏ qua và không được phân tích đồng bộ để cho ra được những thông tin thực sự có ý nghĩa đối với hoạt động quản trị. Để có được một bức tranh tổng thể về toàn bộ hoạt động quản lý và sản xuất, người điều hành doanh nghiệp cần thu thập rất nhiều dữ liệu và cần các chuyên gia xử lý dữ liệu có kinh nghiệm đọc, tổng hợp và phân tích. Việc này sẽ tốn không ít thời gian và công sức trong khi thị trường sản xuất không có chỗ cho bất kì sự chậm chễ nào. Do đó, việc ứng dụng AI trong hỗ trợ tổng hợp, phân tích dữ liệu theo yêu cầu của doanh nghiệp là rất thiết thực. 1.4.2. Điện toán đám mây Điện toán đám mây (cloud computing) là mô hình điện toán sử dụng công nghệ máy tính và phát triển dựa vào mạng Internet. Đó là việc ảo hoá các tài nguyên tính toán và ứng dụng. Thay vì sử dụng một hay nhiều máy chủ (có thể nhìn thấy, chạm, nắm bằng tay), thì nay người dùng sẽ sử dụng các tài nguyên được ảo hoá thông qua môi trường Internet. Chúng ta có thể truy cập đến bất kỳ tài nguyên nào tồn tại trong “đám mây (cloud)” tại bất kỳ thời điểm nào và từ bất kỳ đâu thông qua hệ thống Internet. 16 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  18. lOMoARcPSD|42620215 Ba mô hình của điện toán đám mây bao gồm IaaS, PaaS và SaaS. Mỗi loại sẽ có những đặc điểm như sau:  Infrastructure as a Service (IaaS) IaaS (Dịch vụ cơ sở hạ tầng) chuyên cung cấp các tính năng cơ bản nhất như mạng, máy tính ảo, không gian lưu trữ dữ liệu, CPU, RAM, HDD/SSD,... Khi sử dụng dịch vụ này, người dùng đã có một máy chủ ảo trên không gian đám mây để làm việc. Người dùng không cần phải quan tâm tới các khía cạnh khác như máy chủ nằm ở trung tâm dữ liệu nào, sử dụng mạng viễn thông nào,...  Platform as a Service (PaaS) PaaS (Dịch vụ nền tảng) cho phép người dùng lựa chọn các công cụ để triển khai và sử dụng. Người dùng không cần quan tâm tới việc cập nhật các phiên bản mới hay các vấn đề liên quan tới RAM, CPU, ổ cứng, bộ nhớ,...  Software as a Service (SaaS) SaaS (Dịch vụ phần mềm) được thiết kế dành cho người dùng cuối. Người dùng có thể biết hoặc không cần biết về kỹ thuật máy tính. Công việc của họ là làm quen với phần mềm và ứng dụng vào công việc của mình. Ứng dụng của công nghệ điện toán đám mây:  Cơ sở dữ liệu đám mây Cơ sở dữ liệu được lưu trữ bằng công nghệ điện toán đám mây luôn hoạt động một cách mạnh mẽ nên một tổ chức nào đó có thể tiết kiệm được khoản chi phí mua máy chủ để lưu trữ và vận hành. Ngoài ra, chúng ta không phải lo lắng điều gì bởi đội ngũ kỹ thuật của nhà cung cấp sẽ đảm bảo tính ổn định của hệ thống cơ sở dữ liệu trong suốt quá trình vận hành.  Dịch vụ lưu trữ Website an toàn: Các tổ chức chỉ phải thanh toán theo nhu cầu thực tế khi sử dụng dịch vụ lưu trữ nhưng vẫn luôn đảm bảo vấn đề an toàn thông tin được xuyên suốt và trọn vẹn.  Sao lưu, khôi phục dữ liệu nhanh chóng Sao lưu lại nguồn dữ liệu trong quá trình hoạt động rất quan trọng. Khi có sự cố xảy ra, người dùng vẫn có thể tự động khôi phục dữ liệu nhanh chóng. Trước khi xuất hiện công nghệ điện toán đám mây, mỗi cá nhân hay tổ chức phải tự sao lưu thủ công. Tuy nhiên khi áp dụng ứng dụng này thì tất cả mọi dữ liệu đều được sao lưu hoàn toàn tự động để đảm bảo sự tiện lợi đến mức tối đa trong suốt quá trình sử dụng.  Ứng dụng quản lý doanh nghiệp Khi đưa các dữ liệu lên hệ thống lưu trữ đám mây, các doanh nghiệp có thể dễ dàng kiểm soát và quản lý dữ liệu một cách hiệu quả nhất. Hầu hết các nền tảng chuyên phân tích dữ liệu đều sử dụng hình thức này và chúng đều có khả năng xử lý dữ liệu có cấu trúc hoặc không có cấu trúc một cách trọn vẹn. 17 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  19. lOMoARcPSD|42620215  Lưu trữ và chia sẻ dữ liệu hiệu quả Chỉ cần có Internet, người dùng có thể hoàn toàn sao lưu và truy xuất dữ liệu ở khắp mọi nơi và bất cứ khi nào họ cần. Những ứng dụng trên nền tảng điện toán đám mây được sử dụng phổ biến tính đến nay đó là: Google Drive, Dropbox, One Drive… 1.4.3. Big Data Big Data là tài sản thông tin dữ liệu, những dữ liệu này có khối lượng lớn, tốc độ gia tăng dữ liệu cao, có tính đa dạng, tính xác thực và mang lại giá trị nên đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được các quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu. Khi làm việc với một lượng lớn Big Data, điều cần thiết là phải hiểu rõ nguồn thông tin thô và cách xử lý nó trước khi phân tích. Vì có rất nhiều dữ liệu, nên việc trích xuất thông tin phải được thực hiện một cách hiệu quả để thu được giá trị cao nhất có thể từ dữ liệu đã cho. Dưới đây là các loại Big Data: - Dữ liệu có cấu trúc Dữ liệu được lưu trữ trong bản ghi, tất cả thông tin có cùng một phạm vi thuộc tính. Dữ liệu có cấu trúc còn được gọi là dữ liệu quan hệ. Một trong những lợi ích của dữ liệu có cấu trúc là quá trình xử lý đơn giản và dễ hiểu trong việc kết hợp nhiều bảng dữ liệu. Bởi vì các tài nguyên dữ liệu có liên quan đã được xác định và có định dạng nhất quán. - Dữ liệu phi cấu trúc Mọi dữ liệu thu thập được không có cấu trúc nhất định và không phải tất cả dữ liệu đều có hướng dẫn cho người dùng biết về cách sử dụng chúng. Điều khó khăn nhất của việc phân tích dữ liệu phi cấu trúc là tạo ra một ứng dụng để hiểu được thông tin mà nó đang trích xuất. Thông thường, việc giải thích một cách có hệ thống là cần thiết, điều này khó và thay đổi tùy thuộc vào hình thức và mục tiêu cuối cùng. - Dữ liệu bán cấu trúc Dữ liệu bán cấu trúc bao gồm dữ liệu có cấu trúc và phi cấu trúc. Nó chủ yếu đề cập đến dữ liệu phi cấu trúc với siêu dữ liệu được đính kèm. Chẳng hạn, một thư điện tử là một ví dụ cho dữ liệu bán cấu trúc. Thời gian gửi của thư điện tử, địa chỉ email của người gửi và người nhận và các thông tin quan trọng khác đều được kết nối với nội dung của thư. Mặc dù nội dung thực sự được gửi là không có cấu trúc, nhưng các thành phần như vậy cho phép dữ liệu trở nên có cấu trúc một phần. Big Data có 5 đặc trưng: Volume, Variety, Velocity, Veracity và Value. Theo đó lần lượt là khối lượng, mức độ đa dạng, tốc độ phân tích xử lý dữ liệu, tính xác thực của dữ liệu và giá trị thông tin. Hình 1.4 minh họa mô hình Big Data. 18 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
  20. lOMoARcPSD|42620215 Hình 1.4. Mô hình Big Data  Volume – Khối lượng Trên thực tế, lượng dữ liệu được tạo ra trong gần hai thập kỷ gần đây. Và theo dự báo trong những năm tới lượng dữ liệu còn tăng gấp nhiều lần. Thực tế là lượng dữ liệu sẽ siêu lớn khi mà IoT (Interet of Thing) ngày càng được ứng dụng rộng rãi hơn với hàng triệu tỉ cảm biến điện tử được sử dụng. Vì vậy, ngày càng nhiều dữ liệu được tạo ra, lưu trữ và xử lý là nhờ các công nghệ đột phá như điện toán đám mây, bộ siêu vi xử lý…  Variety – Mức độ đa dạng Theo cách hiểu truyền thống thì dữ liệu được hiểu là dữ liệu có cấu trúc. Dữ liệu được lưu vào các cột và các dòng như trong Excel. Tuy nhiên, quan điểm về dữ liệu trong thời đại mới đã mở rộng hơn rất nhiều, nó có thể là: Âm thanh, hình ảnh, video, email, … Đa số dữ liệu là dữ liệu phi cấu trúc. Điều này khiến làm cho dữ liệu trở nên đa dạng đến mức phức tạp. Hình 1.5. Dữ liệu tạo nên Big Data  Velocity – Tốc độ Đây là thuật ngữ quan trọng trong Big Data, nó đề cập tới tốc độ dữ liệu được tạo ra, lưu trữ, xử lý và truy vấn. Trong quá khứ thì dữ liệu được cập nhật thường xuyên nhưng thời gian phân tích, xử lý và lập báo cáo thường là định kỳ. Có thể là hàng tuần hoặc hàng tháng mới thu thập được đầy đủ dữ liệu để phục vụ việc báo cáo. Nhưng hiện tại với sự phát 19 Downloaded by VDOC Online Solutions (vdochcm@gmail.com)
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
37=>1