✨Sách - Giáo Trình Khai Phá Dữ Liệu Web

Tác giả: Hà Quang Thuỵ, Đoàn Sơn, Phan Xuân Hiếu, Nguyễn Trí ThànhNăm XB: 2011Số trang: 312Khổ sách : 16 x 24Nhà xuất bản: NXBGDVNNội dung :Trong cuốn sách nổi tiếng "Data Mining – Concepts andTe...

Tác giả: Hà Quang Thuỵ, Đoàn Sơn, Phan Xuân Hiếu, Nguyễn Trí Thành

Năm XB: 2011

Số trang: 312

Khổ sách : 16 x 24

Nhà xuất bản: NXBGDVN Nội dung : Trong cuốn sách nổi tiếng "Data Mining – Concepts and Techniques" hai tác giả Jawei Han và Micheline Kamber nhận định rằng, tình trạng "giàu về dữ liệu mà nghèo về thông tin" là một động lực phát triển lĩnh vực khai phá dữ liệu và phát hiện tri thức trong cơ sở dữ liệu (CSDL). Hoạt động nghiên cứu và triển khai xây dựng các hệ thống tự động nhận ra các mẫu có giá trị, mới, hữu ích tiềm năng và hiểu được trong khối dữ liệu đồ sộ, nhằm bo ) sung tài nguyên tri thức cho con người là hết sức cần thiết và có ý nghĩa trong quá trình hình thành và phát triển kinh tế tri thức.

Ngày nay, World Wide Web đã trở thành một kho tài nguyên dữ liệu khổng lồ về mọi lĩnh vực; kho tài nguyên dữ liệu này dạng không ngừng tăng trưởng với tốc độ cao. Kho tài nguyên dữ liệu Web tiềm ẩn nhiều mẫu thông tin quý giá đối với hoạt động của cộng đồng nói chung và từng cá thể nói riêng. Các hệ thống khai phá dữ liệu Web đã trở thành các công cụ làm cho tài nguyên Web "kho trời chung vô tận của riêng mình" (Cao Bá Quát) thực sự phát huy hiệu quả tới cộng đồng và tới mỗi cá thể trong cộng đồng. Phù hợp với sự phát triển của Web, hoạt động nghiên cứu và triển khai về khai phá dữ liệu Web không ngừng được tăng trưởng. Hiệp hội các nhà khoa học về Phát hiện tri thức và Khai phá dữ liệu (The Association for Computing Machinery's Special Interest Group on Knowledge Discovery and Data Mining, viết tắt là SIGKDD) đã tập hợp được nhiều nhà khoa học, trong đó có nhiều nhà khoa học máy tính nổi tiếng thế giới. Từ năm 1995 tới nay, hoạt động điển hình nhất của SIGKDD là tổ chức Hội nghị Khoa học quốc tế thường niên ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Khai phá dữ liệu Web đã trở thành một trong những nội dung nhận được nhiều quan tâm nhất tại ACM SIGKDD Conference on Knowledge Discovery and Data Mining và các hội nghị khoa học quốc tế lớn khác.

Từ năm 2006, "Khai phá dữ liệu Web" đã là một môn học trong Chương trình đào tạo ngành Công nghệ thông tin (CNTT) và ngành Hệ thống thông tin (HTTT) tại Khoa Công nghệ Thông tin, Trường Đại học Công nghệ (ĐHCN), Đại học Quốc gia Hà Nội (ĐHQGHN). Giáo trình Khai phá dữ liệu Web này được tập hợp và hoàn thiện từ nội dung các bài giảng trong thời gian vừa qua, nhằm cung cấp một tài liệu hoàn chỉnh phục vụ hoạt động giảng dạy và học tập môn học này tại Khoa CNTT, Trường.

👁️ 170 | 🔗 | 💖 | ✨ | 🌍 | ⌚
VNĐ: 45,000
Tác giả: Hà Quang Thuỵ, Đoàn Sơn, Phan Xuân Hiếu, Nguyễn Trí Thành Năm XB: 2011 Số trang: 312 Khổ sách : 16 x 24 Nhà xuất bản: NXBGDVN Nội dung : Trong cuốn sách
Công ty Học Liệu Sư Phạm giới thiệu: Tác giả: Nhiều tác giả Nhà xuất bản: Nhà Xuất Bản Giáo Dục Việt Nam Đơn vị phát hành: Nhà Xuất Bản Giáo Dục Việt Nam Ngày
Trong cuốn sách nổi tiếng "Data Mining – Concepts and Techniques" hai tác giả Jawei Han và Micheline Kamber nhận định rằng, tình trạng "giàu về dữ liệu mà nghèo về thông tin" là một
thumb|Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL. **Cơ sở dữ liệu** () là một tập hợp các dữ liệu có tổ chức liên quan đến
**Rò rỉ dữ liệu** hay **vi phạm dữ liệu**, **lộ dữ liệu** là "việc tiết lộ, công khai hoặc làm mất thông tin cá nhân một cách trái phép". Kẻ tấn công có nhiều động
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
Đây là danh sách **Phần mềm mã nguồn mở**: là phần mềm máy tính được cấp phép giấy phép mã nguồn mở. Bài viết này không có tham vọng liệt kê tất cả những phần
nhỏ|thế=|Các tầng của [[internet được hình tượng thành một ngọn núi băng, web chìm nằm ở giữa núi băng.]] **Web chìm** (tiếng Anh: **deep web**) hay **web ẩn** (tiếng Anh: **invisible web**, **undernet** hoặc **hidden
thumb|right|Trang bìa của Dự án Blue Book. **Dự án Blue Book** (_Sách Xanh_ hay _Quyển sách màu Xanh da trời_) là một trong hàng loạt nghiên cứu có hệ thống về vật thể bay không
Sau đây là **danh sách các dự án trí tuệ nhân tạo** trong hiện tại và quá khứ đáng chú ý. ## Các dự án chuyên ngành ### Mô phỏng bộ não con người *
Sách- Tin Học Ứng Dụng Tự Học Nhanh Microsoft Access ( tặng sổ tay xương rồng ) Sổ tay ngẫu nhiên 1 trong 4 hình Access 2019, luôn là một chương trình ứng dụng cơ
**Kinh điển Phật giáo sơ kỳ** (thuật ngữ tiếng Anh: _Early Buddhist texts_ - **EBT**), hay **Kinh văn Phật giáo sơ kỳ**, là một khái niệm học thuật để chỉ hệ thống các kinh văn
1. Data Strategy - Chiến Lược Dữ Liệu Dữ liệu đang thay đổi cách chúng ta sống và làm việc với tốc độ chưa từng có. Nó là tất cả dấu vết ta để lại
**Phương tiện truyền thông mạng xã hội** (tiếng Anh: _social media_) là các ứng dụng hoặc chương trình được xây dựng dựa trên nền tảng Internet, nhằm tạo điều kiện cho việc tạo mới hoặc
**Opera** là một trình duyệt web và cũng là một bộ phần mềm Internet được phát triển bởi Opera Software, hiện được hơn 270 triệu người sử dụng trên thế giới. Trình duyệt này bao
Trước đây, việc điều khiển một cỗ máy bằng cách nói chuyện với chúng chỉ là những câu chuyện trong khoa học viễn tưởng. Nhưng viễn tưởng này đang dần trở thành hiện thực với
Dưới đây là **danh sách các quan niệm sai lầm phổ biến**. Các mục trong bài viết này truyền đạt , còn bản thân các quan niệm sai lầm chỉ được ngụ ý. ## Nghệ
**Internet Movie Database** (**IMDb** - cơ sở dữ liệu điện ảnh trên Internet) là một trang cơ sở dữ liệu trực tuyến về điện ảnh thế giới. Nó cung cấp thông tin về phim, diễn
thumb|Dark web - tầng dưới cùng của [[không gian mạng]] **Dark web** (tạm dịch: **web tối**) là những nội dung mạng World Wide Web nằm trong darknet trực tuyến nhưng không thể truy cập bằng những cách thông thường mà
**Web 1.0** là giai đoạn phát triển đầu tiên của World Wide Web (Viết tắt: _www_)- được phát minh bởi Nhà khoa học người Anh Tim Berners-Lee, kéo dài khoảng từ năm 1997 đến năm
**Danh sách các nhà phát minh** được ghi nhận. ## Danh sách theo bảng chữ cái ### A * Vitaly Abalakov (1906–1986), Nga – các thiết bị cam, móng neo leo băng không răng ren Abalakov (hay ren
**Creepypasta** là những truyền thuyết kinh dị được chia sẻ trên khắp Internet. Creepypasta kể từ đó đã trở thành một thuật ngữ chung được dùng để chỉ về bất kỳ nội dung kinh dị
NỘI DUNG SÁCH “Python Và Ứng Dụng-Lập Trình Web” PHẦN 1: TỔNG QUAN VỀ THIẾT KẾ WEB GIỚI THIỆU CHƯƠNG 1: LẬP TRÌNH VỚI WEB 3   PHẦN 2: HƯỚNG DẪN SỬ DỤNG FLASK Phần 2 gồm 11 chương hướng dẫn bạn đọc khai thác và sử dụng Flask trong thiết kế Web CHƯƠNG 2: 40 CÂU HỎI ĐÁP VỚI THƯ VIỆN FLASK CHƯƠNG 3: THỰC HÀNH VỚI FLASK (CƠ BẢN) Bài tập 1: Chương trình Hello Word! Bài tập 2: Bắt đầu với dự án Headline đầu tiên. Bài tập 3: Sử dụng template trong dự án Headlines. Bài tập 1: Chương trình Hello Word! hướng dẫn người học cách thiết lập môi trường phát triển, thiết lập máy chủ web và viết ứng dụng Flask đầu tiên. Bài tập 2: Bắt đầu với dự án headlines hướng dẫn cách chạy code Python khi người dùng truy cập một URL và cách trả về dữ liệu cơ bản cho người dùng. Bạn đọc sẽ tìm hiểu cách tự động tìm nạp các headlines mới nhất bằng cách sử dụng nguồn cấp dữ liệu RSS. Bài tập 3: Sử dụng template trong dự án headlines: Giới thiệu các template Jinja và cách tích hợp các template này vào dự án Headlines. Các tác giả cũng sẽ hướng dẫn cách phục vụ các nội dung HTML động bằng cách chuyển dữ liệu từ code Python sang file template.   CHƯƠNG 4 - THÔNG TIN ĐẦU VÀO CỦA NGƯỜI DÙNG CHO DỰ ÁN HEADLINES: Chương này trình bày cách lấy thông tin đầu vào từ người dùng qua Internet và sử dụng thông tin đầu vào này để tùy chỉnh nội dung sẽ hiển thị cho người dùng. Bạn đọc sẽ tìm hiểu xét cách truy cập thông tin thời tiết hiện tại thông qua API JSON và đưa thông tin này vào dự án Headlines .   CHƯƠNG 5  - CẢI THIỆN TRẢI NGHIỆM NGƯỜI DÙNG TRONG DỰ ÁN HEADLINES: Chương này hướng dẫn cách thêm cookie vào dự án Headlinesđể ứng dụng có thể ghi nhớ các lựa chọn của người dùng. Bạn đọc cũng sẽ tạo kiểu cho ứng dụng bằng cách thêm một số CSS cơ bản.   CHƯƠNG 6 - XÂY DỰNG CRIME MAP TƯƠNG TÁC: Chương này giới thiệu một dự án mới là xây dựng một bản đồ tội phạm. Bạn sẽ học về cơ sở dữ liệu quan hệ, cài đặt MySQL trên máy chủ, và xem cách tương tác với cơ sở dữ liệu từ ứng dụng Flask.   CHƯƠNG 7 - THÊM GOOGLE MAPS VÀO DỰ ÁN CRIME MAP: Chương này hướng dẫn cách thêm tiện ích Google Maps và cách thêm và xóa điểm đánh dấu khỏi bản đồ dựa trên cơ sở dữ liệu. Bạn sẽ thêm một form HTML với nhiều thông tin đầu vào khác nhau cho người dùng để báo cáo tội phạm mới và hiển thị các tội phạm hiện có.   CHƯƠNG 8 - XÁC THỰC THÔNG TIN ĐẦU VÀO CỦA NGƯỜI DÙNG TRONG DỰ ÁN CRIME MAP: Chương này hướng dẫn cách thêm tính năng vào ứng dụng bản đồ tội phạm, để đảm bảo rằng, người dùng không thể phá vỡ đầu vào, dù là vô tình hay cố ý.   CHƯƠNG 9 - XÂY DỰNG ỨNG DỤNG WAITER CALLER: Chương này giới thiệu một dự án khác - Dự án ứng dụng gọi người phục vụ đến bàn tại nhà hàng. Bạn đọc sẽ tìm hiểu về Bootstrap và thiết lập hệ thống Kiểm soát tài khoản người dùng cơ bản sử dụng Bootstrap làm giao diện người dùng.   CHƯƠNG 10 - SỰ KẾ THỪA TEMPLATE VÀ WTFORMS TRONG DỰ ÁN WAITER CALLER: chương này giới thiệu các tính năng kế thừa template của Jinja để chúng ta có thể thêm các trang tương tự mà không cần code trùng lặp. Chúng ta sẽ sử dụng thư viện WTForms để làm cho việc xây dựng và xác thực các form web trở nên dễ dàng hơn.   CHƯƠNG 11 - SỬ DỤNG MONGODB VỚI DỰ ÁN WAITER CALLER: chương này giới thiệu cách cài đặt và định cấu hình MongoDB trên máy chủ và liên kết MongoDB với dự án WAITER CALLER. Bạn đọc cũng sẽ hoàn thành dự án cuối cùng bằng cách thêm các chỉ mục vào cơ sở dữ liệu và thêm một biểu tượng yêu thích vào ứng dụng.   CHƯƠNG 12: HƯỚNG DẪN SỬ DỤNG PYQT6 Giới thiệu PyQt6. Ngày và giờ trong PyQt6.
**Tự động hóa tài liệu** (còn được gọi là **lắp ráp tài liệu**) là thiết kế các hệ thống và quy trình công việc hỗ trợ tạo ra các tài liệu điện tử. Chúng bao
The AI Edge - Khai Thác Thế Mạnh AI Trong Sales Và Marketing Trí tuệ nhân tạo - AI đang có những bước phát triển mạnh mẽ và được ứng dụng ngày càng nhiều trong
Trong thế giới hiện đại, kỷ nguyên số đã và đang không chỉ là một phần mở rộng của cuộc sống thường nhật mà còn trở thành nền móng cơ bản trong mọi hoạt động
Giải Mật Ngoại hạng Anh Những chiến lược kinh doanh tối mật & bước ngoặt lịch sử nào đã đưa Ngoại hạng Anh trở thành đế chế công nghiệp giải trí hàng đầu thế giới?
nhỏ|Ảnh chụp màn hình trò chơi giáo dục Chinese Tap trên Android để dạy học tiếng Trung. **Phần mềm giáo dục** là phần mềm máy tính có nhiệm vụ chính là hỗ trợ dạy học
nguyễn công minh trí là người tạo ra **Công nghiệp 4.0**. Công nghiệp 4.0 tập trung vào công nghệ kỹ thuật số từ những thập kỷ gần đây lên một cấp độ hoàn toàn mới
✩ Công ty phát hành: Công Ty TNHH Thương Mại STK ✩ Tác Giả: Trần Tuờng Thụy - Phạm Quang Hiển ✩ Năm Xuất Bản: 2024 ✩ Kích Thước: 16 x 24 cm ✩ Số
Làm Việc Từ Xa, Từ A Đến Z Trong nền kinh tế toàn cầu hiện đại ngày nay, khái niệm làm việc từ xa đã không còn quá xa lạ. Các công ty và tổ
- Nếu bạn muốn hiểu sâu về cách mà thị trường chứng khoán vận hành? - Nếu bạn muốn trở thành một nhà giao dịch chuyên nghiệp? Thì bộ sách đệ tử chân truyền của
DIGITAL TRANSFORMATION - CHUYỂN ĐỔI SỐ Bất kỳ tổ chức nào cũng đều phải đối mặt với những thay đổi lớn tới từ bên ngoài trong quá trình chuyển đổi số. Vậy tổ chức của
thumb|Anh em nhà Duffer và dàn diễn viên của mùa 2 _Cậu bé mất tích_ tại [[San Diego Comic-Con International 2017]] _Cậu bé mất tích_ là một loạt phim truyền hình web của Mỹ thuộc
**Dịch vụ mạng xã hội** (tiếng Anh: **social networking service** – **SNS**) là dịch vụ nối kết các thành viên cùng sở thích trên Internet lại với nhau với nhiều mục đích khác nhau không
**Trình độ kỹ thuật số** (hay còn gọi _trình độ số_, _năng lực công nghệ số_ **)** đề cập đến khả năng sử dụng thông tin và công nghệ kỹ thuật số để tìm kiếm,
Từ năm 2006, trang web lưu trữ tài liệu WikiLeaks đã xuất bản các tài liệu đăng lên ẩn danh. Các tài liệu này vốn không được công bố cho công chúng. ## 2006–08 WikiLeaks
**Google Cloud Platform** (**GCP**), được cung cấp bởi Google, là một bộ dịch vụ điện toán đám mây chạy trên cùng một cơ sở hạ tầng mà Google sử dụng nội bộ cho các sản
**Mạng từ** là một cơ sở dữ liệu từ vựng tiếng Anh. Nó nhóm các từ tiếng Anh thành các tập hợp đồng nghĩa gọi là loạt đồng nghĩa, cung cấp các định nghĩa ngắn
**FIle Explorer**, trước đây là **Windows Explorer, **là một ứng dụng quản lý tập tin đi kèm trong tất cả các phiên bản hệ điều hành Windows từ Windows 95 về sau. Nó cung cấp cho người dùng một giao diện
**Social bookmarking** (tạm dịch là Mạng xã hội đ_ánh dấu trang_) là một dịch vụ trực tuyến cho phép người dùng thêm, chú thích, chỉnh sửa và chia sẻ dấu trang của các tài liệu
thumb|right|Ngành STEM cấu thành từ bốn ngành học: Science ([[Khoa học), Technology (Công nghệ), Engineering (Kỹ thuật) và Mathematics (Toán học)]] **STEM** – Khoa học, Công nghệ, Kỹ thuật và Toán học (STEM, trước đây
            Trong thời đại công nghệ 4.0 hiện nay, robot không còn là khái niệm xa lạ mà đã và đang trở thành một phần tất yếu trong cuộc sống và sản xuất. Việc ứng
**Microsoft Bing**, thường được gọi là **Bing**, là một công cụ tìm kiếm trên web do Microsoft sở hữu và vận hành. Dịch vụ này có nguồn gốc từ các công cụ tìm kiếm trước
Giải Mật Ngoại Hạng Anh Những chiến lược kinh doanh tối mật & bước ngoặt lịch sử nào đã đưa Ngoại hạng Anh trở thành đế chế công nghiệp giải trí hàng đầu thế giới?
Hành Trình Thống Trị Thế Giới Của Youtube - Like, Comment, Subscribe Trên khắp thế giới, mọi người xem hơn một tỷ giờ video trên YouTube mỗi ngày. YouTube đã giúp chúng ta giải trí
**Xử lý ngôn ngữ tự nhiên** (_natural language processing_ - NLP) là một nhánh của trí tuệ nhân tạo tập trung vào các ứng dụng trên ngôn ngữ của con người. Trong trí tuệ nhân
**Công khai tính dục** (_coming out of the closet_, thường được nói ngắn gọn là **coming out**), là một cụm ẩn dụ cho việc người thuộc cộng đồng LGBT tự tiết lộ về xu hướng
CUỐN SÁCH NÀY, MANG ĐẾN LỢI ÍCH GÌ? 1. Lợi ích trực tiếp cho những người muốn BÁN KHỐNG & Làm giàu từ BÁN KHỐNG, với: - Những Quy Tắc Thiết Yếu Trong Bán Khống
Đây là danh sách các nhân vật trong light novel _RE:ZERO - Bắt đầu lại ở thế giới khác_ cùng với phiên bản anime và manga của nó. thumb|Các nhân vật trung tâm của loạt