Độ tương tự cosin là một cách đo độ tương tự (measure of similarity) giữa hai vectơ khác không của một không gian tích vô hướng. Độ tương tự này được định nghĩa bằng giá trị cosine của góc giữa hai vectơ, và cũng là tích vô hướng của cùng các vectơ đơn vị để cả hai đều có chiều dài 1. Giá trị cosine của 0° là 1, và bé hơn 1 với bất kỳ góc nào trong khoảng các radian .
Độ tương tự cosin là một thẩm định có tính định hướng chứ không phải về độ lớn (to nhỏ): hai vectơ cùng hướng có độ tương tự cosin là 1, hai vectơ vuông góc nhau (hay có hướng 90°) có độ tương tự là 0, và hai vectơ đối nhau theo đường kính có độ tương tự (hay 180°) là -1. Độ tương tự cosin đặc biệt được sử dụng trong không gian dương với kết quả được giới hạn chặt chẽ trong biên độ . Cái tên "độ tương tự cosin" bắt nguồn từ thuật ngữ "cosin có hướng": trong trường hợp này, các vectơ đơn vị có độ "tương tự" tối đa nếu chúng song song và "khác nhau" cực đại nếu chúng là trực giao (vuông góc). Điều này tương tự với cosin, có giá trị lớn nhất khi các phân đoạn tạo thành một góc bằng 0, và giá trị bằng 0 (không liên quan) khi các đoạn thẳng vuông góc.
Định nghĩa
Cosine của hai vectơ khác không được suy ra bằng cách sử dụng công thức tích vô hướng Euclid:
:
Cho hai vectơ chứa các thuộc tính, A và B, độ tương tự cosine, , được thể hiện bằng tích vô hướng và độ lớn là
:
với và là thành phần của vectơ và tương ứng.
Độ tương tự có giá trị −1 có nghĩa là trái nghĩa hoàn toàn, với giá trị 1 nghĩa là giống nhau hoàn toàn, với 0 có nghĩa là trực giao hay tương quan (decorrelation), trong khi các giá trị ở giữa biểu thị sự giống nhau hoặc không giống nhau ở mức trung gian.
Đối với so khớp chuỗi xấp xỉ (approximate string matching), các vectơ thuộc tính A và B thường là các vectơ tf–idf của các tài liệu. Độ tương tự cosine có thể xem là một phương thức bình thường hóa độ dài tài liệu trong quá trình so sánh.
Trong trường hợp truy hồi thông tin, độ tương tự cosine của hai tài liệu sẽ từ 0 đến 1, do các tần số thuật ngữ (dùng các trọng lượng tf-idf) không thể là giá trị âm. Do đó, góc giữa các vectơ tần số thuật ngữ không thể lớn hơn 90°.
Nếu các vectơ thuộc tính được chuẩn hóa (bình thường hóa) bằng cách trừ đi bình quân của vectơ (ví dụ, ), phép đo được gọi là độ tương tự cosin ở tâm (centered) và tương đương với hệ số tương quan Pearson (Pearson correlation coefficient). Ví dụ về cách định tâm,
👁️
0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Độ tương tự cosin** là một cách đo độ tương tự (measure of similarity) giữa hai vectơ khác không của một không gian tích vô hướng. Độ tương tự này được định nghĩa bằng giá
Các điểm trong hệ tọa độ cực với gốc cực _O_ và trục cực _L_. Điểm màu xanh lá có bán kính là 3 và góc phương vị là 60°, tọa độ là (3, 60°).
**Dị hướng từ tinh thể** là dạng năng lượng trong các vật có từ tính có nguồn gốc liên quan đến tính đối xứng tinh thể và sự định hướng của mômen từ. Trong tinh
Một ví dụ tính toán sử dụng năng lượng vi từ học, một hình vuông [[permalloy cạnh 600 nm, dày 20 nm. Các dạng năng lượng chủ yếu chi phối trường hợp này là năng
**Word2vec** là một kỹ thuật xử lý ngôn ngữ tự nhiên. Thuật toán Word2vec sử dụng một mô hình mạng thần kinh để học các liên kết từ (sự liên quan của từ) từ một
Sơ đồ hoạt động của [[kính hiển vi chui hầm điện tử, một sáng chế đã mang lại cho các tác giả của nó giải thưởng Nobel vật lý.]] Một ống sóng electron hướng vào
**Toán học Ấn Độ** phát triển trên tiểu lục địa Ấn Độ từ 1200 TCN cho đến cuối thế kỷ 18. Trong thời kỳ cổ điển của toán học Ấn Độ (400 đến 1200), những
Trong thiên văn học, **hệ tọa độ thiên văn** là một hệ tọa độ mặt cầu dùng để xác định vị trí biểu kiến của thiên thể trên thiên cầu. Trong tọa độ Descartes, một
Triều lên (nước lớn) và triều xuống (nước ròng) tại [[vịnh Fundy.]] **Thủy triều** là hiện tượng nước biển, nước sông... lên xuống trong một chu kỳ thời gian phụ thuộc biến chuyển thiên văn.
phải|Hình vẽ miêu tả [[hàm số sin(_x_) và các xấp xỉ Taylor của nó, tức là các đa thức Taylor bậc 1, 3, 5, 7, 9, 11 và
**Góc thiên đỉnh Mặt Trời** là góc giữa các tia song song của Mặt Trời và phương thẳng đứng. Nó là góc phụ với góc cao Mặt Trời, tức là góc chiếu của các tia
**Richard Phillips Feynman** (; 11 tháng 5 năm 1918 – 15 tháng 2 năm 1988) là một nhà vật lý lý thuyết người Mỹ được biết đến với công trình về phương pháp tích phân
|} Mặt Trăng quay quanh Trái Đất theo hướng cùng chiều với chiều quay Trái Đất và hoàn thành một chu kỳ quỹ đạo khi so sánh với các ngôi sao cố định trong khoảng
Trên [[cung (hình học)|cung tròn bất kỳ có bán kính R, có cung bằng độ dài bán kính được gọi là cung có số đo 1 radian hay cung 1 radian. Góc ở tâm chắn
Trong Toán học, Vật lí và kĩ thuật, **vectơ** hay **hướng lượng** (theo phiên âm Hán Việt) (tiếng Anh: _vector_) là một đoạn thẳng có hướng. Đoạn thẳng này biểu thị phương, chiều và độ
Trong toán học, **dãy Cauchy** (; ), được đặt tên theo nhà toán học Augustin-Louis Cauchy, là dãy mà các phần tử tiến đến gần nhau tùy ý khi dãy tiếp tục. Chính xác hơn,
**Niccolò Fontana Tartaglia** ( tiếng Ý: [nikkoˈlɔ ffonˈtaːna tarˈtaʎʎa] ; 1499/1500 - 13 tháng 12 năm 1557) là một nhà toán học, kỹ sư người Ý (thiết kế công sự), một nhà khảo sát
**Giải tam giác** () là bài toán lượng giác tập trung vào việc tìm ra các yếu tố (nghiệm) của một tam giác (góc và độ dài cạnh), khi chưa biết một số yếu tố
Trong toán học, **lượng giác** (tiếng Anh: _trigonometry_, lấy nguyên gốc từ tiếng Hy Lạp cổ đại của hai từ τρίγωνον nghĩa là "tam giác" và μέτρον nghĩa là "đo lường") là một phân nhánh
nhỏ| Hàm [[sin và tất cả các đa thức Taylor của nó đều là các hàm lẻ. Hình ảnh này cho thấy và các xấp xỉ Taylor của nó, các đa thức bậc 1,
**Định lý Pythagoras**
Tổng diện tích của hai hình vuông có cạnh là hai cạnh vuông của tam giác vuông (_a_ và _b_) bằng diện tích của hình vuông có cạnh là cạnh huyền (_c_). Trong
**Chuyển động học** là một nhánh của cơ học cổ điển, có mục đích mô tả chuyển động của các điểm, vật thể và hệ vật trong khi bỏ qua nguyên nhân dẫn đến các
_Cuốn [[The Compendious Book on Calculation by Completion and Balancing_]] Từ _toán học_ có nghĩa là "khoa học, tri thức hoặc học tập". Ngày nay, thuật ngữ "toán học" chỉ một bộ phận cụ thể
phải|Một tia đi qua gốc của hyperbol cắt hyperbol tại điểm , với là 2 lần diện tích của hình giới hạn bởi tia và trục
phải|nhỏ|350x350px| Phổ của các **âm Shepard** tăng dần trên thang tần số tuyến tính. **Âm Shepard** hay **giai điệu Shepard**, được đặt theo tên của Roger Shepard, là một âm thanh nhân tạo gồm sự
phải|Hàm sinc chuẩn (xanh) và hàm sinc không chuẩn (đỏ) trên cùng một hệ trục tọa độ từ _x_ = −6π đến 6π. Trong toán học, **hàm sinc**, ký hiệu là sinc(_x_) hoặc đôi khi
thumb|upright|Hệ [[vật nặng-lò xo dao động tắt dần dưới ngưỡng với ]] Trong các hệ vật lý, sự **tắt dần** là sự hao hụt năng lượng của hệ dao động do hiện tượng tiêu tán.
**Phương tiện truyền thông mạng xã hội** (tiếng Anh: _social media_) là các ứng dụng hoặc chương trình được xây dựng dựa trên nền tảng Internet, nhằm tạo điều kiện cho việc tạo mới hoặc
right|thumb|upright=1.35|alt=Graph showing a logarithmic curve, crossing the _x_-axis at _x_= 1 and approaching minus infinity along the _y_-axis.|[[Đồ thị của hàm số|Đồ thị của hàm logarit cơ số 2 cắt trục hoành tại và đi
Số **pi** (ký hiệu: ****), còn gọi là **hằng số Archimedes**, là một hằng số toán học có giá trị bằng tỷ số giữa chu vi của một đường tròn với đường kính của đường
thế=In this animation depicting an infinite and homogeneous sky, successively more distant stars are revealed in each frame. As the animation progresses, the more distant stars fill the gaps between closer stars in the field
Trong hình học phẳng, **đường tròn** (hoặc **vòng tròn**) là tập hợp của tất cả những điểm trên một mặt phẳng, cách đều một điểm cho trước bằng một khoảng cách nào đó. Điểm cho
phải||Hình 1 – Một tam giác với các góc _α_ (hoặc _A_), _β_ (hoặc _B_), _γ_ (hoặc _C_) lần lượt đối diện với các cạnh _a_, _b_, _c_. Trong lượng giác, **Định lý cos** (hay
nhỏ|Ý nghĩa hình học Trong hình học phẳng sơ cấp, **phương tích của một điểm** là một số thực thể hiện khoảng cách tương đối của điểm đó đối với một đường tròn cho trước.
right|thumb|**Tam giác Kepler** là một tam giác vuông hình thành bởi ba hình vuông có diện tích tạo thành một cấp số nhân với công bội là [[tỷ lệ vàng.]] **Tam giác Kepler** là một
Trong toán học, một **hàm liên tục** hay **hàm số liên tục** là một hàm số không có sự thay đổi đột ngột trong giá trị của nó, gọi là những điểm gián đoạn. Chính
Trong Giải tích, **Định lý kẹp** là một định lý liên quan đến giới hạn của hàm số. Định lý kẹp là một công cụ mang tính kĩ thuật thường dùng trong các phép chứng
**Công suất điện xoay chiều** là phần năng lượng được chuyển qua mạch điện xoay chiều trong một đơn vị thời gian. ## Giới thiệu Công suất được định nghĩa như là phần năng lượng
thumb|Căn bậc hai của 2 bằng với độ dài của [[cạnh huyền của một tam giác vuông có hai cạnh đáy bằng 1.]] **Căn bậc hai của 2**, hay lũy thừa 1/2 của 2, được
nhỏ|Suất phản chiếu của ánh sáng Mặt Trời với nhiều điều kiện bề mặt khác nhau. **Suất phản chiếu** hay **suất phản xạ** (tiếng Anh: _albedo_) là khái niệm liên quan đến hiện tượng phản
Trong hình học, **phương hướng** hay đơn giản là **hướng** của một vật thể như một đường thẳng, mặt phẳng hoặc một vật thể rắn khác là một trong những khái niệm được dùng để
nhỏ|Fonction argcoth - graphe Trong toán học, các **hàm lượng giác nghịch đảo** (đôi khi còn được gọi là **hàm arcus**, **hàm lượng giác ngược** hoặc **hàm cyclometric**) là các hàm ngược của các hàm
nhỏ|320x320px|Video time-lapse về nhật động của các thiên thể trên bầu trời, quay tại [[Đài quan trắc La Silla.]] Trong thiên văn học, **nhật động** hay **chuyển động (hàng) ngày** là sự chuyển động biểu
Trong toán học, **công thức de Moivre** (hay **định thức de Moivre, đẳng thức de Moivre**, tiếng Anh: _de Moivre's formula_) phát biểu rằng với mọi số thực **' và số nguyên **', đẳng thức
nhỏ|Khu vực hấp dẫn kỳ lạ phát sinh từ một [[phương trình vi phân. Phương trình vi phân là một lĩnh vực quan trọng của giải tích toán học với nhiều ứng dụng cho khoa
nhỏ|247x247px|Đỉnh điểm (_culmination_) của một ngôi sao là khi đường chuyển động biểu kiến hàng ngày của nó cắt đường kinh tuyến (_meridian_) nơi quan sát. Trong thiên văn học quan sát, **đỉnh điểm** hay
Vào những năm 1760, Johann Heinrich Lambert đã chứng minh rằng số (pi) là vô tỷ: nghĩa là nó không thể được biểu thị dưới dạng phân số _a_/_b_, trong đó _a_ là số nguyên
**Sin** là một hàm số lượng giác. Giá trị của một cung tròn trên vòng tròn đơn vị bằng độ lớn hình chiếu của đầu mút cung đó lên trục tung. Sin của một góc
Một tam giác với ba cạnh _a_, _b_, và _c_. Trong hình học, **Công thức Heron** là công thức tính diện tích của một tam giác theo độ dài 3 cạnh. ## Công thức :
**Regiomontanus** (hay còn có tên gọi khác là **Johannes Müller xứ Könisberg**) (1436-1476) là nhà khoa học người Đức. Ông là người đa tài: vừa là nhà toán học, vừa là thiên văn học, vừa