✨Nhận dạng ký tự quang học

Nhận dạng ký tự quang học

Nhận dạng ký tự quang học (tiếng Anh: Optical Character Recognition, viết tắt là OCR), là loại phần mềm máy tính được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. OCR được hình thành từ một lĩnh vực nghiên cứu về nhận dạng mẫu, trí tuệ nhận tạo và machine vision. Mặc dù công việc nghiên cứu học thuật vẫn tiếp tục, một phần công việc của OCR đã chuyển sang ứng dụng trong thực tế với các kỹ thuật đã được chứng minh.

Nhận dạng ký tự quang học (dùng các kỹ thuật quang học chẳng hạn như gương và ống kính) và nhận dạng ký tự số (sử dụng máy quét và các thuật toán máy tính) lúc đầu được xem xét như hai lĩnh vực khác nhau. Bởi vì chỉ có rất ít các ứng dụng tồn tại với các kỹ thuật quang học thực sự, bởi vậy thuật ngữ Nhận dạng ký tự quang học được mở rộng và bao gồm luôn ý nghĩa nhận dạng ký tự số.

Đầu tiên hệ thống nhận dạng yêu cầu phải được huấn luyện với các mẫu của các ký tự cụ thể. Các hệ thống "thông minh" với độ chính xác nhận dạng cao đối với hầu hết các phông chữ hiện nay đã trở nên phổ biến. Một số hệ thống còn có khả năng tái tạo lại các định dạng của tài liệu gần giống với bản gốc bao gồm: hình ảnh, các cột, bảng biểu, các thành phần không phải là văn bản

Hiện nay, với chữ Việt, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 có khả năng nhận dạng trực tiếp các loại tài liệu được quét qua máy quét, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang. Kết quả nhận dạng được lưu trữ sang định dạng của Microsoft Word, Excel... phục vụ rất tốt nhu cầu số hóa dữ liệu.

Ngoài ra, còn có một dự án OCR Tiếng Việt có tên VietOCR, được phát triển dựa trên nền tảng mã nguồn mở tesseract-ocr do Google tài trợ. VietOCR có khả năng nhận dạng chữ Việt rất tốt. Đây là một chương trình nguồn mở Java/.NET, hỗ trợ nhận dạng cho các dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP.

ABBYY - một hãng công nghệ hàng đầu trên thế giới về lĩnh vực Nhận dạng ký tự quang học đã tiến hành nghiên cứu và triển khai công nghệ nhận dạng Tiếng Việt vào tháng 4 năm 2009. Với công nghệ này độ chính xác trong việc nhận dạng tài liệu chữ in Tiếng Việt lên tới hơn 99% (cứ nhận dạng 100 ký tự thì có chưa đến 1 ký tự sai). Công nghệ của ABBYY chấp nhận hầu hết các định dạng ảnh đầu vào như: PDF, TIFF, JPEG, GIF, PNG, BMP, PCX, DCX, DjVu... Kết quả nhận dạng được lưu trữ dưới các định dạng MS Word, MS Excel, HTML, TXT, XML, PDF, PDF 2 lớp, trong đó định dạng PDF 2 lớp là một định dạng hoàn hảo cho việc lưu trữ và khai thác tài liệu. Với định dạng này, người đọc có thể đọc trung thực ảnh gốc nhờ lớp ảnh bên trên, các công cụ tìm kiếm có thể tìm kiểm toàn văn trên văn bản nhờ lớp text nhận dạng được bên dưới.

Trạng thái hiện thời của công nghệ OCR

Sự nhận dạng chính xác ký tự Latin đánh máy được xem là vấn đề đã được giải quyết. Tỷ lệ chính xác thực tế đạt tới 99%, mặc dù một số ứng dụng đòi hỏi tỷ lệ chính xác cao hơn nữa cần phải con người kiểm tra lại lỗi.

Việc nhận dạng chữ in bằng tay, chữ thảo bằng tay, và thậm chí những phiên bản đánh máy được in ra của vài chữ (đặc biệt là những chữ có số chữ cái lớn), vẫn còn là một đề tài của các nghiên cứu.

Các hệ thống nhận dạng ký tự viết tay đã đạt được những thành công lớn về mặt thương mại trong những năm gần đây. Trong số đó là thiết bị nhập cho những thiết bị hỗ trợ cá nhân (PDA) như những phần mềm chạy trên Palm OS. hãng Apple Newton đi tiên phong trong công nghệ này. Những giải thuật sử dụng trong những thiết bị này sử dụng những ưu điểm rằng thứ tự, tốc độ, và hướng của những đoạn dòng đơn lẻ đã được biết trước. Tương tự, người dùng có thể được yêu cầu sử dụng chỉ một vài loại kiểu chữ nhất định. Những phương pháp này không thể dùng được trong phần mềm scan tài liệu giấy, do đó sự nhận dạng chính xác văn bản in bằng tay vẫn là một vấn đề lớn đang được bỏ ngỏ. Với mức chính xác từ 80% đến 90%, những ký tự in bằng tay sạch sẽ có thể được nhận ra, nhưng độ chính xác đó vẫn tạo ra hàng tá lỗi mỗi trang, khiến cho công nghệ đó chỉ hiệu quả trong vài trường hợp nào đó. Sự đa dạng của OCR hiện nay được biết đến trong công nghiệp là ICR, (Intelligent Character Recognition - Nhận dạng Ký tự Thông minh).

Nhận dạng chữ viết tay là một lĩnh vực nghiên cứu sôi nổi, với tỷ lệ nhận dạng thậm chí còn thấp hơn cả văn bản in bằng tay. Tỷ lệ nhận dạng cao hơn của những bản viết tay chung chung hầu như là không thể nếu không sử dụng thông tin về ngữ pháp và văn cảnh. Ví dụ như, nhận dạng cả một chữ từ một cuốn từ điển thì dễ hơn là việc cố gắng lấy ra những ký tự rời rạc từ đoạn đó. Đọc dòng Tổng cộng của một tờ séc (luôn luôn được viết bằng số) là một ví dụ trong đó sử dụng những từ điển nhỏ hơn có thể tăng tỷ lệ nhận dạng rất nhiều. Kiến thức về ngữ pháp của một ngôn ngữ được scan cũng có thể giúp xác định một từ có thể là động từ hay danh từ, ví dụ như vậy, sẽ cho phép độ chính xác cao hơn. Hình dạng của chữ viết tay bản thân nó đã không chứa đủ thông tin về để nhận dạng chính xác (hơn 98%) tất cả những đoạn chữ viết tay.

Một vấn đề khó khăn của máy tính và con người đó là những bản lưu của những lễ thánh và đám cưới của những nhà thờ cũ chỉ toàn chứa tên. Những trang đó có thể bị hư hại do thời gian, nước hay lửa và những tên trên đó có thể đã lỗi thời hoặc chứa những chính tả hiếm gặp. Lĩnh vực nghiên cứu khác là tiếp cận hợp tác, ở đó máy tính hỗ trợ con người và ngược lại. Kỹ thuật xử lý hình ảnh của máy tính có thể hỗ trợ con người trong việc đọc những văn bản cực kỳ khó đọc như Bản viết trên da cừu của Archimede hay những Cuộn giấy da lấy từ vùng Biển Chết.

Tóm lại, đối với những vấn đề nhận dạng phức tạp hơn mạng nơ-ron được sử dụng rộng rãi bởi chúng có thể làm làm đơn giản hóa cả biến đổi affine lẫn biến đổi phi tuyến.

👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Nhận dạng ký tự quang học** (tiếng Anh: _Optical Character Recognition_, viết tắt là **OCR**), là loại phần mềm máy tính được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ
Công nghệ "nhận dạng ký tự thông minh" hay còn gọi là "nhận dạng chữ viết tay" (ICR) là bản dịch từ các ký tự viết tay sang dạng văn bản với ký tự mà
nhỏ|Chữ ký của ngôi sao đồng quê Tex Williams. **Nhận dạng chữ viết tay** (_Handwriting recognition - HWR_), còn được gọi là **Nhận dạng văn bản viết tay** (_Handwritten Text Recognition - HTR_), là khả
nhỏ|Hình ảnh của một trang chữ bao gồm các ký tự chữ nổi và các ký tự chữ chìm ở trang bên kia **Nhận dạng quang học chữ nổi Barille** là hoạt động chụp và
Đây là bài con của **Trí tuệ nhân tạo**, nội dung chú trọng vào sự phát triển và **lịch sử ngành trí tuệ nhân tạo**. ## Sự phát triển của lý thuyết trí tuệ nhân
thumb|right|Quang học nghiên cứu hiện tượng [[tán sắc của ánh sáng.]] **Quang học** là một ngành của vật lý học nghiên cứu các tính chất và hoạt động của ánh sáng, bao gồm tương tác
**Quang học** là một lĩnh vực vật lý học, chuyên nghiên cứu về ánh sáng, cụ thể la nguồn gốc và cách truyền ánh sáng, cách thức nó biến đổi cùng vời những hiện tượng
**Học có giám sát** là một kĩ thuật của ngành học máy để xây dựng một hàm (_function_) từ dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm các cặp gồm đối tượng đầu
nhỏ|Một bóng ma Brocken với một [[Glory (hiện tượng quang học)|vầng glory bao quanh.]] **Bóng ma Brocken** (), còn gọi là **cung** **Brocken** hoặc **bóng ma núi**, là hiện tượng bóng của người quan sát
**Định dạng tập tin hình ảnh** là phương tiện chuẩn hóa để tổ chức và lưu trữ hình ảnh kỹ thuật số. Định dạng tập tin hình ảnh có thể lưu trữ dữ liệu ở
[[Tập tin:Passports-assorted.jpg|nhỏ|Hộ chiếu thông thường của Hà Lan, ngoại giao Nepal, hộ chiếu phổ thông của Ba Lan và Hộ chiếu Công vụ của Cộng hòa Nhân dân Trung Hoa]] nhỏ|Kiểm soát hộ chiếu tại
thế=Một vầng hào quang 22° quanh Mặt Trời, được nhìn thấy trước trại cơ sở Annapurna, Annapurna, Nepal.|nhỏ|347x347px|Một vầng hào quang 22° quanh Mặt Trời, được nhìn thấy trước trại cơ sở Annapurna, [[Annapurna, Nepal.]]
thumb|Một [[hào quang 22° quanh Mặt Trăng ở Atherton, CA.]] **Hiện tượng quang học** là bất kỳ sự kiện nào quan sát được là kết quả của sự tương tác giữa ánh sáng khả kiến
**Xuất bản điện tử** (tiếng Anh: **electronic publishing,** viết tắt là e-publishing; cũng được gọi là **digital publishing** hoặc **online publishing**) là việc sử dụng các thiết bị kỹ thuật số trong hoạt động xuất
thumb|Hệ thống giám sát Thụy Sĩ-Châu Âu: nhận dạng khuôn mặt và xe cộ, mẫu mã, màu sắc và biển số xe. Sử dụng tại Đức và Thụy Sĩ để giám sát và ghi lại
**Tỉnh trưởng Chính phủ Nhân dân tỉnh Tứ Xuyên** (Tiếng Trung Quốc: 四川省人民政府省长, Bính âm Hán ngữ: _Sì Chuān shěng rénmín zhèngfǔ shěng zhǎng_, _Tứ Xuyên tỉnh Nhân dân Chính phủ Tỉnh trưởng_) được bầu
phải|nhỏ|Kính hiển vi thạch học, là một loại [[kính hiển vi quang học được trang bị ống kính phân cực chéo, một ống kính nội soi, và bộ điều tiết (phổ biến là tấm vật
Một trong những kiến ​​trúc máy tính lượng tử có triển vọng nhất là **máy tính lượng tử bẫy ion**. Thiết kế này đã được đề xuất lý thuyết vào năm 1995 bởi Cirac và
Phần mềm là các lệnh được lập trình mà được lưu trữ trong bộ nhớ được lưu trữ của các máy tính kỹ thuật số để bộ xử lý thực hiện. Phần mềm là một
**QANDA** (viết tắt của Q and A (Question and Answer)) là một nền tảng học tập và quảng cáo dựa trên trí tuệ nhân tạo AI được phát triển bởi Mathpresso Inc., một công ty
**Phân loại bằng thống kê** là một thủ tục thống kê trong đó các thể riêng biệt sẽ được sắp vào từng nhóm dựa trên số lượng thông tin về một hay nhiều tính chất
Các CAPTCHA thuở đầu tiên như thế này, được chương trình EZ-Gimpy tạo ra, đã được Yahoo sử dụng. Tuy nhiên, đã có công nghệ đọc được loại CAPTCHA này.|thế=smwm Một CAPTCHA hiện đại. Ngoài
Hình khuôn mặt cười ở góc trên cùng bên trái là hình ảnh raster. Khi phóng to, các pixel riêng lẻ xuất hiện dưới dạng hình vuông. Mở rộng hơn nữa, chúng có thể được
Một chương trình độc hại được cho là "chưa từng thấy" đã được phát hiện, có thể tấn công và đánh cắp thông tin dữ liệu của người dùng từ hình ảnh có trên các
**Caesi** (hay còn gọi là **Xê-si**, tiếng Anh: **cesium**, tiếng Latinh: "caesius") là một nguyên tố hóa học trong bảng tuần hoàn có ký hiệu **Cs** và số nguyên tử bằng 55. Nó là một
thumb|[[Bảng tuần hoàn]] **Nguyên tố hóa học**, thường được gọi đơn giản là **nguyên tố**, là một chất hóa học tinh khiết, bao gồm một kiểu nguyên tử, được phân biệt bởi số hiệu nguyên
thumb|upright=1.3|Các [[hàm sóng của electron trong một nguyên tử hydro tại các mức năng lượng khác nhau. Cơ học lượng tử không dự đoán chính xác vị trí của một hạt trong không gian, nó
nhỏ|Quang phổ của một ngọn [[lửa, cho thấy ba vạch chính, đặc trưng cho thành phần hóa học của các chất trong ngọn lửa.]] **Quang phổ học** hay **Phổ học** là ngành nghiên cứu về
Nhận dạng vật thể bay không xác định là một nhiệm vụ khó khăn do chất lượng kém mức thông thường của các bằng chứng được cung cấp bởi những người báo cáo nhìn thấy
**Phim quảng cáo** (hoặc còn gọi hẹp là **Quảng cáo truyền hình**, theo thuật ngữ tiếng Anh là _television advertisement_ hay _television commercial_ -viết tắt _TVad_ hay _TVC_- hoặc thường được gọi đơn giản là
phải|nhỏ|Bắc cực quang phải|nhỏ|Nam cực quang nhỏ|Bắc cực quang chiếu sáng trên [[hồ Bear (Alaska)|hồ Bear]] nhỏ|Nam cực quang tại châu Nam Cực Trong thiên văn học, **cực quang** là một hiện tượng quang học
**Lý Quang Địa** (; 29 tháng 9 năm 1642 – 26 tháng 6 năm 1718) là một nhà chính trị, nhà lý học trứ danh thời kỳ đầu nhà Thanh. Mặc dù Lý Quang Địa
**Mây dạ quang** hay **mây tầng trung lưu vùng cực** là một hiện tượng tương tự như mây, khá hiếm khi xảy ra ở phần trên của khí quyển Trái Đất, nói chung được nhìn
**Kính hiển vi điện tử truyền qua** (tiếng Anh: _transmission electron microscopy_, viết tắt: TEM) là một thiết bị nghiên cứu vi cấu trúc vật rắn, sử dụng chùm điện tử có năng lượng cao
nhỏ|Hình minh họa [[quang học trường gần, với sự nhiễu xạ của ánh phát phát ra từ sợi dò của **kính hiển vi quang học quét trường gần**, cho thấy bước sóng ánh sáng và
**Chủ nghĩa tự do** là một hệ tư tưởng, quan điểm triết học, và truyền thống chính trị dựa trên các giá trị về tự do và bình đẳng. Chủ nghĩa tự do có nguồn
**Quảng cáo nhắm đối tượng** (Tiếng Anh: _Targeted Advertising_) là một hình thức quảng cáo trực tuyến (online marketing), hướng đến một đối tượng khán giả có các đặc điểm cụ thể. Các đặc điểm
**Đại học Vật lý Kỹ thuật Moskva (MIPT,** tiếng Nga: Московский Физико-Технический институт), còn được biết đến với tên gọi **Phystech** - là trường đại học hàng đầu của Nga, chuyên đào tạo các chuyên
**Vật lý vật chất ngưng tụ** là một trong các nhánh của vật lý học nghiên cứu các tính chất vật lý trong pha ngưng tụ của vật chất. Các nhà vật lý vật chất
thumb|right|348x348px|Bìa của bài thơ có chủ đề tiến hóa của [[Erasmus Darwin, _Temple of Nature_ cho thấy một nữ thần vén bức màn bí ẩn của thiên nhiên (bên trong là Artemis). Tượng trưng và
nhỏ|Ký hiệu A còng, một phần của địa chỉ Email SMTP. **Thư điện tử** hay **hòm thư điện tử** (**email** hay **e-mail**) là một phương thức trao đổi tin nhắn giữa những người sử dụng
Một viên kim cương nhân tạo trong suốt **Kim cương nhân tạo** hay **kim cương tổng hợp** là loại đá được sản xuất với ánh quang, tính chất vật lý giống như một viên kim
Cấu trúc cắt ngang của một thấu kính từ sử dụng trong [[kính hiển vi điện tử truyền qua.]] **_Thấu kính từ_** (tiếng Anh: _Magnetic lens_) là một loại thấu kính hay một loại thiết
**Từ kế** hay **máy đo từ** là thiết bị dùng để đo đạc _cường độ_ và có thể cả _hướng_ của từ trường trong vùng đặt _cảm biến từ trường_. _Cảm biến từ trường_ hoạt
phải|nhỏ|Đèn huỳnh quang dạng thu nhỏ loại mới và dạng ống dài loại cũ **Đèn huỳnh quang** hay gọi đơn giản là **đèn tuýp** (hay **đèn ống**) gồm điện cực (wolfram) và vỏ đèn phủ
**Chuyển động học** là một nhánh của cơ học cổ điển, có mục đích mô tả chuyển động của các điểm, vật thể và hệ vật trong khi bỏ qua nguyên nhân dẫn đến các
right|thumb|Ultrasound representation of [[Urinary bladder (black butterfly-like shape) a hyperplastic prostate. An example of engineering science và medical science working together.]] thumb|Example of an approximately 40,000 probe spotted oligo [[microarray with enlarged inset to show
Ngọc opal trên chiếc vòng này là các vi cấu trúc có chu kỳ không gian tạo nên khả năng phát [[ngũ sắc. Đây là một tinh thể quang tử tự nhiên, tuy chưa có
nhỏ|Bức Tranh _Die Tafelrunde_ của họa sĩ [[Adolph von Menzel. Bữa ăn của Voltaire, cùng vua Phổ Friedrich II Đại Đế và các viện sĩ Viện Hàn lâm Khoa học Berlin.]] **Phong trào Khai sáng**,
Thuật ngữ **nhiệt động học** (hoặc **nhiệt động lực học**) có hai nghĩa: # Khoa học về nhiệt và các động cơ nhiệt (**nhiệt động học cổ điển**) # Khoa học về các hệ thống