Tập tin (, viết tắt cho tập thông tin, còn được gọi là tệp, tệp tin) là một tập hợp của thông tin được đặt tên. Thông thường thì các tập tin này chứa trong các thiết bị lưu trữ như đĩa cứng, đĩa mềm, CD, DVD cũng như là các loại chip điện tử dùng kĩ thuật flash có thể thấy trong các ổ nhớ có giao diện USB. Nói cách khác, tập tin là một dãy các bit có tên và được chứa trong các thiết bị lưu trữ dữ liệu kỹ thuật số. trong phần mềm.
Đặc điểm
- Một tập tin luôn luôn kết thúc bằng 1 ký tự đặc biệt (hay dấu kết thúc) có mã ASCII là 255 ở hệ thập phân. Ký tự này thường được ký hiệu là EOF (từ chữ End Of File).
- Một tập tin có thể không chứa một thông tin nào ngoại trừ tên và dấu kết thúc. Tuy nhiên, điều này không hề mâu thuẫn với định nghĩa vì bản thân tên của tập tin cũng đã chứa thông tin. Những tập tin này gọi là tập tin rỗng hay tập tin trống.
- Độ dài (kích thước) của tập tin có thể chỉ phụ thuộc vào khả năng của máy tính, khả năng của hệ điều hành cũng như vào phần mềm ứng dụng dùng nó. Đơn vị nhỏ nhất dùng để đo độ dài của tập tin là byte. Độ dài của tập tin không bao gồm độ dài của tên tập tin và dấu kết thúc.
Thuộc tính
Những đặc tính và giới hạn của tập tin gọi là thuộc tính của tập tin.
Các loại thuộc tính
Tùy theo hệ thống tập tin mà các thuộc tính này có thể khác nhau.
Ví dụ các thuộc tính trên hệ thống tập tin FAT bao gồm:
- Archive: lưu trữ. Trên các hệ điều hành DOS thì thuộc tính này được định khi mỗi khi tập tin bị thay đổi, và bị xóa khi thực hiện lệnh
backup
để sao lưu dữ liệu.
- Hidden: ẩn. Khi một tập tin có thuộc tính này thì các chương trình liệt kê các tập tin theo mặc định sẽ bỏ qua, không liệt kê tập tin này. Người sử dụng vẫn có thể làm việc trên tập tin này như bình thường.
- Read-only: chỉ đọc. Khi một tập tin có thuộc tính này thì các chương trình xử lý tập tin theo mặc định sẽ không cho phép xóa, di chuyển tập tin hoặc thay đổi nội dung tập tin. Còn các thao tác khác như đổi tên tập tin, đọc nội dung tập tin vẫn được cho phép.
- System: thuộc về hệ thống. Một tập tin có thuộc tính này sẽ chịu các hạn chế bao gồm các hạn chế của thuộc tính Hidden và các hạn chế của thuộc tính Read-only, nghĩa là không bị liệt kê, không thể xóa, di chuyển, thay đổi nội dung. Thuộc tính này chủ yếu dùng cho các tập tin quan trọng của hệ điều hành.
- Sub-directory (hay directory): thư mục con. Những tập tin có thuộc tính này được xử lý như là thư mục. Thư mục là tập tin ở dạng đặc biệt, nội dung không chứa dữ liệu thông thường mà chứa các tập tin và các thư mục khác.
Ngoài ra, còn rất nhiều thuộc tính khác của các tập tin mà tùy theo hệ điều hành sẽ được định nghĩa thêm vào.
Ví dụ đối với hệ điều hành Linux các tập tin có thể có thêm các thuộc tính như các quyền sử dụng tập tin, đặc điểm của tập tin, và thông tin về các loại tập tin như là các loại tập tin liên kết mềm, các socket, các pipe...
Lưu ý: Các thuộc tính của một tập tin thường không ảnh hưởng đến nội dung thông tin của tập tin đó nhưng lại ảnh hưởng rất nhiều đến chức năng và việc sử dụng tập tin. Ví dụ các tập tin không có thuộc tính cho phép thi hành thì không thể xem là một phần mềm khả thi được mặc dù nội dung của nó có thể chỉ chứa các chỉ thị máy tính. Cách để làm tập tin trở nên khả thi là thay đổi thuộc tính khả thi của nó hay là phải thay đổi phần đuôi của tên tập tin (như là trường hợp của hệ điều hành Windows - DOS)
Định dạng
Cấu trúc của một tập tin định nghĩa cách thức mà tập tin đó được chứa, được thực thi, và thể hiện trên các thiết bị (như màn hình hay máy in) gọi là định dạng của tập tin. Định dạng này có thể đơn giản hay phức tạp.
Định dạng của tập tin phụ thuộc vào nhiều yếu tố trong đó quan trọng nhất bao gồm:
- Hệ điều hành giống nhau và kiến trúc máy tính khác nhau có thể đòi hỏi các định dạng cho tập tin một cách khác nhau.
: Ví dụ: Trên cùng một kiến trúc Intel, tập tin văn bản dạng đơn giản nhất tạo nên bởi hệ điều hành Linux cũng có sự khác nhau với tập tin văn bản của Windows (hay DOS). Dĩ nhiên, các tập tin văn bản này lại càng không thể đọc được trên các máy dùng hệ điều hành Mac OS (chúng khác nhau hoàn toàn về mặt kiến trúc máy tính) nếu không có các tiện ích đặc biệt để chuyển đổi định dạng.
- Tập tin dùng cho các mục tiêu khác nhau cũng sẽ có các định dạng khác nhau. Ngoài sự ràng buộc về định dạng của hệ điều hành, các tập tin dùng trong các ứng dụng hay các phần mềm khác nhau cũng sẽ khác nhau và sự khác nhau này tùy thuộc vào kiến trúc của các ứng dụng sử dụng các tập tin đó.
: Ví dụ dễ hiểu nhất là định dạng của mật tập tin văn bản phải khác với định dạng của một tập tin hình ảnh hay tập tin âm thanh.
- Các tập tin dùng cho cùng một mục tiêu cũng không thể có định dạng khác nhau tuỳ theo nhà sản xuất nào đã thiết kế ra nó.
: Ví dụ: Trong các tập tin hình vẽ đồ họa thì các tập tin kiểu Bitmap (các tập tin hình có đuôi là.bmp) có định dạng hoàn toàn khác với các tập tin kiểu Tagged Image File Format (đuôi của loại tập tin này là.tif) và cũng khác với tập tin kiểu Joint Photographic Experts Group (với các đuôi có dạng.jpg hay.png).
Tên
- Tùy theo hệ điều hành mà có thể có các quy ước về tên tập tin.
- Độ dài của tên tập tin tùy thuộc vào hệ thống tập tin.
- Tùy thuộc vào hệ thống tập tin và hệ điều hành mà sẽ có một số ký tự không được dùng cho tên tập tin.
: Ví dụ: Trên hệ điều hành Microsoft Windows, không được dùng các ký tự sau trong tên tập tin: \ /: ? " < > |, tên tập tin không quá 255 ký tự thường.
- Theo truyền thống cũ của hệ thống DOS và Windows, tên tập tin thường bao gồm hai phần: phần tên và phần mở rộng (còn gọi là phần đuôi). Tuy nhiên, tên của một tập tin không nhất thiết phải có phần mở rộng này.
*Trên Windows hiện nay, một số tập tin có thể không có phần tên, trong trường hợp này, tập tin bắt buộc phải có phần mở rộng.
Các ví dụ về cấu trúc bit trong nội dung thông tin của tập tin
Ví dụ về cấu trúc bit của tập tin ASCII
Tập tin:dinhdangtext.gif
Trong hình trên là hai tập tin văn bản dạng đơn giản dùng mã ASCII. Tập tin "hoso.txt" là tập tin soạn ra bằng lệnh edit
của hệ điều hành Windows. Tập tin thứ nhì, "hoso2.txt", lại được soạn thảo bằng lệnh vi
trong hệ điều hành Linux. Hãy lưu ý quy ước xuống hàng của tập tin trong Windows sẽ bao gồm hai byte: dấu CR (cariage return) có giá trị ASCII là 0x0D và dấu LF (line feed) có giá trị 0x0A; trong khi đó, Linux chỉ cần dấu LF là đủ. Điều này cho thấy sự khác nhau về định dạng.
Ví dụ về cấu trúc bit của tập tin hình ảnh
Tập tin:dinhdangbmp.gif
👁️
4 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Tập tin** (, viết tắt cho **tập thông tin**, còn được gọi là **tệp**, **tệp tin**) là một tập hợp của thông tin được đặt tên. Thông thường thì các tập tin này chứa trong
Trong điện toán, khái niệm **hệ thống tập tin** hoặc **hệ thống tệp** () được dùng để chỉ các phương pháp và cấu trúc dữ liệu mà một hệ điều hành sử dụng để theo
**Định dạng tập tin hình ảnh** là phương tiện chuẩn hóa để tổ chức và lưu trữ hình ảnh kỹ thuật số. Định dạng tập tin hình ảnh có thể lưu trữ dữ liệu ở
Trong các hệ điều hành tương tự Unix, **tập tin thiết bị** hoặc **tập tin đặc biệt** là giao diện tới driver thiết bị nằm trong hệ thống tập tin như một tập tin thông
**Thuộc tính tập tin** hoặc **thuộc tính tệp**/**thuộc tính file** là siêu dữ liệu được liên kết với tập tin máy tính mà xác định hành vi của hệ thống tập tin. Mỗi thuộc tính
**Tên tập tin** hay **tên tệp** hay **tên file** (tiếng Anh: _filename_ hoặc _file name_) là tên dùng để xác định duy nhất một tập tin máy tính được lưu trữ trong hệ thống tập
nhỏ|Một tập tin bitmap **Định dạng tập tin** là một cách chuẩn để thông tin được mã hóa trong việc lưu trữ trong các file. Nó chỉ định cách các bit được sử dụng để
**RSS** là một định dạng tập tin thuộc họ XML dùng trong việc chia sẻ tin tức Web (_Web syndication_) được dùng bởi nhiều website tin tức và weblog. Công nghệ của RSS cho phép
**Kích thước tập tin** là kích thước của một tập tin máy tính. Thông thường nó được đo bằng đơn vị byte với một tiền tố. Lượng không gian đĩa trên thực tế được sử
**Phần mở rộng tên tập tin** hay **phần mở rộng tên tệp** hay **phần mở rộng tên file** (tiếng Anh: **Filename extension**) hay còn gọi là **"đuôi"** của tập tin, là một định danh được
Một **tập tin lưu trữ**, còn gọi là **tệp lưu trữ** hay **file lưu trữ** (tiếng Anh: _archive file_) là một tập tin bao gồm một hoặc nhiều tập tin máy tính cùng với siêu
thumb|Một [[kết xuất hex của 318 byte của favicon Wikipedia, hay Tập tin:Wikipedia's W.svg. Cột đầu tiên đánh số địa chỉ bắt đầu của dòng, trong khi *
đánh dấu sự lặp lại.]] **Tập tin
Trong khoa học máy tính, thuật ngữ **Hệ thống Tập tin Phân tán** (_Distributed File System_) hay còn gọi là **Hệ thống tệp tin mạng** (_Network File System_) dùng để chỉ bất kỳ một hệ
Trong điện toán, **tập tin manifest** hay **tập tin kê khai** (tiếng Anh: _manifest file_) là một tập tin chứa siêu dữ liệu (metadata) cho một nhóm các tập tin đi kèm vốn là một
Các dịch vụ lưu trữ tập tin (file hosting services) là một loại đặc biệt của lưu trữ tập tin trực tuyến. ## Tính năng ### Khác biệt với dịch vụ chia sẻ tập tin
**Chia sẻ tập tin** là thực hành phân phối hoặc cung cấp quyền truy cập vào phương tiện kỹ thuật số, như chương trình máy tính, đa phương tiện (âm thanh, hình ảnh và video),
nhỏ|Tập tin cấu hình Trong điện toán, **tập tin cấu hình** (tiếng Anh: **config files** hay **config files**) sẽ cấu hình tham số và cài đặt ban đầu cho các chương trình máy tính. Chúng
**CHM** là phần mở rộng tên file (tập tin) trong đĩa cứng lưu trữ nhiều trang Web và được tổ chức dưới dạng cây thư mục. Nó còn được gọi là một HTML Help. ##
nhỏ|Ví dụ về một Hệ quản lý tập tin. **Hệ thống quản lý tệp** hoặc **trình duyệt tệp** là chương trình máy tính cung cấp giao diện người dùng để quản lý tệp và thư
Đây là danh sách các định dạng tập tin sắp xếp theo thể loại,theo cách mà nó được tìm thấy trên máy tính. Phần mở rộng trong tên file luôn được ghi chú trong dấu
thumb|Trong khi Nemo hiển thị một thiết bị có mount hay không, được xá định bởi tùy chọn x-gvfs-show
cho tiến trình gvfs-udisks2-volume-monitor. ảnh chụp của [[GNOME Disks.]] **Nemo** là trình quản lý file mặc
**JAR** (**J**ava **AR**chive) là một định dạng tập tin gói thường được dùng để tổng hợp nhiều tập tin lớp Java, siêu dữ liệu và tài nguyên liên quan (văn bản, ảnh,...) thành một tập
Sách Bài tập Tin học dành cho Trung học cơ sởđược biên soạn để giúp học sinh củng cố và phát triển những kiến thức đã được học trong sách giáo khoa Tin học dành
Trong lĩnh vực tin học, **máy chủ tập tin** (file-server) là một máy chủ trong mạng có mục đích chính là cung cấp một địa điểm để lưu trữ các tập tin máy tính được
**Tập đoàn Công nghiệp – Viễn thông Quân đội**, thường dược biết đến dưới tên giao dịch **Viettel** hay **Tập đoàn Viettel**, là một tập đoàn viễn thông và công nghệ Việt Nam được thành
**Vingroup** (tên đầy đủ: _Tập đoàn Vingroup - Công ty CP_) là một tập đoàn đa ngành của Việt Nam được thành lập vào ngày 8 tháng 8 năm 1993 bởi một nhóm các du
**Tập Cận Bình** (giản thể: 习近平; phồn thể: 習近平; bính âm: _Xí Jìnpíng_; phát âm: [ɕǐ tɕînpʰǐŋ], sinh ngày 15 tháng 6 năm 1953) là một chính trị gia người Trung Quốc. Ông hiện đang
thế=Picture of schoolchildren doing sit-ups|nhỏ|Học sinh đang thực hiện tư thế _Sit-up_ (gập bụng), một bài tập Calisthenics, trong một ngày hội [[Khỏe mạnh thể chất|thể thao tại trường.]] Human flag, một kĩ thuật nâng
**Tập đoàn quân số 8** (Tiếng Đức: **_8. Armee / Armeeoberkommando 8 / A.O.K. 8_**) là một đơn vị cấp Tập đoàn quân của Đức trong Thế chiến thứ nhất. Nó được triển khai ở
**Vụ tin tặc tấn công các sân bay tại Việt Nam 2016** là vụ tấn công của các tin tặc (hacker) vào chiều 29 tháng 7 năm 2016 vào một số màn hình hiển thị
**Hành vi tập thể của động vật** (_Collective animal behavior_) hay **hành động hàng loạt của động vật** là một dạng hành vi của động vật mang tính xã hội liên quan đến hành vi
**Tập tính học** nghiên cứu các hành vi của động vật (đặc biệt trong xã hội của loài vật như ở khỉ và chó sói, do đó đôi khi bộ môn này được coi là
**Hiệp sĩ của Đức tin** là một cá nhân đã đặt trọn niềm tin vào bản thân mình và Chúa trời, và có thể hành động một cách tự do và độc lập so với
thumb|right|Một [[sơ đồ Venn mô phỏng phép giao của hai tập hợp.]] **Lý thuyết tập hợp** (tiếng Anh: _set theory_) là ngành toán học nghiên cứu về tập hợp. Mặc dù bất kỳ đối tượng
Các **tập mờ** hay **tập hợp mờ** (tiếng Anh: _Fuzzy set_) là một mở rộng của lý thuyết tập hợp cổ điển và được dùng trong lôgic mờ. Trong lý thuyết tập hợp cổ điển,
Tập tin:Glee red-yellow.svg **_Glee_** là một bộ phim truyền hình bi-hài được phát sóng trên Fox và được sáng lập bởi Ryan Murphy, Brad Falchuk, và Ian Brennan. Tập phim đầu tiên của chương trình
**Tập đoàn ING** () là một ngân hàng và dịch vụ tài chính đa quốc gia Hà Lan có trụ sở chính tại Amsterdam. Các hoạt động chính của ING là trong lĩnh vực ngân
Tập tin:How i met your mother logo.svg _How I Met Your Mother_ là loạt phim hài kịch tình huống truyền hình dài tập của Hoa Kỳ, được viết và sáng lập bởi Carter Bays và
Tập tin:Criminal Minds Logo, dec 2014.png _Criminal Minds_ là một bộ phim truyền hình về cảnh sát lần đầu phát sóng trên đài CBS vào ngày 22 tháng 9 năm 2005. Bộ phim theo một
**Mô hình thông tin xây dựng (BIM), hay mô hình thông tin công trình** là một quy trình liên quan tới việc tạo lập và quản lý những đặc trưng kỹ thuật số (được gọi
Trong tin học, **template** là một bản mẫu theo đó người dùng có thể thêm thông tin và thu được một đối tượng thông tin cụ thể trong một ứng dụng tin học. ## Ví
frame|Mô hình hoạt động bộ nhớ cache của máy tính Trong tin học, **cache** ( ) hoặc **bộ nhớ đệm** là một thành phần phần cứng hoặc phần mềm lưu trữ dữ liệu để các
**NTFS** (Viết tắt của từ New Technology File System). **Tiếng Việt**: "**Hệ thống tập tin công nghệ mới**". **NTFS** là hệ thống tập tin tiêu chuẩn của Windows NT, bao gồm cả các phiên bản
**FIle Explorer**, trước đây là **Windows Explorer, **là một ứng dụng quản lý tập tin đi kèm trong tất cả các phiên bản hệ điều hành Windows từ Windows 95 về sau. Nó cung cấp
**Công nghệ thông tin và truyền thông** (tiếng Anh: _Information and communications technology_, ICT) là cụm từ thường dùng như từ đồng nghĩa rộng hơn cho công nghệ thông tin (IT), nhưng thường là một
thumb|Bản đồ các cửa hàng Target tại Hoa Kỳ, tính đến tháng 12 năm 2020 **Target Corporation** (tên thương mại **Target** và cách điệu tất cả thành chữ thường kể từ năm 2018) là một
**MediaFire** là một dịch vụ lưu trữ tệp trực tuyến và chia sẻ dữ liệu miễn phí có trụ sở tại Quận Harris, Texas, Hoa Kỳ. Tất cả các thành viên đăng ký đều có
**Trại tập trung Auschwitz** ( ) là một mạng lưới các trại tập trung và trại hủy diệt do Đức Quốc Xã dựng lên tại vùng lãnh thổ Ba Lan bị nước này thôn tính
**RAR** là viết tắt của **_R_**oshal **_AR_**chive. Nó là một định dạng file nén độc quyền có hỗ trợ nén dữ liệu, sửa lỗi, và tập tin kéo dài. Nó được phát triển bởi một
**cp** là lệnh Unix dùng để sao chép tập tin và thư mục. Lệnh có 3 chế độ hoạt động tùy theo đối số truyền vào: sao chép tập tin sang tập tin khác, sao