文字檔案
文字檔案(text file,textfile,flatfile)一般指只有字元原生編碼構成个二進位電腦檔案,摎富文字相比,像毋包含字樣式个控制元素,做得分盡簡單个文字編輯器直接讀取。
資料儲存
因為結構簡單,文字檔案分人廣泛用在記錄資訊,佢做得避免其他檔案个格式堵著个一兜問題。另外,當文字檔案當中个部分資訊出現錯誤个時節,旦勢做得較該个對毋著个時節恢復出來,還過繼續處理其他个內容。文字檔案个一個缺點係冤仇值較低,也就係講,其實本旦做得用還較細个儲存空間來記錄這兜資訊。
格式
ASCII
ASCII 標準使致得單淨含有 ASCII 字元个文字檔案可以在 Unix、Macintosh、Microsoft Windows、DOS 同其他作業系統之間自由互動,其他格式个檔案係當難做到這點个。毋過,在這兜作業系統裡背,換行符合毋係共樣,處理非 ASCII 字元个方式乜無共樣。
MIME
文字檔案在 MIME 標準个類型為 " text / plain ",這外,佢一般還有編碼个資訊。在 Mac OS X 出現進前,當資源分叉(resource fork)指定某一個檔案个類型為「TEXT」時,Mac OS 就認為講這個檔案係文字檔案。在Windows 中,做一個檔案个副檔名安做「txt」時,系統就認為佢係一个文字檔案。另外,在特殊个目的喔,有兜文字檔案用其他副檔名。比將講,電腦个原始碼乜係文字檔案,佢兜个字尾係用來指明厥个程式語言个。
. txt
. txt 係包含當少格式資訊个文字檔案个副檔名。. txt 格式並無明確个定義,佢一般係講該兜做得分系統終端或者簡單个文字編輯器接受著个格式。任何做得讀取文字个程式都做得讀取帶有 . txt 副檔名个檔案,故所,一般認為這種檔案係通用个、跨平台个。
在英文字檔案當中,ASCII 字元集係盡輒常看著个格式,還過在當多場合, 佢乜係預設个格式。對帶重音符號个同其他个非 ASCII 字元,定著愛選擇一種字元編碼。在當多系統裡背,字元編碼係由電腦个區域設定个。長透看著个字元編碼包含支援當多歐洲語言个 ISO八千八百五十九肥一。
因爭蓋多編碼淨做得講有限个字元,一般呢佢兜淨做得用來表達幾種語言。Unicode 制定吔一種試等做得表達所有已經知語言个標準,Unicode 字元集非常大,佢包括了大大部分都知个字元集。Unicode 有幾下種字元編碼,其中最輒常看著个係 UTF 八十五,這種編碼做得相比方向 ASCII,共樣內容个 ASCII 文字檔案同 UTF 八文字个檔案完全共樣。===Windows 个 . txt 檔案===
微軟个 MS-DOS 摎 Windows 採用了相同个文字檔案格式,佢兜都用得 CR 摎 LF 兩隻字元準做換行符,這兩隻字元對應个 ASCII 碼分別係十三同十。一般,盡尾一行文字毋以換行符(CR-LF 標誌)結尾,包含記事本內个當多文字編輯器乜無在檔案个盡尾添換行符。
大部分 Windows 文字檔案使用 ANSI、OEM 或者係 Unicode 編碼。Windows 所指个 ANSI 編碼一般係元組个 ISO 八千八百五十九隻編碼,毋過對於像中文字、日文、朝鮮文恁樣形个環境,需要使用二位元組字元集。在過渡到 Unicode 前,Windows 緊用 ANSI 做為系統預設个編碼。還過 OEM 編碼,也係一般來講个啦 MS-DOS 頁碼,好 IBM 為早期 IBM 個人電腦个文字模式顯示系統定義个。在全螢幕个 MS-DOS 程式當中同時使用吔圖形个還過照行繪製个字元。新版本个 Windows 做得用 UTF 十六 LE 摎UTF 八pa24類个 Unicode 編碼。
展現
用文字編輯器打開一隻文字檔案了後,使用者做得看著做得讀个純文字內容。控制字元有成時編輯器準做文字指令,下把仔分人準做像純文字該樣做得編輯个跳脫字元。雖然文字檔案裡肚有純文字資訊,但係通過特殊个方法,檔案內个控制字元(尤其係檔案結束字元)做得分純文字做毋得見。
參考
參見
- 文字編輯器
- ASCII
- Unicode
- 記事本