در حالی که ما اسناد متنی را به عنوان خطوط متن می بینیم، رایانه ها در واقع آنها را به عنوان داده دودویی (Binary) یا مجموعه ای از یک و صفر می بینند. بنابراین، شخصیت (Character) در یک سند متنی باید با کدهای عددی نمایش داده شود. به منظور انجام این کار، متن با استفاده از یکی از چندین نوع رمزگذاری کاراکتر ذخیره می شود.
محبوب ترین انواع رمزگذاری کاراکترها کد استاندارد آمریکایی برای تبادل اطلاعات (ASCII) و یونیکد هستند. در حالی که ASCII هنوز توسط تقریباً همه ویرایشگرهای متن پشتیبانی می شود، یونیکد بیشتر مورد استفاده قرار می گیرد زیرا از مجموعه کاراکترهای بزرگتر پشتیبانی می کند. یونیکد اغلب به عنوان UTF-8، UTF-16 یا UTF-32 تعریف می شود که به استانداردهای مختلف یونیکد اشاره دارد. UTF مخفف "Unicode Transformation Format" است و عدد نشان دهنده تعداد بیت (Bit) مورد استفاده برای نمایش هر کاراکتر است. از روزهای اولیه محاسبات، کاراکترها حداقل با یک بایت (Byte) (8 بیت) نشان داده می شدند، به همین دلیل است که استانداردهای مختلف یونیکد کاراکترها را در مضرب 8 بیت ذخیره می کنند.
در حالی که ASCII و Unicode رایج ترین انواع رمزگذاری کاراکترها هستند، سایر استانداردهای رمزگذاری نیز ممکن است برای فایل های متنی رمزگذاری (Encoding) استفاده شوند. به عنوان مثال، انواع مختلفی از استانداردهای رمزگذاری کاراکترهای خاص زبان وجود دارد، مانند غربی، لاتین-آمریکایی، ژاپنی، کره ای و چینی. در حالی که زبان های غربی از کاراکترهای مشابه استفاده می کنند، زبان های شرقی به مجموعه کاراکترهای کاملاً متفاوتی نیاز دارند. بنابراین، یک رمزگذاری لاتین از نمادهای مورد نیاز برای نشان دادن یک متن رشته (String) به زبان چینی پشتیبانی نمی کند. خوشبختانه، استانداردهای مدرن مانند UTF-16 از یک مجموعه کاراکتر بزرگ به اندازه کافی برای نمایش حروف و نمادهای غربی و شرقی پشتیبانی میکنند.
تعریف رمزگذاری کاراکتر (Character Encoding) در این صفحه یک تعریف پایه نگاشته شده توسط تک بورد است. اگر مایل به ارجاع به این صفحه یا استناد به این تعریف هستید، با شرط درج لینک به این صفحه می توانید از این محتوا استفاده کنید.
هدف تک بورد توضیح اصطلاحات کامپیوتری به روشی است که به راحتی قابل درک باشد. ما برای سادگی و دقت با هر تعریفی که منتشر می کنیم تلاش می کنیم. اگر بازخوردی درباره تعریف رمزگذاری کاراکتر (Character Encoding) دارید یا میخواهید یک اصطلاح فنی جدید پیشنهاد کنید، لطفاً با ما تماس بگیرید.
آیا می خواهید اصطلاحات فنی بیشتری یاد بگیرید؟ در خبرنامه روزانه یا هفتگی مشترک شوید و شرایط و آزمون های ویژه را در ایمیل خود تحویل بگیرید.