یونیکُد[۱] (به انگلیسی: Unicode) استانداردی صنعتی برای رمزنگاری نویسههای رایانهای و نمایش و پردازش متن به اکثر زبانهای دنیا[۲] است.
این استاندارد هماهنگ با مجموعه جهانی نویسهها تالیف شدهاست و به صورت کتابی به نام 'The Unicode Standard' منتشر شدهاست. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعهای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعهای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعهای ازمرجع فایلهای دادههای کامپیوتر و تعدادی موارد مربوط مانند جزییات نویسه،برابری یونیکد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپتهای سمت چپ به راست) میباشد. در سال ۲۰۱۲، آخرین ویرایش، یونیکد ۶٫۱ است.
موفقیت یونیکد در یکی کردن کدبندی نویسهها سبب استفاده گسترده اش در جهانیسازی و بومیسازی نرمافزارها شدهاست. این استاندارد در بسیاری از فناوریهای اخیر پیاده شدهاست از جمله: اکس ام ال، زبان برنامه نویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عاملهای مدرن.
یونیکد میتواند توسط رمزنگاری نویسههای مختلفی پیادهسازی شود. پرکاربرد ترین رمز نگاریها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.
رمزنگاری UTF-8 برای رمزنگاری نویسههای موجود در استاندارد اسکی تنها ۱ بایت استفاده میکند. کد نویسههای موجود در رمز نگاری اسکی، در هر دو رمزنگاری یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده میکند.UCS-2 برای تمام نویسهها از ۲ بایت استفاده میکند بنابراین نمیتواند تمام نویسههای موجود در استاندارد فعلی یونیکد را رمزنگاری کند. UTF-16 رمزنگاری UCS-2 را گسترش میدهد و برای نویسههای باقیمانده از ۴ بایت استفاده میکند.
محتویات
۱ تاریخچه و توسعه
۲ یونیکد در ویندوز
۳ همچنین بخوانید
۴ پیوند به بیرون
۵ پانویس
۶ منابع
تاریخچه و توسعه
هدف یونیکد رفع محدودیتهای موجود در کدبندی نویسههای قدیمی است، مانند کدبندیهایی که بر پایه استاندارد ISO 8859 تعریف شدهاند، که استفاده گستردهای در کشورهای مختلف پیدا کردهاند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندیهای قدیمی این مشکل مشترک را دارند که امکان پردازش متنهای دوزبانه (معمولا به وسیله نویسههای لاتین و نمادهای محلی) را فراهم میکنند، ولی پردازش بیش از دو زبان را ممکن نمیکنند.
نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارایه میکند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارایه میکند و کار ساخت تصویر (شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرمافزار دیگری مانند مرورگر وب یا واژهپرداز میگذارد.
یونیکد در ویندوز
در ویندوز ایپیآی توابع یونیکد با پسوند W میآیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبانهای برنامه نویسی انواع دادهای که یونیکد را پشتیبانی میکنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته میشود.