یونی کد یا یونیکد – Unicode
منبع: گرته (اولین نشریه تحلیلی، پژوهشی طراحی گرافیک ایران)
نویسنده: جواد میرحسینی
یونیکد – یونی کد (Unicode)، استانداردی صنعتی است که اجازه میدهد نمادهای تمامی رسمالخطهای دنیا با رایانه نمایش داده شوند.
اغلب نوآوریهای جدید با پیچیدگیها و جزئیات زیادی همراه است و در ظاهر برای استفاده ساده نیستند.
این عوامل سبب میشوند که کاربران روی خوشی به آنها نشان ندهند، هرچند در بعضی از موارد بهناچار آن را فراگرفته و استفاده میکنند؛ یونیکد نیز از این قاعده مستثنی نیست.
قبل از درک مفهوم یونی کد ، بد نیست درباره سیستمهای کدگذاری بیشتر بدانیم. همانطور که میدانید هر دادهای که در کامپیوتر وجود دارد، حتی تصاویر یا فیلمها، بهصورت یک سری از ارقام در مبنای ۲ ذخیره میشوند. این دادهها در اصل از رقمهای صفر و یک تشکیل شده و به صورت خاصی ذخیره شدهاند. ما میتوانیم اطلاعاتی مانند یک تصویر را طبق الگوریتمهایی ذخیره کرده و آن را مشاهده یا ویرایش کنیم. تمامی حروف و اعدادی که نمایش داده میشوند نیز به همین شکل هستند.
اختصاص دادن یک عدد خاص با در نظر گرفتن قالب خاص برای کاراکترها را «کدگذاری» می گوییم که این کدگذاریها بهصورت استانداردهای جهانی در میآیند و مانند استاندارد و یا یونی کد در سیستمهای کامپیوتری از آنها استفاده میشود.
یونی کد به هر نویسه، یک عدد مشخص اختصاص میدهد؛ مستقل از محیط، مستقل از برنامه، و مستقل از زبان. استاندارد یونیکد را پیشتازان صنعت کامپیوتر از قبیل شرکتهایی چون آی.بی.ام، اَپل، اچ.پی، اورکل، جاست سیستم، سان، سای بیس، مایکروسافت یونیسیس و بسیاری از شرکتهای دیگر پذیرفتهاند.
امروزه یونیکد در بسیاری از سیستم عاملها، مرورگرها و بسیاری از محصولات دیگر پشتیبانی می شود. پیدایش استاندارد یونیکد و در دسترس بودن ابزارهایی که از آن پشتیبانی میکنند، از چشمگیرترین روندهای جدید در صحنه جهانی فناوریهای نرم افزاری بوده است.
گنجاندن یونیکد در سایتها و برنامههای کاربردی، در مقایسه با کدهای قدیمی، میتواند باعث کاهش قابلملاحظه هزینهها شود.
یونیکد این امکان را فراهم میکند که یک محصول نرمافزاری یکسان یا یک سایت مشخص، بتواند بدون نیاز به طراحی مجدد، در محیطها، زبانها و کشورهای متعددی کار کند.
یونیکد به دادهها نیز امکان میدهد که بدون تحریف از سیستمهای مختلف داده شوند؛ بدینترتیب یونیکد امکان کدگذاری همه نویسههای مورد استفاده در نوشتن زبانهای دنیا را فراهم میکند.
یونیکد شیوهای نیز برای کدگذاری ۸بیتی متون مشخص کرده است که نویسه ها را پس از اعمال یک تابع خاص به کدشان، بهصورت دنبالههایی که از یک تا چهار بایت دارند نگه میدارد. این شیوه که با UTF-8 شناخته میشود، به این خاطر است که نویسههای اسکی را عینا حفظ می کند و در نتیجه، هم برنامههای قدیمی راحتتر با آن کنار میآیند و هم طول پروندههای لاتین را زیاد نمیکند، بسیار محبوب است. در واقع بسیاری از سیستمهایی که ادعای پشتیبانی یونیکد را دارند، تنها UTF-8 را پشتیبانی میکنند و پروندههای یونیکد، اعم از کاربردهای اینترنتی یا موارد استفاده محلی، عمدتا در قالب UTF-8 ذخیره شدهاند.
در استاندارد یونیکد، نویسههای فارسی در بلوک مربوط به خط عربی قرار دارند. این بلوک برای در بر گرفتن نویسههای زبانهایی که از خط عربی استفاده میکنند، مثل فارسی، اردو، پشتو، سندی، و کردی گسترش یافته است. این بلوک نشانههای قرآنی از قبیل نشانههای سجده و پایان آیه، و علائم وقف را نیز در بردارد.
در یونیکد با وجود یکیسازی کدهای حروف مشترک، برای حروف فارسیای که بار معنایی یا نمایشی متفاوت با حروف عربی دارند، نویسههای جداگانه در نظر گرفته شده است. یعنی کلیه حروف خاص فارسی(پ،چ،ژ،گ) و نیز «ک» و «ی» فارسی که با حرف مشابه در عربی تفاوت نمایشی دارند، مکان جداگانهای اختصاص دادهاند. کلیه اعرابهای متداول حضور دارند و میان شکل فارسی / اردو و عربی ارقام نیز بهعلت شکل و رفتار متفاوت، تفاوتهایی منظور گشته است.
از مهمترین مزایایی که یونیکد برای زبان فارسی دارد (مثل بسیاری زبانهای دیگر) میتوان موارد زیر را نام برد:
در نسخه استاندارد هر نرمافزاری که از این استاندارد پشتیبانی کند، میتوان فارسی نوشت یا متون فارسی را خواند. بدینترتیب دیگر نیازی به تأمین نسخههای خاص فارسی یا عربی نیست.
برای خواندن متون فارسی که توسط شرکت خاصی نوشته شده اند، نیازی به داشتن فونت خاص آن شرکت نداریم و هر متن فارسی که با استاندارد یونی کد کدگذاری شده باشد، با هر فونتی یونیکدی قابلمشاهده است.
امکان استفاده همزمان از زبانهای فارسی و انگلیسی را تأمین میکند.
بدون استفاده از فونتهای خاص امکان استفاده از علایم خاص را فراهم میکند.
بهطور کلی، یونیکد به شرح زیر است:
نویسههای شانزده بیتی
ترتیب مفهومی (در مقابل دیداری)
کارایی
یکیسازی (اختصاص یک کد به نویسههای مشترک در چند زبان مختلف)
نویسه، نه شکل (یک «ع»، و نه چهارتا: «ﻋ»، «ﻌ»، «ﻊ»، «ع»)
ترکیب پویا
بار معنایی (حرف بودن، مقدار عددی)
دنبالههای معادل (امکان ذخیرهسازی یک متن به دو شکل مختلف ولی معادل)
متن ساده (و نه مفاهیمی مثل تغییر قلم، جدول بندی، و صفحهآرایی)
قابلیت تبدیل (هر متن موجود در قالب یک مجموعه نویسه سنتی باید بدون از بین رفتن معنا قابل تبدیل به یونیکد باشد).
تا کنون نظری ثبت نشده