کنسرسيوم وب (W3C) استانداردهای HTML و
CSS را با يک ديد کلی به همه زبانها و مليتها در نظر گرفته است. بخصوص راجع به
زبانهای موجود در خاورميانه که از راست به چپ هستند. زبان فارسی و عربی از جمله
اين زبانها می باشند. لازم بذکر است که زبان فارسی و چند زبان ديگر مانند اردو
و پشتو بعنوان بخشی از زبان عربی در نظر گرفته شده اند. اما اين مساله نه تنها
سبب عدم بکارگيری فارسی در دنيای اينترنت نيست بلکه دريچه ارزشمندی است که بسوی
زبان فارسی گشوده شده است تا بلکه در آينده نگاه مستقلی به اين زبان ايجاد
گردد. زبان فارسی در استاندارد يونيکد تحت بلوک زبان عربی اين استاندارد بخوبی
پشتيبانی شده است و امروزه تنها راه بکارگيری زبان فارسی در اينترنت بصورت
استاندارد محسوب می شود.
مجموعه مقالاتی که در اين زمينه ارائه می
گردد با الهام از مقاله ای بنام Authoring HTML for Middle Eastern Content
منتشره توسط شرکت مايکروسافت در سال 2001 می باشد. در اين مقالات سعی خواهد شد
روش های ساخت صفحات وب بصورت فارسی با استفاده از HTML 4.0 و CSS2 بيان گردد.
مجموعه نويسه
جهت نمايش صحيح يک صفحه وب، مرورگر بايد نوع مجموعه نويسه ای که در آن صفحه
استفاده شده است را بداند. جهت اين امر بايد نوع مجموعه نويسه در قسمت HEAD
صفحه HTML قبلا معرفی شده باشد. برای اينکار از يک تگ META بين تگ های <HEAD> و
<HEAD/> بصورت زير استفاده می کنيم:
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html; charset=utf-8">
در حالت فوق مجموعه نويسه صفحه بصورت
utf-8 مناسب برای صفحات فارسی بصورت يونيکد تعريف شده است. برای صفحات وب با
زبانهای خاورميانه ای معمولا مجموعه نويسه های زير را داريم:
iso-8859-1 - ISO Latin-1 standard (no
Arabic characters included)
iso-8859-6 - ISO Arabic standard
windows-1252 - Windows 1252 (no Arabic characters included)
windows-1256 - Windows Arabic codepage
asmo-708 - ASMO 708 codepage
dos-720 - Arabic DOS 720 codepage
بخاطر داشته باشيد که مجموعه نويسه ها
محدود هستند. اگر نويسه ای در يک صفحه استفاده شده است که در مجموعه نويسه
تعيين شده برای صفحه وجود ندارد، اين مساله بايد بصورت صريح برای مرورگرمشخص
گردد تا عمل نمايش صفحه بدرستی انجام پذيرد.
تعيين زبان
با استفاده از مشخصه LANG می توان نوع زبان را برای هر يک از عناصر HTML مانند
بدنه، پاراگراف، متن و غيره را مشخص نمود. تعيين اين مشخصه می تواند در موارد
زير مفيد باشد:
• تشخيص زبان برای موتورهای جستجو
• کمک به مرورگر جهت انتخاب نوع بهتر نمايش شکل نويسه ها
• کمک به مرورگر جهت رعايت علائم و نقطه گذاری، فواصل، اتصال يا جداسازی حروف
• کمک به برنامه های غلط گير املائی يا انشائي
بعنوان مثال می توان زبان را برای تگهای
<P> و <BODY> بصورت زير تعريف نمود:
<BODY LANG="fa">
<P LANG="fa">
همچنين می توان اين عمل را يک بار برای
کل صفحه در قسمت HEAD بصورت زير تعريف نمود:
<META HTTP-EQUIV="Content-Language"
CONTENT="fa">
در عبارت فوق که در قسمت HEAD صفحه HTML
می آيد با استفاده از علامت fa نوع زبان، فارسی تعريف شده است. توجه داشته
باشيد که تقدم مشخصه LANG برای هر عنصر HTML از عبارت فوق بالاتر است.
هر زبان علامت يا مجموعه علائم مخصوص به
خود را دارد که همه اين علائم مشخص شده اند و می توانيد استاندارد مربوطه را در
[RFC1766]
ببينيد. بعنوان مثال برای زبان انگليسی از en و برای عربی از ar استفاده می
شود.
اندازه فونت
هنگامی که مرورگر، يک صفحه با متون مختلف، مثلا فارسی و انگليسی را نمايش می
دهد ممکن است استفاده از اندازه فونت پيش فرض برای هر دو زبان، سبب نمايش
نادرست و يا ناموزون صفحه گردد. بعبارت ديگر مثلا ممکن است متون فارسی در مقابل
متون انگليسی خيلی کوچکتر به نظر برسند.
بهترين راه حل برای حل چنين مشکلی تعيين
اندازه فونت برای هر نوع از متون است. بدين منظور برای راحتی کار می توان از
CSS استفاده نمود. در مثال زير دو نوع مدل يکی برای نمايش متون فارسی و ديگری
برای نمايش متون انگليسی تعريف و استفاده شده است.
<STYLE type="text/css">
SPAN.farsi
{ font-face: Times New Roman;
font-size: 12pt; }
SPAN.english
{ font-face: Times New Roman;
font-size: 10pt; }
</STYLE>
<BODY>
<P>
<SPAN class="farsi">.سلام اينجا ايران است</SPAN>
<SPAN class="english">Hello, This is Iran.</SPAN>
</P>
</BODY> |