X
تبلیغات
پیکوفایل
رایتل
چهارشنبه 1 شهریور‌ماه سال 1385

وب معنایی

مقاله به بحث درباره موج آینده توسعه شبکه جهانی وب، موسوم به وب معنایی می پردازد. وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. مقاله به اجمال به توصیف پنج سطح وب معنایی می پردازد شامل: 1) آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)؛ 2) فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.){تعریف نوع سند(دی.ان.اس.)}/ فرانمای چارچوب وصیف منبع (آر.دی.اف)؛ 3) واژگان- هستی شناسی؛ 4)قواعد- منطق و برهان؛ 5)امنیت- اطمینان. مقاله با این نتیجه خاتمه می یابد که بایستی وب سایت های خود را به عنوان جزئی از یک کل در نظر بگیریم، نه در انزوا از دیگر سایت ها.

کلید واژه ها :وب معنایی

متن مقاله :

مقدمه

در حالیکه به نظر می رسد با فروکش کردن موج دات کام ها {سایت های تجاری.م.} ، بخشی از انقلاب اینترنت خاتمه یافته است، انقلاب خاموش دیگری در وب در حال وقوع است. وب تا کنون درمسیر تولید، ورود، ذخیره و نمایش اطلاعات موفق بوده است، اما بازیابی و پردازش هنوز به عنوان یک مشکل باقی است.

موج اول پیشرفت وب شامل ارائه حداکثر اطلاعات ممکن به شکلی بود که بتواند به صورت مستقیم در قالب زبان نشانه گذاری فرامتن (HTML)برای مخاطب نمایش داده شود. بانک های اطلاعاتی هر روز بیش از پیش تلاش می کنند اطلاعات را به شکلی تولید نمایند که قبل از نمایش برای کاربر، توسط دیگر رایانه ها قابل خواندن و پردازش باشد. آنها برای برچسب گذاری داده ها، به جای HTML از زبان نشانه گذاری توسعه پذیر (XML) بهره می برند و برخی از آنها به منظور استاندارد سازی قالب محتوا به نحوی که صرف نظر از کاربرد نهایی، توسط رایانه ها نیز قابل خواندن باشد به استفاده از چارچوب توصیف سند (RDF) روی آورده اند.

در موج جدید پیشرفت تلاش می شود تا هر شیی اطلاعاتی موجود در جهان اطلاعات به واسطه موضوع، محل، پدیدآورنده، تاریخ و دیگر ویژگی هایش توصیف شود. این نوع اطلاعات پیشتر تنها در یک بانک اطلاعاتی ذخیره می شد اما اکنون ممکن است در یک سند ذخیره شود.
وجه تمایز میان یک پیشینه در یک پایگاه اطلاعاتی و یک سند هر روز کم رنگ تر می شود. اطلاعات ممکن است در ابربرچسب (Metatag) ها در راس یک صفحه HTML قرار گیرد یا یک سند کامل ممکن است با استفاده از XML با بخش های مفصل نظیر عنوان، چکیده، روش ها، و نتایج کدگذاری شود.

این موج تازه پیشرفت را "وب معنایی"( Semantic web) می نامند. وب معنایی شیوه ای است برای ایجاد یک وب که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. این امر ممکن است از بازیابی اسناد گرفته تا جمع بندی عناصر برنامه ای مختلف برای خلق یک نرم افزار کاربردی را دربر گیرد. تیم برنرزلی (Tim Berners-Lee) {ابداع کننده وب معنایی.م.}عقاید خود را درباره این امکانات در { http://www.w3.org/2000/talks/1206-xml2k-tbl }مطرح کرده است.

وب معنایی شامل پنج سطح است:
1. آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URI) ،
2. فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (XML Schema) {تعریف نوع سند(DTD) }/ فرانمای چاچوب توصیف منبع (RDF Schema) ،
3. واژگان- هستی شناسی،
4. قواعد- منطق و برهان،
5. امنیت- اطمینان.

در حالیکه بسیاری از این عناصر پیشاپیش پیرامون وب وجودداشته اند، فناوری هایی که امکان بکارگیری منسجم آنها را فراهم می کند به تازگی عرضه شده اند. محدودیت های اصلی این رهیافت بیشتر از عوامل انسانی نشأت می گیرد تا از فناوری.

آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)

نقطه آغاز برای اطلاعات وب، آدرس منحصر به فرد آن است- اما آیا واقعاً منحصر به فرد است؟ ما با مکان نماهای متحدالشکل منبع (URL) به عنوان شیوه توصیف محل ها آشنا هستیم اما با ایجاد تغییر در اسامی حوزه ها و بسته شدن سایت ها، نشانگرهای منحصر به فرددیگری اتخاذ می شوند نظیر نشانگر دیجیتالی شئی (DOI) یا یو.آر.ال ثابت (برای جزئیات بیشتر نگاه کنید به http://www.purl.org). راه حل های گوناگونی وجود دارد، این موارد را می توان به صورت کلی تر به عنوان URI ها توصیف کرد که این مزیت رادارند که اگر آدرس وب نهایی تغییر کند، URI هنوز به محلی اشاره می کند که نهایتاً به محل اصلی منبع منتهی می شود.

فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.)/ فرانمای چاچوب توصیف منبع (آر.دی.اف)

زبان نشانه گذاری توسعه پذیر قبلاً در مقاله دیگری توصیف شده است(1). تولید برونداد در قالب XML ازیک بانک اطلاعاتی چه به عنوان یک صفحه وب ثابت یا یک نتیجه جستجوی پویا امر بسیار ساده ایست. این برونداد می تواند توسط یک برنامه کاربردی دیگر مورد استفاده قرر گیرد و امکان تبادل، ترکیب یا پردازش داده ها را فراهم نماید (برای جزئیات نگاه کنید به http://www.xml.org).

XML شیوه ای برای برچسب گذاری داده هاست. با این حال نیازمند یک فرانما (طرح) برای اعتبار بخشی به محتوای برچسب (Tag) هایی است که هر جزء از داده ها را توصیف می کنند. پدیدآورنده، عنوان و سال ممکن است به عنوان برچسب در سندی که توسط یک فرانما یا تعریف نوع سند (DTD) توصیف شده است درج شوند. زبان نشانه گذاری توسعه بین المللی (IDML) می تواند مثال خوبی باشد (برای اطلاعات بیشتر نگاه کنید به http://www.idmlinitiative.org/).
مادامیکه به سمت یک نظام خودکار که در آن رایانه ها داده ها را تعبیر می کنند پیش می رویم، لازم است برچسب هایی برای کنترل پردازش داده ها و اطمینان از استاندارد سازی محتوا وجود داشته باشد؛ این همان جایی است که آر.دی.اف اهمیت می یابد. آر.دی.اف یک استاندارد است که گاه برای تبادل داده میان بانک های اطلاعاتی مورد استفاده قرار می گیرد.
یکی دیگر ازسیستم های کدگذاری که برای کمک به تبادل محتوا به زبان های مختلف ایجاد شده است، Unicode است. یونی کد استانداردی است برای مشخص نمودن حروفی که خارج از مجموعه کدهای ASCII قرار دارند. یونی کد یک استاندارد جهانی برای نمایش حروف و علائم فراهم نموده و تبادل ساده آنها با دیگر برنامه های کاربردی را بدون بروز اشکال در مورد حروف دارای اکسان (علائم صوتی) میسر می نماید (برای جزئیات بیشتر نگاه کنید به http://www.unicode.org/).

واژگان- هستی شناسی

این مبحث، هم به واژگان رایانه نظیر واژگان مورد استفاده برای خدمت دهنده های اینترنت جهت برقراری ارتباط و تبادل اطلاعات ارتباط می یابد و هم به مفاهیمی که گروه های فعال درحوزه های موضوعی مختلف جهت تعریف حوزه موضوعی شان بکار می برند.. هر دو مورد برای اطمینان از بازیابی و نمایش اسناد یا داده های مرتبط در هنگام جستجوی کاربر به زبان طبیعی ضرورت دارند. مراحل دخیل دراین امر نه تنها شامل عبارت جستجوی ارسال شده به بانک های اطلاعاتی مختلف جهت دریافت پاسخ می شود بلکه اهمیت برقراری پیوند میان واژگان در زبان ها و رشته های مختلف را نیز دربر می گیرد.

قواعد- منطق و برهان

قواعدی که رایانه با اتکا به آنها به بازیابی داده ها از طیفی از منابع می پردازد در واقع همان Script ها و برنامه های نرم افزاری هستند. برخی بر این باورند که این قواعد بایستی به مرحله ای از تکامل برسند که به صورت خودکار به عنوان مثال افزایش دستمزد ها را در یک شرکت بر مبنای برآورد فروش یا تولید در اینترانت آن شرکت کنترل کنند؛ اما شاید هم در جهان علمی، اعتبار، برگرفته از گزارش ها یا نوشته های افراداست نه رایانه.

امنیت- اطمینان

در حالت واقعی، اگر چه ایده یک وب یکپارچه ممکن است جذاب به نظر برسد، اما هر روز بیش از پیش با محدودسازی وب از طریق ایجاد رمز عبور برای وب سایت ها مواجه می شویم. اطلاعات به طور معمول میان یک گروه از شرکت ها یا یک کنسرسیوم از سازمان ها به اشتراک گذاشته می شود. تجربه شخصی من این است که در مورد همکاری با سازمان های وابسته به سازمان ملل و بانک جهانی، اگر قرار باشد آنها با گردآوری انبوه اطلاعات یک نظام مرکزی تدارک ببینند، تردید وجود دارد. جایی که یک تعاونی یا کنسرسیوم از سازمان ها پیرامون امنیت یا نفع مشترک گرد هم می آیند، رهیافت اشتراک داده ها موفق تر است. فناوری های جدید شیوه هایی جهت وصول اطمینان از تضمین امنیت اطلاعات فراهم می کنند. به طبع، دراین صورت کاربر نیز اطمینان و اعتماد بیشتری به داده ها و نظام پیدا می کند. در نتیجه نهایتاً با مجموعه ای از وب ها مواجه خواهیم بود که از اطمینان لازم برای کاربردهای مختلف توسط گروه های متفاوت برخوردار هستند. این شبکه ها نسبت به نظام های موجود که مبتنی بر یک سازمان فراهم کننده محتوا هستند، خدمات بهتری می توانند ارائه کنند.

وب معنایی چگونه بر نظام شما اثر می گذارد؟

همه گروه های فراهم کننده اطلاعات روی وب پیشاپیش با انتخاب ابربرچسب های بکار رفته در صفحات وب خود، به نحوی در ایجاد نوعی وب معنایی مشارکت کرده اند. با انتخاب برچسب ها، به عنوان نمونه برچسب های پیشنهادی Alta Vista یا Dublin Core (http://www.purl.org/dc/) شیوه هایی جهت توصیف پدید آورنده، عنوان وموضوع یک سند فراهم می شود. انتخاب کلیدواژه موضوعی احتمالاً مشکل تر است. اگر در یک شرکت کشاورزی کار می کنید ممکن است به عنوان مثال از AGRIS یا CAB Thesaurus یا سیاهه کلید واژگان خاص خودتان استفاده کنید.

ممکن در حال استفاده از یک بانک اطلاعاتی برای ایجاد وب سایت خود باشید. دراین صورت احتمالاً با ایکس.ام.ال به عنوان شیوه ای جهت ارسال داده ها به دیگران و دریافت داده ها از دیگر منابع به منظور درونداد دسته ای داده ها آشنا باشید. وقتی این موارد پیچیده تر می شوند، ممکن است از نرم افرارهای کاربردی ای استفاده کنید که معرّف لایه های منطق و برهان در وب معنایی هستند. به عنوان مثال ممکن است تنها پذیرای دروندادی باشید که با معیارهای خاصی مطابقت داشته باشد، به یک موضوع خاص مربوط باشد و به دوره زمانی خاصی محدود شود.

بسیاری از وب سایت های موجود دارای حوزه های امن متکی بر رمز عبور هستند اما مشکل توسعه وب سایت ها، به ایجاد اطمینان هنگام همکاری با سایر فراهم کنندگان اطلاعات جهت ایجاد خدمات مشترک و یا همکاری با کاربران جهت ارائه خدمات برمی گردد.

روشن است مادامی که وب معنایی تا قبل از رسیدن به دیدگاه های مطرح شده توسط افرادی چون تیم برنرزلی همچنان به تکامل خود ادامه می دهد، ما بایستی وب سایت های خود را جزئی از یک کل در نظر بگیریم و نه درانزوا از دیگر سایت ها. با توجه به این ایده، ارزش آن را دارد که توجه خود را معطوف شیوه ایجاد وب سایت ها کرده و با بهره گیری از فناوری های نوین به همکاری با دیگران جهت تدارک خدمات روی آوریم.
نویسنده (گان) : کریس ادیسون  
ترجمه از :حمید رضا جمالی مهموئی (دانشجوی دکترای اطلاع رسانی دانشگاه سیتی لندن)
نظرات (0)
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
نام :
پست الکترونیک :
وب/وبلاگ :
ایمیل شما بعد از ثبت نمایش داده نخواهد شد