هستی شناسی ژن یا Gene Ontology یک پروژه گروهی در بیوانفورماتیک برای یکسان سازی نمایش ژن و ویژگی های محصول ژن در همه گونه ها است. به طور خاص، هدف این پروژه: ۱) حفظ و توسعه واژگان کنترل شده ژن و ویژگی های محصول ژنی است. ۲) حاشیه نویسی ژن ها و محصولات ژنی، و جذب و انتشار داده های حاشیه نویسی. ۳) ابزارهایی برای دسترسی آسان به تمام جنبه های داده های ارائه شده توسط پروژه برای فعال کردن تفسیر عملکردی داده های تجربی با استفاده از هستی شناسی ژن است. داده های هستی شناسی ژن یک داده پویا است. در نشریه جهان شیمی فیزیک در مورد ژنوم، DNA و RNA، پروتئین، آنزیم، درخت فیلوژنی و ژنتیک ملکولی مقالاتی منتشر شده است. در این مطلب شما را با هستی شناسی ژن آشنا میکنیم.
هستی شناسی ژن
نامگذاری ژن بر ژن و محصولات ژنی تمرکز دارد، هستی شناسی ژن بر عملکرد ژنها و محصولات ژنی تمرکز دارد. GO همچنین تلاش خود را با استفاده از زبان نشانه گذاری گسترش می دهد تا داده ها (نه تنها از ژن ها و محصولات آنها، بلکه همچنین ویژگی های انتخاب شده) قابل خواندن باشد. این کار را به گونه ای انجام دهد که در همه گونه ها یکپارچه باشد (در حالی که قراردادهای نامگذاری ژن بر اساس تاکسون بیولوژیکی متفاوت است).
تاریخچه هستی شناسی ژن
هستی شناسی ژن در ابتدا در سال ۱۹۹۸ توسط کنسرسیومی از محققین ساخته شد که ژنوم سه ارگانیسم مدل را مطالعه می کردند: مگس سرکه (مگس میوه)، موش، و مخمر آبجو یا نانوا. بسیاری دیگر از پایگاههای داده ارگانیسمهای مدل به کنسرسیوم هستیشناسی ژن ملحق شدهاند و نه تنها به دادههای حاشیهنویسی کمک میکنند.
بلکه در توسعه هستیشناسیها و ابزارهایی برای مشاهده و اعمال دادهها نیز مشارکت دارند. بسیاری از پایگاههای دادههای اصلی گیاهان، حیوانات و میکروارگانیسمها در این پروژه مشارکت دارند. از جولای ۲۰۱۹، هستی شناسی ژن شامل ۴۴۹۴۵ اصطلاح است. ۶۴۰۸۲۸۳ حاشیه نویسی برای ۴۴۶۷ موجودات بیولوژیکی مختلف وجود دارد.
مجموعه قابل توجهی از ادبیات در مورد توسعه و استفاده از هستی شناسی ژن وجود دارد. به یک ابزار استاندارد در بیوانفورماتیک تبدیل شده است. اهداف آنها سه جنبه دارد: ایجاد هستی شناسی ژن، اختصاص هستی شناسی به محصولات ژن و توسعه نرم افزار و پایگاه داده برای دو مورد اول. چندین تحلیل از هستیشناسی ژن با استفاده از ویژگیهای رسمی و مستقل از دامنه کلاسها نیز شروع به ظاهر شدن کردهاند. برای مثال، تحلیل هستی شناختی و هستی شناسیهای بیولوژیکی است.
اصطلاحات و هستی شناسی ژن
از دیدگاه عملی، هستی شناسی ژن چیزی است که ما درباره آن می دانیم. هستی شناسی شامل چیزهایی است که قابل تشخیص یا مستقیما قابل مشاهده هستند و روابط بین آن است.
هیچ اصطلاح استاندارد جهانی در زیست شناسی و حوزه های مرتبط وجود ندارد و کاربرد اصطلاحات ممکن است مختص یک گونه، منطقه تحقیقاتی یا حتی یک گروه تحقیقاتی خاص باشد. این امر ارتباط و اشتراک گذاری داده ها را دشوارتر می کند. هستی شناسی ژن از اصطلاحات تعریف شده ای استفاده کرده که ویژگی های محصول ژن را نشان می دهد. هستی شناسی سه حوزه را پوشش می دهد:
- جزء سلولی، اجزای یک سلول یا محیط خارج سلولی آن
- عملکرد مولکولی، فعالیت های عنصری یک محصول ژن در سطح مولکولی، مانند اتصال یا کاتالیز
- فرآیند بیولوژیکی، عملیات یا مجموعه ای از رویدادهای مولکولی با شروع و پایان مشخص، مربوط به عملکرد واحدهای زنده یکپارچه: سلول ها، بافت ها، اندام ها و موجودات.
تعریف اصطلاح هستی شناسی ژن
هستی شناسی ژن یک اصطلاح دارد. شامل یک کلمه یا رشته ای از کلمات است. یک شناسه الفبایی عددی منحصر به فرد است. یک هستی شناسی که دامنه ای را که به آن تعلق دارد نشان می دهد. اصطلاحات همچنین ممکن است مترادف هایی داشته باشند که دقیقا معادل اصطلاح نام، گسترده تر، محدودتر یا مرتبط طبقه بندی می شوند.
ارجاع به مفاهیم معادل در سایر پایگاه های داده؛ و نظرات در مورد معنی یا کاربرد اصطلاح. هستی شناسی ژن به عنوان یک گراف غیر چرخه ای جهت دار ساختار یافته است و هر عبارت روابطی با یک یا چند عبارت دیگر در همان حوزه و گاهی اوقات با حوزه های دیگر تعریف می کند. واژگان هستی شناسی ژن به گونه ای طراحی شده است که خنثی از گونه ها باشد و شامل اصطلاحاتی است که برای پروکاریوت ها و یوکاریوت ها، موجودات تک سلولی و چند سلولی قابل استفاده است.
به عنوان مثال، یک حاشیه نویس ممکن است یک اصطلاح خاص را برای نشان دادن یک مسیر متابولیک درخواست کند، یا بخشی از هستی شناسی ممکن است با کمک کارشناسان جامعه بازنگری شود. ویرایشها توسط ویراستاران هستیشناسی بررسی میشوند و در صورت لزوم پیادهسازی میشوند.
فایلهای هستیشناسی و حاشیهنویسی هستی شناسی ژن به صورت رایگان از وبسایت GO در قالبهای مختلفی در دسترس هستند. یا میتوان به صورت آنلاین با استفاده از مرورگر AmiGO به آنها دسترسی داشت. پروژه هستی شناسی ژن همچنین نگاشت های قابل دانلودی از اصطلاحات خود را به سایر سیستم های طبقه بندی ارائه می دهد.
حاشیه نویسی ژنوم
حاشیه نویسی ژنوم شامل گرفتن داده ها در مورد یک محصول ژنی است. حاشیه نویسی، هستی شناسی ژن از اصطلاحات هستی شناسی ژن استفاده می کند. حاشیه نویسی از GO در وب سایت منتشر می شود.
جایی که می توان آنها را مستقیما دانلود کرد یا با استفاده از AmiGO به صورت آنلاین مشاهده کرد. علاوه بر شناسه محصول ژنی و عبارت GO مربوطه، حاشیه نویسی های GO حداقل داده های زیر را دارند: مرجعی که برای ایجاد حاشیه نویسی استفاده می شود (مثلا یک مقاله ژورنالی). کد مدرک نشان دهنده نوع شواهدی است که حاشیه نویسی بر آن استوار است.
اطلاعات پشتیبان، بسته به اصطلاح هستی شناسی ژن و شواهد استفاده شده و اطلاعات تکمیلی، مانند شرایطی که عملکرد تحت آن مشاهده می شود. ممکن است در حاشیه نویسی GO گنجانده شود.
در سال ۲۰۱۰، بیش از ۹۸٪ از تمام حاشیه نویسی های هستی شناسی ژن به صورت محاسباتی استنباط شدند، نه توسط متصدیان، اما از ۲ ژوئیه ۲۰۱۹، تنها حدود ۳۰٪ از تمام حاشیه نویسی های GO به صورت محاسباتی استنباط شدند. از آنجایی که این حاشیهنویسیها توسط انسان بررسی نمیشوند. کنسرسیوم هستی شناسی ژن آنها را تا حدی کمتر اعتماد دارند.
معمولا اصطلاحات سطح بالاتر و جزئیات کمتری دارند. مجموعه داده های حاشیه نویسی کامل را می توان از وب سایت GO دانلود کرد. برای حمایت از توسعه حاشیه نویسی، کنسرسیوم GO کارگاه های آموزشی را ارائه می دهد و گروه های جدیدی از متصدیان و توسعه دهندگان را راهنمایی می کند. بسیاری از الگوریتمهای یادگیری ماشین برای پیشبینی حاشیه نویسیهای هستیشناسی ژن طراحی و پیادهسازی شدهاند.
ابزار هستی شناسی ژن
تعداد زیادی ابزار موجود هم به صورت آنلاین و هم برای دانلود وجود دارد که از داده های ارائه شده توسط پروژه GO استفاده می کنند. اکثریت قریب به اتفاق اینها از طرف اشخاص ثالث هستند. کنسرسیوم هستی شناسی ژن دو ابزار AmiGO و OBO-Edit را توسعه و پشتیبانی می کند.
AmiGO یک برنامه مبتنی بر وب است که به کاربران اجازه می دهد تا به جستجو، مرور و تجسم هستی شناسی ها و داده های حاشیه نویسی محصول ژنی بپردازند. همچنین دارای یک ابزار BLAST است. ابزارهایی است که امکان تجزیه و تحلیل مجموعه داده های بزرگتر و یک رابط برای پرس و جو از پایگاه داده GO به طور مستقیم را فراهم می کند.
AmiGO را به صورت آنلاین در وب سایت GO برای دسترسی به داده های ارائه شده توسط کنسرسیوم هستی شناسی ژن مشاهده کنید. یا می توان آن را برای استفاده محلی در هر پایگاه داده ای که از طرح پایگاه داده GO استفاده می کند دانلود و نصب کرد.
OBO-Editیک ویرایشگر هستی شناسی منبع باز و مستقل از پلتفرم است که توسط کنسرسیوم هستی شناسی ژن توسعه و نگهداری می شود. این در جاوا پیاده سازی شده است و از یک رویکرد گراف گرا برای نمایش و ویرایش هستی شناسی ها استفاده می کند. OBO-Edit شامل یک جستجوی جامع و رابط فیلتر است. رابط کاربری را نیز می توان با توجه به تنظیمات کاربر سفارشی کرد. OBO-Edit می تواند برای مشاهده، جستجو و ویرایش هر هستی شناسی استفاده شود. به صورت رایگان در دسترس است.
کنسرسیوم هستی شناسی ژن
کنسرسیوم هستی شناسی ژن مجموعه ای از پایگاه های بیولوژیکی و گروه های تحقیقاتی است که به طور فعال در پروژه هستی شناسی ژن درگیر هستند. این شامل تعدادی پایگاه داده ارگانیسم مدل و پایگاه داده پروتئین چند گونه، گروه های توسعه نرم افزار و یک دفتر تحریریه اختصاصی است.
بزرگترین ژن انسانی
کروموزوم شماره یک بزرگترین کروموزوم انسان است.