Банкі даных біялагічнай інфармацыі



ЗМЕСТ

 

ЗМЕСТ

УВОДЗІНЫ

ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

§1. Асноўныя прымяненні інфармацыйных тэхналогій

§2 Банкі даных біялагічнай інфармацыі

§3 Візуалізацыя біялагічнай інфармацыі

§4 Пашуковыя сістэмы

ГЛАВА 2 ВЫКАРЫСТАННЕ ІНФАРМАЦЫЙНЫХ ТЭХНАЛОГІЙ ДЛЯ ЗАДАЧ ПАРАЎНАННЯ Ў БІЯІНФАРМАТЫЦЫ

§1 Супастаўленне з узорам

§2 Параўнанне структур бялкоў

ГЛАВА 3

ВЫКАРЫСТАННЕ ПРАГРАМНЫХ БІБЛІЯТЭК

§1 Бібліятэка BioJava

Глава 4 ПРАКТЫЧНАЕ ВЫКАРЫСТАННЕ БІБЛІЯТЭКІ BIOJAVA

§1 Пастаноўка задачы

§2 Усталёўка бібліятэкі

§3 Выбар алгарытмаў

§4 Напісанне праграмы пошуку найбліжэйшых паслядоўнасцяў

§5 Тэсціраванне праграмы пошуку найбліжэйшых паслядоўнасцяў

ЗАКЛЮЧЭННЕ

СПІС ВЫКАРЫСТАНАЙ ЛІТАРАТУРЫ

ДАДАТАК 1

 


УВОДЗІНЫ

 

Сёння ўсё хутчэй нарастае аб'ём малекулярна-біялагічных і малекулярна-генетычных даных. Асэнсаванне гэтых каласальных па аб'ёмах даных ужо немагчыма без прыцягнення інфармацыйных тэхналогій і матэматыкі. Менавіта таму на стыку інфарматыкі, біялогіі і матэматыкі ўзнікла біяінфарматыка. Пад біяінфарматыкай зараз разумеюць прымяненне камп'ютэраў для вывучэння біялагічных аб'ектаў. У больш вузкім сэнсе яе можна разумець як прымяненне камп'ютэрных метадаў для вырашэння задач малекулярнай біялогіі. Сярод асноўных задач біяінфарматыкі вылучаюць:

l вывучэнне геномаў

l аналіз і прадказанне структуры бялкоў

l аналіз і прадказанне ўзаемадзеяння бялкоў

Біяінфарматыка ўключае ў сябе наступныя элементы:

l базы даных, у якіх захоўваецца інфармацыя пра біялагічныя аб'екты

l набор інструментаў для аналізу і апрацоўкі гэтай інфармацыі

l распрацоўку матэматычных мадэляў біялагічных аб'ектаў і алгарытмаў рашэння разнастайных біялагічных задач

Сярод банкаў даных найбольш вядомым прадстаўніком з'яўляецца Protein Data Bank (PDB) [1]. Гэта сховішча трохмернай структурнай інфармацыі аб бялках і нуклеінавых кіслотах. Гэтыя даныя звычайна атрымоўваюцца з дапамогай рэнтгенавай крысталаграфіі ці спектраскапіі на аснове ядзерна-магнітнага рэзанансу. Напаўняюць банк біёлагі і біяхімікі эксперыментальнымі данымі.

На бягучы час існуе шмат пакетаў праграм, якія прыназначаны для работы з біяфізічнай і біяхімічнай інфармацыяй. Вылучаюць наступныя накірункі:

l візуалізатары інфармацыі з банкаў даных біялагічнай інфармацыі

l прадказанне другаснай ці трэцічнай структуры бялку па вядомай першаснай структуры

l прадказанне ўзаемадзеяння бялок-бялок і бялок-рэчыва

l параўнанне бялкоў з банкаў даных і ацэнка іх падабенства

l пабудова іерархічных дрэваў эвалюцыі біялагічных аб'ектаў

Варта заўважыць, што ўсе гэтыя банкі і праграмы пабудаваны з улікам існуючых алгарытмаў збору, захавання і апрацоўкі біялагічнай інфармацыі. З-за таго, што амаль усе задачы адносяцца да класу NP-поўных, то атрыманне рашэння ператвараецца ў складаную задачу. З-за медыцынскай важнасці гэтым праблемам прысвечана шмат увагі, што выклікае цеснае ўзаемадзеянне інфарматыкаў, біяхімікаў і біяфізікаў. Гэтыя праблемы і будуць асвечаны ў дадзенай працы.


ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

 

§1. Асноўныя прымяненні інфармацыйных тэхналогій

 

Як ужо было сказана, выкарыстанне камп'ютэраў для вырашэння біялагічных задач стала неабходным. Асноўныя сферы іх прымянення наступныя:

l камунікацыя

l кіраванне прыстасаваннямі

l вылічэнні

l захаванне

Камп'ютэры шырока выкарыстоўваюцца для кіравання разнастайнымі прыстасаваннямі для працы з біялагічнымі аб'ектамі: машынамі для секвенціравання ДНК, брадзільнымі чанамі, біярэактарамі і гэтак далей. Гэтыя устаноўкі кіруюцца праграмуемымі рукамі-робатамі і змяншаюць патрэбу ў людзях-аператарах. Там, дзе вельмі важны час выканання, камп'ютэры выйграюць у людзей, бо могуць працаваць без перапынкаў і з вялікай дакладнасцю.

З развіццём сеткавых тэхналогій і персанальных камп'ютэраў падрыхтоўка вучоным артыкула стала не толькі ў разы хутчэйшым, але і яго распаўсюджванне таксама паскорылася. Зараз мала хто з вучоных будзе адразу звяртацца да папяровага выдання, а хутчэй за ўсё звернецца да адной са шматлікіх баз даных біялагічных структур. Стала магчымай сумесная праца вучоных у геаграфічна аддаленых рэгіёнах.

Вылічальныя задачы ў біяінфарматыцы прадстаўлены вельмі шырока: ад візуалізацыі і пошуку падобных амінакіслотных ланцужкоў да мадэліравання ўзаемадзеяння складаных бялкоў па трохмерных іх структурах. Рашэнню такіх задач дапамагае вялікая колькасць гатовых праграмных сродкаў, а таксама наяўасць гатовых праграмных бібліятэк, якія спрашчаюць напісанне новых праграм і падтрымку старых.

Функцыі захавання шырока прадстаўлены ў выглядзе разнастайных сховішчаў інфармацыі, адрозных па сваёй эфектыўнасці, даступнасці і характары інфармацыі, для працы з якой яны прыназначаны.

 

Банкі даных біялагічнай інфармацыі

 

Адной з найважнейшых частак прымянення камп’ютэраў у малекулярнай біялогіі з’яўляецца захаванне біялагічнай інфармацыі. Для гэтай мэты існуе шэраг спецыяльных сховішчаў, гэтак званых банкаў даных ці баз даных. Яны знаходзяцца ў цэнтры выкарыстання інфармацыйных тэхналогій у біяінфарматыцы. Насамрэч, большасць аперацый па вылічэннях і камунікацыі заснавана на даных, што знаходзяцца ў банках даных. Інфармацыя ў іх захоўваецца на трывалай і доўгачасовай аснове, амаль не падвяргаецца зменам, і яе форма прыстасаваная для хуткага выканання аперацый пошуку, сартыроўкі і іншых.

Існуе шэраг розных тыпаў такіх сховішчаў: банкі нуклеатыдных паслядоўнасцяў, бялковых паслядоўнасцяў, трохмерных структур, паслядоўнасных матываў (матыў – невялікі структурны элементы, які сустракаецца ў многіх пратэінах, напрыклад, α-спіраль). У табліцы 1.1 прыведзены некаторыя прадстаўнікі кожнага тыпу баз даных [2].

 

Табліца 1.1. Тыпы баз біялагічных даных

Тып базы даных Прыклады Заўвага

Нуклеатыдныя паслядоўнасці

GenBank Адна з найвялікшых баз даных паслядоўнасцяў
EMBL Еўрапейская лабараторыя малекулярнай біялогіі
NDB База даных нуклеінавых кіслотаў

Бялковыя паслядоўнасці

SWISS-PROT Швейцарскі і Еўрапейскі інстытуты біяінфарматыкі
PIR Рэсурс інфармацыі пра бялкі

Трохмерныя структуры

PDB Банк пратэінавых даных
MMDB База даных малекулярнага мадэліравання
Паслядоўнасныя матывы LIGAND Хімічныя структуры і рэакцыі
  PROSITE Паслядоўнасныя матывы
  ProDOM Бялковыя дамены

 

Акрамя публічных, ёсць шэраг прыватных базаў даных, які хутка пашыраецца. У яго ўваходзяць базы, стварэннем і падтрымкай якіх займаюцца кампаніі і камерцыйныя лабараторыі пры падтрымцы акадэмічных інстытутаў. Напрыклад, база даных LifeSeq ад кампаніі Incyte Genomics, Inc. утрымоўвае паслядоўнасці генаў ад людзей, пацукоў і мышэй.

Незалежна ад таго, прыватнай ці публічнай з’яўляецца такая база, усе яны выконваюць адмысловыя функцыі па працы з біялагічнай інфармацыяй (пераважна функцыі пошуку, захавання і накаплення).


Дата добавления: 2020-12-12; просмотров: 47; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!