时间:2022-10-14 20:33:26
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇生物信息学论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
关键词:推荐系统;生物信息学
推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。
1推荐系统的工作流程
应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。
(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。
(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。
(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。
(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。
2生物信息学推荐系统的设计
综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。
生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。
本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。
(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。
(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。
(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。
(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。
3生物信息学推荐系统的实现
生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。
数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。
推荐算法完成整个个性化推荐的任务,用Java实现。(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。
(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。
(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。
(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。
下面给出方法FCArithmetic的关键代码:
Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵
user_item=this.SVD_Calculate(user_item);//调用SVD降维方法
Vectorc_uservector=newVector();//当前用户向量
Vectoro_uservector=newVector();//其他用户向量
Vectorc_user_correlate_vector=newVector();
//当前用户与其他用户之间相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.获得当前用户向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.获得其他用户的向量
//3.计算当前用户与其他用户的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根据当前用户与其他用户的相似度,计算其邻居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。
4结束语
在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。
优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。
参考文献:
[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.
[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.
[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.
[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.
[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.
[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.
关键词:生物信息学 实践能力 课程体系 培养模式
中图分类号:G4 文献标识码:A 文章编号:1673-9795(2013)07(a)-0047-02
1 生物信息学概述
伴随现代高通量分子生物学技术的快速发展,生物信息学在生物医药领域的应用日益深入[1]。作为数学理论、计算机技术和生物医药研究的整合学科,生物信息学在生物进化、生理功能、疾病治疗、药物开发、农林产业等众多领域均具有重要的应用价值,是研究生命科学、医药科学内在定量规律的重大交叉前沿学科。鉴于生物信息学的重要研究价值和广阔的产业化前景,发展生物信息学专业教育,有计划的建设生物信息学专业课程体系,开展面向实践能力的生物信息学人才培养对促进现代生物医学发展有重要的意义[2]。
2 生物信息学教育发展现状
生物信息学发展起步于20世纪末,在短短的十几年中,生物信息学已经发展成为了横跨多个研究领域的朝阳专业,国内众多高等学府、科研院所相继开设了生物信息本科和研究生专业[3]。但是,在实际的教学和研究过程中,绝大数单位依托于单一的数学、计算机或生物学专业开展,人才培养模式尚处于探索阶段,在培养过程存在生物信学理论基础薄弱、课程体系不健全、课程内容不完善、专业教材匮乏、专业师资队伍缺乏等问题。
哈尔滨医科大学生物信息科学与技术学院是全国领先创办生物信息学专业的单位之一,多年来致力于生物信息学的科学研究和本、硕、博各类人才培养,坚持以学生为本,以培养高素质生物信息学专门人才为目标,深化教学改革,以满足日益发展的生物信息学高端人才需要[4]。为解决生物信息学的教育教学问题,培养高水平的现代生物信息学人才,我们提出立足国内高等生命科学与医学教育,建立面向实践能力培养的生物信息学专业课程体系,以实现高质量培养具有理工科创新思维能力的生物医学人才,为我国生命科学―医药学科教育教学、科学研究和产业化输送大批专门人才。
3 生物信息课程体系建设
3.1 课程建设目标和指导方针
结合生物信息学才培养目标,经过数十名骨干教师十余年生物信息学教学实践及人才培养成果经验反馈,我们适时调整本科生课程及教学内容,逐步建立起面向实践能力培养的生物信息学专业课程体系。奠定了本科生的人文素养与科学素养并重,公共基础理论及专业理论相辅相乘,重视学生理工生物医学全方面素质提高,重点突出学生实践能力的人才培养方针,并在实践中培养了大批具有创新思维能力的优秀高端生物信息学专业人才。
3.2 生物信息学课程体系建设方案
考虑到生物信息学多学科交叉特点和国家大学生培养要求,及学生未来就业深造所必需的基础和专业能力,我们在国内率先开创了生物信息学专业人才培养课程体系,并在医学院校独立开展近40余门数理基础课程和生物信息学专业课程。主要的课程建设情况如下:
(1)公共基础课程(国家限修课):政治理论课程、公共外语、体育。
(2)生物医学基础课程:解剖生理学、发育生物学、生物化学、细胞生物学、分子生物学、生物技术实验、分子药理学等。
(3)计算机基础课程:计算机基础、高级语言程序设计(C++&JAVA)、数据结构、Perl语言程序设计、数据库系统原理、Linux操作系统与程序设计等(上述课程均含上机实践)。
(4)数学基础课程:数学分析、高等代数、概率论与数理统计、数理逻辑、组合数学与图论、微分动力学方程、运筹学等(上述课程均含上机实践)。
(5)专业基础课程:信息论基础、生物统计学、生物医学图像处理、模式识别、优化算法、随机过程、生物信息学概论、生物信息数据挖掘、生物信息软件设计与开发、分子生物软件工程、生物信息学数据可视化、专业外语等(上述课程均含实验)。
(6)专业课程:生物芯片技术、结构生物学、分子进化、分子生物网络、基因组信息学、蛋白质组信息学、药物基因组信息学、统计遗传学、计算表观遗传学、计算机辅助药物设计等(上述课程均含实验)。
(7)综合实践课程:课题标书设计、科研论文写作、生物信息学进展等。
我们在实践基础上开创的面向实践能力培养的生物信息学专业课程体系不同于其他院校,具有明显的跨专业交叉性教学计划特色。该课程体系着眼于基础理论与实践应用相结合、素质培养与专业培养相结合、扎实稳妥与创新思维相结合。注重学生在医学、生物学、数学、计算机科学方面的基础性教育,同时,强调了创新型人才培养、高精尖人才培养、特色化人才培养。厚基础、宽口径,使学生在本科阶段不但打好将来从事生物信息学、系统生物学、生物医药等相关领域创新性研究工作基础,更重要的是该专业课程体系与实践密切联系,切合相关研究开发与产业实际,能够培养学生从事原始创新研究与产业开发的能力。
4 生物信息学本科生培养模式建设
4.1 五年制分段培养与多学科教育体系
目前,我们根据生物信息学交叉学科人才培养特点,考虑到基础课程多,实践能力要求高等因素,采取“2+2+1”的五年制本科人才培养模式,包括两年理论基础课程、两年专业课程与一年实践应用课程培养(含科研训练+毕业设计)。此模式在学生就业和用人单位反馈中证实具有显著的人才培养效果。
课程体系建设依托于生物医学综合优势及深厚的数学、计算机科学功底,通过理论教学与实践训练中的知识技能交叉、渗透,培养适应21世纪生命学科与转化医学领域急需的生物信息学复合型人才。在此基础上,从学科的交叉性出发,进一步加强不同类别课程之间的有机融合,加大相关领域知识的整合力度,建立更为紧密、完善,符合生物信息学学科特点的课程体系,将进一步推动学科的发展和系统性教育理论体系的建立。
4.2 面向实践能力培养的本科生教育模式
在本科学生的培养过程中,我们特别重视学生实践能力的培养,通过教研一体化、学业导师制、报告研讨制等先进的教学方法,引导学生早期接触生物信息学应用领域和科学研究,在巩固学习知识的同时,加强对学科的认识和对未来的把握。
“教研一体化”的实践教学模式:面向实践能力培养的课程体系建设,要求教学模式上的改革,使得人才培养模式由注重多数学生基础理论知识培养的大众教育,向注重少数高精尖创新能力培养的精英式教育转变。充分利用骨干教师在生物信息学领域的研究经验,将科学研究成果快速转化成优秀的教学素材,培养学生动手、实践、创新能力,注重培养学生实际产业化的认知水平和实践能力。
本科生学业导师制:本科生进入专业课教学阶段,实行学业导师制。采取学生与一线骨干教师双向选择方式,使每名学生拥有自己的学业指导教师。导师为学生提供思想教育和专业辅导,并通过指导大学生数学建模竞赛、创新创业科研训练、早期科学研究等方法促进学生的学习尽头和对专业的深入认识。
专题报告与研讨制度:本科生毕业设计阶段,强调学生的“主体”学习地位,使学生选择感兴趣的学科方向,在导师指导下进行科研训练与实践。要求学生自主利用网络等各方面资源,获取学科前沿信息,并以专题报告形式展示学习成果,通过提问、研讨、总结,提升自身专业素养及专业技能,独立完成达到核心期刊发表水平的生物信息这科研课题。
5 生物信息学课程体系建设的意义
在全体师生的努力下,经过多年的实践探索,我们对生物信息学课程体系从基础到实践的不同阶段进行分段式、推进式的改革与建设。在政策措施、人员配备、经费匹配等各方面给予鼎力支持。优先保证面向实践能力培养的生物信息学课程体系快速、有效的建设,已经形成国内顶尖的生物信息学本科教育理论和实践团队,并为国家输送着大批高水平生物信息学人才。
面向实践能力培养的生物信息学课程体系建设,一方面能够完善生物医学本科生、研究生的知识结构,提高运用理工科思维和技能解决复杂生命科学问题的综合科研能力,更为有效的实现生命科学攻关和创新研究理论形成;另一方面,生物医药是我国科技研发的薄弱环节,在课程体系建设基础上,培养适用于现代高通量分子生物学技术的创新型生物信息学人才,将为我国的医药物研发提供强有力的推动作用,并有利于创新临床诊断技术开发和个性化医疗的实现,促进科技转化,产生潜在的、不可估量的经济价值。
6 致谢
本文研究内容是在黑龙江省高等教育教学改革专项项目,黑龙江省高教学会重点课题创新型生物医学信息学人才培养模式研究,黑龙省创新创业人才培养项目面向生物信息产业开发的创新型专业人才培养模式研究与实践,哈尔滨医科大学医学教育研究课题面向实践能力培养的生物信息学专业课程整合设计研究资助下完成的,课程体系的建设得到哈尔滨医科大学学校领导的支持,并得到兄弟院校相关领域专家、学者的帮助,在此一并感谢。
参考文献
[1] Ned Wingreen and David Botstein. Back to the Future:Education for Systems-level Biologists[J].Nature Review Molecular Cell Biology,2006,7(11):829-832.
[2] 徐良德,马晔,孙红梅,等.八年制医学教育中开展《生物信息学》教学的实践探讨[J].素质教育,2011,11:33-34.
關键词:生物信息学;教学方法;医学本科生
中图分类号:G642.0文献标志码:A文章编号:1674-9324(2017)51-0146-03
生物信息学是20世纪80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科[1-2]。它包含了生物信息的获取、处理、储存、分发、分析和解释等在内的所有方面;综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。目前,生物信息学在医学领域中已广泛应用于基础医学、临床医学及药学等多个学科。特别在科学研究工作中,生物信息学的作用逐步显现,越来越受到重视。近期,精准医疗概念的提出与相应模式的推进,进一步强化了运用生物信息学工具的要求。精准医疗是将临床信息、患者表型与基因蛋白谱进行整合,从而为患者量身制定精准诊断、预后及治疗策略。因此在高通量测序产生数以万计的庞大组学数据中,只有依托生物信息学技术,才能探寻基因突变、药物靶向等隐含遗传学奥秘的精确位点,进而提供可靠的个性化治疗方案。可见,生物信息学是精准医疗的核心内容之一。当前,大多数医学院校均已开设研究生生物信息学课程,但尚未将生物信息学正式列入本科生培养方案,以选修课形式开设生物信息学课程的院校也极为鲜见。医学本科生是祖国医学的未来,是临床一线最直接的储备军,面对飞速发展的生物技术和以几何级数增长的生物大数据,如果现阶段的医学本科生还不能学会如何利用和解读这些资源,这将大大阻碍临床医学的发展。综上,一方面医学领域对生物信息学方面存在旺盛的需求,另一方面大多数院校均未正式开设本科生生物信息学课程,造成生物信息学人才极度紧缺。针对这一现状,笔者近年来围绕在研的各项科研课题,选拔学有余力的优秀学生,在学校开展的各项大学生科研能力训练、创新创业项目支持下,吸收本科生进入实验室,对医学类本科生的生物信息学教学实践方面做了一些尝试,培养了一些初步掌握生物信息学知识与方法的本科学生。在此对教学过程中的感想和体会做一简要总结,并对本科生生物信息学的教学模式进行了探讨。
一、在医学本科生中开展生物信息学的教学实践
(一)尊重学生的教育主体地位,实施因材施教
由于生物信息学涵盖了计算机科学、统计学、分子生物学和分子遗传学等诸多学科相关知识,所以一般情况下生物信息学科研实践的开展要迟于上述各门课程。在开展的过程中,要充分考虑学生的自身条件,进行分组施教。因为不同学生对相关背景知识的掌握不同,会导致他们接受相关教学内容的快慢程度不一样,因此要针对不同层次的学生开设不同等级的实践内容。此外,根据学生将来从事的工作类型导致的对生物信息学的需求不同,可有针对性地分成科研组和临床组。如有些学生将来可能主要从事科研工作,因此希望掌握较多的生物信息学知识,包括各种计算机语言的使用、编程、复杂统计软件的使用等等,这类学生学习热情比较高涨。
(二)构建多学科教师组成的教学团队,实现知识的互补与整合
由于生物信息学是一门新兴的交叉学科,需要计算机学、统计学、医学生物化学、医学遗传学等相关学科的共同发展来支撑。此外,生物信息学专业知识较为前沿,而且涉及的医学研究领域较多。再加上目前生物信息学的专业教师缺少,这就限制了学科的发展。因此,在教学过程中应该合理组建教学团队,授课教师需要来自不同的专业,了解本专业最新的知识,教师之间相互学习沟通,将不同学科的相关知识整合起来[3],并需持续补充和学习生物信息学前沿知识,在授课内容上还要体现教师自身优势。这样不但可以在知识结构上互补,还可以满足不同专业学生的需求。
(三)围绕教师在研科研课题和学术会议,追踪医学研究前沿
生物信息学是一门快速发展的学科。近年来计算机技术、生物技术以及医学技术及医疗模式都在快速更新。因此医学生生物信息学实践教学不能拘泥于原有教材。在进行基础和共性的知识教学时要利用教材。而对于前沿的知识,教师一方面要结合在研的各项科研课题引入知识点,另一方面可带学生参加一些与生物信息学相关的学术会议,让他们开阔眼界,增长见识,激发科研灵感。
(四)调动学生主观能动性,激发其学习潜能
由于学生专业背景知识掌握程度差异较大,以及学生自身兴趣不同,传统的大班教学较难达到一致性的教学效果。因此,在教学过程中可以采取不同的分组方式以满足学生不同的需求。由于现阶段生物信息人才非常缺乏,因此在教学过程中,对于个别基础较强的学生,教师可以有针对性地对他们进行一些更深层次的培养,充分挖掘学生的潜力,利用课余时间,合理安排一些“实战”性任务,通过实践锻炼,提升他们的专业科研素质,为当代生物信息学的发展培养特色人才。如我校2009级临床专业熊同学、2010级药学专业本科生熊同学,都对生物信息学兴趣非常浓厚,在科研实践中表现得十分出色,充分利用课余和寒暑假时间,在老师的精心指导下,用perl语言成功编写出分析组学数据的一系列程序。在研究生面试时,他们扎实的生物信息学功底获得导师的青睐,并成功读取/保送了国内知名大学的研究生。
二、医学本科生生物信息学教学方法、教学模式的探讨
(一)PBL教学法在案例教学中的应用
PBL(Problem-BasedLearning)教学法[4],也称作问题式学习。生物信息学是一门操作性和实验性很强的学科,要利用互联网、计算机和各种生物信息学数据处理软件来解决实际问题。目前,生物信息学已成为生命科学研究领域的重要工具。在实际训练中应以问题为导向,针对每个知识点尽量从实际的应用案例出发,引导学生自主探究、合作学习、进行交流。注重培养学生的实际操作能力和解决问题的能力,使学生能在解决问题的过程中学会各种技能,如统计方法、计算机语言和软件的基本使用、编程技巧及数据库的运用等。随着生物信息学技术的快速发展,整合不同生物技术产生的数据将有利于人们发现疾病致病相关位点和药物作用靶点。在本实验室开展的PBL教学实践中,我们以代谢性疾病作为主要研究方向,对糖尿病、高胆固醇血症及肝癌等展开了疾病相关基因/位点的全基因组筛查。
(二)在教學过程中发挥优秀学生的引领作用,以点带面
由于生物信息学在医学研究中的重要性逐渐凸现,因此要求参加科研实践培训的学生人数逐年增多。而目前生物信息学专业的老师相对缺乏,为了解决这一矛盾,我们在实践教学和科研中摸索出一种新的方法,即以“导师-学生双向选择制”遴选学生进入老师课题组后,以优秀学生为中心,采用以点及面式训练。与以往的老师带学生做试验的传统模式不同,在培训中教师除作为指导老师外,还要善于在众多的学生中发现优秀的人才,并对这些有天分的学生进行精细培养,然后以这些人才为中心点,进行放大,即由一个优秀的学生指导几个后参加培训的学生,在这几个学生中再选出优秀的学生作为下一轮的指导“老师”,这种以点带面的特色实践教学模式不但能节约大量教学资源,而且将最大限度地挖掘学生的科研潜力,有利于培养学生的科研创新素质。
(三)以大学生的各类科研训练、创新创业项目为载体开展教学活动
目前,科技创新已成为发达国家保持持久竞争力的“法宝”。中国早在若干年前就确立了“科技兴国”的战略目标。大学生是祖国的未来,大学生科研创新能力的培养是21世纪高校人才培养的核心内容。国内外众多高校都开展了多种形式的大学生创新训练计划。因此,将生物信息学科研训练与学校开展的各类科研创新训练计划(如大学生“挑战杯”、“创新学分”或“大学生创新性实验计划”等)相结合,将更加有效地利用各种资源,全面锻炼学生的科研创新能力,例如,文献的检索与阅读,各种组学数据的收集、处理和分析,程序的编写,实验设计和操作,科研项目书的撰写,科研论文的书写等。
(四)同步开展科技文书的写作训练,总结成果保持学生的热情
疾病的发生发展与特异基因的改变密切相关,鉴定与疾病相关的基因是医学科研工作的重要内容之一。在科研实践训练中,学生利用生物信息学方法,通过分析处理感兴趣的数据(如基因组、转录组、单核苷酸多态性、全基因组关联分析等),可挖掘出一些与疾病相关的内在信息,或再通过实验对分析结果加以验证。教师可鼓励学生将这些阶段性的成果进行发表,这对学生来说是一种能力上的认可,可以增加学生的科研信心,激发他们的科研热情和动力。此外还要鼓励学生积极申请学校乃至全国性的大学生“挑战杯”等竞赛。培养学生的创新和挑战激情,以便激励他们在科研之路上能再创新高。如我校2012级本科生王同学,从大学一年级开始就进入实验室学习生物信息学分析数据,勤奋钻研,已分别于2013和2014年发表了2篇核心文章,并已成功申请到我校大学生“挑战杯”项目,在我校大学生作品“挑战杯”竞赛中获得二等奖。这些成果极大地鼓舞了同学们的科研热情。
三、本科生生物信息学科研实践中存在的问题
随着生物信息学在医学领域的广泛应用,越来越多的学生意识到这门学科的重要性,都积极参与实践练习。而生物信息学实践离不开计算机这一硬件设备,同时由于生物数据量庞大,这就要求较高的计算机的配置。此外,现阶段生物信息学专业教师比较缺乏,在一定程度上也会影响教学实践的开展。因此,对医学本科生开展生物信息学实践训练尚需相关资源的配套和完善。
四、结语
本文主要探讨了对医学本科生开展生物信息学科研实践过程中的一些感想和体会,并在多年教学实践基础上,总结出一种以科研为核心、学生为主体、训练项目为载体的科研实训教学模式。当前虽然一些医学院校已经开设了生物信息学课程,但是在教学内容、教学方法和教学模式上还有很多不足,尚有待进一步的摸索和改进[5-6]。此外,我们要加大硬件设施的投入,并不断加强师资队伍建设,积极参与教学改革,整合各种教学力量,从而提高生物信息学教学质量。
致谢:感谢南昌大学医学实验教学中心汪雁老师生前对本科生生物信息学教学方面的贡献!
参考文献:
[1]Shachak A,Ophir R,Rubin E.Applying instructional design theories to bioinformatics education in microarray analysis and Primer design workshops[J].Cell Biol Educ,2005,4(3):199-206.
[2]Boyle JA.Bioinformatics in undergraduate education:practical examples[J].Biochem Mol Biol Educ,2004,32(4):236-238.
[3]樊代明.整合医学纵论[J].医学争鸣,2014,5(5):1-13.
[4]祝鸿程,刘浩,王迎伟,等.基础医学课程PBL教学应用的新思路[J].基础医学与临床,2011,31(12):1410-1412.
[5]冉景盛,姚启伦.生物信息学创新教学模式初探[J].生物学通报,2009,44(1):46-48.
[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。
一、生物信息学的产生
21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。
二、生物信息学研究内容
(一)序列比对
比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
(二)结构比对
比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。
(三)蛋白质结构预测
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
(四)计算机辅助基因识别
给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
(五)非编码区分析和DNA语言研究
在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
三、生物信息学的新技术
(一)Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen, Branford, CT, USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。
(二)基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列 是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distant relationship)。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(ab initio folding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segment matching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
(三)新的数据工具
Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自ABⅠPrism dNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
参考文献
查看更多《中华整形外科》杂志社信息请点击: 《中华整形外科》编辑部
无
(i0002)沉痛悼念乔群教授 无
(i0003)中华医学会整形外科分会血管瘤与脉管畸形专业组第一次学术交流会会议纪要 胡晓洁 江成鸿 林晓曦
(i0004)《中华整形外科杂志》2011年总目录 无
临床论著
(401)乳腺癌保乳术后腹腔镜带蒂网膜瓣一期乳房重建术 宋向阳 管丹丹 林辉 戴益 郑雪咏 朱一平 王先法
(405)重度褥疮的临床治疗经验 许喜生 马铮铮 周永生 欧才生 程勇 陈凯 李柏同 周海洋 胡永才
(411)咪喹莫特治疗婴幼儿血管瘤 马刚 林晓曦 江成鸿 陈辉 李伟 胡晓洁 金云波 陈达 陈晓东 叶肖肖
(415)小儿颈部巨大囊状淋巴管瘤的手术治疗 刘大看 马玉春 郭晓楠 朱晓爽 董长宪
读者·编者·作者
(417)本刊对论文中实验动物描述的要求 无
临床论著
(418)游离胫后动脉穿支皮瓣修复手、足背皮肤缺损 赵风景 张兴群 姚建民 马亮 张龙春 陈莹
(421)改良vechitti阴道成形与腹膜阴道成形术的对比研究 董丽霞 陈树波
(424)型尿道上裂的解剖学修复 李养群 潘焕丽 唐勇 陈文 赵穆欣 杨喆 刘晓吉 胡春梅 刘媛媛 马宁 谢淼
(427)悬韧带松解延长术后延长长度预测模型的建立和验证 王洪一 陶灵 陈亮 曹川 李世荣
实验论著
(431)p57^kip2和maspin在病理性瘢痕组织中的表达 蔡玉梅 朱世泽 郑志芳 杨维群 吴文艺
(437)饲服环磷酰胺对兔耳早期增生性瘢痕组织的影响 邵家松 孟德峰 岳毅刚 周海 花鸣春 张敏
(442)血管内皮干细胞动员剂对糖尿病小鼠颅骨缺损愈合的影响 王晓霞 stephen warren
(448)四氯二苯二噁英致胎鼠腭裂作用机制的初步探讨 蒲亚兰 刘丽玲 甘立强 何晓梦 傅跃先
生物信息学
(453)基于文献挖掘的增生性瘢痕相关基因的生物信息学分析 黄琛 李博仑 秦泽莲
工作研究
(461)胸大肌后与腺体后隆乳术后患者损伤情况比较 郭科 孙家明 苏永胜
(462)奈福泮与曲马多预防整形手术腰麻-硬膜外联合麻醉寒战的效果比较 张治明 欧阳帆 王剑鸣 赵振龙 张安生
经验介绍
&nb
sp; (464)邻指指动脉岛状皮瓣修复手指皮肤软组织缺损 侯桥 曾林如 王利祥 许良 吴国明 朱芳兵
(465)先天性狭窄及闭锁八例手术治疗体会 胡春梅 李养群 唐勇 杨喆 赵穆欣 刘媛媛 陈文 马宁
技术改进
(467)介绍一种微创无菌快速获取可移植脂肪颗粒装置 黄海玲 刘宏伟 佘文莉 徐媛 陈苑雯 谢波 肖丽玲
(468)薄膜涂色法在扩张皮肤面积测量中的评价 谭子明 沈为民 彭旦生
病例报告
(470)会阴严重烧伤患者再造一例 朱小平 包国宏 黄朝帅
(471)足拇趾离断再植及踝前穿支皮瓣修复成功一例 储国平 吕国忠 赵庆国 杨敏烈
综述
关键词:B细胞表位;服务器;研究
中图分类号:R392
表位是抗原分子中被相应抗体或抗原受体识别的特定部位。B细胞表位[1]是抗原中可被B细胞抗原受体(BCR)或抗体特异性识别并结合的线性片段或空间构象性结构,其刺激机体产生B细胞介导的体液免疫应答,并产生效应分子(抗体)和效应细胞。线性B细胞表位是由抗原分子表面肽链上连续的氨基酸残基构成的序列。B细胞表位预测研究主要还是以线性B细胞表位预测为主,目前已有较多关于线性B细胞表位的数据库和预测算法、软件。
1 抗原表位
抗原表位[2],又称抗原决定簇(antigenic determinant,AD)指抗原分子中决定抗原特异性的特殊化学基团。抗原通过抗原表位与相应的淋巴细胞表面的抗原受体结合,从而激活淋巴细胞,引起免疫应答;抗原也借表位与相应抗体或致敏淋巴细胞发生特异性结合而发挥免疫效应。抗原表位的性质、数目和空间构型决定抗原的特异性。抗原表位是免疫原抗原性的物质基础,开展对抗原表位的研究将对病原的诊断以及分子疫苗的设计等具有重要的意义。
2 线性B细胞表位筛选方法
B细胞表位[3]是抗原中可被B细胞抗原受体(BCR)或抗体特异性识别并结合的线性片段或空间构象性结构,其刺激机体产生B细胞介导的体液免疫应答,并产生效应分子(抗体)和效应细胞。在免疫学中认为,表位才是抗原刺激机体免疫系统产生特异性免疫应答的真正部位。B细胞表位预测是表位预测的一个重要组成部分,大多数的研究是针对线性B细胞表位预测,通过组合抗原蛋白物理化学性质、结构性质、统计显著性度量等特征属性进行表位预测,并取得一定的研究成果。
2.1 基于递归神经网络的线性B细胞表位预测服务器[4]
在多肽疫苗的开发中B细胞表位起到了至关重要的作用,在疾病的诊断中,也可用于过敏研究。标准的前馈(FNN)和递归神经网络(RNN)有被用在本研究中,用于预测抗原序列中的B细胞表位。网络已经被训练和测试,在一个完整的数据集中,由700个非冗余的B细胞表位来自于Bcipep数据库和同等数量的非表位来自于SWISS-PROT数据库。该网络已经训练和测试在不同的输入窗口长度和隐结点中。最大精度已使用递归神经网络具有单隐层的35个隐藏的单位窗口长度为16。当测试在五倍折交叉验证时,最终的网络产生准确度为65.93%。相应的敏感性,特异性和阳性预测值为67.14,64.71,和65.61%。在以往的研究中RNN比FNN在B细胞表位的预测中效果更好。该肽的长度也是重要的在预用词从抗原序列的B细胞表位。
2.2 基于氨基酸对抗原规模的线性B细胞表位预测[5]
在生物信息学中蛋白抗原位点的鉴定是至关重要的,开发的合成肽疫苗,免疫诊断测试的距离和抗体的产生。目前,大多数的预测算法倾向于使用氨基酸滑动窗口方法。这些方法过于简单,并在实践中产生不良的预测结果。提出了一种新颖的规模,称为氨基酸对抗原(AAP)规模,基于这一发现,更加有利于B细胞表位预测。它表明,使用SVM(支持向量机)分类,AAP抗原尺度方法具有更好的性能比现有单个氨基酸倾向尺度。AAP抗原规模可以反映一些特殊的序列在B细胞表位特征中,它的本质是为什么新的方法是优于现有的。可以预料与已知的抗原表位的数据,氨基酸对抗原规模的做法将进一步增强。
2.3 基于内核字符串线性B细胞表位预测[6]
B细胞表位的鉴定和表征在疫苗设计中扮演重要的角色,免疫诊断测试,并产生抗体。因此,可靠的计算工具预测线性B细胞表位是非常可取的。评估的支持向量机(SVM)利用五个不同的内核上五倍使用交叉验证的方法分类培训同源减少701线性B细胞表位,从Bcipep数据库中提取的数据,和701非抗原表位,随机抽取从SwissProt数据库序列。根据我们的结果计算实验中,我们提出BCPred,线性B细胞表位预测的新方法使用序列内核。我们表明,预测性能BCPred(AUC=0.758)优于11基于SVM分类器的开发和评估,以及在我们的实验中,我们执行的AAP(AUC=0.7),最近提出的一种方法,用于预测线性B细胞使用氨基酸对抗原的表位。此外,我们比较AAP和BCPred,ABCPred 独特的B细胞表位,使用递归神经网络的方法,该方法为使用两个数据集先前已用于评估ABCPred的。使用和分析的数据集的结果这个比较表明,不同的B细胞表位的相对性能的结论预测方法的基础上得出的实验中使用的数据集的独特的B细胞表位的可能产生的性能评估方法的估计过于乐观。这认为使用精心同源性减小数据集的B细胞表位的预测方法进行比较,以避免有关如何不同的方法的误导性的结论相互比较。同源精简数据组和BCPred实现以及APP的方法是公开的。
2.4 基于一种新系统的线性B细胞表位预测[7]
在几十年的研究中尽管具有挑战性的任务,B细胞抗原表位的准确的预测仍然是在计算免疫学中。只有10%的已知B细胞表位的估计是连续的,但他们往往却是目标预测,因为解决三级结构是必需的,它们是不可或缺的肽疫苗和治疗蛋白质工程的发展。在这篇文章中,提出COBEpro,新的两步预测连续B细胞系统抗原表位。COBEpro是能够分配表位pensity分数两个独立的肽片段抗原序列内的残留物。COBEpro首先使用支持向量机进行预测在查询抗原序列和肽片段,然后计算表位的倾向得分为每个基于片段的预测的残余物。次要结构和溶剂辅助功能信息(无论是预测或准确)可以被纳入到提高性能。COBEpro实现了交叉验证受试者工作特征曲线(AUC)下teristic高达0.829片段上抗原决定基的倾向得分任务的AUC为0.628残余物外延主题倾向得分任务。
3 用于线性B细胞表位预测工具建立与评价的数据库
免疫信息学[8]数据库是随着生物信息学和免疫基因组学的不断进步而逐渐发展起来的,是专门收录免疫学相关分子信息,实现数据存储、查询、分析,计算等功能的数据库。最初,与免疫相关的多肽序列、抗原分子等信息与其他生物数据一起,被收录在各类生物信息学数据库中,随着免疫学研究的发展,人们对免疫学相关分子信息的需求越来越迫切,需要单独对这些数据进行计算、分析和预测,一些研究机构开始尝试从生物信息学基础数据库中提取免疫相关的生物数据,开发集存储、查询、计算、预测以及绘图分析功能为一体的免疫学数据库。目前,网络上的免疫信息学数据库已达数十个,它们的规模大小不一,内容与侧重点也不尽相同,其中的大部分数据来源于GenBank、EBI、EMBL,供研究人员免费使用。
3.1 Bcipep:B细胞表位数据库
Bcipep[9]是各种免疫原性B细胞表位数据库,目前Bcipep数据库包含3031个条目,其中包括763免疫显性,1797免疫原性和471空的免疫原性的抗原表位,每条记录包含多肽序列、源蛋白、病原体、免疫原性、中和性、模式生物、实验方法、参考文献、抗原结构等信息,它涵盖范围广泛,如病毒、细菌、原生动物、真菌。该数据库提供了一组工具,用于分析和提取的数据,其中包括关键字搜索,肽谱分析和BLAST搜索。Bcipep称为一个完整B细胞表位数据库,已经开发了一个覆盖广泛的病原体的抗原决定簇的信息。该数据库有助于B细胞表位预测方法的研究、合成肽疫苗的设计和疾病的诊断。
4 结束语
显而易见,线性B细胞表位预测现状与人们理想预期还存在很大的差距,利用软件预测线性B细胞表位并不完全准确,还需要实验的进一步验证。为了研发更准确的预测工具,需要建立高质量的训练数据集和检验数据集,数据集的质量高低与预测工具的预测能力密切联系;另外,统一评价体系也是目前急待解决的问题。评价体系的标准化,既有助于软件开发者采用最有效的算法创建更准确的工具,又方便了使用者对工具的筛选和评价。统一评价体系首先要面临的问题是所有数据格式的统一,有了一致的数据格式,才能进行比较。在表位预测领域尚缺乏高质量的标准数据集,针对标准的数据集开发自动评价工具将是未来的发展方向。相信随着生物信息学的快速发展,线性B细胞表位计算机预测技术将会越来越成熟。
参考文献:
[1]Peters B,Sidney J, Bourne P, et al.The design and implementation of the immune epitope database and analysis resource[J].Immunogenetics,2005,57(5):326-336.
[2]吴敏毓,刘恭植.医学免疫学:第四版[M].北京:中国科学技术大学出版社,2002:1-2.
[3]吕凤林,朱锡华.人C5aR(CD88)序列结构分析及其B细胞表位预测[J].免疫学杂志,1998,14(3):153-156.
[4]Saha S,Raghava GP (2006) Prediction of continuous B-cell epitopes in an antigen using recurrent neural network. Proteins.65:40-48.
[5] Chen J,Liu H,Yang J,Chou KC (2007) Prediction of linear B-cell epitopes using amino acid pair antigenicity scale.Amino Acids 33:423-428.
[6]El-Manzalawy Y,Dobbs D, Honavar V (2008) Predicting linear B-cell epitopesusing string kernels.J Mol Recognit 21:243-255.
[7]Sweredoski MJ,Baldi P (2009) COBEpro: a novel system for predictingcontinuous B-cell epitopes.Protein Eng Des Sel 22:113-120.
[8]Walsh R, Locarnini S. Hepatitis B precore protein: pathogenic potential and therapeutic promise[J].Yonsei Med J,2012,53(5):875-85.
[9]Saha S, Bhasin M, Raghava GP (2005) Bcipep:a database of B-cell epitopes.BMC Genomics 6:79.
[10]Roseman AM, Berriman JA., Wynne SA., et al. A structural model for maturation of the hepatitis B virus core[J]. Proc Natl Acad Sci USA, 2005,102(44):15821-6.
[11]Yasser EL-Manzalawy, Vasant Honavar. Recent advances in B-cell epitope prediction methods[J]. Immunome Res,2010,6(Suppl 2):S2.
[12]Roggen EL. B-cell epitope engineering: A matter of recognizing protein features and motives[J].DDT:Technol,2008,5(2-3):e49-55.
[13]冯新港.免疫信息学原理及其应用[M].上海:上海科学技术出版社,2009,6:1-5.
[14]Alix,A. (1999) Vaccine,18,311-314 (314).
关键词:网络平台;虚拟化;团队教学模式
中图分类号 G642.0 文献标识码 A 文章编号 1007-7731(2016)23-0150-03
Research on Application of Virtual Team Teaching Model Based on Network Platform
Gao Zhihua1 et al.
(1College of Biological Science and Engineering,Hebei University of Economics and Business,Shijiazhuang 050061,China)
Abstract:This article introduced the concept and superiority of team teaching.Taking Plant biology and Bioinformatics courses as an example,the necessity and implementation effect of virtual team teaching were discussed using internet instant message tools based on network platform.Teaching practice showed that virtual team teaching model can cultivate practice and innovation abilities of students,and promote the soft power of university's teaching.
Key words:Network platform;Virtual;Team teaching model
在科技飞速发展、信息急剧膨胀背景下的互联网+和大数据时代,人们更加注重需求的个性化和多元化,高校的教学活动也应顺势发力,寻求适应新的教学模式。面对社会对学生创新能力和综合素质要求的不断提高,高校在新一轮教学改革的推动下,大大缩减了专业基础课学时,整合优化了不同学科的教学内容,鼓励教师在多学科相互协同下完成更加综合的专业教学工作。针对地方财经类院校教学实际情况,笔者在不增加任何教学和师资成本的前提下,基于网络平台,利用各种网络通讯工具,以植物生物学和生物信息学两门课程为例,进行了虚拟化团队教学模式应用研究,以改善教学效果,提高教学质量。
1 团队教学的概念和优越性
“团队”概念最初诞生于企业管理,团队管理理论也被企业广泛采用,并被认为是企业成功的基本保障。团队是由2个或者2个以上的人组成,通过人们彼此之间的相互影响、相互作用,行为上遵循共同规范的一种介于组织与个人之间的组织形态。与普通工作群体不同,团队的主要特征是团队成员承诺共同的工作目标和方法,并互相承担责任[1]。团队教学是指由若干有着共同的目标,具有互补技能或者知识的教师,彼此间通过分享认知和合作行动以共同承担教学任务的,能够相互沟通协作的教师共同组建形成的有效工作群体[2]。20世纪50年代中期,美国在中小学推行“小组协同教学制(即协同教学)”,实行合作教学,开创了团队教学的先河,20世纪70年代以后在高校开始应用团队教学。目前美国的大中小学80%左右实施某种形式的团队教学[3]。
团队教学是教学团队围绕专题来进行集体教学,团队成员无论在学历结构、知识结构、实践经历,还是年龄结构、职称结构等方面,都可以实现优势互补,多角度的透视,多纬度的解构,多要素的建构,与传统的单人教学(即一人一书面对一个班讲到底,单兵作战或独立作业的教学形式)相比,具有以下优越性:
1.1 符合当代社会对人才的需求标准 在社会竞争日益激烈的当下,用人单位越来越务实,更加看重学生的实际能力和综合素质,对学生专业的深度与广度也有了新要求,这就要求学校不断拓展学科的内涵和外延,促进不同学科间交叉融合,整合教学内容,更新教学方法。但是,教师的单独教学受其知识面、固有专业、科研领域和时间精力等诸多方面的约束,难以保证在所有教学环节和授课内容上都做到极致,而不断引进新师资也不现实,团队教学则根据不同的教学要求和教师的教学特长及学术专长,统筹安排,合理搭配,让最合适的教师承担其最擅长的教学内容[4]。通过这种最佳组合、优势互补的方式,不仅能以不变应万变去满足多样化的社会用人需求,而且可以充分发挥学校师资1+1>2的协同效应。
1.2 促进教师教学与科研的良性循环 如果把高校看做一家工厂,那么学生就是产品,教师就是工人。要想让自己的产品在市场上具有核心竞争力,就要有所为有所不为,就得做我们最擅长的,让我们的强项更强,因为竞争对手不会给我们留补短板的时间和机会。同样,如果一名教师单独把一门学科交叉性强的课从头讲到尾,则势必要求他花更多的时间和精力去学习太多新领域的知识与技能,而且在相当长的一段时间里一直是“新手”,教学效果也不会太好。团队教学则可以让每名教师只负责教授自己最拿手的1~2个教学专题,使其在已有的优势领域继续潜心研究,其科研成果不仅能及时更新到教学之中,做到常讲常新,而且还容易在专题教学及师生互动中获得灵感,受到启迪,为可持续的科研找到新的生长点,真正步入教学与科研的良性循环。
1.3 有助于提升高校教学软实力 自20世纪90年代初,哈佛大学教授约瑟夫・奈提出“软实力”概念之后,便掀起了“软实力”研究与应用的热潮。教学软实力与教学场地、仪器设备、师资队伍、校园环境等教学硬实力同等重要,尤其是在各个高校教学硬实力发展日益同质化的今天,教学理念、教学体系、教学方法、教学改革、课程建设、教学质量等教学软实力就成为高校提高核心竞争力、实现跨越式发展过程中最值得思考和研究的课题。团队教学不能单纯地理解为“几个人的简单相加、拼凑合上一门课”,而是由优势互补、相互协作的教师组成一个有机整体共同授课,不仅是教学方法上的改革,更是一种教学理念的突破。几名教师能走到一起共同完成一门课的教学任务,这本身就需要每个人先摈弃陈旧的教学观念。参与团队教学的每位教师同时还担任了其他课程的教学任务,有助于处理好先行课程与后行课程在教学内容、教学重点等方面的衔接问题,也可以从一个课程群的更高层次去搞好课程建设,并推进相关教学改革,提高教学质量。
除此之外,团队教学还可以加强教师间、师生间的互动交流,不同教师的性格魅力、授课风格、教学经验也会迁移默化地感染、启发和熏陶每位学生,对他们的个性培养、素质教育起到积极作用,也有利于良性评价和竞争机制的形成[5-6]。
2 虚拟化团队教学的必要性
几十年来,已经有一些学者对团队教学模式进行了研究和试验。国外的团队教学模式主要是为了弥补单一学科教师的知识不足,在交叉学科和语言类课程中采用该模式组织教学。Anderson和Graber等就曾分别在交叉学科的课程教学中采用并研究过该模式,他们指出,采用该模式组织教学可以激起师生的创新思维,体现教学的艺术性。我国学者在团队教学模式的具体实施方面(如教学团队的构建、教学内容的分配等)进行了可行性探索[3,7-8]。但是,由于通常的团队教学模式需要双倍甚至更多倍的经费和师资,鉴于教学成本的考虑,这种实体化团队教学模式在地方院校中大范围推广受到不同程度的限制。在这种形势下,零成本的虚拟化团队教学就成了一种最优选择,它可以灵活采用多种团队教学模式,根据授课内容选择适合不同专题的主讲人组建虚拟的教学团队,有利于最终形成育人合力,克服长期以来高校“单口相声”式授课存在的种种弊端,拓宽学生知识面,调动学生学习积极性,提高学生实践创新能力,培养符合社会需求的优秀人才。
3 虚拟化团队教学的实施效果
团队教学模式特别适合跨学科性质的课程,在此我们选择了植物生物学和生物信息学两门课程进行了虚拟化团队教学尝试,具体实施效果如下:
3.1 梳理教学内容,组建虚拟教学团队 植物生物学课程是由原来的植物学(主要包括植物解剖结构和植物系统分类两部分内容)、植物生理学和植物生态学3门课程的教学内容整合而成,涉及至少3个学科的专业知识,我们遴选出:植物细胞与生根培养、校园绿化植物资源调查研究、植物激素与细胞信号转导、植物引种快繁与生态因子等多个教学专题,并邀请各位主讲人,共同组成植物生物学虚拟教学团队。生物信息学是一门跨生物学、数学、计算机科学和信息学的多学科交叉性学科,教好这门课就要求教师同时具备这些学科的背景知识,其难度可想而知。所以,我们也根据课程内容筛选出:文献检索与数据库构建、序列比对算法解析、数据挖掘与R语言、RNA-seq测序与数据分析、蛋白质组学质谱数据分析等课程主题,也同样把各位主讲人通过网络平台聚在一起组建成生物信息学虚拟教学团队。
3.2 节约教学成本,并用团队教学模式 团队教学模式弹性而多元,大体可以分为以下4种模式[9]:(1)全员模式:教学团队各成员共同参与一门课的各个教学环节,并负有平等的责任和发言权。在同一时间内同一个班级前展开互动,从不同视角讨论同一主题。(2)支持模式:教学团队各成员根据自身特长轮流授课,负责不同的课程主题,共同参与学生的最终考核与成绩评定。当一位教师授课时,其他教师处于从属地位,扮演不同角色辅助学生学习。(3)嘉宾模式:由一位教学团队成员全权负责整门课程的所有教学环节,其他成员以嘉宾或客座的身份针对自己负责的课程主题进行讲座。(4)分享模式:教学团队成员分别在不同班级独立授课,但会不定期地碰面交流观点,分享经验和资源。还可以用某种方式共享一些自己的资源,以供其他成员借鉴和学习。
为了节约教学成本,由一名教学团队成员全程负责整门课程的所有教学环节,同时在授课教室利用网络平台将一个或几个甚至是所有其他成员按需连线进入教学现场,共同授课,这样就相当于综合利用了全员模式、支持模式和嘉宾模式3种模式。教学团队中,有的成员除了参与教授这门课外,还给其他班级讲别的课,有的成员可能来自其他行业,有的成员还可能身处国外,在课下都可以通过网络平台聚在在一起进行交流,分享教学经验与收获,这便是分享模式。
3.3 利用网络平台,虚拟团队教学环境 学校教室大都安装了多媒体设备,并能通过校园网访问互联网,利用即时聊天工具腾讯QQ、微信等把教学团队成员的讲课视频“现场直播”到教室,同时也可以借助视频和音频设备把教室的图像和声音传给对方,虚拟团队教学环境,实现师生互动。师生还可以随时随地远程登陆服务器上传、下载课程作业、教学资料。
3.4 加强课下师生交流,激发学生学习热情 课下除了通过E-mail联系之外,还建立了不同主题的QQ群、微信群等,方便师生、生生及时沟通,把时间化整为零,将“有限的”课堂教学外延到“无限的”课下交流之中。有的群还保留着曾经上过我们课的往届学生,他们经常在群里以自己的学习经历进行言传身教,营造出浓厚的W习氛围。还可以在群里给学生提供一些课外学习网站链接,作为延伸阅读,激发学生的学习热情。
3.5 立足团队教学实践,驱动师生科研创新 为了能在团队教学实践中找到科研新切入点,尝试把植物生物学和生物信息学两门课程的师生拉进一个群,进行“大杂烩”式的交流,可以在新的广度和深度上挖掘新问题。教学团队各成员的专业不同,阅历不同,对问题的洞察力也不同,能用独到的眼光和敏锐的嗅觉在这种师师、师生、和生生互动中捕捉到稍纵即逝的科研灵感,凝练问题深入研究。例如,上植物生物学课的学生在听了植物细胞与生根培养、植物引种快繁与生态因子等专题后,对植物优良品种的培育和鉴定很感兴趣,但苦于数据处理,得知这一情况后,上生物信息学的学生就在教师的指导下利用R语言开发了一款用于分析灰色关联度的软件――greyRelationalAnalysis.R[10]。为了方便大家使用,还用C++语言开发出greyRelationalAnalysis.R软件的第二版,并把可分析的灰色关联度类型由原来的一种扩展到了4种,该工作已进入论文投稿阶段。又如,发现学生在课外学习长链非编码RNA(long non-coding RNA,lncRNA)时,对检索到的大量相关文献难以有效管理和利用,便带领学生用R语言对lncRNA生物学文献挖掘方法进行了探索,目前该工作也正在投稿。正是源于团队教学实践的科研项目,培养了学生的科研创新能力,使教师科研有了可持续推进的动力。这些成功案例丰富了团队教学内容,激励着更多学生勇攀知识高峰。
4 结语
眼下,大学生就业率被视为高校的生命线,而这与高校的教学质量又息息相关。如何在办学经费十分紧张的地方高校提升教学软实力,实现跨越式发展,是摆在我们面前的一个共性的难题。通过本文的教学实践表明,这种零成本的虚拟化团队教学模式作为一种新型教学模式在互联网+和大数据背景下具有可行性。因此,今后应该充分发挥虚拟化团队教学模式的优势,更好服务于高校教学,以培养更多符合新时代需求的可用之才。
参考文献
[1]李钜恒.团队式教学在实训课程中的应用[J].辽宁行政学院学报,2006(8):127-128.
[2]郑建芳.职业学校教师团队建构理念与策略[J].哈尔滨职业技术学院学报,2007(5):20-21.
[3]邱镛妃.分模块团队教学在人力资源管理课程中的应用[J].山东电力高等专科学校学报,2009,12(2):16-20.
[4]何侃.论复杂性视阈中的高职院校教师团队建设[J].教育与职业,2010(36):69-71.
[5]谢晓平.高校思想政治理论课团队教学模式探讨[J].理论界,2007(12):222-223.
[6]丁玲,朱景林.团队教学模式在“形势与政策”课教学中的应用研究[J].成功(教育),2012(11):26.
[7]丛培英.思想政治理论课团队教学的功能与途径研究[J].沈阳工程学院学报(社会科学版),2011,7(2):259-261.
[8]张素莲.以课程组为基础的团队教学模式――关于高校思想政治理论课教学改革探索[J].教育教学论坛,2013(48):257-258.