引言

中药材指药用植物、动物矿物的药用部分采收后经产地初加工而成的原理药材。一般传统中药材讲究道地性,是中国传统中医的道地药材,是在一特定自然条件、生态环境的地域内所产的药材,因生产较为集中,栽培技术、采收加工也都有一定的讲究,以致较同种药材在其他地区所产者品质佳、疗效好。

1、中药材的发展简史

中药材是在人类与疾病作斗争的过程中,随着生产发展的需要和科学研究的进步而逐渐积累和发展起来的关于天然药物的科学。从历史上看,中药材的发展大致可分为三个时期,即传统本草学(或药物学)时期、近代商品中药材时期和现代中药材新时期。

传统本草学时期

古时,人们将记载药物的书籍称为“本草”。我国历代“本草”有400多部,《山海经》是我国最早的本草著作的萌芽之作。《神农本草经》是秦汉时期的本草专著,也是现存最早的药学专著,为中药学的发展奠定了理论基础。明朝李时珍的《本草纲目》是医药方面的工具书,是中古时期最完备的分类系统。

传统经典本草著作列表

近现代发展时期

19世纪中叶,中药材从药物学中分出成为独立的学科,中药材近代发展开始。随着国际交通和贸易的发展,生药采购和流通区域扩大,生药种类和数量逐渐增多,主要研究商品生药的来源,鉴定商品生药的真伪和优劣。而后随着显微镜鉴别技术、化学定性和定量分析方法、物理化学分析方法在生药鉴定工作中的应用,中药材的形态学鉴定、品质评价鉴定、药材有效成分鉴定得到了新的且快速的发展。

1960年以后,现代仪器分析方法、药材有效成分的不断阐明及其分析方法的迅速发展,迎来了现代中药材的新时期,推动了对影响药材品质的各种因素进行科学的探讨。植物化学分类学的发展,新的生药资源的开发越来越受到重视。

近现代中药类著作列表(部分)

中药材GAP(Good Agricultural Practice)是我国于2002年起执行的《中药材生产质量管理规范(试行)》,是我国中药制药企业实施的GMP重要配套工程,是药学和农学结合的产物。实施中药材GAP的目的是规范中药材生产全过程,从源头上控制中药饮片,中成药及保健药品,保健食品的质量,并和国际接轨,以达到药材“真实、优质、稳定、可控”的目的。

从2015年开始,国家相继出台了《中药材保护与发展规划(2015-2020)》、《中医药发展战略规划纲要(2016-2030)》。《规划》指出,中药材是中医药事业传承和发展的物质基础,是关系国计民生的战略性资源,这是我国第一个关于中药材保护和发展的国家级专项规划,对当前和今后一个时期我国中药材资源保护和中药材产业发展进行了全面部署。《纲要》明确了未来十五年中国中医药发展方向和工作重点,是新时期推进中国中医药事业发展的纲领性文件。

2、中药材面临的问题

中药材的研究是一项复杂的系统工程,领域广泛,涉及学科多,难度大,周期长,需要多部门、多行业、多学科、多层次、多方位互相配合,分工协作,共同努力;依靠现代科学技术,对中药进行系统化研究,在不久的将来开发更多的中药合法进入欧美国际市场,为人类健康作出应有的贡献。

目前,中药材的发展主要存在以下问题:

1)种子种苗的提纯复壮和优良种品选育工作滞后,造成中药材的质量不稳定
2)中药材中农药残留、有害重金属含量超标
3)不合理的开发利用,野生资源消耗速度过快
4)中药材栽培、加工技术不规范
5)中药材的流通存在诸多困扰(如质量、标准以及知识产权流失等)
6)中药材基础研究有待加强
7)中药材的国际化

从上述问题可以看出,在中药材产业领域,提升药材质量、加强中药知识产权保护、规范药材种植、建立全面的市场规划和预测以及更加重视中药材基础研究是亟待解决的问题。

3、高通量技术在中药材研究中的应用

1)基因组de novo测序

基因组序列包含生物的起源、进化、发育、生理以及与遗传性状有关的一切信息,是从分子水平上全面解析各种生命现象的前提和基础。中药基因组学,作为目前全世界都非常关注的前沿领域,将为创新性药物生产提供新的手段。

基因组从头测序(de novo sequencing),是指对基因组序列未知或没有近缘物种基因组的某个物种的全基因组序列的测序。不需要任何参考序列资料即可对某个物种进行测序,然后用生物信息学手段对测序序列进行拼接、组装和注释,从而获得该物种的基因组序列图谱。基因组de novo测序是后续重测序以及有参转录组研究的基础。

我国药用植物有10000多种,约占中药材资源总数的87%,是所有经济植物中最多的一类。本草基因组计划(Herb Genome Program,HerbGP)是2010年提出的针对具有重要经济价值的药用植物和代表不同次生代谢途径的模式药用植物开展的基因组层面的系列研究计划,主要内容包括全基因组序列的测定、组装和生物信息学分析,及具有典型次生代谢途径的模式药用植物研究平台的建立和抗病抗逆等优良性状遗传机制的阐明等后基因组学研究。

随着高通量测序技术的成熟、测序成本和测序时间的大大降低,相信越来越多的药用植物基因组信息将被公布。基因组测序技术已广泛应用在探索生物体基因组信息、生物体生长发育、目标性状基因的表达调控和代谢变化以及群体遗传进化及生态适应性研究中。

第三代DNA测序技术解决了二代测序高GC区域无法准确测定、高重复序列无法跨越、海量短序列组装困难等几大困扰,以及其超长读长和高准确率的特点,目前已在基因组de novo测序中广泛应用。第三代测序技术与二代测序技术的联合应用是基因组从头测序的最佳选择。

基因组de novo测序技术在中药材中的应用,将对中药材植物的资源分布、药用种类、植物化学成分变异与药理研究、生物学特性与生理生态学研究、资源保育与可持续利用方面产生重要意义。另外,可能会为中药材植物的“道地”药材形成机制提供研究参考理论依据,从而促进我国“道地”药材产业化和国际化的研究进程。

中药材基因组研究应用

 

中药材基因组测序流程

技术参数

 

目前已完成测序的中药材

2)基因组重测序

全基因组重测序是在已有参考基因组序列情况下对已知物种的个体基因组进行测序,并在个体或群体水平进行差异性分析。通过将短片段测序序列定位到参考基因组以及利用测序个体序列与参考基因组序列进行比对,我们可以在全基因组范围内检测包括单核苷酸多态性(SNPs)、短的插入缺失(Indels)、结构变异(SV)和拷贝数(CNVs)等一系列不同类型的序列变异,并根据已知的信息对其注释。

SNP是基因组DNA序列上广泛存在的最基本的变异形式,用SNP等现代分子标记构建基因组遗传变异图谱,是研究基因组多样性、获得驯化选择区域并筛选重要性状关键基因的一个重要的研究内容。目前已广泛应用在高密度遗传图谱构建、重要性状QTL定位和精细定位、群体基因组学和进化研究以及GWAS分析中。

技术参数

3)简化基因组测序

简化基因组测序技术是利用酶切技术、序列捕获芯片技术或其他实验手段降低物种基因组复杂程度,针对基因组特定区域进行测序,进而反映部分基因组序列结构信息的测序技术。目前,限制性酶切位点相关的DNA(Re-striction-site associated DNA,RAD)测序和基因分型测序(Genotyping by sequencing,GBS)应用较为广泛。

该技术不受有无参考基因组的限制,可大大简化基因组的复杂性,减少实验费用,通过一次测序就可以获得数以万计的多态性标记。简化基因组测序技术已成功应用于SNP标记的开发、高密度遗传图谱的构建、重要性状QTL定位和精细定位、群体基因组学以及系统发生学等基因组研究热点领域,此外,它还可以辅助de novo测序基因组序列组装。

技术参数

4)群体基因组学及系统发生学研究

利用重测序技术、简化基因组、芯片等技术对道地中药材进行研究,主要集中在遗传结构和遗传多样性方面,可反映品种间的亲缘关系,从而为种质改良提供理论基础。

了解道地居群形成的进化历史,掌握影响道地居群遗传分化的现代因素(如基因流、自然选择或人工选择等)和历史性事件(如片断化、快速扩展和拓殖现象等),利用群体遗传学的理论和方法对道地药材进行研究,为道地中药材的遗传分化、遗传成因、道地栽培居群起源、道地中药材分子地理标识筛选以及道地药材产地的分子鉴定提供理论基础,为揭示道地中药材的遗传成因、实现道地药材栽培科学的引种和产地鉴别(种内鉴别)提供新的理论和方法。

5)转录组测序

转录组即一个活细胞所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。利用RNA-seq技术可以对中药材进行转录本结构、基因表达水平等研究,通过RNA-seq高通量测序技术不断挖掘中草药中RNA的序列、结构、表达及功能等信息,为中药的良种选育提供技术支撑,为揭示中药材的生长发育、代谢物合成途径等生物学过程中的分子机制提供理论支持。

中药转录组的研究尚处于起步阶段,相关研究还很零散。惊喜的是已有数种中药材植物的转录组研究取得了突破性进展,显示出转录组技术在中药研究中的巨大潜力,为后续中药其它物种转录组的研究奠定了基础。

技术参数

6)荧光定量分析

实时荧光定量PCR(Real Time PCR or qRT PCR)是一种在PCR反应体系中加入荧光物质,利用荧光信号对整个PCR进程进行实时监测,从而达到对未知起始模板进行定量分析的方法。该技术具有操作简单、方便快捷、灵敏度高、特异性强、动力学范围宽、污染率低等优点,被广泛应用于核酸定量分析。

目前,实时荧光定量广泛应用于中药材基因差异表达分析、品种及真伪鉴别的研究,如在甘草、黄花蒿等药用植物中的基因表达差异分析,对金银花与山银花、 白术与苍术品种及真伪的鉴别等。

7)基因芯片

基因芯片技术主要应用于基因表达谱分析、基因突变、多态性分析及监测基因组整体转录表达情况,为探索中药作用靶点、药物筛选、中药成分鉴定、道地药材鉴别等现代中药研究开辟了崭新的领域。

基因芯片在中药品种的快速、准确、自动化鉴别方面有不少进展。这一技术的前提是获取不同中药样本的特异性基因序列,即基因分型。道地药材与非道地药材为同种异地生物,两者形态、组织构造等特征的差别往往不明显,给道地药材的鉴别带来很大困难。而利用基因芯片高效、高通量分析生物信息的优势可快速进行鉴别。这种鉴别芯片可以采用密度较低,集PCR、杂交、检测于一体的PCR芯片。这类芯片成本低,应用广泛,可推广到各地中药材站、医院的药材科、海关以及众多的中药科研机构。

4、道地药材的分子鉴定

中药鉴定是中药材生产过程的关键,目前中药材品种混乱现象严重。

中药材经典鉴定技术有性状鉴定、基原鉴定、显微鉴定和理化鉴定,从感官水平、器官水平、细胞水平到理化水平,而道地药材实际上是一个品质的概念,对于品质优劣评价特别是道地药材和非道地药材的鉴别,这四大鉴定手段往往力不从心,此外,经典鉴定方法也不能满足安全用药的需求。

随着分子生物学技术的快速发展,DNA条形码技术、基因芯片技术和高通量测序技术的应用使从分子水平进行道地药材的快速、准确鉴定成为可能。

DNA条形码技术

不同中药材均可方便地提取较为完整的DNA,然后利用通用引物扩增短的条形码序列来实现中药材的快速准确鉴定。条形码技术的研究结果在不同物种之间具有可比性,操作简便性且具有高效性。 DNA条形码可以建立鉴定数据库,容易数字化,短时间即可掌握,易于推广,这对传统医药走向国际化将起到巨大推动作用。该技术不受物种发育阶段和形态的限制,鉴定速度快,准确性高、获取信息量大,通用性强,使用方便,是生物物种鉴定发展的主要方向之一。

中药DNA条形码鉴定工作流程包括:中药DNA提取、PCR扩增与测序、条形码数据库的构建以及基于数据库比对鉴定物种,从中药材中获得高质量DNA是关键。

条形码序列要求:种间差异较大,便于进行种与种的区分;种内序列变异尽量小,从而使种间和种内变异有一个很明晰的界定。

基因芯片

运用基因芯片技术鉴定中药材的道地性,对道地药材的原产地保护、种质资源评估和品种鉴定具有重要意义,可以鉴定易混淆的中药物种,目前已取得一定的经验和成果。另外,目前有许多研究正围绕药材的道地性形成机制以及生态环境对基因组DNA的影响等深入展开。基因芯片技术因其具有高效、快速等众多优点成为中药材道地性鉴定的一项新技术。

目标区域测序

利用18S rDNA/ITS扩增子或者目标区域测序进行品种资源鉴定和系统进化分析。目前ITS序列因其长度适中、易于扩增、进化速度快、变异性高等优点,已广泛应用于药用植物系统进化、亲缘关系、物种鉴定研究。

叶绿体测序

叶绿体基因组研究可用于药用植物的起源以及系统进化研究、物种鉴定(可用于种内鉴定),具有极高的通用性和分辨率。研究表明,叶绿体基因间序列在许多植物类群中已经显示了充分的变异,可用于植物分子谱系地理分析和进化显著单元的确定,在药用植物的道地居群和非道地居群间也存在显著分化,具有道地居群特有的单倍型可用于中药材产地鉴别。

叶绿体全基因组条形码是一种利用叶绿体全基因组序列对植物进行快速、准确识别和鉴定的技术,与传统DNA条形码技术相比,具有更强的分辨力和更好的通用性,有望成为植物分子鉴定的新标准。当然,需要同时考虑叶绿体DNA和核基因的居群遗传结构,才能正确划分进化显著单元,由此判断道地居群和非道地居群是否存在隔离分化或基因流,最终阐明道地药材能否实现产地鉴别。

5、经典案例解析

1)紫芝基因组de novo测序

为了应对遗传不稳定性和其他生物体的影响,真菌进化出了强大的基因组和化学防御系统,然而对担子菌类防御系统的分子基础了解较少。研究人员通过全基因组测序、DNA甲基化测序、转录组测序、小RNA测序对模式药用真菌紫芝的次级代谢和防御过程进行了全面分析。

材料和方法:

紫芝单倍体菌株ZZ0214-1

基因组de novo测序(测序深度500x,文库300bp、3kb、5kb、8kb、20kb),转录组测序(3个生长时期,菌丝体、原基、子实体,每样本4G左右),DNA甲基化测序(测序深度100x),小RNA测序(2个生长阶段,菌丝体、子实体)

测序平台:Roche 454 GS FLX 和Illumina HiSeq 2000

研究结果:

紫芝含有12条染色体,基因组大小48.96 Mb,编码15,688个基因;约有30多个基因簇参与生物合成和次级代谢,同时有大量基因参与其物质运输和调控过程。

紫芝的化学防御功能可能受到多种基因调控机制影响;基因组防御对于维持物种遗传物质稳定性具有重要意义,而化学防御与其次生代谢产物的合成与调控具有密切关系。

此研究为通过比较基因组学研究灵芝次生代谢和生长发育,进而通过分子育种培育优良品种奠定了坚实的基础。

2)铁皮石斛基因组de novo测序

石斛(Dendrobium)是在兰科中仅次于石豆兰属(Bulbophyllum)的第二大属,具有较高观赏和药用价值,铁皮石斛是大约1300年前唐代以来“中国最为名贵、药用价值最高的石斛品种之一”。然而到目前为止,人们都是利用几种分子分析方法来识别石斛种类及对其进行基因分型,还没有人对石斛的基因组序列进行测序。研究人员结合第二代Illumina Hiseq 2000测序技术和第三代PacBio测序技术铁皮石斛的基因组进行了解析。

材料与方法:

铁皮石斛新鲜叶片

二代测序 Illumina HiSeq 2000,测序深度100x,小片段库250kb、500bp、800bp,大片段库2kb、5 kb、10 kb、20 kb

三代测序 PacBio RS II,测序深度10x,10kb文库,110 SMRT cells

研究结果:

铁皮石斛,二倍体,38条染色体,基因组大小1.35 Gb,有35,567个蛋白编码基因。

研究发现,兰科植物有着完整的花序基因集,并有一些相对于其他单子叶植物的特异性的花序基因,与真菌共生和抗旱性有关的一些基因家族发生了明显扩增,与多糖生成相关的SPS和SuSy基因发生了大规模复制,铁皮石斛生物碱合成信号通路可以从已有的研究结果基础上延伸到16-epivellosimine的合成。

铁皮石斛全基因组图谱的完成不仅解决了兰科植物进化的重大科学问题,还为铁皮石斛遗传工程育种和药用成份的开发利用,规范产业发展研究提供重要资源和基础。

3)丹参基因组de novo测序

丹参是唇形科的药用植物,其干燥根是传统常用中药,丹参酚和丹参酮是其药物活性成分。本研究对栽培杂交种丹参的基因组进行了组装,比较分析了白花丹参与紫花丹参的遗传差异,并对其药用活性成分的生物合成分子机制进行了探究。

材料与方法:

紫花丹参栽培品种99-3,白花丹参地方品种

基因组de novo测序(紫花丹参,测序深度:Illumina 250x,Roche/454 >10x,PacBio >10x),基因组重测序(白花丹参,测序深度42x,覆盖度90%)

测序平台:Illumina HiSeq 2000,Roche 454 GS FLX,PacBio RS II

研究结果:

丹参基因组大小615 Mb,组装基因大小538 Mb,contig N=12.38 Kb,scaffold N50=51.02 Kb,预测编码基因30,478个。

白花丹参和紫花丹参基因组内部具有多态性差异,这些基因组多样性可能引起了两份材料的表型差异,比如花色、丹参酮;研究发现了丹参酮生物合成相关的4个CPS/CYP基因簇及其相关调控因子。 丹参全基因组研究为揭示丹参主要药理活性成分丹参酮和丹参酚酸生物合成及其调控的分子机制,促进丹参优良品种选育提供了重要的遗传背景基础;中药基因组研究不但有助于世界认识中医药,加速中药国际化进程,而且还可通过申请国际专利等方式在国际化竞争中抢占主动。

4)丹参转录组测序

丹参是常用的中药之一,在治疗心脑血管疾病、抗氧化方面有显著的疗效,主要活性成分包括脂溶性的丹参酮和水溶性的酚酸类化合物。研究人员首次将第二代和第三代高通量组合测序策略应用于植物转录组研究,从组学水平分析药用模式植物丹参的基因可变剪接现象,揭示脂溶性丹参酮生物合成途径及其调控相关基因的差异表达及可变剪接变化规律,为中药活性成分生物合成途径解析及合成生物学研究提供了新思路。

材料和方法:

丹参根的周皮、韧皮部、木质部组织,每组3个重复

二代测序 HiSeq 2500 PE100,10 G/样本;

三代测序 PacBio RS II 4个文库(<1,1-2,2-3,>3 kb),2 SMRT cells/文库,5 G/样本

研究结果:

联合二代和三代测序技术获得了丹参根特别是丹参皮中全部转录本信息,发现约有40%的基因发生可变剪切;综合解剖学和化学分析结果证实,丹参酮生物合成具有组织特异性,其合成与积累的主要部位是丹参根的周皮组织;根据丹参酮的含量差异及根三个组织部位的基因表达差异,阐明丹参酮生物合成途径上游萜类合酶的表达变化规律,并预测了15个CYP450s、5个SDRs和1个2ODD基因参与丹参酮下游的生物合成。

联合测序技术揭示丹参活性成分合成机理是一个令人激动的里程碑事件,将受到植物代谢研究领域的广泛关注。

 

附录

附录一 甘肃道地中药材图集简介

 

“当归之乡”-甘肃岷县

当归(Angelica sinensis),伞形科 当归属多年生草本植物

入药部位:干燥根

 

“党参之乡”-甘肃渭源

党参(Codonopsis pilosula),桔梗科党参属多年生草本植物

入药部位:干燥根

 

“黄芪之乡”-甘肃陇西

黄芪(Astragalus membranaceus),蝶形花科黄芪属多年生草本植物

入药部位:干燥根

 

“半夏之乡”-甘肃西和

半夏(Pinellia ternata),天南星科半夏属多年生草本植物

入药部位:块茎

 

“板蓝根之乡”-甘肃民乐

又称崧蓝(Isatis indigotica Fortune),十字花科菘蓝属二年生草本植物

入药部位:干燥根

 

附录二 样本采集指南

新鲜组织样本

样本量:≥2g

将样本分割成50mg左右的小块放入1.5ml或者2.0ml的EP管中。若组织样本表面有蜡质防护,需要先破坏其屏障,以方便组织保存试剂进入组织。若需全株提取请将整株组织样装入自封袋中,方便准确取样。

液氮速冻后,放于-80℃冰箱中保存。

干冰运输。

注:液氮速冻时间视组织大小而定,一般样本在液氮中无大量汽包产生,即认为速冻完成。

DNA样本

样本量:de novo测序≥500ug,其他≥3ug

样本浓度:≥50ng/µl

样本纯度:OD260/280值应在1.8~2.0之间,无RNA污染无降解

-20℃或-80℃冰箱保存。

DNA冷冻低温运输(-20℃)或干冰运输。

注:运输过程中请用parafilm将管口密封好,以防出现污染。

RNA样本

样本量:≥5ug

样本浓度:≥60ng/μl

样本纯度:OD260/280值在1.8~2.2之间,28S:18S≥1.5,RIN ≥ 8,无明显降解

-80℃冰箱保存,样本保存期间避免反复冻融。

干冰运输,尽量在72小时内送达。

注:收集过程中避免污染、操作迅速、保持低温;运输过程中请保持样本的低温状态,避免降解。

 

附录三 中药材高通量文献集锦(部分)

[1] Xu H, Song J, Luo H, et al. Analysis of the genome sequence of the medicinal plant Salvia miltiorrhiza[J]. Molecular plant, 2016, 9(6): 949-952.

[2] Xiao L, Yang G, Zhang L, et al. The resurrection genome of Boea hygrometrica: A blueprint for survival of dehydration[J]. Proceedings of the National Academy of Sciences, 2015, 112(18): 5833-5837.

[3] Yan L, Wang X, Liu H, et al. The genome of Dendrobium officinale illuminates the biology of the important traditional Chinese orchid herb[J]. Molecular plant, 2015, 8(6): 922-934.

[4] Zhu Y, Xu J, Sun C, et al. Chromosome-level genome map provides insights into diverse defense mechanisms in the medicinal fungus Ganoderma sinense[J]. Scientific Reports, 2015, 5:1-14.

[5] Chen S, Xu J, Liu C, et al. Genome sequence of the model medicinal mushroom Ganoderma lucidum[J]. Nature communications, 2012, 3: 913.

[6] Van Bakel H, Stout J M, Cote A G, et al. The draft genome and transcriptome of Cannabis sativa[J]. Genome biology, 2011, 12(10): 1.

[7] Xu Z, Peters R J, Weirather J, et al. Full‐length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza and tanshinone biosynthesis[J]. The Plant Journal, 2015, 82(6): 951-961.

[8] Baba S A, Mohiuddin T, Basu S, et al. Comprehensive transcriptome analysis of Crocus sativus, for discovery and expression of genes involved in apocarotenoid biosynthesis[J]. Bmc Genomics, 2015, 16(1):1-14.

[9] Jain M, Srivastava P L, Verma M, et al. De novo transcriptome assembly and comprehensive expression profiling in Crocus sativus to gain insights into apocarotenoid biosynthesis[J]. Scientific Reports, 2016, 6.

[10] Chen X, Li Q, Li Y, et al. Chloroplast genome of Aconitum barbatum var. puberulum (Ranunculaceae) derived from CCS reads using the PacBio RS platform[J]. Frontiers in plant science, 2015, 6: 42.

[11] Ni L, Zhao Z, Xu H, et al. Chloroplast genome structures in Gentiana (Gentianaceae), based on three medicinal alpine plants used in Tibetan herbal medicine[J]. Current Genetics, 2016: 1-12.

[12] Ni L, Zhao Z, Dorje G, et al. The Complete Chloroplast Genome of Ye-Xing-Ba (Scrophularia dentata; Scrophulariaceae), an Alpine Tibetan Herb[J]. PloS one, 2016, 11(7): e0158488.

[13] Zhang J, Chen M, Dong X, et al. Evaluation of four commonly used DNA barcoding Loci for chinese medicinal plants of the family schisandraceae[J]. Plos One, 2015, 10(5).

[14] Wang M, Lu S. Validation of Suitable Reference Genes for Quantitative Gene Expression Analysis inPanax ginseng[J]. Frontiers in Plant Science, 2016, 6(696).