X 为了您更好的体验建议你全屏浏览!
当前位置:首页 >> 技术&动态 >> 技术与常见问题 >>光学显微镜在系统生物学中的应用

光学显微镜在系统生物学中的应用

作者:硬度计服务商创诚致佳
浏览量:426
发布时间:2021-06-15
内容摘要:人类本质上是一种视觉物种。我们的大部分感觉新皮层都在处理我们从周围环境中收集的视觉输入。毫不奇怪,可视化技术是科学和工程的核心 。系统生物学的最终目标之一是阐明分子系统状态与高级表型特征之间的关系。然而,生物体的光散射和其他光学特性使信息图像的获取复杂化。几十年来,化学固定和生物物质切片已被用于提高...

人类本质上是一种视觉物种。我们的大部分感觉新皮层都在处理我们从周围环境中收集的视觉输入。毫不奇怪,可视化技术是科学和工程的核心 系统生物学的最终目标之一是阐明分子系统状态与高级表型特征之间的关系。然而,生物体的光散射和其他光学特性使信息图像的获取复杂化。几十年来,化学固定和生物物质切片已被用于提高样品的稳定性和光学特性。然而,通过检查固定样本来了解活的动态生物系统充其量只是一个启发式过程。

后基因组时代的主要挑战是理解动态生物系统的规则。当前的基因组工具与显微镜和计算的进步相结合,促进对任何感兴趣的遗传实体的体内观察。生物技术、技术和跨学科合作的最新进展为生物过程提供了比以往任何时候都更现实的见解。在系统生物学方面,显微镜是一种连接生物复杂性的多个尺度的工具,范围从分子到种群。光学显微镜的最新进展允许对纳米结构的前所未有的了解,以及前所未有的实验吞吐量。此外,小而完整的生物体的高分辨率三维 (3D) 成像现在是可行的反过来,成像技术的进步需要用于自动图像分析的计算机视觉技术。

系统生物学中的光学显微镜机会

近几十年来,技术的突破性进步利用了高分辨率显微镜的发展此外,对遗传编码荧光标记的化学和物理特性的更好理解导致了活细胞成像应用的优化和有限的不良实验副作用 此外,越来越多的可用荧光蛋白  和其他荧光标记 促进了从单个分子到整个生物体的广泛样本类型的成像。另一方面,大多数显微镜是高度专业化的设备。因此,选择合适的显微镜和数据分析工具需要考虑生物学问题和样品特性(图 1)。在下面的部分中,我们介绍了从单一蛋白质复合物到细胞培养模型和越来越复杂的生物体的生物系统,并给出了适当的光学显微镜应用的说明性例子。然而,在许多情况下,所示技术可用于整个范围的样品类型。

图1
图1

基于显微镜的项目成功需要考虑的因素:高度专业化显微镜的发展提高了基于图像的项目中原始数据的质量。然而,最佳结果基于选择合适的成像系统。可用成像技术的完整概述超出了本综述的范围。但是,作为指导,选择合适的显微镜是基于样本和项目特定的因素。显微镜的光学器件需要获得具有足够分辨率和穿透深度的图像,并且需要考虑可接受的光毒性应力水平来照射样品。在项目管理层面,需要考虑系统生物学中往往较高的所需吞吐量,并且需要建立足够的图像分析基础设施以避免图像分析和数据解释中的瓶颈。

全尺寸图片

分子成像

分子成像是分子生物学和体内成像交叉的学科光学分子成像可用作研究生物分子的时空动态及其相互作用的有力工具包括体外体内

例如,在纯分子尺度上,成像提供了对 F1-ATPase 在 ATP 合酶内旋转运动的理解对这种高度结构化的大分子复合物的大小和动力学分别在纳米和微秒范围内进行分析,需要有关分子参与者的初步知识。为了在显微镜下观察旋转,Yasuda 等人。 将 F1 的亚复合物固定在表面结合的珠子上,并将荧光标记的肌动蛋白丝连接到 ATP 合酶的每个 γ 亚基上。这些结构安装在盖玻片上。体外ATP 的加入最终触发了几个百分比的荧光肌动蛋白丝的连续旋转。当时,这些以单分子分辨率获得的高速图像被记录在 8 毫米的录像带上。自从这项工作发表以来,已经开发了新技术以获得更高的时间和空间数据分辨率然而,此类研究的样品制备仍然是一项手动且耗时的工作

活体中的单分子成像提供了通过在天然细胞环境中定位特定分子(如 RNA 和蛋白质)来研究细胞和组织中分子组织的能力。然而,许多亚细胞结构的尺寸低于可见光的衍射极限。因此,允许超越衍射极限的超分辨率显微镜技术,例如 PALM 和 STORM,越来越多地用于分析活细胞内分子复合物和单分子的组织原理 [ 21]]。系统生物学的一个核心范式是理解包括许多不同分子因素的生物网络。然而,在经典荧光显微镜中,可以同时测量的通道数量受到荧光团之间光谱重叠的限制。在这种情况下,重要的是要注意最近的发展成功地增加了可以同时测量的分子种类的数量。例如,Lubeck 等人。 报道了一种方法,通过将超分辨率显微镜和使用 mRNA 条形码与相邻发射器/激活剂对相结合的组合标记,显着增加了可同时测量的分子种类的数量。作为概念证明,作者分析了单个酵母细胞内 32 个基因的 mRNA 水平。这种条形码技术的进一步改进有可能用于以单细胞分辨率进行组学实验,这可能是系统生物学的一个重要里程碑。

然而,从整体的角度来看,对单分子机器的机械理解并不能完全理解更高层次的系统。相反,重要的是研究多个尺度的生物系统并确定分子、细胞、器官和复杂特征(如临床综合征)之间的潜在信号转导链。现代系统生物学和系统生物医学的一个主要目标是转化研究,它开发临床应用以改善患者的生活质量然而,在找到临床应用之前,体外实验的结果需要在更生理的背景下进行验证,例如细胞培养中的分子成像、活组织培养  或活脑 ]。

细胞成像

体外在分子尺度生物物理过程的成像需要时间密集型的样品制备,而比例较高过程的成像(图 2)是通常在更高的吞吐量,这是在统计电源和网络分析方面的一个重要优点是可行. 基于细胞筛选具有生物效应的生物或化学化合物是现代转化系统生物学的核心。高内涵筛选 (HCS) 将高通量显微镜与大量单细胞生理特征的自动提取相结合配备自动对焦系统的自动显微镜  可用于进行高通量实验,其中分析了数十万种化合物或遗传扰动的影响。这种基于图像的高通量筛选的经典读数是固定端点,可以从多个图像通道收集数据。虽然缺乏动态信息是终点测量的一个限制因素,但终点测量可能的高通量和使用针对固定样本中细胞内抗原的抗体的可能性都是选择终点分析策略的有效论据 与许多生化测定,将得到的细胞群的图像规避人口平均局限性通过在单细胞水平分析图像数据然而,这种高通量筛选产生的大量图像需要自动图像分析,包括识别和隔离感兴趣的区域或对象(分割)以及提取数值强度和形态特征。

图2
图2

在生物医学系统选择显微镜应用:),(),和(ç通过隐马尔可夫有丝分裂事件的建模来评价有丝分裂相变[的)分析 。A)显示给定单元格的类预测估计的格状图。B ) 事件顺序图和时间序列图像示例。C ) 处于不同细胞分裂状态的双染色 HeLa 细胞。D ) 和 ( E ) 线虫形态分析。D ) 单个蠕虫的自动分割 E ) 单个线虫数据集的拉直 I ) 和 ( J ) 斑马鱼的身体图谱 I ) TH 表达区以绿色突出显示。J ) 将单个图像信息注册到斑马鱼身体图谱数据库中。F )、( G ) 和 ( H )小鼠体内成像。F ) 微型显微镜重 1.9 克 G ) 肠黏膜屏障功能的动态分析 H ) 活小鼠大脑中树突棘动力学的纳米镜检查 所有图像均经出版商许可使用。

全尺寸图片

除了单细胞信息外,光学显微镜还提供了从粗略的静态模型到更精细的动态模型的途径。低通量和中通量自动显微镜可用于获取多个样品的连续图像系列并分析所得动力学数据。活细胞成像的最大优势在于其评估细胞甚至亚细胞事件动态的潜力。一个例子是 Chao 等人的一项研究。,其中在单个细胞中分析了特定 mRNA 的局部翻译。关于细胞群,活细胞成像能够评估细胞异质性和同步性,这对于理解细胞分化很重要 ,以及转录因子(如 NF-kappaB)的局部和全局控制机制

现代活细胞成像可以建立在一系列基于荧光的方法之上,这些方法可用于量化蛋白质的亚细胞分布、亚细胞穿梭过程的动力学和分子结合率 使用高度调谐的设置,例如 Förster 共振能量转移 (FRET) 和荧光寿命成像显微镜,可以在分子分辨率下观察快速时空蛋白质-蛋白质相互作用的动力学 然而,空间解析动态信息的充分解释需要比稳态图像更高级的分析。除了分割之外,活细胞成像应用通常还需要对象跟踪。动态信息与转化研究高度相关。例如,确定水凝胶基质弹性与肌肉干细胞迁移之间的相关性可能会导致开发基于细胞的肌肉萎缩疾病疗法 经典跟踪算法通过连接相邻的时间点以顺序方法分割和跟踪单元格。然而,与经典跟踪和细胞谱系识别算法相比,可以实现考虑整个图像序列和先验知识(例如,关于有丝分裂和细胞凋亡)的改进算法,用于注释最佳跟踪和识别最可能的细胞谱系

同时测量多种细胞特性或特征的可能性赋予 HCS 巨大的力量和具有挑战性的复杂性。典型应用包括筛选潜在的先导物、潜在的候选药物分子和基因筛选。这两种方法都检测由分子因素引起的细胞形态变化。虽然系统生物学中的多尺度分析旨在将分子因素和表型结果联系起来,但 HCS 可用于自上而下和自下而上的方法 使用 HCS,可以分析未经测试的分子因素对明确表型结果的影响,或对多因素表型特征进行分类,以预测潜在的网络状态和途径。使用 HCS 来预测在表型筛选中鉴定的化合物的潜在途径或分子靶标是一种假设生成方法,可以为理解具有未发现致病过程的复杂疾病提供新的视角。相比之下,使用 HCS 来验证潜在的药物靶点是一种更经典的、假设驱动的方法,它需要关于表型特征的更具体的先验知识。一个常见的例子是 RNA 干扰筛选,它通常侧重于精确定义的表型

HCS 的最高级形式结合了自下而上和自上而下的方法。例如,HCS 可以将全基因组筛选与对广泛表型特征的整体看法相结合。由 Neumann 和 Walter 等人执行的具有高度先进计算图像处理的全基因组 RNA 干扰筛选,使用来自 2 天活细胞成像的大规模多因素表型分析成功识别了数百个涉及多种生物功能的人类基因,包括细胞分裂、迁移和存活 [ 48 , 49 ]。重要的是,这项研究还证明了单细胞事件顺序分析对于旨在了解细胞尺度上的相关性和因果关系的调查的价值。

细胞分裂等罕见事件的成像仍然是一项具有挑战性的工作。绕过手动选择罕见事件的一种方法是使用机器学习方法来识别感兴趣的细胞事件。为了填补这一空白,康拉德等人。50 ] 开发了 Micropilot,这是一种自动识别细胞状态并为目标图像采集做出决策的软件。图像采集级别的预过滤会导致有价值信息的丢失;因此,预过滤的适用性取决于预过滤的类型和提出的生物学问题。例如,预过滤从先前的时间点移除信息,但允许在选定的感兴趣区域增加下游事件顺序分析的吞吐量。

酵母

系统生物学的一个主要目标是达到对细胞遗传学和生理学的系统理解水平。芽殖酵母是一种简单且遗传易处理的真核系统,是此类功能基因组研究的主要模式生物 [ 51 ]。酵母中的经典基因组筛选侧重于特定的形态特征,例如细胞大小、细胞形状或芽位点模式 [ 52 , 53]]。此外,这种模式生物的短寿命为衰老研究提供了一个有趣的特征。然而,液体培养中的酵母细胞是悬浮细胞。出芽导致子细胞数量呈指数增长。通过拍摄单个酵母细胞整个生命周期的快照,对短寿命出芽酵母的衰老进行经典分析 [ 54 , 55 ] 涉及从较大的母细胞中手动解剖子细胞的繁琐操作。最近,李等人。56] 描述了一种基于微流体的解决方案,其中细胞在其整个生命周期内都被固定,而不会积累子细胞。因此,微流体与显微镜的结合极大地改善了基于图像的衰老分析工作流程。基于显微镜的细胞计数法也是一种强大的工具,它具有免费提供的软件,可以量化细胞分辨率时间序列中的荧光强度 [ 57 ]。

与哺乳动物细胞培养类似,酵母项目需要最大限度地提高表型读数的多样性。用于酵母细胞多参数形态学分析的现成解决方案 CalMorph 是一种图像处理程序,可量化三重染色酵母细胞中的 501 个细胞形态参数 [ 58 – 60 ]。亚细胞事件的自动表型分析已成功用于基于参考突变组的形态表型识别药物靶点 [ 61 ]。

秀丽隐杆线虫

基因调控网络的纯细胞培养分析不足以理解信号转导通路,信号转导通路可能涉及不同生物复杂性规模的多种调控机制。与酵母相比,线虫秀丽隐杆线虫具有作为与人类具有更高遗传同源性的多细胞动物模型的优势。此外,用整只动物进行药物发现筛选具有识别调节全身表型的化合物的优势。动物筛选也有可能在发现过程的早期消除具有全身毒性的化合物。在动物模型(如秀丽隐杆线虫)中进行正向和反向遗传筛选的能力仍然是了解人类疾病表型的分子途径的最有力的实验范式之一 [ 62 ]。潜力分析访问人类疾病表型的不同方面肯定会确保导向转化研究在未来这种模式生物的重要作用,通过高通量大量等基因动物和HCS [ 62 - 67 ]。在成像方面,它对于成人来说只有大约 1 毫米的小尺寸和在所有发育阶段的透明度都是有利的特征。最后,通过大小和荧光对蠕虫进行流式分选的可能性能够进行高通量实验 [ 68 ]。

在线虫中高级图像分析的一个例子是行为运动分析。秀丽隐杆线虫可以在广泛的环境中移动,包括在基质上爬行、在流体中游泳以及通过微流体基质运动。对于经典运动分析,每个环境都需要定制的最先进的图像处理工具,这些工具依赖于启发式参数调整 [ 69 – 80 ]。斯尼特曼等人。81] 最近提出了一种所谓的多环境模型估计框架,该框架在各种环境中都是通用的。在此图像分析过程中,背景环境和线虫外观的统计模型是从单个图像中明确学习的,其中包括其环境中的线虫,并用于准确分割目标线虫。

蠕虫的运动和复杂的形态结构对于系统生物学中的多尺度方法很感兴趣,其目的是连接分子事件和有机状态。完整的生物体,如线虫,比简单的细胞模型具有更多的形态特征。格林等人。82 ] 表明复杂组织(如性腺)的稳态表型特征足以重建线虫的高分辨率遗传网络然而,相对复杂的形态对不同蠕虫的比较分析提出了挑战。图像配准是解决此类问题的经典工具。图像处理的最新进展可以使线虫变图像,创建蠕虫的带注释的 3D 身体图谱 [ 35 , 83 ],并对单个蠕虫进行高通量形态学表型分析 [ 34 ]。

贝塞尔光束技术和结构照明显微镜的进步有望超越衍射极限,深入了解复杂的生物现象,这些现象需要在多细胞环境中扩展高分辨率时间序列

定量图像分析的挑战

图像分析的一个中心目标是将显微图像转换为具有生物学意义的定量数据。然而,使用现代系统生物学产生的图像数据量对于手动分析来说非常庞大。因此,自动图像分析工具的开发是必不可少的。由于现代成像数据的复杂性和规模,生物成像数据的计算分析已经成为生物信息学和计算机视觉的一个重要新兴子学科使用多参数成像数据的研究在很大程度上依赖于图像采集、数据管理、可视化和正确数据解释的计算方法专用计算机视觉系统的典型功能是数据预处理、图像分割、特征提取和决策在过去的 20 年里,无数的商业(表 1)和开源(表 2)图像分析和数据管理工具已经发展 在这篇评论中,我们专注于开源解决方案,这些解决方案促进了社区驱动的图像分析开发工作。

需要自定义计算工作流程进行图像采集的显微镜开发示例包括结构照明显微镜 、超分辨率显微镜 和贝塞尔光束显微镜 一些现代显微镜每天可以产生高达 30 TiB 的数据 然而,系统生物学中生成的图像量正在迅速增长。因此,存储解决方案的可扩展性以及对图像存储库和成像项目常用文件格式需求的认识正在增加。

对图像分析的研究已经开发了一个完整的图像分析工具生态系统。ImageJ ,以前称为 NIH 图像,是图像分析开源工具领域的榜样。从一开始它就一直是免费的,并成为最受欢迎和广泛使用的多用途图像分析工具。ImageJ 之所以成功,是因为科学界可以自由地使用它来专注于图像分析而不是应用程序编程。通过添加插件实现的软件可扩展性概念对开发人员和最终用户也很有用。此外,这一概念已被最近发展的平台采用,例如 Fiji [ 和 Icy ]。ImageJ 的成功故事仍在继续,因为目前正在开发下一代 ImageJ2 软件(表 2)。

系统生物学中图像分析的两个主要挑战是分析复杂的高级结构(例如整个生物体)以及随着吞吐量不断增加的实验的兴起。胚胎和大脑等大规模生物系统的图像需要最先进的算法来拼接、配准和映射到解剖图谱。除了在该领域建立的可扩展 Vaa3D  和 Fiji 软件包之外,现在还出现了可以处理 TiB 规模数据集的新工具,例如 TeraStitcher]。虽然此类高级结构的成像通常以相当低的吞吐量进行,但需要大量用户输入的部分自动化工作流程仍然很常见。相比之下,高通量实验中产生的图像数量通常会增加几个数量级,无法手动分析。面临的挑战是在合理的时间内对来自 HCS 集的数据进行有意义的分析。几个用于图像分析的开源软件包包括基于机器学习的细胞分类功能。其中一些包是 CellProfiler 、CellClassifier  和 R 包 EBImage ,它们提供固定细胞图像的工作流程。

CellProfiler 可用于解决多个应用领域,包括强度和形态测量。与为固定对象设计的工具相比,CellProfiler 可以执行二维 (2D) 对象跟踪。有关细胞事件之间时间耦合的信息与理解生物系统的生理学高度相关。延时成像已成为研究动态细胞过程(例如细胞分裂或标记目标的细胞内运输)的强大工具。然而,对于这种高通量电影摄影的分析,目前只有少数工具可用。细胞认知  是一个免费提供的软件平台,包括高通量批处理和复杂细胞动力学的注释,例如单个细胞通过不同细胞分裂状态的进展。在该平台中,时间隐马尔可夫建模用于减少状态转换时的分类噪声并区分具有相似形态的不同状态。简而言之,CellCognition 为基于实时成像的筛选提供了一个分析平台,可通过直接对细胞动力学进行评分的分析进行分析 BioImageXD 是用 Python 和 C++ 编写的,它利用了库 VTK  和 ITK ]。因此,与 CellProfiler 和 CellCognition 不同,BioImageXD 可以通过为多维荧光图像集(包括时间序列)提供高级批处理功能来提供 2D 和 3D 分析选项。除了用于可视化、共定位分析、分割和跟踪的内置工具外,BioImageXD 的图形用户界面还有助于自定义图像分析管道的组装。该项目的开源设计,以及 Python 和黄金标准文件格式(如 OME-TIFF)的使用,应进一步促进该项目的发展,以帮助从事时空解析数据的社区

开源软件可以促进编程生物学家和对生物学感兴趣的计算机科学家之间的富有成效的合作。然而,一个重要的挑战是确保整个显微镜用户社区都可以使用分析工具。用于图像分析的专业编程、易于使用的开源工具的及时公开可用性将取决于有才华的图像分析代码编写者的职业机会,而这些新兴工具的质量将取决于良好的编程实践。最近,Carpenter 等人。 描述了图像分析软件的可用性标准,并提倡将可用性作为具有广泛影响的图像分析研究中更有价值的目标。作者强调,图像分析软件应该是用户友好的、模块化的、开发人员友好的、经过验证的和可互操作的。通常,可用的开源软件的开发需要用户和程序员之间的密切合作,这样生成的软件不会因缺乏软件工程专业知识或现实世界的适用性而受到影响。具有非常好的可用性的开源图像信息学平台的一个突出例子是最近开发的通用图像分析平台 Icy 该平台的主要目标是对开发人员友好,促进及时有效的合作以及可重复的研究。该软件基于 Java 构建,但也可以与最初基于 C++ 的 VTK 和 ITK 库一起用于本地 3D 可视化。现代且组织良好的用户界面提供对最先进的图像分析工具和基于 μManager 的  显微镜控制的访问,以进行带反馈的实时采集。此外,完整协议的编写由所谓的工作流设计工具促进,该工具将单个进程表示为图形块,并且不需要任何 Java 编程知识

研究人员提出前所未有的科学问题的创造力将继续给图像分析带来挑战,而这些挑战无法用单个软件工具解决。由于普遍使用各种不同的软件工具来获取和分析数据,因此这些工具之间的连接性和互操作性至关重要。幸运的是,许多开发人员已经了解这一点,最成功的开源图像分析平台正在明确开发共享数据和代码的方法 最后,需要提取所需特征的图像分析,但不足以得出生物学相关的结论。提取的基于图像的特征需要进行进一步的高级数据分析。反过来,提取特征的分析和相关特征的识别可以通过机器学习大大提高。

机器学习

基于图像的研究中不断增加的信息内容对数据解释提出了新的挑战。由一整套特征定义的多参数表型描述符,也称为表型 ,可用于对包含在单个像素、单个图像或整个筛选数据集中的信息进行聚类。然而,基于机器学习的分类可用于图像分割和图像衍生特征的高级分析

Ilastik是基于该训练机器学习算法用于识别属于一类感兴趣的[图像的像素用户定义的例子的开放源码工具 ]。这种高度先进的分割方法对于经典的基于模型的分割结果不佳的图像特别有用。

机器学习可以帮助将在图像处理中获得的基于图像的特征分类为具有生物学意义的模式。可以使用图像特征执行以下 3 类一般任务:统计比较、监督学习和无监督学习。在监督学习中,用户通过提供信息(例如实验条件的注释或指示化合物的浓度)来输入先验知识。在这些情况下,有监督的机器学习可以确定最有用的特征来区分注释的生物模式。一些例子是剂量反应曲线 [和时间序列中的时间点

细胞认知 是在有丝分裂调节剂的全基因组筛选的背景下开发的。该工具结合了明确编码的图像分割和监督机器学习来自动识别和注释有丝分裂阶段。考虑到单个细胞有丝分裂状态的注释,监督学习意味着必须对一小组细胞手动进行有丝分裂状态的注释。将此带注释的训练集提供给学习算法,以找到对剩余单元格执行注释的方法。对于训练集和主数据集中的每个细胞,算法被赋予一组输入变量,它使用它标记有丝分裂状态。形式上,学习阶段包括找到将输入变量映射到正确决策的数学函数。一些现成的分类器,包括基本形式的支持向量机,使用线性决策函数。然而,在 CellCognition 中,使用了具有非线性径向核的支持向量机。设置工作分类算法的主要挑战是定义足够的特征作为输入变量。考虑人类可以用来执行分类任务的属性类型可能会有所帮助。形状是分类有丝分裂状态的重要属性(图 考虑人类可以用来执行分类任务的属性类型可能会有所帮助。形状是对有丝分裂状态进行分类的一个重要属性(图 考虑人类可以用来执行分类任务的属性类型可能会有所帮助。形状是对有丝分裂状态进行分类的一个重要属性(图 2乙)。然而,形状不容易量化。相反,CellCognition 在分类过程中使用了一组定量特征,例如圆度。CellCognition 的例子表明,监督式机器学习可以利用人类对复杂特征的解释,如形状和此类复杂特征的数学抽象,这是高通量项目中自动分类工作流程所必需的。

与监督机器学习相反,无监督学习(例如聚类分析)可以独立于先验知识使用,以在数据中查找组。无监督学习的一个例子是通过药物的作用对药物进行聚类 监督学习和无监督学习的组合通常被称为半监督学习。一个经典的方法是从监督学习开始,以确定在使用无监督学习来发现生物相关性的未知子类之前,是否可以使用给定的特征来区分一些主要类别

工作流系统

工作流系统最近开始出现在基于图像的系统生物学中,并为用户提供了更大的灵活性。这些工具将图像分析工具和机器学习工具等应用程序称为分析管道的组件。工作流系统可用于构建用于图像采集的虚拟系统,并且无需编写复杂的脚本即可执行特征提取和高级数据分析。随着对复杂处理、图像分析和高级数据解释的需求不断增加,开源工作流系统越来越受欢迎。KNIME  是一个开源工作流系统,具有非常广泛的领域集,可连接图像分析工具和其他生物信息学工具,以创建复杂的图像处理和分析工作流。

一些开源图像分析工具也可以在不使用工作流系统的情况下进行组合。例如,CellProfiler 凭借其强大的集成能力,可以在自动图像分析管道的上下文中运行 ImageJ 宏或 Ilastic 机器学习算法。在基于图像的系统生物学背景下,KNIME 的主要优势在于它可以构建超出可用图像分析工具直接互操作性的工作流程。例如,KNIME 可以将来自斐济 [用于 n 维图像分析的库 ImgLib 集成到尚未具备此功能的工作流程中。

数据库

系统生物学中的大量实验、图像、元数据和可提取特征需要关系数据库。在 HCS 中,内在需要用户友好、可扩展且功能强大的信息管理系统。数据管理平台应使用户能够收集、整合、共享和发布数据。在互操作性的范围内,这些平台还应该能够连接到数据处理管道和工作流系统。使用开源数据库的好处是可扩展性和平台定制的可能性。

生物图像语义查询用户环境(Bisque) 是为交换和探索生物图像而开发的。Bisque 系统支持从图像捕获到图像分析和查询的多个领域。该平台以图像和元数据数据库为中心。集成的分析工具允许进行高级语义查询以及图像内容的比较。Bisque 专门为研究人员提供组织和定量分析工具,用于时间分辨多通道 3D 筛选数据。图像和元数据使用与图像相关联的标签(即名称-值对)进行组织。通常,用户通过浏览集合或使用特定查询进行搜索来定位感兴趣的图像。该系统有一个集成的网络图像浏览器,用于对图像进行过滤、排序和排序。图像组织器通过分层标签排序执行高级排序。此外,用户可以使用数据模型和分析扩展来扩展 Bisque,以使系统适应本地需求。Bisque 的可扩展性源于以下两个核心概念:灵活的元数据工具和基于 Web 的开放架构。

打开显微镜环境(OME)项目杠杆成像着眼于底层需要共同的文件格式的项目。OME 提供了 Bio-Formats,这是一种完全解析 120 多种专有图像格式并将专有元数据转换为 OME-XML 数据模型的工具。OME-TIFF 格式是带有 OME-XML 元数据的 Tiff 图像的容器格式,也是社区驱动项目中使用最广泛的图像格式。为确保数据完整性,Bio-Formats 将专有文件格式元数据转换为键值对表,随后将其作为注释存储在关系数据库 OMERO  中导入的图像上]。OMERO 旨在为图像数据生成器和用户提供一个统一的数据管理平台。简而言之,OMERO 对图像和元数据使用了多种存储机制,并提供了一个应用程序编程接口,用于使用基于 C++、Python、Matlab 或 Java 的远程图像分析工具。最近添加的功能还允许在表格中组织定量特征。

在 HCS 中,跟踪定量特征至关重要。OpenBIS 是一个框架,用于为 HCS 数据和元数据构建用户友好、可扩展且功能强大的信息系统。OpenBIS 允许用户收集、集成、共享和发布基于图像的数据并连接到数据处理管道。该框架建立在从项目管理层到样本特定数据集的分层结构上,易于扩展和专业化,但不限于成像项目。OpenBIS 是一个灵活的平台,用于处理图像、结构化元数据(例如,样本注释)和非结构化数据(例如,附加文件),并且可以扩展到非常大的数据。

数据库与工作流系统(如 KNIME)的组合可以实现经典图像数据库范围之外的功能集成。例如,KNIME 节点 1Click1View (1C1V) 的开发是为了促进来自 HCS 的大规模图像数据集和数字数据之间的链接 在筛选板级别,1C1V 可用于以热图的形式可视化定量特征。Phaedra  是另一个连接到 KNIME 的信息学工具,已开发用于支持药物筛选和目标发现的工作流程。该工具可用于绘制剂量反应曲线、管理排除和注释选项,以及执行细胞分类、统计质量控制和报告。


结论

从历史上看,显微镜一直是一种定性技术。然而,由于标记和成像方法以及计算机视觉和信息学的进步,现代显微镜已经广泛改进了从生物样本中提取有意义的定量数据。尽管技术进步,但需要找到统计显着性所需的实验吞吐量与新生物学知识的潜在输出之间的平衡。明确的研究计划和先验知识是转化系统生物医学进展的关键先决条件。在许多情况下,基于图像的方法可以做出重大贡献。然而,选择合适的实验模型并使用最适合所选方法和样品特性的成像技术至关重要。鉴于系统生物学中光学显微镜应用的种类繁多,寻找一种能够满足所有需求的通用图像分析工具往往是虚幻的。正确的方法是专注于高质量原始数据的生成,并利用现有图像分析工具的灵活性来集成所需的图像分析和数据处理工作流程。



北京创诚致佳科技有限公司专业从事分析测试仪器设备的研发、生产制造、市场开发、国际贸易、销售及技术服务。