成年线虫高分辨率图像的自动标注.ppt
文本预览下载声明
成年线虫高分辨率图像的自动标注 什么是秀丽隐杆线虫 秀丽隐杆线虫(Caenorhabditis elegans)是一种能够在温和环境中独立生存的土壤线虫,以微生物如大肠杆菌(E. coli)等为食,有雄性及雌雄同体(hermaphrodite)两种性别。自然界中,绝大多数个体为雌雄同体,雄性仅占0.05% 秀丽隐杆线虫的优势 线虫是一种非常简单多细胞真核生物。线虫结构简单且通身透明 体细胞数目恒定,雌雄同体的成虫含有959个体细胞和约2000个生殖细胞;雄性成虫有1031个体细胞和约1000个生殖细胞 线虫生命周期短,从一个受精卵发育成可以产卵的成虫只需要两三天,节约了实验所消耗的时间 由于具有雄性和雌雄同体这两种性别,线虫在遗传研究上具有无可比拟的优势 秀丽隐杆线虫的生命周期 研究秀丽隐杆线虫的意义 线虫在生命科学的各个领域,包括胚胎发育、性别决定、细胞凋亡、行为与神经生物学等的研究中得到广泛应用。在MAPK信号传导、细胞程序性死亡、TGF-β信号传递途径、RNAi干扰和small RNA、衰老和寿命及脂肪代谢等方面取得了重大突破。可见线虫作为模式生物对于生命科学领域具有非凡的意义。 组合优化问题介绍 三要素:变量,约束和目标函数 变量:求解过程中选定的基本参数 约束:对变量取值的限制 目标函数:可行方案衡量标准的函数 目标:从组合问题的可行解集中求出最优解 组合优化问题介绍 组合优化问题是在给定的约束条件下,求目标函数最优值(最小值或最大值)的问题。组合优化问题的一个实例可以表示为一个对偶(S, f),其中解空间S为可行解集,目标函数f是一个映射,定义为 f : S-R 求目标函数最小值的问题称为最小化向题,记为 min f(i) , i 属于 S 同理,求目标函数最大值的同题称为最大化间题,记为 max f(i) , i 属于 S 算法提出的意义 过去标定秀丽隐杆线虫图像上的细胞是手动分割的,这非常的单调并且耗时 之前偶匹配算法是适用于L1状态(第一幼虫时期),它是基于位置的算法,L1时期细胞位置和数目是相对固定的。但是到成虫期,细胞数目急剧增长,细胞种类和空间位置也发生明显变化,故在成虫期不适用 本文算法介绍 本文作者将成年线虫的细胞标定问题转为为组合优化问题,该算法基于先前的偶匹配算法,但丰富了评价函数。加入了诸如细胞尺寸,邻里密度等特征 然后,作者介绍了利用最小损失最大流来解决组合优化问题,并且运用一种基于交叉熵–基学习算法来调节模型的参数,提高匹配正确率 上图是成年线虫在Z轴上的投影,蓝色部分有由DAPI染色,代表细胞中的DNA,绿色是由绿色荧光蛋白(GFP)染色,代表细胞核 算法的表示 将细胞标定问题转化为组合优化问题 假设图像中有p个细胞 (它们的位置和边界已经在预处理中提取)。 表示我们希望预测每个细胞所对应的标签, 表示 的候选标签 代表那些没有被标定细胞, 等代表训练集中q种由专业人员标定的不同细胞。 于是给每个细胞决定的任务就变成了如下组合优化问题: (i)每个细胞只分配一个来自 的标签 (ii)每个标签 只分配给每个细胞 (iii)这个未指定的标签 可能对应了多个细胞 算法的表示 是一个矩阵,当细胞 和标签 相匹配时,将 置1,否则置0。同样的, 是由可能的细胞标签分配所组成的损失函数,最后,问题可表示为: subject to 注:上面的这些限制确保了每个细胞只能分配惟一的标签,反过来也是一样 损失矩阵的定义 众所周知损失值 是算法重要因素。所以我们相对之前的算法考虑了更多的特征,列举如下: (1)细胞位置 (2)细胞尺寸 (3)GFP表达水平 (4)DAPI强度 (5)附近细胞 (6)细胞形状 所有上面的因素都是专业标定师在标定成熟线虫所考虑的特征 损失矩阵的定义 这里,我们先单独考虑细胞的位置(其他的特征的损失矩阵类似)。假设我们已经得到了线虫图像的训练集 我们用 表示在标准虫坐标空间的3D向量坐标,每一维都是零均值和方差。损失矩阵的一种表示方法是马氏距离:
显示全部