Biopython教程

Biopython表型微阵列

Biopython表型微阵列详细操作教程

表型定义为生物体针对特定化学物质或环境表现出的可观察的特征或性状。表型微阵列可同时测量生物体对大量化学物质和环境的反应，并分析数据以了解基因突变，基因特性等。

Biopython提供了一个出色的模块Bio.Phenotype来分析表型数据。本小节中我们将学习如何在本章中解析，内插，提取和分析表型微阵列数据。

1. 解析

表型微阵列数据可以采用两种格式：CSV和JSON。Biopython支持两种格式。Biopython解析器解析表型微阵列数据并作为PlateRecord对象的集合返回。每个PlateRecord对象都包含WellRecord对象的集合。每个WellRecord对象均以8行12列的格式保存数据。八行由A到H表示，而12列由01到12表示。例如，第四行和第六列由D06表示。

我们通过以下示例了解解析的格式和概念：

第1步 - 下载Biopython团队提供的Plates.csv文件 - https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/Plates.csv

第2步 - 加载表型模块，如下所示-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
from Bio import phenotype

第3步 - 调用phenotype.parse方法，并传递数据文件和格式选项(pm-csv)。它返回如下可迭代的PlateRecord对象，

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> plates = list(phenotype.parse('Plates.csv', "pm-csv"))
>>> plates
[PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'],WellRecord['A03'], ..., WellRecord['H12']')]
>>>

第4步 - 从列表中访问第一板，如下所示-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> plate = plates[0]
>>> plate
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ...,
WellRecord['H12']')
>>>

第5步 - 如前所述，一个板包含8行，每行包含12个项目。可以通过以下两种方式访问WellRecord-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> well = plate["A04"]
>>> well = plate[0, 4]
>>> well WellRecord('(0.0, 0.0), (0.25, 0.0), (0.5, 0.0), (0.75, 0.0),
(1.0, 0.0), ..., (71.75, 388.0)')
>>>

第6步 - 每个well在不同时间点都会进行一系列测量，可以使用for循环进行访问，如下所示：

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> for v1, v2 in well:
... print(v1, v2)
...
0.0 0.0
0.25 0.0
0.5 0.0
0.75 0.0
1.0 0.0
...
71.25 388.0
71.5 388.0
71.75 388.0
>>>

2. 插值

插值可让您更深入地了解数据。Biopython提供了对WellRecord数据进行插值的方法，以获取中间时间点的信息。语法类似于列表索引，因此易于学习。

要获取20.1点处的数据，只需将其作为索引值传递即可，如下所示：

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> well[20.10]
69.40000000000003
>>>

可以传递开始时间点和结束时间点以及下面指定的内容-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> well[20:30]
[67.0, 84.0, 102.0, 119.0, 135.0, 147.0, 158.0, 168.0, 179.0, 186.0]
>>>

上面的命令以1小时为间隔从20小时到30小时内插值数据。默认情况下，间隔为1小时，可以将其更改为任何值。例如，按照以下指定的时间间隔15分钟(0.25小时)-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> well[20:21:0.25]
[67.0, 73.0, 75.0, 81.0]
>>>

3. 分析和提取

Biopython提供了一种适合使用Gompertz，Logistic和Richards Sigmoid函数分析WellRecord数据的方法。默认情况下，fit方法使用Gompertz函数。我们需要调用WellRecord对象的fit方法来完成任务。代码如下-

# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-25
>>> well.fit()
Traceback (most recent call last):
...
Bio.MissingPythonDependencyError: Install scipy to extract curve parameters.
>>> well.model
>>> getattr(well, 'min') 0.0
>>> getattr(well, 'max') 388.0
>>> getattr(well, 'average_height')
205.42708333333334
>>>

Biopython依赖scipy模块进行高级分析。它使用scipy模块来计算min，max和average_height详细信息。

找工作要求35岁以下，35岁以上的程序员都干什么去了？

长久以来，一直有一个问题困扰着技术人——如何打破“程序员的35岁职业魔咒”，这一天迟早会到来，或早或晚。

或许是选错了行业，程序员薪水虽高，但光鲜的外表下，背后的苦衷只有自己知道。三十多岁本该是一个人事业的黄金期，但技术变化日新月异，行业竞争异常残酷，对一个企业来说，永远有比你更年轻、劳动成本更低的人可以选择，这让你的中年危机提前到来。破局的智慧可以看看这本书！>>

<< Biopython基因组分析 Biopython绘图 >>

昵称：邮箱：