-
使用awk从vcf文件中提取字符串
我正在运行以下代码来处理vcf表中的数字数据。 <pre><code> cat inputfile | while read row; do echo -
“((1-h)* qs [i]中的错误:二进制运算符的非数字参数”)每当我尝试运行我的代码时,都会不断弹出
我有来自52位患者的一些原始数据,并且我格式化了原始数据,在第一列中包含Entrez基因ID,在接下来的5 -
计算pandas DataFrame中值的频率
具有此pandas.core.frame.DataFrame: <pre><code>Gorilla A T C C A G C T Dog G G G C A A C T Humano -
细胞因子数据的R Limma P值与Foldchange
我正在尝试与Bioconductor的<code>limma</code>合作来计算p值和倍数变化值,并找到差异表达的基因。 我 -
从一些文件中复制字符串并将其粘贴到bash中的新文件中
我有一些包含fasta数据的文件。同一目录中的所有文件都具有不同的名称。 文件1 <pre><code>>gene1 AAA -
CI的Bootstrap失败
您好,我一直在尝试进行引导以在R的MINE统计分析中建立CI。我已经尝试了多个软件包,但是现在我已经 -
使用python我想知道一个点(具有三个坐标)是否更接近给定另一点的2 cm
我有两个这样的<code>numpy.ndarray</code>,但有更多行: <pre><code>A = numpy.array([[7.087, 0.038, -130.550], -
我在R中重复测量ANOVA是否正确?
我在R中进行了重复测量ANOVA,以观察治疗(3个不同的治疗组),性别,年龄和受教育程度对特定生物标 -
如何使用python从列中的所有数据中删除最后一个字符?
我在表的列中有这样的数据。 <pre><code>RcHm_v2.0_CPg0501681 RcHm_v2.0_CPg0501691 RcHm_v2.0_CPg0501701 RcHm_v2.0_CPg05017 -
GEKKO分批补料生物反应器ODE方程的不可行系统
我对GEKKO和生物反应器建模都是陌生的,所以我可能缺少明显的东西。 我有一个由10个ODE组成的系 -
如何将XML NER数据从CRAFT语料库转换为spaCy的JSON格式?
<strong>如何使用spaCy在<a href="https://www.ncbi.nlm.nih.gov/research/pubtator-api/publications/export/biocxml?pmcids=PMC6207735" r -
生物医学命名为实体识别的西斯帕西(NER)
<strong>如何使用Scispacy标记实体?</strong> 当我尝试使用<code>scispacy</code>执行NER时,它通过将生物 -
如何检查1排50个碱基的DNA序列是否包含DNA结合基序?
我有一个DNA序列文件,其中有2000行,每行50个碱基。.<br/> 我有2000行的标签文件...具有0和1。<br/> 对应于D -
在Python中优化数据框子集操作
总结问题 我正在尝试优化我编写的某些代码。按照当前的形式,它可以按预期工作,但是由于需 -
将.maf文件另存为表
我正在尝试将.maf文件另存为表格,但始终会出现以下错误: <pre><code>Error in as.data.frame.default(x[[i]], op -
LEfSe-LDA得分的垂直线
我正在使用以下命令在Python 2.7的Google Colab上使用<a href="https://bitbucket.org/biobakery/biobakery/wiki/lefse" rel="nofol -
如何为多状态PDBfile中的原子重新编号?
我无法提出解决问题的想法,因此我无法继续进行研究。我还没有做到这一点,因此我在计算和生物信 -
我的miniconda3安装(python3.7.1)中缺少time.thread_time()
我正在尝试使用<code>DigitalCellSorter</code>模块(与生物统计相关)来编写一些Python代码。该模块中的一种 -
从基因组中提取特定转录序列的问题
我正在R中的Linux上从基因组中获取特定的转录序列。我能够导入基因组,提取成绩单注释(tx),并获得 -
Python中的嵌套循环将结果存储在单个字典中
晚上好, 我目前正在研究一个程序,以在继续攻读本科学位时进一步了解Python。我正在尝试创建 -
串联多个fastq文件并重命名到父文件夹
目前,我具有作为fq.gz文件的基因组测序数据,每个样品都包含一个标题为样品名称的文件夹,其中包含 -
比较“ A”,“ C”,“ G”,“ T”的字符的最快方法
我希望提高生物信息学算法的速度,该算法要求比较“ A”,“ C”,“ G”,“ T”之一的字符(例如, -
我如何按一列对整个熊猫数据帧进行排序,以3s为单位移动行
我有一个数据框,其中包含基因(集合ID和通用名),同源物,计数和总数,按以下三个顺序排列: -
按名称匹配行
我有2个数据集(基因名称的列表/列),例如: <pre><code>df1 Gene_id SUMO2 CDC37 COPB2 BECN1 CAPNS1 </code></pre> -
R中CoverageHeatmap(Bioconductor)功能的问题
我有两组成对比对,其中查询基因组1(q1)与参考基因组比对,查询基因组2(q2)与相同的参考基因组比 -
错误:mdb_env_open:没有这样的文件或目录BLAST +本地数据库问题
因此,我遵循此处提供的NCBI说明:<a href="https://www.ncbi.nlm.nih.gov/books/NBK52640/" rel="nofollow noreferrer">https://ww -
将荷马标签目录转换为.hic文件时,如何解决查找临时文件的问题?
我正在尝试将本垒打标签目录转换为* .hic文件,以便使用Juicer可视化它们。我正在使用TagDir2Hic.pl,通过 -
为什么当脚本位于PATH中时,以下.sh脚本为何显示找不到.py命令?
我正在尝试在<a href="https://rki_bioinformatics.gitlab.io/ditasic/" rel="nofollow noreferrer">https://rki_bioinformatics.gitlab.io/ -
在其他序列中找到频率最高的序列
我给了10个DNA序列,每个序列由18个碱基组成,并要求我编写一个程序,计算所有这些序列中最频繁的序列 -
通过终端和通过RStudio安装软件包有什么区别?
<strong>背景</strong> 我试图在输入'R'后通过命令install.packages()在macOS终端中安装软件包“ zip”: