深度生成模型因發現新的分子和材料而迅速流行。 這樣的模型可以從大量的分子結構中學習並產生新的化合物。 這項工作中介紹了分子集(moses),乙個基準平台,可支援針對藥物發現的機器學習研究。 moses實現了幾種流行的分子生成模型,並提供了一組指標來評估所生成分子的質量和多樣性。 借助moses,旨在標準化分子生成研究,並促進新模型的共享和比較。
pip install molsets
導入庫
import pandas as pd
from rdkit import chem
from moses.metrics import get_all_metrics
載入資料
gen = ['cnc', 'oc1ccccc1-c1cccc2cnccc12',
'cccp',
'cc1noc(c)c1cn(c)c(=o)nc1cc(f)cc(f)c1',
'cc1nc(ncc2ccccc2)no1-c1ccccc1']
評估
get_all_metrics(gen)
<
高分子理想鏈的隨機行走模型
原文 m.doi,introduction to polymer physics,1.1.1 random walk model 高分子鏈有大量的內部自由度,例如,聚乙烯分子中繞每個c c鍵的都有乙個轉動自由度,所以高分子能夠取很多種不同的構象,具有很高的柔順性,因此我們可以將一根高分子鏈模型化成一...
高分子鏈的自避隨機行走模型
原文 m.doi,introduction to polymer physics,1.1.2 the effect of short range interactions 在前面的高分子格仔隨機行走模型中,每個鍵的取向是完全是隨機的,並且與前面相鄰的鍵的取向是完全無關的。即高分子可以折回它已經佔據的...
生成模型和判別模型的區別
有監督機器學習方法可以分為生成方法和判別方法 常見的生成方法有混合高斯模型 樸素貝葉斯法和 馬爾科夫模型等,常見的判別方法有svm lr等 生成方法學習出的是生成模型,判別方法學習出的是判別模型。生成模型主要是求解聯合概率密度,比如我們有資料集 c,x 其中 c,x 表示其中乙個樣本,c為類別,x為...