jojo199619吧 关注:22贴子:6,299

ICML 2020会议

只看楼主收藏回复



IP属地:广东1楼2020-07-17 00:41回复
    Hierarchical Generation of Molecular Graphs using Structural Motifs
    Wengong Jin, Regina Barzilay, Tommi Jaakkola,
    和之前的JT-VAE有点像,我感觉是比以前多了一个connection的vocabulary library。所以挑选片段的时候不是从所有的片段里面直接挑选,而是先挑选最有可能的片段类型,然后再挑选该片段类型里面最匹配的连接点样式。
    还是我喜欢的graph based的模型,稍微的改进空间在于片段的定义和选择,感觉我的炒鸡官能团会在这方面好一点,但是不能直接套用这个方法?因为如果那样分解就不是单纯的树形结构了,还有环状结构了,也许在decode的阶段会产生问题


    IP属地:广东2楼2020-07-17 00:47
    收起回复
      Deep Molecular Programming: A Natural Implementation of Binary-Weight ReLU Neural Networks
      Marko Vasic, Cameron Chalk, Sarfraz Khurshid, David Soloveichik,
      是冲着标题点进去的。里面提到了对反应的处理,binary这里体现的是-1/+1,类比到化学反应可以认为是反应物或者生成物那边,其实并没有完全听懂,里面的化学反应似乎也是更抽象的化学反应(酶促反应之类的)。感觉和我这个差别有点远了,毕竟我做的这个虽然也是化学反应但是是精确到了原子级别的,所以暂时对我的启发有限,而且没有太明白对于复杂反应(或者说各种反应物生成物之间存在复杂的关系网络的情况),这个具体要怎么运用起来


      IP属地:广东3楼2020-07-17 00:51
      回复
        Learning to Navigate in Synthetically Accessible Chemical Space Using Reinforcement Learning
        Sai Krishna Gottipati, Boris Sattarov, Sufeng Niu, Haoran Wei, Yashaswi Pathak, Shengchao Liu, Shengchao Liu, Simon Blackburn, Karam Thomas, Connor Coley, Jian Tang, Sarath Chandar, Yoshua Bengio,
        好多作者(((话说又是Coley大佬有参与的,看来科研界广告也是很重要了
        好多中国人的名字
        说是现有的任务:预测合成路线、反应结果、优化分子等等,并没有解决关于合成可行性(或者说难度)的问题
        提出问题:比方说在逆合成分析预测中,有没有可能只在“有效”的化学反应中进行“检索”呢?给定现有的分子,要预测可能的反应模板和反应物
        想要用RL,Agent给出的行动就是预测反应模板和反应物,环境(Environment)给出一个反馈,这个选择好不好,给一个score
        但是现在模板也很多,就算选了模板,反应物的选择也有很多,这个庞大的数量,而且是离散的空间,是现有的RL技术所不能handle的
        所以他们将要预测的反应物变成一个连续的空间(预测他的representation而不是它本身),然后将这个representation map到实际的、离散的反应物中去,这个map的方法他们用的kNN。然后这个kNN是环境的一部分,所以剩下的这个连续的空间就可以用现有的很多RL的算法去handle了


        IP属地:广东4楼2020-07-17 01:33
        回复
          接上一楼
          整个过程是把现有的化合物作为一个state,然后用第一个NN(Template selector)选择合适的模板,他的inputs是现在的这个化合物。然后用第二个NN(Reactant selector)选择合适的反应物,这里的inputs是上一步挑选出来了的模板还有现在的化合物,outputs则是一个连续的、代表反应物的representation。上面也说了这个representation可以通过kNN来映射到具体的化合物上去。
          然后他们的Computational Chemistry Engine可以给出一个reward和对应的产物,这个产物就是下一个state(的反应物),然后以此类推,最长不超过5步(提问回答)。
          Agent: Softmax*mask(因为太多了,只选8个)-> template -> 反应物reprensentation
          Environment: 反应物reprensentation -(kNN)-> 反应物 -> 产物 ->打分 --(最高分的)-> 下一轮


          IP属地:广东5楼2020-07-17 03:19
          回复
            Datasets: QED, HIV-RT pIC50


            IP属地:广东6楼2020-07-17 03:22
            收起回复
              A Generative Model for Molecular Distance Geometry
              Gregor Simm, Jose Miguel Hernandez-Lobato
              动机是分子的三维结构很重要,但是适合的graph models里面都没有考虑。
              背景:一个分子可以有多个构型。MC的方法太过昂贵。
              目标:想要发展一个新的probabilistic model来学习分子的构型分布。想要用MMD metric来比较实验方法获得的构型和构型生成模型生成的构型。用这个概率模型的预测结果来描绘IS scheme的分布(构型)。
              Conditional Variational autoencoder
              Distance信息在edge里面,和原先的edge feature concatenate。
              Datasets: ISO17 (197分子+400K 构型)
              他们把结果和RDKit还有DL4Chem(另一个ML model)比较,总体来说他们最后rdkit次之然后是那个DL4吧
              不过看起来是3D到3D,所以要生成首先得要一个3D的结构,然后data不够也是个问题,最后他提到精确性还没有一个好的方法去预估(我在想用一些QM或者MM的方法自己栽培数据不香吗(难道是太贵。。。啊3D


              IP属地:广东7楼2020-07-17 03:42
              回复
                Reinforcement Learning for Molecular Design Guided by Quantum Mechanics
                Gregor Simm, Robert Pinsler, Jose Miguel Hernandez-Lobato,
                突然发现和上一个是同一个一作。。。用RL的真多0.0
                他开场先吐槽了现有model的问题:生成模型受限于训练集数据,现有的RL模型没有3D而且仅限于单个分子。所以他们提出了RL for molecular design in 3D
                他们希望这个RL不仅能够handle 3D而且还能应用于一团分子(和单个相对),他们的reward function是根据QM来的(难道让QM算一遍?待会儿看他怎么解释先
                action: 挑选一个原子,然后挑选原子在空间中的位置(用键长、键角和二面角表示)
                reward: 评估这个摆放好的构型
                他们试了十二个原子这么大的分子说是可以
                说是缺点:挑选原子的原子池要先定义,生成的分子结构复杂度有限


                IP属地:广东8楼2020-07-17 03:55
                回复
                  Improving Molecular Design by Stochastic Iterative Target Augmentation


                  IP属地:广东9楼2020-07-17 04:07
                  回复
                    啊这,不知道为什么作者就被认为有广告了


                    IP属地:广东10楼2020-07-17 04:08
                    回复
                      看到boss。。。嗯M老面孔的感觉。。。
                      目标:translate input molecule to a similar molecule with better prooperty score
                      datasets: QED, QRD2
                      他们通过他们的增值数据的方法证明(在HierGNN等模型上)确实有用
                      首先sample input-output pairs from generator
                      Filter with propert predictor, add "good" pairs to training data
                      Train generator, repeat


                      IP属地:广东11楼2020-07-17 04:08
                      收起回复
                        A Graph to Graphs Framework for Retrosynthesis Prediction
                        Chence Shi, Minkai Xu, Hongyu Guo, Ming Zhang, Jian Tang,
                        前提1:大部分分子反应前后只有小部分结构发生改变
                        前提2:反应机理通常可以用电子转移来描述
                        先预测反应的键(哪根键需要断),然后将拆下来的子片段进行“翻译”:
                        先预测要用的原子1,2,要用的键,不断重复直到model判定该停了
                        所以总的来说不需要
                        我喜欢这个主意!!


                        IP属地:广东12楼2020-07-17 05:55
                        回复
                          Learning Graph Models for Template-Free Retrosynthesis
                          Vignesh Ram Somnath, Charlotte Bunne, Connor W. Coley, Andreas Krause, Regina Barzilay
                          又是熟悉的名字,我已经懒得吐槽了
                          和上面的工作思想有点类似,首先是graph-based,其次template-free。想要最大的利用原有的结构。
                          所以大体也是分两步:一是edit prediction,就是预测变化的键,这里变化的键包括键由存在变成不存在,或者键的类型发生了改变。然后把这根键断开,剩下的部分在所有的“leaving group library”里面找。
                          和上一个工作比起来吧我觉得还是有局限性,在于:这个一根键变化的前提假设不一定总是成立,导致有的反应不work,问了昨天作者这个问题他们说直接在dataset里面就把不符合这个条件的反应(大概占2%)移除了(大雾,不过这个是一整个substructure从leaving group里面选,所以(任务容易点)准确率高了


                          IP属地:广东13楼2020-07-17 23:04
                          回复
                            Graph Convolutional Gaussian Processes for Link Prediction
                            Felix Opolka, Pietro Lió


                            IP属地:广东14楼2020-07-18 00:35
                            回复
                              不对


                              IP属地:河南来自Android客户端16楼2020-09-22 14:15
                              收起回复