实际应用
那好,这样的算法逻辑,听起来是不错,实际应用的情况怎么样呢?
研究人员把这套算法用在寻找一类叫PAG的新材料上。PAG的学名是光致酸生成剂,是光刻胶里面的一种成分。在光照之下,它可以产生酸性的物质,改变光刻胶的特性,用于芯片加工。PAG是一种非常尖端的材料,对它的研究马虎不得,而且花费也会十分高昂。你想,作为研究人员,每开发一种PAG,都得在实际的光刻机上应用以后,才能知道它到底怎么样。按照常规的筛选方式,一个课题开发出一个系列几百种备选的材料,也是常有的事。但是,这其中只有极少数可能被用上,甚至还可能全军覆没。但是,按照前面说到的逻辑,利用人工智能进行新材料的开发,目标会非常明确,省钱又省力。
在已知的PAG系列中,已经得到广泛应用的几类材料并不是很完美,它们存在生物累积和致毒的风险。简单来说,就是如果长期接触这些PAG,人体有可能会积累这些成分,出现中毒现象。那利用人工智能,就能发现健康又环保的新PAG吗?还真可以。具体的做法是,第一步,研究人员把超过6000份专利、论文以及数据源全都输入到工作平台上,让机器进行深度学习。按照一般的篇幅计算,如果是研究人员亲自阅读这些内容,需要半年到一年的时间。通过对这些研究成果的学习,机器首先筛选出大约5000种PAG的结构。在这个基础上,一些关键指标达不到要求的PAG会被剔除,机器再根据它们的参数进行分类计算,从而判断出哪些结构是有利于最终目标的。这样一来,机器就可以根据学习的结果生成一个数据库,库中包含大约3000种候选目标。
这些目标,大多数是全新的物质,并没有被前人研究过。整个数据库的生成,只花费大约六小时。同样的工作量要是交给常规的科研团队,一般得花上几个月的时间。
在这3000多个候选目标中,机器继续进行学习,构建出新的模型,最终选出大约400种最有可能的目标,用它们进行模拟实验。而且,这些模拟实验并不需要在光刻机上实际进行,同样也是根据机器学习的结果,对它们进行筛选,找出其中性能最优的那一个。实际上,通过改进算法,这项筛选甚至不用将所有目标都运行一遍。研究人员只试了90多个候选材料,就找到了最心仪的目标。随后,机器又根据学习结果推荐了“一步法”的合成路线。“一步法”是化学里的术语,意思是原料加到反应设备里,产物直接就可以合成出来,不需要额外的操作工序。“一步法”合成的材料,在工业化的时候会很有优势。研究人员根据算法给出的方案进行验证,的确获得了比较理想的结果。也就是说,把人工智能用在新材料的开发上,可行性非常高。实际操作中,还有很多指标需要去考虑,经常会出现一种材料某方面很优秀,而另外一方面却很糟糕的情况,机器评价起来就会有难度。这也就回答了我开头提到的那个重要的问题,就是人工智能被应用以后,材料学家会不会失业?