1月26日,上海人工智能研究院(上海AI院)开源发布了首个科学大规模模型Pulco Chemistry(ChemLLM),拓展了支持科学研究的大规模模型的搜索路径。
基于树胜普语2.0强大的基础模型能力,普科化学将大量的化学专业数据注入到大规模模型中,获得了理解和处理化学相关专业任务的知识和能力。与此同时,研究人员发现,随着化学技能的掌握,数学和物理领域以及大型模型的推理能力也得到了加强。
Puco Chemical 目前是开源的,可免费用于商业用途。
开源链接:https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
聚焦核心:注入化学知识和卓越的专业知识
为了评估Pluco Chemical的专业能力,上海人工智能研究院的研究人员测试了其在分子名称转换、分子性质预测和反应产物预测——三个相关任务上的表现。这些任务分别涉及表示化学品、性质和反应产物。转化是化学研究的基础和核心。
在转换分子名称时,模型必须在不同的分子表示形式(例如SMILES、IUPAC 名称和分子式)之间准确转换。
在预测分子特性时,模型必须根据分子的结构和组成来预测化学特性,例如沸点、密度和溶解度。
在预测反应产物时,模型必须根据指定的反应物和反应条件预测反应产物的结构。
测试结果,PUCCO在这三项任务上分别获得了22.0、49.0和7.0的分数,远超同规模其他模型的水平,超过了GPT-3.5,表明PUCCO具有较高的理解力和能力。我已经证明了这一点。处理化学知识。
借助树胜普语2.0基础模型优秀的多语言能力,普科化学经过专业的化学知识培训,还拥有优秀的化学中英文翻译能力。这使得化学研究人员能够克服语言障碍,准确翻译化学领域的专有名词。化学文献以获得更多化学知识。
下图提供了Pulco Chemical Translation 于2024 年1 月16 日在期刊《自然·化学》 上发表的论文摘要。
在普科化学,除了专门的化学知识培训外,我们还提供初中和高中知识。对于初高中化学题,不仅可以简单回答,还可以给出具体的解释,如下图所示。
齐头并进:逻辑推理能力增强,泛科学能力显现。
特殊能力的增强是否是以牺牲其他能力为代价的呢?实践表明,PUC Chemical不仅在化学领域表现更好,在数学、物理、推理等方面的能力也得到了增强。
研究人员使用MMLU(大规模多任务语言理解数据集)作为测试集来评估PUK Chemical 在常见场景下的表现,测试和评估该语言模型的多任务处理能力,并与其他公司进行了比较。对模型进行比较,以评估化学训练数据对基础模型的影响。
根据评估结果,PUCCO Chemistry在大学化学任务中获得了47.0分,表现优于所有其他模型。这反映了您回答化学问题和处理复杂化学任务的能力。
研究人员还发现,该模型在大学数学、大学物理和STEM(科学、技术、工程和数学)类别等相关领域也取得了最好的成绩,尽管它没有接受过数学或物理方面的训练。我实现了。同时,PUCCO Chemicals 在形式逻辑任务上也达到了最高水平。上述结果表明,用化学训练大规模模型也可以增强其数学和推理能力。
有趣的是,PUC Chemical 在道德场景、人文和社会科学等子任务上也表现出了更好的平均表现。这表明,训练具有特定主题专业知识的大模型实际上并不会让大模型“分散”他们的道德水平和一般任务水平,而是会帮助你提高。
从个案推理:拓展大规模模型应用,培育科研新范式
针对大规模语言模型的化学专业训练不仅拓展了大规模模型的应用空间,也为科学人工智能相关研究开辟了新的探索途径。
上海AI for Science团队通过深入研究化学、物理、生命、地球等科学领域的基础理论和最新人工智能理论,探索人工智能研究范式。推进关键科学问题,加速人工智能在化学医药研发中的应用。新材料、气象等领域的渗透和落地,将促进各行业的发展。其中,化学人工智能研究以语言模型为核心,通过大规模模型连接智能实验设备,全方位提高实验效率,实现化学研究的自动化和智能化。相关研究范式的创新提高了科学发现的速度,实现了更大的社会效益。
未来,基于Pulco的化学模型,人工智能将智能支持化学研究,例如规划化学合成路线、优化化学反应条件、自动分析实验结果,从而提高化学研究的效率和质量。
(原标题:《上海AI实验室开源发布科学大模型“浦科化学”》)