用ChatGPT协助开展科研工作2

书接前回,继续聊用 ChatGPT助力科研。

Kung 和 Cheatham 等人(2022)评估了大型语言模型ChatGPT在美国医学执照考试(USMLE)中的表现,该考试由三个考试组成:步骤1、步骤2CK和步骤3。

ChatGPT在没有任何专门训练或强化的情况下,在所有三次考试中的表现都达到或接近通过门槛。

此外,ChatGPT在其解释中表现出高水平的一致性和洞察力。

这些结果表明,大型语言模型有可能协助医学教育,甚至有可能协助临床决策。

这个,在之前的一篇推文 《ChatGPT通过医师资格考试》中有较为详细的介绍,这里就不再赘述了!

Photo by Kelly Sikkema on Unsplash

Alshater (2022)认为,ChatGPT应该对科学研究工作有帮助,尤其是用于构建研究性研究中所涉及的一系列任务,但是,并没有实证验证。

就目前而言,在可见的报道中,将ChatGPT应用于科学研究的实践探索大多集中在研究摘要的创建和文献综述方面。

在社交媒体上,可以看到很多有关帮助研究人员进行文献综述、摘要创建、题目拟定方面的提示语设计,这些提示语可以帮助研究人员快速地将 ChatGPT整合到自己的研究工作中。

但是,实证的研究报告正在迅速增加中。

例如,Aydin 和 Karaarslan (2022)试图创建一个适合学术期刊的医疗保健方面的文献综述,结果发现,尽管ChatGPT可以帮助生成文献综述,但是,可能存在相当大的“剽窃”嫌疑,或给予了糟糕的释义。

自留地君曾有一篇《ChatGPT:信息素养研究综述》,就是利用 ChatGPT生成的。尽管可以快速获取一部分文献和信息,但总体感觉平淡无奇。

GAO等人 (2022)发现,尽管ChatGPT所生成的摘要可以通过AI 生成文字识别系统鉴别为由 AI 平台生成的,但是,它确实可以在没有明显剽窃痕迹的情况下生成新颖的论文摘要。

Chen 和 Eger (2022)还探讨了学术论文标题和摘要的生成方面的可能性。

在金融领域,Wenzlaff 和 Spaeth (2022)发现,ChatGPT能够对新的金融概念生成合理的、学术上适当的概念界定。 

通过展示该平台可以作为对开放性文本调查结果评分的一个补充,Mellon 等人 (2022)探讨了ChatGPT在研究测试方面的一个应用。

虽然Adesso (2022)使用 GPT3 撰写了一篇完整的物理学论文, “按原样”提交给了期刊, Zhai (2022)也尝试创建研究论文的大纲。

根据金融期刊审稿人对生成输出的评级,Dowling 和 Lucey(2023)发现, AI 聊天机器人 ChatGPT 可以显著协助金融研究。并且,原则上,这些结果应该可以跨研究领域推广。

在Dowling 和 Lucey(2023)看来,在想法生成和数据识别方面,ChatGPT有明显的优势。然而,该技术在文献综述和开发适当的测试框架方面相对较弱。

之前,自留地君也曾报道过有报道的第一篇和ChatGPT联署的学术论文

Kung, T.H., Cheatham, M., Medenilla, A., Sillos, C., De Leon, L., Elepaño, C., Madriaga, M., Aggabao, R., Diaz-Candido, G., Maningo, J., & Tseng, V. (2022). Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models. PLOS Digital Health.

Alshater, M.M. (2022). Exploring the Role of Artificial Intelligence in Enhancing Academic Performance: A Case Study of ChatGPT. SSRN Electronic Journal.

Dowling, Michael M. and Lucey, Brian M., ChatGPT for (Finance) Research: The Bananarama Conjecture (January 11, 2023). 

Available at SSRN: https://ssrn.com/abstract=4322651 or

http://dx.doi.org/10.2139/ssrn.4322651

Gao, C.A., Howard, F.M., Markov, N.S., Dyer, E.C., Ramesh, S., Luo, Y., & Pearson, A.T. (2022). Comparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector, plagiarism detector, and blinded human reviewers. bioRxiv.