收藏 分销(赏)

基于ChatGPT信息增益的男性不育研究热点和趋势评估.pdf

上传人:自信****多点 文档编号:3004936 上传时间:2024-06-12 格式:PDF 页数:8 大小:4.71MB
下载 相关 举报
基于ChatGPT信息增益的男性不育研究热点和趋势评估.pdf_第1页
第1页 / 共8页
基于ChatGPT信息增益的男性不育研究热点和趋势评估.pdf_第2页
第2页 / 共8页
基于ChatGPT信息增益的男性不育研究热点和趋势评估.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于 信息增益的男性不育研究热点和趋势评估陆俊宇王姣刘行云何孟桥吴蓉蓉詹超英陈俐鲭张影波,沈百荣(四川大学华西临床医学院 华西医院成都 中国热带农业科学院热带作物品种资源研究所海口 )摘要目的 意义 探索包括 在内的大语言模型辅助决策系统的应用潜力,以实现其在临床转化,分析 信息增益对男性不育研究热点总结和趋势评估的效果。方法 过程 基于 数据库,运用文献计量学、主题建模、“问 答”咨询等方法,分析文献证据和 虚拟数据下男性不育研究的主题差异。结果 结论 男性不育研究主题从单一转多元,“病例发现”“激素诊断”“精子提取”“遗传标志鉴定”等成为研究热点。应用 可补充文献计量学与主题建模证据,有效

2、探索男性不育研究热点和趋势。关键词男性不育;文献计量学;主题建模;信息增益;人工智能 中图分类号 文献标识码 ,;,(),“”,“”,“”,“”“”,;修回日期 作者简介陆俊宇,本科生;通信作者:沈百荣,教授,博士生导师。基金项目国家自然科学基金面上项目(项目编号:)。引言近年来,由于全球环境恶化和局部污染加剧,男性不育发病率急剧上升,已成为全球性公共健康问题,影响 有生育愿望的夫妇 。男性不育医学信息学杂志 年第 卷第 期 ,的病因和发病机制因精子生成的复杂性而尚不完全清晰 。生物医学文献是医学信息挖掘和临床应用的宝贵资源 。高通量测序技术,如基因组测序、转录组测序、甲基化测序等技术已经广泛

3、用于男性不育症的研究和疾病标志物的发现,有效补充了男性不育症相关知识 。因此,挖掘现有医学文献中的数据资源,不仅对构建知识库、知识图谱、聊天机器人和临床决策支持系统等专业知识工程具有重要价值,也对深入了解男性不育症的研究局限和未来发展趋势具有重要意义。探讨人工智能在医学决策辅助系统中的应用是实现其临床转化的重要途径之一。年 作为标志性大型语言模型(,)崭露头角 。其问世对放射学、牙科学、耳鼻喉科等学科都产生深远影响,有学者 认为 可能改变当前医学教育和实践模式。然而,也有观点认为,作为一个广义生成模型,的所有理解和推断都是基础性的,其主要用于基本知识的查询与推导,而不太可能提供创新性的见解。在

4、某些专业领域,其表现可能无法超越现有人工智能模型 。为了深入理解 在生殖医学文献,特别是男性不育领域的整合与总结能力,本研究选取 数据库作为主要数据来源。以“无精子症”“少精子症”“弱精子症”个男性不育的核心词为检索关键词,首先采用文献计量学、主题建模探索真实世界下男性不育研究的热点与趋势。其次,利用 探索虚拟世界下男性不育研究的热点与趋势。最后,通过对比分析,探索 在文献热点总结和趋势评估中的信息增强能力。研究方法 文献检索与基础数据收集 数据库是 出版集团旗下的引文数据库,因其所收录文献均经过严格的同行评审,受到业界广泛认可与关注。以男性不育研究的高频词“”“”和“”为检索关键词,筛选出题

5、目中包含这些关键词的相关文献。本研究的目标专注于英文文献,另外排除通讯、评论、勘误等类文章。同时,聚焦以人为对象的科学文献。导出“”格式引文记录数据,包括引文基本信息,如作者、标题、发表年份、期刊来源等,还包括作者提供的关键词、摘要、第一作者单位、通信作者单位等信息。文献计量学分析首先借助 包提供的文献计量学函数,分析年度发文量、前 发文机构、前 发文期刊、前 作者排名(以 指数为度量指标)、前 作者文献产出年度变化等指标 。其次,为了评估期刊对男性不育领域发展的贡献能力,基于影响力指数()计算各期刊贡献度。计算方式如下:其中 是期刊引文指数,代表该期刊近 年发表文章平均引用次数,其数据来源于

6、 数据库;源于本研究中该期刊的发文记录数目。基于隐含狄利克雷分布主题建模分析方法的男性不育研究热点分析主题建模分析是探索学科研究热点和趋势最常用的方法,尝试以隐含狄利克雷分布(,)为研究方法探索男性不育研究的热点和趋势。以男性不育医学文献摘要作为数据源构建语料库,首先排除数字、连接符、连词等,使用 包构建语料库 。其次,采用 等描述的基于吉布斯抽样法的 方法主题建模 ,其中最佳聚类数目的选择采用梯度上升法,其聚类范围设置 ,并以对数转化似然概率为最终聚类数目优选指标。最后,以最优聚类数目进行 方法主题建模,其参数采用 包默认参数,其中迭代次数设定为 次,抽样次数为 次,检验频率设为每 代进行一

7、次,同时丢弃前 次抽样结果 。基于 增益的男性不育研究主题和热点分析为了探索 在男性不育文献分析中的增医学信息学杂志 年第 卷第 期 ,益效果,研究对比基于真实世界(文献)和虚拟世界()下男性不育研究中的主题和热点差异性。采用“当前男性不育研究的热点”作为查询问题,将问题输入 后提取研究热点关键词。比较基于文献数据和 提供的关键词间的重合度,以评估 在男性不育研究主题和热点分析中的增益效果。为确保分析结果的可靠性,对问题进行 次重复查询。数据统计与可视化上述数据分析和可视化均在 语言环境中完成 。使用 包进行文献计量学基本分析 。主题建模则采用 包的 方法 。在数据预处理和语料库构建过程中,还

8、使用了 包 和 包 等。而可视化结果的呈现主要依赖于 包 和 包 。结果 基于文献计量学证据的男性不育研究热点分析截至 年 月 日,共从 数据库检索到 篇题目中包含“”“”及“”的科学文献,经排除非文稿型、非英语型和不以人为研究对象的文献后,最后纳入 篇男性不育关联论文,包括 篇研究性论文、篇综述性论文、篇会议论文和 篇书籍章节。基于计年数据的男性不育发文量计量分析依据计年数目,男性不育科学文献数目从 年的每年 篇,提升至 年的每年 篇,其中文献数目年增长率为 。分析文献年增长速率发现,世纪 年代和 年左右呈现两次近指数增长期,推测其分别与核酸检测史上的两次重大科技变革,即聚合酶链式反应(,)

9、检测技术和高通量测序技术发展有关,见图 。对男性不育学科分析发现,“少精子症”“无精子症”和“弱精子”相关男性不育文献主要发表于医学()、生化与分子生 物 学()、多 学 科()、药 学()、农学(),其他学科如化学、环境科学等占比 ,见图 。图 基于计年数据的男性不育发文量计量分析注:为 年男性不育科学文献量;为男性不育总发文的主题分类。基于计年数据的男性不育顶尖学者分析对男性不育作者影响力的数据分析发现,在学术影响力排名前 位的学者中有 位来自中国,包括张远伟(中国科学技术大学)、王沂峰(南方医科大学)等。对张远伟发文数量分析发现,近年其在男性领域相关研究的影响力排名第 位,总发文 篇(均

10、为多作者协作类文章),其中以第 作者发文 篇。在男性不育研究领域国际专家中,以巴西男性生殖中心的 和康奈尔大学的 最负盛名。的学术影响力为 ,发文总数量为 篇,居首位,其中 篇独作文章和 篇多作者文章(其中 篇为多作者文章的第 作者)。发表男性领域相关学术文章 篇(其中 篇独作文章和 篇多作者文章),排名第位。此外,对比中国和国际学者的发文情况发现,国际学者如 和 的发文情况中不仅包括多作者文章,还包括独作文章;而中国学者则多以团队协作的形式发文,见表 。医学信息学杂志 年第 卷第 期 ,表 基于计年数据的男性不育顶尖学者及其协作网络分析排名作者国家 地区单位影响力分数(分)文章总数(篇)独作

11、文章数(篇)多作者文章数(篇)多作者文章中第 作者文章数(篇)巴西男性生殖中心 张远伟中国中国科学技术大学 中国北京大学 王沂峰中国南方医科大学 李红钢中国北京大学 美国康奈尔大学 张欣宗中国广东省精子库 张洪亮中国北京大学 刘见桥中国广州医科大学 李铮中国上海交通大学 基于发文国家 地区差异性的主发文单位分析对发文的国家 地区分析发现,中国、美国、日本、意大利、英国等占据主要地位,见图。对发文量排名前 位(总发文 篇,占男性不育总发文量的 )的研究机构分析发现,中国共有 家单位上榜,即南京医科大学、上海交通大学、华中科技大学、香港中文大学和安徽医科大学,其排名分别为第 位、第 位、第 位、第

12、 位和第 位。美国康奈尔大学和克利夫兰诊所基金会分别以 篇和 篇总发文量,占据第位和第 位。此外伊朗教育、文化和研究学术中心、罗扬研究所和埃及开罗大学表现良好,其分别位于第 位、第 位和第 位,见表 。图 基于发文国家 地区差异的男性不育发文特征分析表 基于发文总量的学术机构排名排名归属机构国家地区发文数量(篇)南京医科大学中国 美国康奈尔大学美国 上海交通大学中国 华中科技大学中国 伊朗教育、文化和研究学术中心伊朗 香港中文大学中国 开罗大学埃及 克利夫兰诊所基金会美国 安徽医科大学中国 罗扬研究所伊朗 基于发文数量和影响力指数的期刊影响力分析对男性不育期刊发文总量和学科影响力分析发现,、和

13、 是男性不育研究领域发文数量最高的期刊,其发文量分别为 篇、篇和 篇。以影响因子、年影响因子和期刊引用指数为指标,、和 是男性不育研究领域最重要的期刊。综合分析发文数量和期刊影响力发现,、和 是男医学信息学杂志 年第 卷第 期 ,性不育研究领域最重要的期刊,其影响力指数分别 、和 ,见表 。表 基于发文总量和期刊影响力的男性不育研究排序期刊发文数量(篇)期刊影响力影响因子年影响因子 影响力指数 注:表示期刊引用指数,代表该期刊近 年文章的平均引用次数。数据来源于 数据库。基于主题建模的男性不育研究热点和趋势分析经模型参数优化后,发现当聚类数设置为 时,其呈现的主题分布最符合男性不育研究趋势分布

14、状况,见图 。其中主题 以“”“”等为主题关键词,表明该主题以病例研究为主要研究方式,探索输精小管阻塞患者中的精子数量或功能变化。主题 以“”和“”为关键词,表明该主题主要探索促卵泡生成激素(,)在精子数量或功能异常中的作用。主题 以“”“”和“”为关键词,表明该主题主要探索非阻塞性无精子症患者中的基因表达模式或标志物。主题 与主题 的关键词类似,以“”“”和“”为关键词,但是“”和“”等关键词比例明显增加,表明该主题研究方向以“”含量的高低探索基因表达变化。主题 以“”和“”为主题关键词,表明该主题主要探索脱氧核糖核酸(,)突变对非阻塞性无精子症的影响。主题 以“”“”“”和“”为关键词,表

15、明该主题以类群或队列为研究对象,探索精子活性或数量。主题 以“”“”“”和“”为主题关键词,表明该主题主要探索生精基因 的缺失或部分缺失对男性不育的影响。主题以“”“”和“”为关键词,表明该主题主要探索活性精子比例对卵胞浆内单精子注射结局的影响。主题 与主题 类似,但是增加了“”“”等关键词比例,表明该主题不仅研究促卵泡生成激素对男性不育的影响,还增加了与其他激素检测比例。主题 则以“”“”“”和“”为关键词,表明该主题主要探索基因型或 位点对非阻塞性无精子症的影响。主题 则以“”“”“”和“”为关键词,表明该主题主要探索非阻塞性无精子症患者中睾丸精子提取术。主题 则以“”“”“”和“”为关键

16、词,表明该主题以白蛋白数量为指标,探索精浆中免疫细胞对精子数量或功能的影响。主题 以“”“”“”和“”为关键词,表明该主题以探索男性不育患者中的精子质量、数量或功能异常为主要内容。主题 以“”和“”为主题关键词,表明该主题以男性不育患者中睾丸活检为主要检验方法,探索睾丸中各生精细胞数量和比例对不育结局的影响。主题 以“”“”和“”为关键词,表明医学信息学杂志 年第 卷第 期 ,该主题主要探索 变异在患者类群中的比例。对主题的时间分布规律研究发现,男性不育的主题分布呈现由简单到多样化的变化历程。如 世纪 年代,男性不育研究的主题主要是“睾丸组织活检”和“非阻塞性无精子症蛋白含量检测”。进入 世纪

17、 年代,随着 技术及色谱技术发展,基因变异检测和激素含量高低成为男性不育患者的常用检测方法,其中主题、主题、主题和主题等明显增加。进入 世纪后,尤其是 年以后,以“转录组”“蛋白组”和“全基因组测序”等为代表的组学技术被广泛应用于男性不育研究,男性不育研究呈现多样化的趋势。图 基于隐含狄利克雷分布的男性不育趋势分析注:为主题距离分布图;为基于 分析的主题及其关键词频率;为不同主题随时间分布的变化规律。医学信息学杂志 年第 卷第 期 ,基于 增益的男性不育研究热点分析 是人工智能领域的超级工具,被证实具有趋势总结能力。为了探索 在男性不育研究中的增益效果,尝试以“问 答”形式探索 在男性不育研究

18、热点中的增益效果。结果表明,共回答了 个男性不育研究的热点问题,其中对男性不育的风险因素方面,提及“环境暴露”“遗传因素”“表观遗传因素”“激素不平衡”“免疫因素”等对精子数量、质量与功能的影响;对于男性不育治疗和预防,提及“干细胞疗法”“非侵入性辅助生殖”“出生控制”和“育性保护”等不育治疗方案和预防策略;对男性不育研究的政策性指导,提及“精准医学”“人工智能”“道德和法律”“男性不育的社会和心理因素”等发展方向和策略,见表 。表 基于 增益的男性不育研究热点评估主题主题解释推荐次数环境暴露调查内分泌干扰化学物质、生活方式等对男性生殖健康的影响干细胞探索干细胞在男性不育症治疗中的应用潜力激素

19、不平衡探索激素在男性不育症中的作用,发展激素治疗非侵入性辅助生殖发展和改进辅助生殖技术(,),如胞浆内单精子注射(,)和睾丸精子提取(,)男性出生控制研究男性避孕的新方法表观遗传探索精子的表观遗传修饰如何影响生育能力和后代健康社会和心理因素探讨男性不育对个人和夫妇的心理影响精子健康和质量了解影响精子质量的因素以及改善精子质量的方法不育遗传学研究导致男性不育的遗传因素和潜在的基因治疗或干预精准医学根据个人的遗传等特征定制不育症治疗策略,以优化结果人工智能使用人工智能和机器学习算法分析精子质量和生育结果预测育性保护保留男性生育能力的技术研究不育中的免疫因素了解免疫系统在男性不育症中的作用和潜在的免

20、疫治疗道德和法律讨论有关生育治疗、精子捐赠和基因检测的伦理和法律问题男性避孕不断努力开发安全、有效、可逆的男性避孕新方法 讨论近年来,伴随着高通量测序技术发展和不育人数的持续攀升,不孕不育研究相关文献呈现出近指数的速率增长。为了探索和对比基于真实世界(文献)数据和虚拟世界()数据下男性不育研究中主题和热点的差异性,以“无精子症”“少精子症”和“弱精子症”为题目关键词,共从 数据库检索到 篇男性不育研究相关科学文献。进一步的文献计量学和主题建模分析显示,男性不育相关研究经历了从简单到多样化的变化历程,其中“阻塞性不育患者的病例发现”“激素在不孕不育及单精子注入患者中的价值”“非阻塞性无精子症患者

21、中睾丸精子提取术”等是男性不育研究领域的热点问题。基于 “问 答”系统,获取包括“环境暴露”“干细胞”“激素不平衡”等 个男性不育研究热点。对比基于文献证据和 “问 答”结果分析发现,的回答不仅能涵盖“环境暴露”“遗传因素”“表观遗传因素”“激素不平衡”等因素对精子数量、质量与功能的影响,还兼顾了“精准医学”“人工智能”“育性保护”等文献数据报道较少的证据,所以 是探索和了解学科研究趋势和热点的效果增益工具,其对快速了解学科方向、制订学科发展策略具有重要的应用潜力。但由于 训练时的语料库主要来源为网络文本语料库、现有图书和维基百科医学信息学杂志 年第 卷第 期 ,等,而并非源于专业男性不育医学

22、文献,其在回答男性不育研究的热点问题时具有泛化性而缺乏专业性,如 高频推荐了“环境暴露”“干细胞”“激素不平衡”“非侵入性辅助生殖”“男性出生控制”“表观遗传”和“精子健康和质量”等男性不育研究热点问题,但对“精准医学”“人工智能”等真实世界(文献)数据的推荐频次较少,突显出 医学问题回答的偶然性。因此,探索将 与专业知识库相结合的垂直 将有助于提升相关医学问题回答的专业性和准确性。结语探索大语言模型在辅助决系统中的应用潜力是实现其临床转化的重要途径。本研究以男性不育问题为研究对象,对比真实世界(文献证据)和虚拟世界(总结)下男性不育的热点。结果表明 不仅覆盖“环境”“遗传”“激素不平衡”等风

23、险因素对男性不育负面影响的热点问题,还突显了文献证据下因文献数量较少而无法重点显示的“精准医学”“育性保护”等热点问题,等大语言模型工具是传统文献计量学的有效补充,有助于探索男性不育研究热点和趋势。但是在研究中也发现 在回答医学问题时的随机性和偶然性,其无法有效提供可实现临床转化的数据证据。此外,本研究还存在局限性,即所有证据依赖于对临床文献的总结和大语言模型的系统总结。而在真实世界,技术的革新、诊断或预测模型的开展、标准或工具的开发将会对学科发展产生极大的促进作用,后续研究将会重点关注男性不育领域的技术革新、诊断或预测模型的开展、标准或工具的开发,以期为揭示男性不育文献、工具、模型的演化规律奠定基础。利益声明:所有作者均声明不存在利益冲突。参考文献 ,():,:,():,():,():张影波,詹超英,王姣,等 精子表型异常的生物信息学研究:现状与未来趋势 中国科学:生命科学,():,():,():,:,():,():,:,():,:,:,():,:,():,:,:,():医学信息学杂志 年第 卷第 期 ,

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服