2024生成式人工智能GenAI在生物医药大健康行业应用进展报告.pdf

资源描述

1、生成式人工智能(GenAI)在生物医药大健康行业应用进展报告生成式人工智能(GenAI)在生物医药大健康行业应用进展报告CMAC医学事务生成式AI联盟理特咨询天士力数智中药创新中心南京柯基数据科技有限公司2024年4月前言前言自2022年底起，OpenAI推出的ChatGPT在全球掀起了热潮。生成式人工智（GenAI）技术日新月异，各行各业正积极探索如何整合最新的GenAI技术以推动数字化转型。据统计，全球大型企业中，已有10%成功将GenAI技术应用于公司层面的平台级项目，50%正在进行小规模尝试，而另外40%仍在观望阶段。生物医药大健康行业作为一个高度专业化和知识密集型的领域。从药物研发到

2、临床试验，再到上市后的学术推广和患者教育等全流程应用场景，涉及到大量非结构化文本、图片和视频的处理。随着集采政策的实施和监管要求的提高，运营成本和复杂性不断上升，因此迫切需要借助人工智能来提升效率，重塑工作模式。自GenAI推出以来，国内外的药械、营养保健、医疗机构以及科研机构纷纷尝试将GenAI技术应用于不同场景，已经有一些公司和机构通过GenAI创造了全新的产品和服务，为业务增值。最近的一项调查显示，GenAI已成为大多数制药公司的首要关注点，40%的高管表示他们正计划将GenAI带来的成本节约重新投入到2024年的预算计划中。另外，60%的公司确立了使用GenAI来帮助企业降低成本或提高

3、生产效率的目标，其中75%的公司将其视为高管层和董事会的优先事项。2023年4月，CMAC牵头与跨国和国内生物制药企业、医药AI领先企业以及医学专家共同发布了ChatGPT背景下的医疗健康行业数字化转型新范式研究报告，引起了业界广泛关注。该报告结合行业实践和实际需求，从ChatGPT技术原理、技术发展、医疗健康行业国内外应用和研究进展，以及ChatGPT大模型在医药场景测试等角度，提出了ChatGPT大模型在医疗健康行业落地的挑战及可能的路径，为在ChatGPT背景下大模型如何赋能医疗健康行业数字化转型提供参考。在过去的一年中，CMAC医学事务生成式AI联盟与数十家跨国和国内的药械企业、营养保

4、健企业、医院、医疗科研机构等展开了深入合作。通过研讨会、咨询、概念验证（POC）、项目申报等形式，我们交流并见证了GenAI在国内生物医药大健康行业的快速发展和面临的挑战，积累了来自第一线的资料和GenAI应用落地的经验和方法论。我们相信，2024年将是GenAI在中国生物医药大健康行业中实现规模化落地的关键一年。因此CMAC医学事务生成式AI联盟牵头，联合理特咨询、天士力数智中药创新中心、柯基数据以及生物医药大健康行业专家和GenAI技术专家，更新发布了本报告。报告着重介绍了最新GenAI技术发展和进展，生物医药大健康行业的应用场景和案例，落地挑战及方法论，以及未来展望。我们希望该报告能为

5、GenAI在整个生物医药大健康行业的应用落地提供有益参考。12第一章 GenAI技术进展概述GenAI 应用进展情况第一章 GenAI技术进展概述GenAI 应用进展情况 GenAI技术定义及背景 GenAI应用领域与案例GenAI应用关键技术GenAI应用关键技术模型训练微调RAG提示词工程LangChainAI AgentGenAI大模型发展现状LangChainAI AgentGenAI大模型发展现状国外大模型国内大模型第二章 GenAI在生物医药大健康行业主要应用场景总览GenAI在生物医药大健康行业主要应用场景总览药物研发第二章 GenAI在生物医药大健康行业主要应用场景总览GenA

6、I在生物医药大健康行业主要应用场景总览药物研发靶点发现与验证分子生成中医药研发临床研究临床研究监管合规临床试验中心筛选药物选择、患者入组临床研究方案设计和试验报告生成药物警戒(PV)上市及商业化上市及商业化学术推广患者教育临床疾病诊疗临床疾病诊疗诊前诊中诊后中医诊疗现状总结第三章 GenAI在生物医药大健康行业的挑战、展望及落地建议面临挑战现状总结第三章 GenAI在生物医药大健康行业的挑战、展望及落地建议面临挑战数据合规性、符合医学逻辑及循证溯源监管合规性数据安全性及私有化部署场景选择和成本内部利益的协同未来展望落地建议未来展望落地建议捕捉变化，动态调整顶层设计，数智思维目标锚定，小步

7、快走能力构建，组织提质合作共行，优势互补4445889101316171818253233343436414444454546474848505050515254575859606060606061626262636464第一章：GenAI技术进展概述第一章：GenAI技术进展概述3Source:Arthur D.LittleFigure 1.GEMRIX 2023 findings生成式人工智能(GenAI)在生物医药大健康行业应用进展报告1.1 GenAI 应用进展情况1.1 GenAI 应用进展情况当OpenAI在2022年11月30日发布ChatGPT的时候，没有人会意识到，新一代人工

8、智能浪潮将在接下来短短数月给人类社会带来一场眩晕式的变革。自2010年代初深度学习问世以来，人工智能进入到第三次高潮。而2017年Transformer算法将深度学习推向了大模型时代。OpenAI基于Transformer的Decoder部分建立起来了GPT家族。ChatGPT一经面世便风靡全球，人们惊讶于其能够进行连贯、有深度对话的同时，也惊异地发现了它涌现了推理、思维链等体现智能的能力。伴随AI预训练大模型持续发展，生成式人工智能（GenAI）算法不断创新以及多模态AI日益主流化，以ChatGPT为代表的GenAI技术加速成为AI领域的最新发展方向，推动AI迎来下一个大发展、大繁荣的时代，

9、将对经济社会发展产生重大的影响。1.1.1 GenAI技术定义及背景1.1.1 GenAI技术定义及背景GenAI(Generative AI，生成式人工智能)指的是通过人工智能技术自动生成内容的生产方式。通过训练模型来生成新的、与训练数据相似的内容。与传统类型的AI主要关注识别和预测现有数据的模式不同，GenAI着重于创造新的、有创意的数据，其关键原理在于学习和理解数据的分布，进而生成具有相似特征的新数据，在文本、图像、音频、视频等多种领域都有广泛的应用。GenAI目前最引人注目的应用当属ChatGPT。ChatGPT是基于OpenAI公司的大语言模型GPT-3.5训练、调试、优化的聊天机器

10、人应用，同一个AI模型可以处理各种各样的文字和推理任务。ChatGPT发布仅两个月即获得1亿月活用户，超越了历史上所有互联网消费者应用软件的用户增长速度。以大语言模型、图像生成模型为代表的GenAI技术，成为新一代人工智能的平台型技术，助力不同行业实现价值跃升。GenAI大爆发的背后，普遍认为三个领域的AI技术的发展为其提供了肥沃的土壤，分别是生成算法、预训练模型和多模态技术。第一，随着各种生成算法的不断创新突破，AI现在已经可以生成文字、代码、图像、语音、视频物体等各种类型的内容和数据。GenAI与过去最显著的区别是从分析式 AI（Analytical AI）发展为生成式AI（Generat

11、ive AI）。分析式AI模型是根据已有数据进行分析、判断、预测，最典型的应用之一是内容智能推荐；生成式AI模型则是学习已有数据后进行演绎、生成创造全新内容。第二，预训练模型，特别是以ChatGPT为代表的大模型，引发了GenAI技术能力的质变。在过去，研究人员需要针对每一个类型的任务单独训练AI模型，训练好的模型只能从事特定任务，不具有通用性。而预训练的大模型技术显著提升了GenAI模型的通用化能力4和工业化水平，让GenAI模型成为自动化内容生产的“工厂”和“流水线”。GenAI模型，包括ChatGPT、GPT-4等大语言模型（Large Language Models，LLM）和Midj

12、ourney、Stable Diffusion等图像生成模型，又被称为基础模型（Foundation Models），其作为基于种类丰富的海量数据预训练的深度学习算法，展现出强大的、更加泛化的语言理解和内容生成能力。以大语言模型（LLM）为例，经过海量的互联网内容数据的训练，大语言模型的参数可以达到万亿甚至百万亿级别。这大大增强了语言模型的生成能力，同一个大语言模型可以高质量地完成各种各样的文字和推理任务，例如作诗、写文章、讲故事、写代码、提供专业知识等等。因此，大语言模型已经成为了各大企业竞相追逐的AI方向。第三，多模态AI技术的发展。多模态技术让GenAI模型可以跨模态地去生成各种类型的内

13、容，比如把文字转化为图片、视频（Sora）等等，进一步增强了GenAI模型的通用能力。1.1.2 GenAI应用领域与案例1.1.2 GenAI应用领域与案例（1）多模态内容生成（1）多模态内容生成A.文本生成领域A.文本生成领域自然语言生成是一种GenAI技术，可以生成逼真的自然语言文本。生成式AI可以编写文章、故事、诗歌等，为作家和内容创作者提供新的创作方式。同时，它还可以用于智能对话系统，提高用户与AI的交流体验。ChatGPT(全名:ChatGenerative Pre-trained Transformer对话生成式预训练变换模型)是由OpenAI开发的一个人工智能聊天机器人程序，

14、于2022年11月推出。该程序使用基于GPT-3.5架构的大语言模型并通过强化学习进行训练。ChatGPT 目前仍以文字方式互动，可以解决包括自动文本生成、自动问答、自动摘要等在内的多种任务。Jasper已经开始为谷歌、脸书等知名公司提供文案GenAI的商业服务。B.图像生成领域B.图像生成领域图像生成是GenAI技术中最为普遍的应用之一。Stability AI发布了稳定扩散（Stable Diffusion）模型，通过开源快速迭代大幅降低了AI绘画的技术使用门槛，消费者可以通过订阅旗下产品DreamStudio来输入文本提示词生成绘画作品，产品已经吸引全球 50多个国家超过100万的用户注

15、册。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告5C.音视频创作与生成C.音视频创作与生成2024年2月16日，OpenAI继一年前发布ChatGPT语言大模型之后，又发布了一款基于人工智能技术的视频生成工具Sora，再次引发轰动。这是一款输入文本即可自动生成高质量视频的文生视频大模型，实现了视频生成领域革命性变革，提供了全新的视觉体验。在部分样片中，Sora还展现了对“物理规律”超强的学习能力，如能够模拟现实环境中的重力、碰撞等物理现象，可以通过直播视频功能实时传递信息，用于直播秀、在线教育、远程医疗等场合。在“现实已经不存在”的惊呼声中，Sora确实打开了人类视频创作的新

16、天空，它将重塑视觉内容生成的未来，同时也反映出人工智能技术远超预期的快速进步。有媒体称，Sora 不仅仅是一个工具，更是一种新的生活方式，将会对整个社会产生重要影响。GenAI技术还可以用于语音合成，即生成逼真的语音。例如，通过学习人类的语音特征，生成式模型可以生成逼真的语音，从而用于虚拟助手、语音翻译等应用。GenAI技术可以用于生成音乐。生成式AI可以根据给定的风格和旋律创作新的音乐作品，为音乐家提供新的创作灵感。这种技术还可以帮助音乐家更有效地探索音乐风格和元素的组合。这些曲目可以用于音乐创作、广告音乐等应用。D.电影与游戏D.电影与游戏GenAI可以用于生成虚拟角色、场景和动画，为电

17、影和游戏制作带来更多的创意可能。此外，AI还可以根据用户的喜好和行为生成个性化的故事情节和游戏体验。2023年3月，腾讯AI Lab在GDC上提出了3D虚拟场景自动生成解决方案，能够帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市，提升3D虚拟场景的生产效率。其中重点分享了城市布局生成、建筑外观生成和室内映射生成三大能力。整个路网生成和微调过程仅需要不到30分钟，相比手动设计效率提升近100倍；而单个独特建筑的制作时间也降低至17.5分钟，大大提升了场景制作的效率。E.代码生成领域E.代码生成领域经过自然语言和数十亿行代码的训练。部分GenAI模型精通十几种语言，包括Python、Ja

18、vaScript、Go、Perl、PHP、Ruby等等。能够根据自然语言的指令生成相应的代码。GitHub Copilot是一个GitHub和OpenAI合作产生的AI代码生成工具，可根据命名或者正在编辑的代码上下文为开发者提供代码建议。官方介绍其已经接受了来自GitHub 上公开可用存储库的数十亿行代码的训练，支持大多数编程语言。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告6(2)翻译(2)翻译GenAI可以直接应用于翻译实践之中，与传统机器翻译系统采用以句子为单位的方式训练不同，大语言模型采用以单词为单位的方式进行训练。这使得大语言模型可以理解并再现单词之间的连贯性和上下文

19、信息，译文因而更加自然、准确。此外，传统机器翻译系统在遇到较为复杂的语言环境时，往往会出现句法和语义方面的错误，而大语言模型可以应付更为复杂的语言环境，产出更为准确、自然的译文。相比较而言，大语言模型在翻译方面展现的性能要比传统机器翻译更加突出，能够产出可与人工翻译译文相媲美的翻译作品。(3)内容理解与分析(3)内容理解与分析腾讯会议AI小助手：只需通过简单自然的会议指令，基于对会议内容的理解，就可以完成信息提取、内容分析、会管会控等多种复杂任务。会后可以自动生成智能总结摘要，还能基于智能录制的能力，帮助用户高效回顾，提升用户开会和信息流转效率。生成式人工智能(GenAI)在生物医药大健康行业

20、应用进展报告(4)科研与创新(AI for Science)(4)科研与创新(AI for Science)GenAI可以在化学、生物学、物理学等领域探索新的理论和实验方法，帮助科学家发现新的知识。此外，GenAI还可以用于药物设计、材料科学等领域，加速技术创新和发展。71.2 GenAI 应用关键技术1.2 GenAI 应用关键技术在GenAI领域中，有四种关键技术：模型训练(Model Training)、微调(Fine Tuning)、检索增强生成(RAG)和提示词工程(Prompt Engineering)。针对不同的业务目标和场景，选择适当的技术模型方法至关重要。1.模型训练(Mod

21、el Training)：1.模型训练(Model Training)：需要大量的数据和计算资源来从头构建一个人工智能模型。它具有高度的可定制性和可扩展性，但耗时较长，成本最高。适用于全新的突破性应用，例如训练一套中医诊疗大模型。2.微调(Fine-Tuning)：2.微调(Fine-Tuning)：专注于将现有模型适应特定任务，提供了定制性和效率之间的平衡。3.检索增强生成(Retrieval-Augmented Generation-RAG)：3.检索增强生成(Retrieval-Augmented Generation-RAG)：通过整合外部知识库来增强模型，非常适合需要当前或广泛信息的

22、任务，是现阶段企业级知识库以及Chatbot建设较高性价比的主要方法。4.提示工程(Prompt Engineering)：4.提示工程(Prompt Engineering)：依赖于设计有效的提示来引导预训练模型，需要在提示设计方面的技能，但计算资源需求较低。这种方法不仅具有成本效益，而且非常有效，然而其潜力经常被低估。每种方法在不同应用中都有其优势和限制，取决于数据可及性、计算资源、特定的任务、对最新信息的需求以及所需技能和成本等因素。1.2.1 模型训练1.2.1 模型训练模型训练类似于AI系统开发的基础阶段(例如重新开发一个ChatGPT)。它涉及从零开始构建AI模型的过程，类似于将种

23、子培育成长成一棵大树。这个过程非常重要，因为它奠定了AI的基本能力和智能。主要适用的场景包括：主要适用的场景包括：1.新领域：1.新领域：当涉足现有模型不适用或不足的领域时。例如，开发一种尚未被探索的新型医学诊断AI2.基于独特数据集应用：2.基于独特数据集应用：在数据对特定需求具有独特性的情况下，例如公司使用客户数据来预测购买模式。3.创新和研究：3.创新和研究：非常适合研究和开发，用于测试新理论或模型。模型训练是人工智能发展的基石，提供了无与伦比的定制化和创新潜力。然而，它需要大量数据和GPU计算资源和开发资源，成本很高，并带有固有的风险，因此更适用于需要定制解决方案或在人工智能应用领域开

24、辟新天地的情况。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告8生成式人工智能(GenAI)在生物医药大健康行业应用进展报告91 1.2 2.2.2 微微调调微调类似于磨练技艺娴熟的艺术家，使其在特定类型中表现出色。它涉及对经过预训练的模型进行调整，即对已经从大规模数据集中学到一般模式的模型进行专门任务或数据集方面的进一步提高。这一过程对于将通用人工智能模型适应特殊需求至关重要。例如基于医学文献训练微调成一套更适合回答健康护理相关的问题。微调主要的适用场景包括:微调主要的适用场景包括:1.特定任务应用：1.特定任务应用：适用于需要模型的一般理解与特定需求相匹配的任务，例如使语言模

25、型适应医学术语。2.2.有限资源：有限资源：适用于无法负担完整模型训练所需的大量资源的情况。3.提升模型性能：3.提升模型性能：当您需要提高预训练模型在特定领域准确性时。在 GenAI 中，微调是将通用模型转变为专业模型的艺术。它在效率和性能增强之间取得平衡，非常适合有针对性改进的场景。这种方法最适用于基础扎实但需要特定专业知识的情况。9-1.2.3 RAG1.2.3 RAG（1）RAG介绍（1）RAG介绍RAG，即检索增强生成（Retrieval-Augmented Generation），是一种结合了信息检索（Retrieval）和文本生成（Generation）的人工智能技术。RAG是G

26、enAI领域的重大进展，它通过整合外部知识源来增强传统的大语言模型(LLM)。这种方法拓宽了人工智能的视野，使其能够访问和利用除初始训练数据之外的大量信息。可以将 RAG 想象为一位学者，除了拥有自己的知识外，还可以即时访问到一座全面的图书馆。上图展示了RAG架构的工作流程，整体分为五步：上图展示了RAG架构的工作流程，整体分为五步：1.用户向Chatbot（LLM应用）提出问题2.根据问题在向量数据库(提前将知识库的文档向量化)检索匹配相关的上下文段落信息3.将检索结果的top_k条段落进行排序,，将提示词和组装的段落以及用户问题三者形成最终的提示词prompt4.将prompt提交给大模型

27、5.大模型生成输出并返回给Chatbot，进而返回给用户图1.RAG工作流程RAG的优势：RAG的优势：1.提高答案准确性：1.提高答案准确性：通过引用外部知识库中的信息，RAG可以提供更准确的回答2.增加用户信任：2.增加用户信任：用户可以通过引用的来源来验证答案的准确性3.便于知识更新和引入特定领域知识：3.便于知识更新和引入特定领域知识：RAG通过结合LLM的参数化知识和外部知识库的非参数化知识，有效地解决了知识更新的问题4.减少幻觉问题：4.减少幻觉问题：RAG能够减少语言模型中的幻觉问题，使生成的响应更准确、可靠生成式人工智能(GenAI)在生物医药大健康行业应用进展报告10RAG的

28、应用场景：RAG的应用场景：1.问答系统：1.问答系统：在问答系统中，RAG通过检索大量信息并生成精准、详细的答案，提高了回答的准确性和信息的丰富度2.内容创作：2.内容创作：RAG可以根据给定的主题或关键词生成丰富且有深度的文章，节省大量的时间和人力资源3.数据分析与挖掘：3.数据分析与挖掘：RAG能够在大规模数据集中快速检索信息，为数据分析提供了一个强大的工具RAG技术通过结合最新的大语言模型和外部知识库，为AI在自然语言处理领域的应用提供了新的可能性，尤其是在需要处理大量信息和提供准确回答的场景中在RAG的技术发展中，从技术角度，呈现出以下几种范式：在RAG的技术发展中，从技术角度，呈现

29、出以下几种范式：图2.RAG技术发展范式生成式人工智能(GenAI)在生物医药大健康行业应用进展报告11其中Graph RAG（Graph Retrieval-Augmented Generation）是一种结合知识图谱和图数据库的检索增强技术。它通过构建图模型的知识表达，将实体和关系之间的联系用图的形式进行展示，并利用大语言模型（Large Language Model,LLM）进行检索增强。Graph RAG的核心在于将知识图谱等价于一个超大规模的词汇表，其中实体和关系对应于单词，使得在检索时能够将实体和关系作为单元进行联合建模。Graph RAG的处理流程划分为两个主要阶段：Graph

30、RAG的处理流程划分为两个主要阶段：1.第一阶段，第一阶段，Index in time。该阶段中系统不仅将知识以图谱的形式进行存储，以便于后续的检索和引用，同时还会执行传统 RAG 流程中的 Split&Embedding操作。2.第二阶段，第二阶段，Query Time。Split&Embedding 的操作带来的最大益处在于能够迅速锁定与查询最为相关的知识点。此外，通过利用知识图谱（KG）中知识点之间的关联关系或语义链接，系统可以快速地识别出在语义层面上相关或接近的知识。这些知识点随后被提供给大语言模型，从而使其能够生成更为贴切的答案。同时，这一过程也有助于防止语言模型产生虚假或不合逻辑的

31、回答，提高了结果的可靠性。Graph RAG的主要特点：Graph RAG的主要特点：1.知识图谱集成：知识图谱集成：Graph RAG利用知识图谱来增强语言模型的理解能力，使得模型能够更好地理解实体间的关系和上下文信息。2.检索增强：检索增强：通过结合图数据库的查询能力，Graph RAG能够提供更准确、相关和多样化的信息来满足用户的需求。3.上下文学习：上下文学习：Graph RAG支持In-Context Learning，即在向模型提出问题时，提供相关的上下文信息作为背景知识，从而生成更符合预期的响应。4.处理复杂查询：处理复杂查询：Graph RAG特别适合处理复杂或多义词查询，因为

32、它能够利用知识图谱中的结构化信息来解决歧义问题。5.表达和推理能力提升：表达和推理能力提升：通过图技术构建的知识图谱，Graph RAG能够帮助大语言模型更好地理解实体间的关系，提升模型的表达和推理能力。6.适应性强：适应性强：Graph RAG技术可以适配不同的大语言模型框架，如LlamaIndex、LangChain等，使得开发者可以专注于LLM的编排逻辑和pipeline设计。Graph RAG作为一种新兴的技术，正在逐渐展现出其在信息检索和处理领域的潜力，尤其是在需要处理大量结构化数据和复杂上下文信息的场景中。随着技术的进一步发展，Graph RAG有望在更多领域得到应用和推广。生成式

33、人工智能(GenAI)在生物医药大健康行业应用进展报告121.2.4 提示词工程1.2.4 提示词工程提示词工程（PromptEngineering，缩写为PE）是一种AI技术，它通过设计和改进AI的提示词来提高AI的表现。PE关注提示词的开发和优化，帮助用户将大模型用于各场景和研究领域。提示词（prompt）在人工智能场景下指给模型的一个初始输入或提示，用于引导模型生成特定的输出。提示词可以是一个问题、一段文字描述，甚至可以是带有一堆参数的文字描述。AI模型会基于提示词所提供的信息，生成对应的文本，亦或者图片。比如，我们在ChatGPT中输入：中国的首都是什么？这个问题就是提示词。掌握了提示

34、词工程相关技能将有助于用户更好地了解大模型的能力和局限性。主要优点主要优点效率：效率：不需要额外的培训或计算资源，使其高效运作。灵活性：灵活性：可以适应各种任务而无需改变基础模型。创造力：创造力：允许对模型的输出进行高度创造性的控制。主要挑战主要挑战依赖技能：依赖技能：提示工程的有效性在很大程度上取决于用户构建有效提示的能力。试错：试错：通常涉及实验过程，可能耗时。(1)提示词技术包含要素：(1)提示词技术包含要素：A.指令，指令，想要模型执行的特定任务或指令。B.上下文，上下文，包含外部信息或额外的上下文信息，引导语言模型更好地响应。C.输入数据，输入数据，用户输入的内容或问题。D.输出指示

35、，输出指示，指定输出的类型或格式。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告图3.提示词工程原理13（2）提示词技术（2）提示词技术1.零样本提示(Zero-Shot Prompt)1.零样本提示(Zero-Shot Prompt)零样本提示是一种先进的自然语言处理技术，旨在让模型在没有先前见过的任务或领域中表现出色。通过零样本提示，模型能够根据用户提供的提示进行推理和生成，即使这些提示与训练数据中的内容没有直接关联。这一技术的核心思想在于通过广泛而有代表性的训练，使模型能够推广到新的输入领域，进而在没有样本支持的情况下作出准确的预测或生成。2.少样本提示(Few-Shot

36、Prompt)2.少样本提示(Few-Shot Prompt)虽然大语言模型展示了惊人的零样本能力，但在使用零样本设置时，它们在更复杂的任务上仍然表现不佳。少样本提示可以作为一种技术，以启用上下文学习。相对于零样本提示，少样本提示更专注于在有限的先验知识下进行任务推理和生成。通过少样本提示，模型可以在只有极少量相关样本的情况下，利用先前学到的知识来更好地理解和处理新的任务或领域。3.思维链(Chain-of-Thought,CoT)3.思维链(Chain-of-Thought,CoT)思维链提示是一种推理和生成的方法，通过将多个提示按照逻辑顺序连接在一起，引导模型实现更复杂的任务。这种方法通过

37、逐步提供信息，促使模型在每个步骤上下文中进行思考，逐渐构建起全局的理解。链式思考提示可以用于解决需要多步骤推理的问题，例如复杂的问题回答或创造性的文本生成。这种技术提供了更深入、更结构化的信息引导，从而增强了模型的表现能力。图4.提示词工程生成式人工智能(GenAI)在生物医药大健康行业应用进展报告14GenAI应用技术的选择方法可以类比于在道路建设中选择最佳路线：GenAI应用技术的选择方法可以类比于在道路建设中选择最佳路线：1.模型训练：模型训练：这相当于修建一条新的道路。它是一个需要大量资源、时间和数据投入的过程。虽然为创建高度定制和强大的人工智能模型铺平了道路，但这是一个庞大的任务，不

38、总是必要或可行的。2.微调：微调：这种方法类似于修改现有的道路。在这里，您从一个预先存在的模型（道路）开始，并进行特定的调整，以更好地适应您的需求。它比修建新道路所需的资源要少，并且可以非常有效，但仍受限于原始模型的局限性。3.检索增强生成（RAG）：检索增强生成（RAG）：将RAG与这个类比相结合，就好像给道路配备了动态标志，可以从各个位置获取信息。RAG结合了预训练模型的优点和获取和整合外部最新信息的能力。与模型训练和微调相比，它更具灵活性，可以适应新的信息。但是，其效率取决于外部数据源的整合和处理，这可能需要大量资源。是现阶段企业级GenAI知识库建设和Chatbot应用的性价比较高的主

39、流方法。4.提示工程：提示工程：这种方法就像找到一个聪明的捷径。它涉及使用智能、有策略的提示来引导预训练的人工智能模型产生期望的结果。这种方法快速、灵活且资源高效，可以利用先进的人工智能模型的能力，而无需大量数据、计算能力或时间。这是一种创新的方式来应用人工智能的能力，往往能够以最小的投入取得令人印象深刻的成果。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告图5.从复杂度和成本以及质量等多维度综合考虑的实际应用路径151.2.5 LangChain1.2.5 LangChain在人工智能领域，大语言模型（LLMs）如GPT-3.5和GPT-4等已经成为了自然语言处理（NLP）的强

40、大工具。它们能够生成连贯的文本、回答问题、甚至创作诗歌和故事。然而，尽管这些模型在处理语言方面表现出色，但它们在实际应用中的潜力仍然受限。为了克服这些限制并充分发挥LLMs的能力，LangChain应运而生。LangChain是哈里森-蔡斯（Harrison Chase）于2022年10月发起的一个基于LLM的应用开发框架开源项目，是目前大模型应用开发的最主流框架之一。它提供了一套工具和组件，使得开发者能够将LLMs与外部数据源和计算能力结合起来，从而创建更加智能和功能丰富的应用。LangChain围绕将不同组件“链接”在一起的核心概念构建，通过统一的接口简化了与 GPT-3.5、GPT-4、

41、llama、文心一言、通义千问等 LLM 合作的过程，使得开发者可以轻松创建定制的高级用例。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告图6.LangChain工作机制截至2024年3月，LangChain平台已实现了与包括亚马逊、谷歌及微软Azure在内的主流云存储系统的深度整合，并且封装了涵盖新闻资讯、影视资料和气象信息的多样化API接口。此外，LangChain提供了对Google Drive文档、电子表格及演示文稿内容的自动化总结、抽取与创建能力；同时涵盖了Google搜索与Microsoft Bing搜索引擎的网络信息检索功能。在自然语言处理领域，它成功对接了O

42、penAI、Anthropic 和 Hugging Face等多家知名机构的语言模型资源。在编程与代码管理方面，LangChain支持Python与JavaScript代码的自动生成、静态分析与调试功能，并采用Milvus与Weaviate向量数据库系统分别用于存储与检索高维向量嵌入及缓存相关对象。为加速数据访问性能，系统配备了Redis作为缓存数据存储方案，并通过Python Requests Wrapper及其他API请求手段确保了与各类服务的无缝交互。在并发处理层面，该平台能够实时追踪并记录线程与异步子进程运行中的堆栈符号信息。截至2024年3月，LangChain已具备读取超过50

43、种不同文档类型和数据源的强大能力，展现出广泛的应用潜力和卓越的技术适应性。161.2.6 AI Agent1.2.6 AI AgentAI Agent，即人工智能代理，是一种具备环境感知、决策制定和行动执行能力的智能体，也被称为“智能业务助理”。其旨在利用大模型技术，通过自然语言交互方式高度自动化地处理专业或复杂工作任务，从而显著减轻人力负担。在本质上，AI Agent是建立在大语言模型之上的智能应用，即在大模型的基础上运行的应用程序。AI Agent不仅限于对话交流，还能整合外部工具，直接完成各种任务。一个基于大模型的AI Agent系统可分为四个组件部分：大模型、规划、记忆和工具使用，对应

44、需要四个能力：包含大语言模型能力、具体拆解问题的能力、具有长短期记忆控制的能力、以及具有调用外部工具的能力。AI Agent有望开启新时代，其基础架构可简单划分为Agent=LLM+规划技能+记忆+工具使用。在这一结构中，LLM充当Agent的“大脑”，为系统提供推理、规划等关键能力。本文着重介绍了基于LLM的Agent的整体概念框架，包括大脑、感知和行动三个关键部分。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告图7.Agent智能体AutoGPT原理介绍171.3 GenAI大模型发展现状1.3 GenAI大模型发展现状1.3.1 国外大模型1.3.1 国外大模型（1）Cha

45、tGPT（1）ChatGPTChatGPT（Chat Generative Pre-trained Transformer）是由OpenAI研发的一款聊天机器人程序，于2022年11月30日发布。它是基于GPT-3.5模型的一个专门优化用于对话生成的语言模型。ChatGPT能够根据用户输入的文本产生智能化的回答，并且具备连续对话的能力，能够捕捉用户的意图，理解上下文，并在多轮对话中提高准确率。截至2023年12月，ChatGPT已无可争议地成为全球范围内增长速度空前的消费级软件应用典范，其用户基数在以突破1.8亿大关，并在此背景下，促使OpenAI公司的估值跃升至800亿美元的新高度。Chat

46、GPT这一划时代产品的发布不仅引发了全球科技界的广泛关注，还强有力地激发了市场对同类竞品的研发热潮，诸如Gemini、ErnieBot、LLaMA 以及Claude等项目应运而生。值得注意的是，ChatGPT在线服务提供了两个迭代版本，分别基于GPT-3.5和更为先进的GPT-4架构构建而成。这两个版本均隶属于OpenAI专有的生成预训练转换器（Generative Pre-trained Transformer，GPT）模型系列，该系列的设计灵感与核心技术基础源自谷歌所研发的Transformer架构。为了满足不同用户的需求，ChatGPT 允许普通用户免费体验基于GPT-3.5版本的服务；

47、而对于追求更高级功能和持续更新内容的用户，则通过商业化品牌“Chat GPT Plus”提供基于GPT-4版本及其后续优化功能的付费订阅服务。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告图8.ChatGPT18生成式人工智能(GenAI)在生物医药大健康行业应用进展报告（2）Gemini（2）GeminiGemini 是由Google DeepMind团队研发的人工智能模型，是LaMDA和PaLM2的继任者，于2023年12月6日发布。这是一个多模态模型家族，支持文本、图像、音频、视频和代码的全方位理解和生成。Gemini模型家族包含三个针对不同应用场景优化的版本：Gemini

48、 Ultra作为旗舰版，专为数据中心级别的高性能计算环境设计；Gemini Pro则定位为通用型解决方案，能在多种工作任务上展现高效性能，并且特别适用于企业级应用及云端服务；而小巧灵活的Gemini Nano，则通过高度优化实现了在资源受限的移动设备上的高效运行，为智能手机和平板电脑等移动平台带来了强大且实时的AI交互体验。Gemini的设计使其能够原生地支持多模态能力，即从一开始就在不同模态上进行预训练，并利用额外的多模态数据进行微调，以提高其有效性。（3）Claude（3）ClaudeClaude是由美国人工智能初创公司Anthropic开发的大语言模型，Anthropic成立于2021年

49、，是一家专注于人工智能安全和研究的公司，旨在建立可靠、可解释、可操纵的人工智能系统。Claude模型提供了API和Slack机器人两种访问方式，其中API访问需要申请并通过后才能使用，而Slack机器人目前处于beta版本，不收费。Claude是由Anthropic公司于2023年3月首次推出的语言模型系列的初代版本，尽管在编码、数学推理等方面尚存在一定的性能局限性，但依然在执行多样化任务上展现出了显著的能力。针对用户的不同需求，Claude推出了两种优化版本：常规版Claude和响应速度更快、成本更低廉、运行更为轻巧的Claude Instant。后者将输入上下文的处理能力提升至容纳10万t

50、oken，约等同于7.5万个英文单词的内容量。同年7月11日，Anthropic发布了Claude系列的重要迭代产品Claude2，该版本对公众开放使用，而其前身Claude1则仅限于经Anthropic审核批准的特定用户群体。Claude2实现了一次重大飞跃，将上下文窗口从原来的9,000个token扩展到了10万个token，并新增了上传PDF和其他文档的功能，使得Claude能够阅读、总结文件内容并辅助完成相关任务。11月份发布的Claude2.1版本中，聊天机器人的处理能力再度翻倍，token扩大至20万个，相当于500页的书面材料。Anthropic在2024年3月4日正式推出了革新

展开阅读全文