浅析建筑学科中的人工智能生成内容技术.pdf

资源描述

1、4时代建筑Time+Architecture2023/11.AI识别能力表现成长图2.AIGC生成的4种类型平面3.AIGC生成的未来曲线感森林社区4.AIGC生成的方案表现图5.AIGC草图生成表现图6.ChatGPT根据描述生成的python程序7.ChatGPT生成的python程序于rhino内的呈现8.ChatGPT根据需求调试9.ChatGPT修复的python程序于rhino内的呈现10.StableDiffusion模型学习Midjourney模型后生成的方案表现图11.方案模型截图12.SD实验过程界面13.基于StableDiffusion1.5生成的结果14.基于Anyt

2、hing4生成的结果15.基于ProtogenV22Anime_22生成的结果1.Al performanceonrecognition2.4typesof plangenerated byAIGC3.Curved-linecommunitiesdrewbyAIGC4.ArchitecturerenderingsdrewbyAIGC5.Renderingcreatedfrom sketchbyAIGC6.Pythonscript created byChatGPT7.Python script ran in Rhino Python8.Python script debug by ChatGP

3、T9.Debugged Python script ran in RhinoPython10.Rendering created by Stable Diffusion based on the modellearning from Midjourney11.Screenshotofdigitalmodel12.SDUIduringtheexperiment13.Result of StableDiffusion1.514.Result ofAnything415.ResultofProtogenV22Anime_22TestscoresoftheAlrelativetohumanperfor

4、mance+20AlsystemspertormbetterthanO+Humanperformance.asthebenchmark,issettozero.thehumanswhodidthesetestsAlsystemsperformworse-20-40Reading-60compre-hension-80HandwritingrecognitionLanguageunderstandingSpeechrecognitionImagerecognition-10020002005201020152020ThecapabilityofeachAlsystem isnormalizedt

5、oaninitialperformanceof-100.Hto679101.意向图3.成果图2.模型裁圈12#13415鲁涵岳张望LUHanyue,ZHANGWang时代建筑Time+Architecture2023/115浅析建筑学科中的人工智能生成内容技术Application of AIGC to Architecture and Its Impacts2022年发布的ChatGPT、M i d j o u r n e y 和StableDiffusion等人工智能（以下简称“Al”）应用技术备受世人关注，各行业也随之掀起了进军AI领域的热潮。这类生成式人工智能（GenerativeAl

6、）属于人工智能生成内容（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）技术，所生成的内容可以是各种形式的数据，比如文字、图像、音频、视频、3D模型等。这些内容的质量几乎与人类做的一样，在个别领域甚至比人类做得更好，而且速度更快（图1）。因此，AIGC被认为是跨越Web2.0（社交网络时代）的技术，在各领域都被广泛讨论，而与文化艺术设计密切相关的建筑学当然也是研究AI应用的先锋学科。AIGC某种程度上是作为技术工具为使用者生成内容，但要像建筑师一样产出内容，AI还需要对这些内容有认知能力，因此在目前的技术水平下还处于工具与应用阶段。现在主流的

7、AIGC是通过神经网络学习训练的，这种训练能让AI学会识别概念，掌握概念之间的联系。2 0 12 年亚历克斯克里热夫斯基（AlexKrizhevsky）发布了一个能够识别图像中出现的物体，并对图像进行正确分类的模型AlexNet。2 识别图像物体也就意味着AIGC拥有“读图能力”，AIGC也因此在建筑学研究中有了新的可能性。AIGC识图能对推动建筑行业发展有重要的意义。人工智能要画出正确的建筑图纸，首先要对建筑图纸的制图规则、图纸的构成要素有认知基础。在“识图能力的基础”上，2 0 18 年哈佛大学研究员斯坦尼斯拉斯夏尤（StanislasChaillou）发表了一个人工智能算法模型，该模型能

8、够根据给定的平面轮廓布置不同风格的平面图（曼哈顿公寓式、维多利亚郊区住宅式、排屋式和巴洛克式）。3这些平面图的生成结果质量都很高，让人很难区分是出自AI还是人类（图2）。AIGC有生成建筑平面图的能力，但是这种生成方式与人类设计逻辑不同，这些出自AI的平面图并没有考虑交通、功能组织和空间联系，更像是对人类现有的图纸的一种摹写。AIGC离生成真正意义的设计内容还有距离，但是已经可以生成一些技术性要求没那么高的内容，而且已经进入到建筑教育和工作生产中。比如，ChatGPT辅助建模，可以通过StableDiffusion和Midjourney生成概念形态和方案表现。在概念设计阶段，AIGC可以为建筑

9、师提供建议、提炼概念和生成意象图。通过输入一段背景信息（建筑师对方案的思考、建筑师与客户之间的对话和项目的基本信息等），AIGC可以分析、总结、输出设计的主要需求和待解决问题等；然后给建筑师提供咨询建议，比如，它能够分析对话中使用频率比较高的词汇，然后给出相应的设计思路。4在概念传递上，AIGC也已经做到了所想即所得的效果，比如设计的方案概念是一个树林里的居住社区，要求建筑展现出未来感的曲线形式，通过简短的描述就可以即刻获得数张与描述相符度极高的图片，还可以选择较满意的结果再生成相似的图片以进行方案比选（图3、图4）。此外还能利用“图像生成图像”的方式快速将草图转换成成熟的概念图（图5）。虽然

10、AIGC还未能完全自动化生成精准的三维模型和图纸，但AIGC生成文字的功能还是为建筑师带来了极大的便利。ChatGPT可以生成兼容建模软件的代码，使用者只需告诉ChatGPT程序的运行平台，提出程序输入、输出的内容和程序的功能，即刻就能获得想要的程序代码（图6、图7）。这大大节约了编写程序语言的时间。此外，如果程序代码不符合使用者需求，ChatGPT还可以根据要求修复程序漏洞（图8、图9）。让AIGC有控制性地生成效果图是目前讨论、实验最广泛的应用领域，这要求AIGC有很精确的控制能力，能够保留模型的形态关系、结构、门窗等，在此基础上添加材质、背景、光影、配景、人物等细节。在这个方面，斯坦福大

11、学博士研究生张吕敏（LyuminZhang）等人发布的StableDiffusion插件ControlNet则大大提升了内容生成的可控性，5 实现了草图生成效果图的功能。为了测试AIGC在多大程度上能帮助建筑师完成从电子模型到效果图的内容生成，笔者线下部署了StableDiffusion进行了测试。StableDiffusionAUTOMATIC111（线下部署的StableDiffusion平台）是效果表达阶段主流的AlGC应用。它允许用户线下使用，它的开源也使得它集成了很多功能，允许用户使用别人的模型，训练、融合自己的模型（图10），因此可控性很高，变化也更多。由于目前并没有专门针对建筑训

12、练的大规模模型，也缺乏画面精细控制的程序工具，StableDiffusion很难一次性达到真正能使用的效果图水平，经常需要长时间的试错和调整，生成一张能用的效果图需要的时间成本较高（图11 图15）。虽然目前AIGC还并未拥有人类设计师同等的智慧”，但已展现出了相当大的潜力。而且从技术发展的速度看，AIGC能很快弥补图面控制力不足的缺陷。从已经发布的几个“生成视频的GAI（生成式人工智能）应用”6 中，我们可以看到生成高质量的视频和三维模型已经成为可能，未来AIGC的应用可能会大大缩短生成声音、视频、三维模型的时间。此外，AIGC结合的软件应用将会更多，人与工作平台的交互性能将更强，这些AI

13、GC应用将使人们的学习生活更高效。相信不久的未来，AI将成为每个人的助手，如同现在的手机般不可或缺。（图片来源：图1源于https:/ourworldindata.org/brief-history-of-ak；图2 源于https:/ 图15作者自绘）参考文献：1 KIELA D,BARTOLO M,YIXIN N,et al.Dynabench:RethinkingBenchmarking inNLPM/OL/TOUTANOVAK,RUMSHISKYA,ZETTLEMOYERL,et al.Proceedingsof the2021Conferenceof the North Americ

14、an Chapterof theAssociation forComputational Linguistics:Human Language Technologies.Canada:Association for Computational Linguistics.2021:4110-41242023-02-11.https:/aclanthology.org/2021.naacl-main.324/.2 KRIZHEVSKY A,SUTSKEVER I,ALEXK.ImageNetclassification with deep convolutional neural networksJ

15、.CommunicationsoftheACM,2017(60):84-90.3 STANSLASC.Architecture&StyleEB/OL.(2019-06-02)2023-02-09.https:/ KULCKE M.Design-Bot-Using Half-Automated QualitativeInterviews as Part of Self Communication within the DesignProcessJ.eCAADe proceedings,2018(1):103-108.5 MARIYA D.Stability for BlenderEB/OL.(2

16、022-12-14)2023-02-11.https:/platform.stability.ai/docs/integrations/blender.6 JONATHAN H,CHAN W,SAHARIA C,et al.Imagen Video:High Definition Video Generation with Diffusion ModelsJ/OL.NewYork:arXiv,2022(2022-10-05)2023-02-11.https:/arxiv.0rg/abs/2210.02303.作者单位：同济大学建筑与城市规划学院香港理工大学作者简介：鲁涵岳，女，同济大学建筑与城市规划学院博士研究生，爱丁堡大学硕士张望通讯作者），男，香港理工大学助理研究员，爱丁堡大学硕士收稿日期：2 0 2 3-0 3-10

展开阅读全文