收藏 分销(赏)

浅析建筑学科中的人工智能生成内容技术.pdf

上传人:自信****多点 文档编号:706886 上传时间:2024-02-18 格式:PDF 页数:2 大小:1.28MB
下载 相关 举报
浅析建筑学科中的人工智能生成内容技术.pdf_第1页
第1页 / 共2页
浅析建筑学科中的人工智能生成内容技术.pdf_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

1、4时代建筑Time+Architecture2023/11.AI识别能力表现成长图2.AIGC生成的4种类型平面3.AIGC生成的未来曲线感森林社区4.AIGC生成的方案表现图5.AIGC草图生成表现图6.ChatGPT根据描述生成的python程序7.ChatGPT生成的python程序于rhino内的呈现8.ChatGPT根据需求调试9.ChatGPT修复的python程序于rhino内的呈现10.StableDiffusion模型学习Midjourney模型后生成的方案表现图11.方案模型截图12.SD实验过程界面13.基于StableDiffusion1.5生成的结果14.基于Anyt

2、hing4生成的结果15.基于ProtogenV22Anime_22生成的结果1.Al performanceonrecognition2.4typesof plangenerated byAIGC3.Curved-linecommunitiesdrewbyAIGC4.ArchitecturerenderingsdrewbyAIGC5.Renderingcreatedfrom sketchbyAIGC6.Pythonscript created byChatGPT7.Python script ran in Rhino Python8.Python script debug by ChatGP

3、T9.Debugged Python script ran in RhinoPython10.Rendering created by Stable Diffusion based on the modellearning from Midjourney11.Screenshotofdigitalmodel12.SDUIduringtheexperiment13.Result of StableDiffusion1.514.Result ofAnything415.ResultofProtogenV22Anime_22TestscoresoftheAlrelativetohumanperfor

4、mance+20AlsystemspertormbetterthanO+Humanperformance.asthebenchmark,issettozero.thehumanswhodidthesetestsAlsystemsperformworse-20-40Reading-60compre-hension-80HandwritingrecognitionLanguageunderstandingSpeechrecognitionImagerecognition-10020002005201020152020ThecapabilityofeachAlsystem isnormalizedt

5、oaninitialperformanceof-100.Hto679101.意向图3.成果图2.模型裁圈12#13415鲁涵岳张望LUHanyue,ZHANGWang时代建筑Time+Architecture2023/115浅析建筑学科中的人工智能生成内容技术Application of AIGC to Architecture and Its Impacts2022年发布的ChatGPT、M i d j o u r n e y 和StableDiffusion等人工智能(以下简称“Al”)应用技术备受世人关注,各行业也随之掀起了进军AI领域的热潮。这类生成式人工智能(GenerativeAl

6、)属于人工智能生成内容(ArtificialIntelligenceGeneratedContent,以下简称“AIGC”)技术,所生成的内容可以是各种形式的数据,比如文字、图像、音频、视频、3D模型等。这些内容的质量几乎与人类做的一样,在个别领域甚至比人类做得更好,而且速度更快(图1)。因此,AIGC被认为是跨越Web2.0(社交网络时代)的技术,在各领域都被广泛讨论,而与文化艺术设计密切相关的建筑学当然也是研究AI应用的先锋学科。AIGC某种程度上是作为技术工具为使用者生成内容,但要像建筑师一样产出内容,AI还需要对这些内容有认知能力,因此在目前的技术水平下还处于工具与应用阶段。现在主流的

7、AIGC是通过神经网络学习训练的,这种训练能让AI学会识别概念,掌握概念之间的联系。2 0 12 年亚历克斯克里热夫斯基(AlexKrizhevsky)发布了一个能够识别图像中出现的物体,并对图像进行正确分类的模型AlexNet。2 识别图像物体也就意味着AIGC拥有“读图能力”,AIGC也因此在建筑学研究中有了新的可能性。AIGC识图能对推动建筑行业发展有重要的意义。人工智能要画出正确的建筑图纸,首先要对建筑图纸的制图规则、图纸的构成要素有认知基础。在“识图能力的基础”上,2 0 18 年哈佛大学研究员斯坦尼斯拉斯夏尤(StanislasChaillou)发表了一个人工智能算法模型,该模型能

8、够根据给定的平面轮廓布置不同风格的平面图(曼哈顿公寓式、维多利亚郊区住宅式、排屋式和巴洛克式)。3这些平面图的生成结果质量都很高,让人很难区分是出自AI还是人类(图2)。AIGC有生成建筑平面图的能力,但是这种生成方式与人类设计逻辑不同,这些出自AI的平面图并没有考虑交通、功能组织和空间联系,更像是对人类现有的图纸的一种摹写。AIGC离生成真正意义的设计内容还有距离,但是已经可以生成一些技术性要求没那么高的内容,而且已经进入到建筑教育和工作生产中。比如,ChatGPT辅助建模,可以通过StableDiffusion和Midjourney生成概念形态和方案表现。在概念设计阶段,AIGC可以为建筑

9、师提供建议、提炼概念和生成意象图。通过输入一段背景信息(建筑师对方案的思考、建筑师与客户之间的对话和项目的基本信息等),AIGC可以分析、总结、输出设计的主要需求和待解决问题等;然后给建筑师提供咨询建议,比如,它能够分析对话中使用频率比较高的词汇,然后给出相应的设计思路。4在概念传递上,AIGC也已经做到了所想即所得的效果,比如设计的方案概念是一个树林里的居住社区,要求建筑展现出未来感的曲线形式,通过简短的描述就可以即刻获得数张与描述相符度极高的图片,还可以选择较满意的结果再生成相似的图片以进行方案比选(图3、图4)。此外还能利用“图像生成图像”的方式快速将草图转换成成熟的概念图(图5)。虽然

10、AIGC还未能完全自动化生成精准的三维模型和图纸,但AIGC生成文字的功能还是为建筑师带来了极大的便利。ChatGPT可以生成兼容建模软件的代码,使用者只需告诉ChatGPT程序的运行平台,提出程序输入、输出的内容和程序的功能,即刻就能获得想要的程序代码(图6、图7)。这大大节约了编写程序语言的时间。此外,如果程序代码不符合使用者需求,ChatGPT还可以根据要求修复程序漏洞(图8、图9)。让AIGC有控制性地生成效果图是目前讨论、实验最广泛的应用领域,这要求AIGC有很精确的控制能力,能够保留模型的形态关系、结构、门窗等,在此基础上添加材质、背景、光影、配景、人物等细节。在这个方面,斯坦福大

11、学博士研究生张吕敏(LyuminZhang)等人发布的StableDiffusion插件ControlNet则大大提升了内容生成的可控性,5 实现了草图生成效果图的功能。为了测试AIGC在多大程度上能帮助建筑师完成从电子模型到效果图的内容生成,笔者线下部署了StableDiffusion进行了测试。StableDiffusionAUTOMATIC111(线下部署的StableDiffusion平台)是效果表达阶段主流的AlGC应用。它允许用户线下使用,它的开源也使得它集成了很多功能,允许用户使用别人的模型,训练、融合自己的模型(图10),因此可控性很高,变化也更多。由于目前并没有专门针对建筑训

12、练的大规模模型,也缺乏画面精细控制的程序工具,StableDiffusion很难一次性达到真正能使用的效果图水平,经常需要长时间的试错和调整,生成一张能用的效果图需要的时间成本较高(图11 图15)。虽然目前AIGC还并未拥有人类设计师同等的 智慧”,但已展现出了相当大的潜力。而且从技术发展的速度看,AIGC能很快弥补图面控制力不足的缺陷。从已经发布的几个“生成视频的GAI(生成式人工智能)应用”6 中,我们可以看到生成高质量的视频和三维模型已经成为可能,未来AIGC的应用可能会大大缩短生成声音、视频、三维模型的时间。此外,AIGC结合的软件应用将会更多,人与工作平台的交互性能将更强,这些AI

13、GC应用将使人们的学习生活更高效。相信不久的未来,AI将成为每个人的助手,如同现在的手机般不可或缺。(图片来源:图1源于https:/ourworldindata.org/brief-history-of-ak;图2 源于https:/ 图15作者自绘)参考文献:1 KIELA D,BARTOLO M,YIXIN N,et al.Dynabench:RethinkingBenchmarking inNLPM/OL/TOUTANOVAK,RUMSHISKYA,ZETTLEMOYERL,et al.Proceedingsof the2021Conferenceof the North Americ

14、an Chapterof theAssociation forComputational Linguistics:Human Language Technologies.Canada:Association for Computational Linguistics.2021:4110-41242023-02-11.https:/aclanthology.org/2021.naacl-main.324/.2 KRIZHEVSKY A,SUTSKEVER I,ALEXK.ImageNetclassification with deep convolutional neural networksJ

15、.CommunicationsoftheACM,2017(60):84-90.3 STANSLASC.Architecture&StyleEB/OL.(2019-06-02)2023-02-09.https:/ KULCKE M.Design-Bot-Using Half-Automated QualitativeInterviews as Part of Self Communication within the DesignProcessJ.eCAADe proceedings,2018(1):103-108.5 MARIYA D.Stability for BlenderEB/OL.(2

16、022-12-14)2023-02-11.https:/platform.stability.ai/docs/integrations/blender.6 JONATHAN H,CHAN W,SAHARIA C,et al.Imagen Video:High Definition Video Generation with Diffusion ModelsJ/OL.NewYork:arXiv,2022(2022-10-05)2023-02-11.https:/arxiv.0rg/abs/2210.02303.作者单位:同济大学建筑与城市规划学院香港理工大学作者简介:鲁涵岳,女,同济大学建筑与城市规划学院博士研究生,爱丁堡大学硕士张望通讯作者),男,香港理工大学助理研究员,爱丁堡大学硕士收稿日期:2 0 2 3-0 3-10

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服