收藏 分销(赏)

2023中国开源开发者报告.pdf

上传人:Stan****Shan 文档编号:1266400 上传时间:2024-04-19 格式:PDF 页数:87 大小:9.92MB
下载 相关 举报
2023中国开源开发者报告.pdf_第1页
第1页 / 共87页
2023中国开源开发者报告.pdf_第2页
第2页 / 共87页
2023中国开源开发者报告.pdf_第3页
第3页 / 共87页
2023中国开源开发者报告.pdf_第4页
第4页 / 共87页
2023中国开源开发者报告.pdf_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、11/*使用电脑阅读,获得最佳体验11序毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM年、生成式 AI GenAI 年。一、这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横空出世,标志着对话式 LLM 开始进入公众视野,为人们提供了全新的人机交互方式。而 2023 年 3 月,同系GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11月份,OpenAI 再发力,GPTs 的到来,“用户自定义ChatGPT”的能力,更是让世人领略了 OpenAI 作为LLM 一哥的宏大叙事能力与强劲技术实力。二、New B

2、ing(Bing AI)代表了微软在 LLM 领域的野心和决心,它首次把当时世人能想到最有价值又可行的 LLM应用场景“智能对话+联网搜索”无缝整合了起来,大有干掉搜索行业和问答社区的趋势,而后事实证明,全球最强IT 问答社区Stack OverFlow 深受其害。Google 紧随其后推出 Bard,作为其首次亮相的对话LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽如人意,车翻了又翻。三、Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM在语言理解和多模态处理能力方面的探索,甚至 Claude 2还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的Ll

3、ama 2 更成为了 LLM 领域开源势力的典型代表,它的出现,犹如一颗投入平静湖面的石子,激荡起层层水波,“Llama 2 一开源,全球范围内进入了百模混战阶段”,这个说法一点也不为过。年底的“虚假宣传”Gemini 与“磁力链开源”Mistral8x7B 两大神作,也凭借不输 GPT-4 的实力,将 LLM 狂潮卷到天际。四、Stable Diffusion 和 Midjourney 这两大图像生成系统的出现,极大地拓展和加速了 LLM 在计算机视觉领域的应用,它们突破了传统图像生成方式的局限,仅需要用户提供文字描述,就可以生成高质量的数字艺术作品。它们的图像生成质量、样式多样性和用户便捷

4、性都是极大的突破。这为广大的个人用户和创意行业提供了强有力的工具,彻底改变了数字艺术内容的创作方式。同时,它们也引发了人工智能在创作领域的伦理和法律讨论。LLM 杀进多媒体领域。往后 DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在这条路上的进一步发展。五、AI 编程方面,Copilot 可以根据开发者的代码提示自动补全代码,大大提高了开发效率。这也引发了代码原创性的讨论,但它已经实实在在将 LLM 拉进了编程应用领域。六、LangChain 的出现,实现了 LLM 之间的链式交互,使多个 LLM 模型串联工作,发

5、挥各自的优势,并且可以将LLM 模型与外部数据源进行连接,产生更强大的语言理解和生成效果。这开启了 LLM 集成应用的新方向,并诞生了一个新的细分领域“LLMOps”。七、“提示词工程”,这是 LLM 直接催生出来的新“学科”,它的核心在于研究人类如何与 LLM 更好地进行“沟通”,找到让 LLM 能够准确理解人类意图的方法。提示词工程探索如何以 LLM 可以解析的方式来表达需要它完成的任务,寻找 LLM 的“最佳输入形式”。通过注入提示词,提示词工程建立了一套“人机交互语法”,来更精准地向 LLM 传达想要它生成何种输出的指令。这为人们与 LLM 之间建立高效、准确的“沟通桥梁”提供了可能性

6、。什么“链式思考11(CoT)”、“自动推理并使用工具(ART)”、“思维树(ToT)”甚至运用心理学对 LLM 进行“情绪提示(EmotionPrompt)”,提示词工程俨然在将 LLM 一点一点解剖,试图让人类成为可以将其掌控的“咒术师”。八、AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM发展的新阶段。LLM Agent 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着 LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。LLM Agent 打破了传统 LLM 的被动

7、性,使LLM 能够主动学习和执行任务,从而提高了 LLM 的应用范围和价值;它为 LLM 的智能化发展提供了新的方向,使 LLM 能够更加接近于人类智能。九、AI 原生,目前还没有明确的定义,大致是说,不同于当前各种应用在原本的基础上增加 AI 能力,使其智能化,但它的智能只充当了“辅助”角色;在 AI 原生的语境下,LLM 从一开始就是应用的中枢,应用本身的架构、功能、交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最经典的“AI 原生”应用。此概念目前还处在萌芽期,明确的概念、应用场景、架构、技术栈细节等尚未完成自洽。换一种视角来看,这个概念的提出其实都没技术什么事,有人称之为

8、“造商业概念”,这里按下不表。十、镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意义,卷应用机会更大”,其实很深刻地指出了内中区别。本报告以开发者视角为主,从 LLM 切入,但实际上或多或少与 GenAI 脱不开关系。2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬刚”ChatGPT,到后来各式各样的大模型与产品出现,覆盖了不同的领域和场景,构建了多元化的大模型生态。大模型方面,百花齐放:百度的文心一言、抖音的云雀大模型、智谱 AI 的 GLM 大模型、中科院的紫东太初大模型、百川智能的百川大模型、商汤的日

9、日新大模型、MiniMax 的ABAB 大模型、上海人工智能实验室的书生通用大模型、腾讯的混元大模型、蚂蚁的百灵大模型等。另一方面,除了大模型本身,中国在 LLM 相关技术领域也快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLMPrompt 的研究、OneFlow 的深度学习框架。值得一提的还有华为的盘古大模型,其中盘古气象大模型是首个精度超过传统数值预报方法的 AI 模型,速度相比传统数值预报提速 10000 倍以上,能够提供全球气象秒级预报。盘古大模型的研究成果在国际顶级学术期刊自然正刊发表,获得

10、国际学术界的认可。年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处理约 40 万字的文本,成为当时全球大模型中最长的上下文窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。十一、这一小节,通过一些数据来简要概述 2023 年的 LLM、GenAI。根据金融数据和软件公司 PitchBook 的数据,从截至 3 月 29 日追踪的 9 笔交易来看,生成式 AI 公司的投前估值中位数已经飙升至 9000 万美元,高于 2022年的 4250 万美元。PitchBook 的分析师预测,以 32%的复合年增长

11、率计算,到 2026 年,生成式 AI 市场规模将达到 981 亿美元。11由英国知名风投公司Air Street Capital 的合伙人Nathan Benaich 等 作 者 联合 撰 写 的“State of AIReport 2023”报告,从研究进展(Research)、行业局势(Industry)、政策影响(Politics)、安全问题(Safety)、未来预测(Predictions)五个维度出发,对人工智能发展现状和未来预期进行了深度分析。从中我们看到:英伟达凭借各国、初创公司、大型科技公司和研究人员对其 GPU 的巨大需求,跻身市值万亿美元俱乐部;主要芯片供应商开发了不受出

12、口管制影响的替代产品;在 ChatGPT 的带领下,生成式 AI 的应用在图像、视频、编码、语音等领域取得了突破性的进展,带动了180 亿美元的风险投资和企业投资。OReilly发 布 的“2023GenerativeAIintheEnterprise”报告显示:54%的 AI 用户预计 AI 的最大好处是提高生产力。77%的受访者使用 AI 来辅助编程。其中提到的具体应用包括欺诈检测、教学和客户关系管理。AI 用户表示,AI 编程(66%)和数据分析(59%)是最需要的技能。许多 AI 采用者仍处于早期阶段:26%的人使用 AI不到一年,而 18%的人已经在生产中进行了应用。16%从事 AI

13、 工作的受访者表示正在使用开源模型。意外结果、安全性、公平性、偏见和隐私是采用者测试的最大风险。工业和信息化部赛迪研究院数据显示,目前,我国已有超过 19 个大语言模型研发厂商。其中,15 家厂商的模型产品已经通过备案,预计今年我国大语言模型市场规模将达到 132.3 亿元,增长率将达到 110%。到 2027 年,我国大语言模型市场规模有望达到 600 亿元。十二、如果要指出当前 LLM 种种“不成熟”中我最关切的,我会说“LLM 解决方案”。当前 LLM 行业面临的一个大方向上的问题是:还没有很好地从“解决方案”的角度去做技术或者应用。所谓“解决方案”,是指在设计和开发 LLM 技术和应用

14、时,首先明确用户的目标,然后围绕目标进行技术研发和应用设计,并且它带有“整体解决”、“解决的不只是某个单点问题”的含义。只有这样,才能确保 LLM 能够真正解决实际问题,而不是成为“应付式”的工具。“应付式”问题主要表现在以下几个方面:LLM 往往是“一刀切”的,无法根据用户的具体需求进行个性化定制。LLM 往往是“碎片化”的,无法提供完整的解决方案。LLM 往往是“被动式”的,需要用户不断完善输入。什么意思呢?就是我找 AI 是要解决实际问题的,但它往往都是给我“应付”一下,直接交货了事了,而不善于去追问本质,去了解细节,去思考你最终想要的是一个什么样的东西。它需要你不断完善自己的输入,甚至

15、有时候可能要求在你自身都不知道“可以想要一个什么东西”的情况下去输入。这样的话其实就是你在输入与输出:整个事情我都想通了,方案我其实也就都出来了,机器给到我的都只是一个个独立性的、小而窄的、解决掉一点一点问题的东西。举个例子,我说我肚子疼,它会直接告诉我肚子疼可能是因为什么,怎样做可以缓解或者解决,但它不会一点一点进行“望闻问切”全套去引导,了解具体情况,最终再给出切实可行的解决方案。但回过头来想想,这个话题可深可浅,往浅了说,当前 LLM产品可以帮助人类翻译、润色一段文字、提炼论文核心内容,这本身也是较为完整的解决方案;当前 LLM Agent、LLMOps,甚至只是说开发者的各种“工程化组

16、合骚操作”,实际上已经可以把不同模型、不同模态、不同工具和知识源整合,正是在往“提供更完整的解决方案”这一方向上的发展。11往深了说,或许这本质上就是在要求 AGI,而它是一个更长远的路途了。而如何将更完备的解决方案给到用户,如何将更平台化、体系化的生成解决方案的技术给到解决方案生产者,是后续 LLM 应用与技术演进的重要路标。你看 GPTs,直接革掉了多少拿 OpenAI API 去套壳的“创新应用”的命?十三、报告介绍作为2023 中国开源开发者报告的引导,这里还是把话题拉回来,简介一下整个报告。前边讲到的 LLM 领域大放异彩,自然是会作为报告中的一个重要部分,我们策划了一个2023 L

17、LM 技术报告篇章,整体围绕 LLM Tech Map 梳理逻辑来展开。从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。是的,先整理了一个 LLM 技术图谱,欲知详情,请查看后续正文。【开源治理】开源健康发展必不可少的一环。【硬核发版】最硬核、最极客的年度发版汇总!【热门话题】回顾 2023 年度热门开发者事件!【重磅官宣】2023 年度开源官宣。【R.I.P.】谨以此篇纪念今年离我们而去的行业巨擘。https:/ Insight:中国开发者开源新动向是关于开源开发者数据的,采用 Gi

18、tee与 OSS Compass 作为数据来源,试图通过数据来反映2023 年开源开发者圈子的相关情况。这里提取几个亮点数据:TypeScript 是增长最快的编程语言,增长率达到49.04%MulanPSL-2.0 在“2023 年使用增长率最快的开源许可证”中排行第二,增长率为 18.34%较为活跃的社区代表:OpenHarmony、openEuler 与MindSpore欢迎查阅、分享。除了 LLM,开源开发者圈当然还有更多高亮事件,我们在此次年度报告中整理成了另一个篇章开源开发者事件回顾,这一篇章梳理成了 9 个大块:【AIGC】回顾 2023 大语言模型 LLM 元年的重磅事件。【1

19、024 黄金眼】关注 IT 相关民生事件,以老百姓的眼睛看 IT 圈,和开发者零距离接触。【项目停更】到了该说“再见”的时候了,江湖有缘再见。【生产事故】冥场面!速来围观 2023 十大生产事故“名场面”。11目录一、开源开发者事件回顾三、中国开发者开源新动向二、2023 LLM 技术报告 46|向量数据库|向量数据库 47|数据库向量支持|数据库向量支持 48|大模型框架、微调|大模型框架、微调 51|大模型训练平台与工具|大模型训练平台与工具 53|编程语言|编程语言57|知名大模型|知名大模型 58|备案上线的中国大模型|备案上线的中国大模型 21|硬核发版|硬核发版 26|热门话题|热

20、门话题 33|重磅官宣|重磅官宣 39|R.I.P.|R.I.P.07|AIGC|AIGC 11|1024 黄金眼|1024 黄金眼 13|项目停更|项目停更 16|生产事故|生产事故 18|开源治理|开源治理 62|插件、IDE、终端|插件、IDE、终端 63|代码生成工具|代码生成工具 64|LLM Agent|LLM Agent 67|LLMOps|LLMOps 68|大模型聚合平台|大模型聚合平台 69|开发工具|开发工具 70|算力|算力出品:OSCHINA&Gitee编委会:雨多田光,OSCHINA 总编局长,OSCHINA 主编王茜,OSCHINA 主编叶子,OSCHINA 新媒

21、体运营鱼仔,OSCHINA 新媒体运营诺墨,Gitee 开源社区产品负责人张力文,Gitee 公有云研发负责人李泽辰,Gitee 主编李涛,APUS 董事长兼 CEO特邀评论员:陈天舟,Bytebase 联合创始人/CTO王春生,禅道软件公司创始人冯若航,Pigsty 作者、磐吉云数创始人叶金荣,GreatSQL 开源生态负责人杜天微,狮偶编程语言作者江湖评谈,多年.NET 虚拟机技术 CLR/JIT 研究设计:张琪11OpenAIOpenAI正式发布正式发布GPT-4GPT-4AIGC回顾 2023 大语言模型 LLM 元年的重磅事件。开源开发者事件回顾AnthropicAnthropic推

22、出推出ClaudeClaude2023 年 3 月,百度全新一代知识增强大语言模型、文心大模型家族的新成员文心一言(ERNIE Bot)正式发布。百度百度文心一言文心一言正式亮相正式亮相2023 年 7 月,Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。相比于 Llama1,Llama 2 的训练数据多了 40%,上下文谷歌发布谷歌发布最强最强AI大模型AI大模型GeminiGemini2023 年 12 月,谷歌发布了其认为规模最大、功能最强大的多模态 AI 大模型Gemini,称比 OpenAI 的 GPT-4 更先进。MetaMe

23、ta开源开源Llama 2Llama 22023 年 3 月 15 日,由 OpenAI 前成员创立的 Anthropic 发布对话 AI 产品Claude,包含 520 亿个参数。与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、摘要、写作、编码,以及响应用户的提问。四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。2023 年 3 月 14 日,OpenAI 正式推出 GPT-4。GPT-4 是多模态大型语言模型(Large M

24、ultiModal Model),这是和 GPT-3 的一个显著区别,它的输入输出不再局限于文本,可以是图像或者是视频。Anthropic团队由参与OpenAI GPT-2和GPT-3模型开发的前研究人员组建,专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。李彦宏称:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 100 万人类标记数据上

25、训练的。7/8711开源开发者事件回顾Auto-GPT 横空出世,席卷 AI 圈“零一万物”发布 Yi 系列开源大模型Auto-GPT 横空出世,席卷 AI 圈“零一万物”发布 Yi 系列开源大模型Vercel 发布v0:根据文本生成 UI 代码Vercel 发布v0:根据文本生成 UI 代码v0 是一款根据文本生成 UI 界面代码的 AI 产品,只要输入文字提示,即可生成需要的 UI 组件界面。智谱 AI 开源 ChatGLM-6B 大模型智谱 AI 开源 ChatGLM-6B 大模型GPT-4 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项目Auto-GPT 横空出世,在 A

26、I 领域掀起巨大的波澜。它就像是赋予了GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断提高自己的性能。Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。2023 年 11 月 17 日,OpenAI 突然发布公告,宣布 Sam Altman 将辞去首席执行官一职,并离开 OpenAI 董事会。现任首席技术官 Mira Murati 将临时担任首席执行官,该任命立即生效。LangChain 是封装了大量 LLM 应用开发逻辑和工具集成的开源 Python 库,提供了一套工具、组件和接口,简化创建由 LLM 和聊天模型提供支持的应用程序的过程。创新工场董

27、事长兼CEO李开复今年3月创办AI大模型创业公司“零一万物”。11 月,零一万物推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放。2023 年 3 月,由清华技术成果转化的公司智谱 AI 宣布开源中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。Sam Altman 被“逐出”OpenAISam Altman 被“逐出”OpenAI如此突发的重磅消息震惊了全世界,有人称之为美国硅谷史上最大的“夺权”事件。经历 105 小时之后,该事件迎来大结局Sam Altman 重返 OpenAI 担任首席执行官,OpenAI 成立全新董事会,微软将在董事会中

28、获得一个无投票权的观察员席位。最火热 LLM 应用框架 LangChain最火热 LLM 应用框架 LangChain与此同时,零一万物完成由阿里云领投的新一轮融资,估值已超 10 亿美元,跻身独角兽行列。8/8711开源开发者事件回顾京东发布言犀大模型京东发布言犀大模型百度推出 AI 编程助手 Comate百度推出 AI 编程助手 Comate2023 年 3 月,微软亚洲研究院和浙江大学的研究团队联合发布论文HuggingGPT:Solving AI Tasks with ChatGPT and its Friends inHuggingFace,介绍了一个大模型协作系统。该系统提出了一种

29、让 LLM 充当控制器的新方法,让 LLM 来管理现有的 AI 模型,来完成多模态的复杂 AI任务,并且使用语言作为通用接口。2023 年 2 月,谷歌首席执行官 Sundar Pichai 宣布,他们将在未来几周内面向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务,称为 Bard与流行的 ChatGPT 展开直接竞争。与此同时,微软开源了基于论文实现的项目 JARVIS。其自我描述是用于连接 LLM 和 AI 模型的协作系统。该系统由 LLM(大语言模型)作为控制器和许多 AI 模型作为协作执行者(来自 HuggingFace Hub)组成。7 月 13 日,京东全面推出京东言犀

30、大模型,服务千行百业,拥抱产业智能。言犀大模型融合了 70%的通用数据与 30%京东数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。2023 年 6 月,百度智能云推出了基于大模型的“Comate”代码助手。借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。谷歌官宣 ChatGPT 竞品:Bard谷歌官宣 ChatGPT 竞品:Bard2023 年 4 月,陈天奇团队(MLC)发布了一个可将大型语言模型和基于 LLM的聊天机器人引入 Web 浏览器的项目:Web LLM。一切都在浏览器内

31、运行,无需服务器支持,并使用 WebGPU 加速。用 ChatGPT 控制 AI 模型用 ChatGPT 控制 AI 模型陈天奇团队发布 Web LLM陈天奇团队发布 Web LLM用浏览器跑大模型用浏览器跑大模型微软开源 JARVIS(贾维斯)微软开源 JARVIS(贾维斯)依托大模型能力,京东云言犀为客户提供涵盖客户服务、营销导购、多模态数字人等多种营服销一体化解决方案。LLMOps 平台 Dify.AI 代码完全开源LLMOps 平台 Dify.AI 代码完全开源2023 年 5 月,LLMOps 平台 Dify.AI 宣布 46,558 行代码完全开源,并临时决定将开源协议从 AGPL

32、 放宽到 Apache 2.0。华为云重磅发布盘古大模型 3.0华为云重磅发布盘古大模型 3.02023 年 7 月,华为云正式发布盘古大模型 3.0。盘古大模型 3.0 是一个面向行业的大模型系列,包括“5+N+X”三层架构。盘古为行业而生,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。9/8711开源开发者事件回顾蚂蚁集团开源 CodeFuse 代码大模型蚂蚁集团开源 CodeFuse 代码大模型阿拉伯语 AI 大模型 Jais 开源阿拉伯语 AI 大模型 Jais 开源2023 年 11 月 7 日,OpenAI 首届开发者大会(OpenAI DevDay

33、)正式开启。大会上,Sam Altman 宣布了多项重磅变化:GPT-4 Turbo 模型,128k 上下文窗口、GPTs 商店、Agent 工具、API 提速降价、更多的 API 开放。2023 年 8 月,谷歌宣布推出 AI 代码编辑器 Project IDX,一个基于浏览器的开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于构建全栈网络和多平台应用程序。2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。在上下文窗口长度、长窗口文本生成质量、长上下文理解以

34、及长文本问答、摘要等方面的表现均全面领先 Claude2。2023 年 9 月,蚂蚁集团正式开源代码大模型 CodeFuse基于蚂蚁基础大模型研发。这是蚂蚁自研的代码生成专属大模型,帮助开发者自动生成代码、自动增加注释、自动生成测试用例、修复和优化代码等。2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720亿个阿拉伯语词块和 2790 亿个英语/代码词块的数据集上进行训练。谷歌发布 AI 代码编辑器:Project IDX谷歌发布 AI 代码编辑器:Project IDX2023 年

35、8 月,Meta 开源了号称是编程领域“最先进的大语言模型”CodeLlama,完全免费且可用于研究和商业用途。百川智能发布 Baichuan2-192K 大模型百川智能发布 Baichuan2-192K 大模型Meta 代码生成大模型:Code LlamaMeta 代码生成大模型:Code LlamaOpenAI 开发者大会宣布 GPTs 商店OpenAI 开发者大会宣布 GPTs 商店用“磁链链接”发布的 Mixtral 8x7B全球首个开源 MoE 大模型用“磁链链接”发布的 Mixtral 8x7B全球首个开源 MoE 大模型2023 年 12 月,有“欧洲版 OpenAI”之称的大模

36、型创业公司Mistral AI用磁链链接开源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。这是一个开放权重的高质量稀疏混合专家模型(SMoE),采用 Apache 2.0License 开源。在大多数基准测试中,Mixtral 的成绩都优于 Llama 2-70B,且推理速度提升了 6 倍。而且在大多数标准基准测试中超过 GPT-3.5。10/8711爱奇艺客户端“白嫖”电视机带宽爱奇艺客户端“白嫖”电视机带宽1024“黄金眼”关注 IT 相关民生事件,以老百姓的眼睛看 IT 圈,和开发者零距离接触。开源开发者事件回顾人大毕业生盗取全校学生信息人大毕业生盗取全校学生信息

37、网友发帖称,自己的电视机在息屏休眠状态时,居然持续保持着 1-5M/s 的上传速度,直至断掉电源才停止上传。而这台新买的电视机上安装的 APP 只有爱奇艺。在他强制关闭爱奇艺 APP 后,电视机的上传速度马上变为零。对此,爱奇艺客服给出的回应是,这是加速手段,对使用没有影响,并提供了关闭 HCDN 开关的操作。HCDN(Hybrid CDN)是爱奇艺技术团队研发的大规模混合架构在线视频数据分发技术。有网友指出,这是爱奇艺客户端将电视机当成了自己的 PCDN 服务器,因此会在后台持续执行上传任务。这种白嫖电费、流量、存储空间的操作,爱奇艺要给用户打钱才对。2023 年 9 月,上海警方接到某科技

38、公司员工张女士报案称,其公司发现计算机系统被他人篡改数据,导致公司账户钱款损失。民警对公司后台电子数据出现的异常账户进行提取,搜证中发现,操作者很有可能是管理网站后台系统的员工,监守自盗的可能性较大。程序员篡改 ETC 余额程序员篡改 ETC 余额河南联通强迫用户更换光猫河南联通强迫用户更换光猫河南周口联通为了强迫用户更换光猫,公司在后台停掉用户的宽带账号,导致用户无法上网,然后让工程师上门“维修”,谎称光猫损坏,需要花 299 元换新。更换完后,联通再在后台恢复用户的网络。员工盗用公司游戏源代码员工盗用公司游戏源代码中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息,并利用这些

39、信息制作了一个给学生颜值打分的网站。针对“中国人民大学部分学生信息被非法获取”的情况,海淀警方接到报警后立即开展调查。经查,嫌疑人马某某(男,25 岁,该校毕业生)涉嫌非法获取该校部分学生个人信息等违法犯罪行为,后被海淀公安分局依法刑事拘留。上海一游戏公司三名员工利用职务之便,在从原公司离职前盗取了公司开发的手游源代码;并将该手游的源代码提供给了另一家网络公司,对方进行简单“换皮”之后就开始上线经营。创建颜值打分网站结局很“刑”一年私吞 260 余万元创建颜值打分网站结局很“刑”一年私吞 260 余万元民警随即展开工作,最终嫌疑人曹某迫于压力主动投案自首。曹某是该公司的软件工程师,他坦白称,去

40、年 8 月发现公司网站后台的漏洞,用母亲和朋友身份证注册了两个 ETC 账户。一年内两个账户分别从公司提取来了 230 余万元和 36 万元,总计 260 余万元。最终曹某因涉嫌盗窃罪被依法刑事拘留。“换皮”上线 半年盈利 1.5 亿“换皮”上线 半年盈利 1.5 亿为了成功上线,离职员工还套用了原公司的 计算机软件著作权登记证 和 网络游戏出版核发单。警方鉴定发现,两款游戏在服务器数据表和服务器战斗服上的相似度达到 100%,服务器游戏服和客户端相似度也在 90%左右。据统计,自盗版游戏上线半年以来,盈利超过 1.5 亿,盗取源代码的三名员工分得利润超过 1500 万。联通公司不仅对老用户进

41、行这种强制更换光猫的行为,还会在给新用户装机的时候,故意使用破旧光猫,也就是之前强迫用户换新留下的,而再过一段时间之后,又会告诉用户使用的是旧光猫无法匹配,必须换新。联通公司还会故意关掉用户的短信服务,在后台增加增值业务,之后再把短信功能打开,以此牟利。这种强制更换光猫的行为并非新鲜事。早在 2022 年上半年,就有不少用户投诉联通公司,以宽带升级为由强制用户更换光猫,否则就无法上网。其中有的投诉明确是河南联通公司,有的则未明确具体地区。11/8711知名大主播翻车现场知名大主播翻车现场开源开发者事件回顾1400 多万部老年手机被植入木马1400 多万部老年手机被植入木马B 站 50 万粉丝

42、up 主通过另一名知名主播购买基于开源软件的导播台方案:将手机摄像头画面推流到 PC,再通过 OBS 推流,使用了 Zerotier+芯象。共计支付 2 万,网友称这名 up 主喜提“超级憨憨大冤种奖”。2023 年 9 月,网传消息称,网易伏羲团队员工因工作原因在出租屋自杀离世;并表示,该员工曾“因 BUG 被 HR 威胁”。9 月 14 日,网易伏羲针对此事发布内部信公布事发经过,称员工存在抑郁倾向,HRBP 在了解到情况后为其安排了休假。并表示经过调查还原和分析,暂未发现NanUI 作者在国庆节发布了停更公告,称该项目将暂停开发,原因是去年被裁员失业后,他已转行销售钢材,现在很难腾出时间

43、来开发和维护 NanUI 项目。四川省攀枝花市公安机关网安部门在 2023 年成功侦破一起非法控制计算机信息系统案。经警方调查,犯罪嫌疑人与老年手机方案商、生产商勾结,在老年机生产环节中植入木马程序,在手机使用者不知情的情况下,后台订购 SP 增值业务,并与 SP 商分成获利(SP 即 Service Provider,服务提供商)。2023 年 2 月,公安机关对该案开展集中收网,专案民警分别赶赴广东、北京、海南、湖南等地共抓获嫌疑人 29 名,冻结涉案资金 6000 余万元。苹果 App Store 被发现存在一个伪装成学习软件的黄色软件,并且冲上了免费 App排行榜第一名。该软件的年龄分

44、级为 4 岁以上,但是会引导用户进入赌博和其他黄色网站。有网友下载了这款软件,想要学习英语字母,结果却发现是一个色情视频软件。事件被曝光后,苹果客服虽然进行了“自动订购”增值业务网易伏羲回应“自动订购”增值业务网易伏羲回应“HR 威胁”相关动机和证据。与此同时,该公司还公布了一系列后续关怀方案。苹果 App Store 免费榜第一是黄色软件苹果 App Store 免费榜第一是黄色软件NanUI 界面组件是一个开放源代码的.NET/.NET Core 窗体应用程序(WinForms)界面框架。适用于希望使用 HTML5/CSS3 等前端技术来构建Windows 窗体应用程序用户界面的.NET

45、开发人员。售卖基于开源软件的解决方案,收费 2 万售卖基于开源软件的解决方案,收费 2 万员工“因 BUG 被 HR 威胁”离世员工“因 BUG 被 HR 威胁”离世回应,但直到当天下午仍未下架软件。甚至排行榜更新后,App Store 免费榜第一、二名再次出现黄色软件。开源框架 NanUI 作者转行卖钢材项目暂停开发开源框架 NanUI 作者转行卖钢材项目暂停开发12/8711网络框架 AFNetworking 停止维护网络框架 AFNetworking 停止维护开源 ROM 魔趣(Mokee)创始人宣布项目结束开源 ROM 魔趣(Mokee)创始人宣布项目结束开源开发者事件回顾开发者遭死亡

46、威胁,项目停止开发开发者遭死亡威胁,项目停止开发GIF 屏幕录制工具 Peek 的开发者在 2023 年 1 月正式宣布项目停止开发,主要原因在于 Wayland 上运行时所面临的一些技术挑战。而解决问题的唯一途径就是以不同的方式、不同的 UI 完全重写应用程序,但“现在的 Peek 几乎没有什么资源可以重用”。开发者表示自己并没有兴趣再开发一个全新的项目,所以做出了放弃该项目的决定。问题堆积如山,GIF 录屏工具 Peek 停止开发问题堆积如山,GIF 录屏工具 Peek 停止开发aardio 编程语言作者发文表示,因妻子患癌,再无精力维护项目。aardio的所有库基本都是由作者一个人编写,

47、并且 17 年来一直保持非常活跃的更新。aardio 是一门专注于桌面软件开发的编程语言,特点是小、轻、快,体积仅 6.5MB,学习和使用成本极低。aardio 虽然小,但提供了惊人数量的开源标准库、扩展库 这些库基本都是由纯 aardio 代码实现。开源项目 Touca 开发商倒闭开源项目 Touca 开发商倒闭开 源 测 试 工 具Touca 的 创 始 人Pejman Ghorbanzade 于 2023 年 3月宣布其公司正式倒闭,不景气的市场大环境是倒闭的一个主要原因。Pejman 于 2021 年创立了 Touca,并于 2022 年 5 月在 Apache-2.0许可下开源。To

48、uca 公司倒闭后,Touca 这个开源项目还将继续存在,并保持开源,Pejman 表示自己会持续维护这个项目,并开始寻找新的机会。aardio 编程语言作者:因妻子患癌,再无精力维护项目aardio 编程语言作者:因妻子患癌,再无精力维护项目因遭受过多的骚扰甚至于死亡威胁,AetherSX2 软 件 的 开 发 者Tahlreth 于2023 年 1 月宣布无限期停止该项目的开发。“AetherSX2 对我来说一直是一个有趣的爱好,而不是为了盈利。继续开发一个不再有趣的项目是没有任何意义的。”AetherSX2 是 Android 平台上最好用的PlayStation 2 模拟器(没有之一)

49、。用户还可以继续下载和使用 AetherSX2,但该应用程序已经不再有进一步的开发计划。国内最大的非营利性开源 ROM 项目魔趣(Mokee)在 2023 年 1 月 7日正式宣布关闭。魔趣下载页面所有固件已备份到 sourceforge。项目作者马丁龙猪发文称,“刷机的时代其实早已落幕,迟迟下不定决心只是希望能让魔趣多存续一些时间,但该来的终究会来。”Mokee 全称 MoKee OpenSource,项目发起于 2012 年 12 月 12 日。早期基于 CyanogenMod(CM),2016 年CyanogenMod 停止开发,后开始基于AOSP。魔趣开源项目 20121212 202

50、30107在停更近 3 年后,适用于苹果旗下多个操作系统(iOS、macOS、watchOS 和 tvOS)的网络框架AFNetworking 在 2023 年 1 月17 日正式发布公告宣布弃用,停止维护。原始仓库将作为一个归档库永久保留。项目停更到了该说“再见”的时候了,江湖有缘再见。13/8711战争、疫情、通货膨胀,资源网站 RARBG 宣布关闭Qt 5.15 LTS 已结束标准支持战争、疫情、通货膨胀,资源网站 RARBG 宣布关闭Qt 5.15 LTS 已结束标准支持开源开发者事件回顾资金严重短缺,又一流行开源项目宣布停止功能开发资金严重短缺,又一流行开源项目宣布停止功能开发“李跳

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服