收藏 分销(赏)

基于深度学习的智能自动新闻摘要APP研制_计划书.pdf

上传人:Fis****915 文档编号:538611 上传时间:2023-11-24 格式:PDF 页数:49 大小:1.85MB
下载 相关 举报
基于深度学习的智能自动新闻摘要APP研制_计划书.pdf_第1页
第1页 / 共49页
基于深度学习的智能自动新闻摘要APP研制_计划书.pdf_第2页
第2页 / 共49页
基于深度学习的智能自动新闻摘要APP研制_计划书.pdf_第3页
第3页 / 共49页
基于深度学习的智能自动新闻摘要APP研制_计划书.pdf_第4页
第4页 / 共49页
基于深度学习的智能自动新闻摘要APP研制_计划书.pdf_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、1目录一、一、计划与摘要计划与摘要.11.1 项目简介.11.2 市场分析.11.3 公司现状.11.4 管理策略.21.5 盈利模式.21.6 营销策略.21.7 财务分析.31.8 风险分析.31.9 创业团队.3二、二、公司简介公司简介.42.1 公司概况.42.2 公司文化.42.3 经营模式.52.4 公司优势.6三、三、市场竞争分析市场竞争分析.63.1 宏观环境分析(PEST 分析).63.2 波特五力分析.113.3 SWOT 分析.133.4 竞争优势分析.153.5 市场需求分析.153.6 目标用户.163.7 市场可行性分析.16四、产品服务四、产品服务.174.1 产

2、品简介.174.2 产品理念.174.3 产品特色.184.4 产品后台技术.204.5 产品 Android 前端设计.214.6 盈利模式.26五、市场营销策略五、市场营销策略.265.1 营销宗旨.265.2 网络社区营销.265.3 网络整合营销.275.4 广告宣传战略.29六、公司战略六、公司战略.306.1 市场开发战略.306.2 未来发展规划.31七、七、财务分析财务分析.327.1 资本现状.327.2 项目财务可行性分析.327.3 财务计划.337.4 财务假设.3427.5 财务预算.357.6 报表预测.367.7 财务指标分析.367.8 财务小结.37八、风险分

3、析八、风险分析.378.1 市场与竞争风险.378.2 账号风险.388.3 管理风险.388.4 政策风险.398.5 财务风险.398.6 风险资本的退出机制.40九、内部管理九、内部管理.419.1 公司组织架构.419.2 团队内部建设体制要求.449.3 创新.461一、一、计划与摘要计划与摘要1.11.1 项目简介项目简介项目宗旨在于:推出快速阅读资讯软件,开拓掌上新闻新型市场,激发全民浏览新闻热情。意文服务有限公司推出的新闻速拾 APP 是一款新闻摘要软件,我们将使用人工智能的前沿技术,文本摘要技术,对新闻文本进行摘要,提取其中最为重要的信息,形成篇幅较短的新闻摘要,以便读者能够

4、快速把握新闻整体内容,从而选择是否进一步了解新闻详细信息。1.21.2 市场分析市场分析项目研发初期,团队分别进行了环境理论分析,需求性实际调研,市场竞争分析。(1)环境理论分析理论分析中,我们分别对宏观经济环境以及社会环境的进行分析。目前我国经济处于上升趋势,人民的精神文化需求日益增大,了解世界各地资讯成为了现代人必不可少的日常活动之一。(2)需求性实际调研除此之外,我们在一定范围内对市场进行了实际调研,在大学人群以及有工作稳定的人群中进行调研,调研显示平常有阅读习惯的人群占了总人数的 75.3%,然而在这些读者中,78.57%的读者认为新闻内容过长不愿意逐字逐句阅读,同时有 83.4%的人

5、群认为新闻标题无法良好地概括新闻文本内容。从调研中可以看到,阅读新闻的读者人群不愿阅读整篇新闻稿,但通过标题也无法掌握新闻要点,难以取舍之下要么选择通读而浪费时间,要么选择浏览标题而难以整体把握新闻内容。(3)市场竞争分析尽管目前自然语言处理是一个热门的研究话题,但是在自然语言处理中的自动摘要商业化程度比较低。真正的功能比较完善的自动摘要的软件寥寥无几,即使有也并非是盈利的。因此,本公司将捉住这一点,寻找机遇。迅速占领这一市场位置,这样就能避免在其他相关领域,如推荐系统,和强大的对手进行竞争,同时获得自身的生存以及盈利空间。1.31.3 公司现状公司现状意文服务有限公司是一家拟建中自然语言处理

6、服务公司。本公司主打产品“新闻速拾”APP 于 2018 年 4 月完成前期的初步开发工作,目前正着2手对 APP 进行优化调试。拟计划在获取各方创业资金后,于下半年在华南师范大学校内进行初步推广运营。并于 2019 年初在广州市各高校间扩大运营范围。“新闻速拾”APP 推行目的在于开发一个新闻摘要的掌上阅读平台,利用自然语言处理中的文本摘要技术,激发读者在本平台下的新闻阅读兴趣,提供更好的新闻阅读体验服务,同时满足读者阅读新闻的快速性和整体性需求。本公司的主要管理团队赖在华南师范大学计算机学院的精英分子,在项目研发以及创业立项等方面有较为充分的经验。1.41.4 管理策略管理策略本公司以开发

7、新闻速拾 APP 为基点,开拓新型的掌上新闻市场,从而达到促进全民新闻阅读的宏伟目标。本公司的管理模式主要是以领导人为核心的创新竞争模式,鼓励内部成员对项目开发进行创意设计,鼓励进行冒险,不断的对产品进行改革以及创新,以适应人工智能产业的更替快、发展快、淘汰性强的形势。在强化公司内部管理研发效力的同时,将挖掘产品面向的潜在人群,同时进行市场的反馈调查,以便在技术更新换代极快的时代中,能够及时推出新版本的软件,提供更好的新闻摘要服务。1.51.5 盈利模式盈利模式盈利模式主要分为广告收入和软件平台出租收入。广告收入是“新闻速拾”公司的主要营业收入。由于本 APP 实现的是文本摘要功能,因而各类新

8、闻网站以及书籍推荐软件均可在本软件下做广告,广告与功能相得益彰,效果也会相比于其他平台更具优势。同时我魔恩将提供软件平台出租服务,即对于各大新闻网站,使用本项目文本摘要的链接,实现彼方新闻阅读量的提升效果,收取相应的费用。1.61.6 营销策略营销策略目前公司的营销策略为:(1)网络社区营销,对于项目初期知名度不高的问题,我们将采用网络社区推广营销的方式,加强前期的宣传力度,通过微信公众号的推送,提高微博以及论坛社区的存在感等方式将项目推广到多方人群中。(2)广告宣传策略。团队将分为三个时期进行不同力度的广告投放。在前期以树立公司形象为目标,提高品牌知名度。中期拥有一定的用户量之后,将进行适当

9、的广告招商。当项目达到稳定期后,巩固原有市场,并加大资金投入,保持先驱领跑者的地位。3(3)用户服务策略。要做出让用户满意的产品,必须要做好顾客的体验以及后续的人性化服务。将根据市场上现有的阅读产品的人性化策略进行逐步的开发调整,在用户使用时间达到一定长度后,将邀请用户填写反馈意见,以便我们更好地完善服务。1.71.7 财务分析财务分析本项目目前的资金状况较为客观,预测的资金投入方向主要是软件平台开发以及软件宣传推广。在运营期间,分为三个阶段:第一个阶段是融资开发推广阶段,这一阶段主要是资金输出;第二阶段开始初步宣传推广,得到各方的广告收入以及平台出租收入,开始实现初步盈利;第三阶段拥有稳定的

10、市场,将进一步吸引投资,扩大公司规模。1.81.8 风险分析风险分析项目目前处于创业初期,推出的产品业务是新闻摘要平台,团队所面临的风险主要分为七个方面:市场与竞争风险、网站风险、账号风险、管理风险、政策风险、财务风险、退出机制风险。公司团队将针对各类风险规划好适当以及尽可能完备的预防性措施,如若产生了无法预测的风险,公司团队将及时采取适当的应对措施,将风险造成的损失降至最低。1.91.9 创业团队创业团队本公司中的核心成员均来自华南师范大学计算机学院的精英学生。公司的组织架构分别侧重于产品的开发运营以及算法理论的研发创新。因此公司将分为财务、市场、信息咨询、技术研发、总办公五个方面,团队成员

11、概况如下:成员姓名学历工作、项目经历刘思佳计算机技术与科学(师范)本科曾参加过金种子、大学生创业训练项目,泰迪杯等竞赛;有科研项目的经验,熟悉项目的运营流程。陈洛轩网络工程本科曾参加过金种子、大学生创业训练项目;现在负责文书以及 app 的前端工作廖南山软件工程本科参加过金种子、大学生创业训练项目;现在负责Android 客户端的研发4林霭良网络工程本科曾参加过金种子、大学生创业训练项目,ACM 等竞赛获得多项奖励;熟悉多种算法;现在负责算法的研发黄镇杰软件工程本科参加过金种子、大学生创业训练项目;现在负责算法的研发陈子颀网络工程本科参加过多种算法竞赛,有科研项目经验;现在负责算法模型的搭建与

12、测试余梓权软件工程本科参加过数据挖掘竞赛、ACM 等竞赛;熟悉 Windows 客户端、Android 客户端、后端等开发架构;现在负责Android 客户端的研发表 1-1 团队成员概况二、二、公司简介公司简介2.12.1 公司概况公司概况意文服务有限公司是一家拟建中的以广东省广州市高校雄厚的人力资源为依托的提供自然语言处理服务的有限公司。本公司始终坚持着“以需求为导向,以顾客为中心”的宗旨,力求能为顾客提供一个高效,准确地能自动处理计算机电子文本的服务。2.22.2 公司文化公司文化由于本公司的主营业务是自然语言处理方向、属于 IT 产业中的人工智能方向,为了更好的适应产业的发展情况,本公

13、司制定的企业文化如下:本公司的企业文化定位为强人文化,鼓励内部之间的竞争与创新,鼓励进行冒险,不断的对产品进行改革以及创新,以适应人工智能产业的更替快、发展快、淘汰性强的形势。同时会分为六个层次建设公司文化:5图 2-1 建设公司文化六个层次其相对应的文化内涵如下:文化类型文化类型文化内涵文化内涵主导文化强调竞争、目标导向领导风格文化开拓创新、感情丰富员工管理文化鼓励创新、自由开放组织凝聚文化自由发挥、公平竞争战略重点文化获取资源、寻找机遇成功准则文化业绩导向、技术个性表 2-1 公司文化内涵由于本公司系新成立的公司,规模、资源、技术等方面都有所欠缺,因此本公司的价值体系将会建立在尊敬领导人的

14、基础之上,以领导人为核心,建立起一个充满活力、创新、竞争的企业文化环境。2.32.3 经营模式经营模式鉴于本公司的实际情况,现在暂时将经营模式定位于利基经营模式。本公司主要针对自然语言处理中的自动摘要进行服务,不和其他占主导地位的竞争者进行正面的竞争。通过专业化经营,瞄准市场的缺失位,来占据市场的有利位置。尽管目前自然语言处理是一个热门的研究话题,但是在自然语言处理中的自动摘要商业化程度比较低。真正的功能比较完善的自动摘要的软件寥寥无几,即使有也并非是盈利的。因此,本公司将捉住这一点,寻找机遇。迅速占领这一市场位置,这样就能避免在其他相关领域,如推荐系统,和强大的对手进行竞争,同时获得自身的生

15、存以及盈利空间。62.42.4 公司优势公司优势本公司最主要的优势是人才方面的优势。本公司的员工都是来自重点本科大学的计算机专业,尽管缺少一定的经营的经验和管理经验,但是有着比较扎实的专业基础和技术能力,能够保证产品具有比较完成以及相对比较强大的功能。同时,由于员工都比较年轻,学习能力比较强,能够迅速学习有关公司的相关经营的知识技能等,能有效的在实战中吸取经验。同时也由于是来自重点本科大学,借助对大学的熟悉程度以及人际关系,能够快速在相关大学中获得一定相关的技术帮助以及能根据市场不断变化的环境及时从大学中吸纳有不同能力的人才。三、三、市场竞争分析市场竞争分析3.13.1 宏观环境分析(宏观环境

16、分析(PESTPEST 分析)分析)PEST 是一种分析企业所处宏观环境分析普遍应用的模型。P,E,S,T 分别代表Political(政治),Economic(经济),Social(社会)和 Technological(科技),这几项都是不受企业掌控的外部环境,基本体现了企业所处的时代背景。下面分别进行分析。图 3-1 宏观环境3.1.13.1.1 政治法律环境分析政治法律环境分析目前,在国内新媒体发展的过程中,政策法规的出台以及管理体系的调整可以说是在匆忙之中启动的。特别是互联网的跨媒体特征,给原来按照行业界限划分的管理体制带来了挑战。新媒体面临的法律环境是比较复杂的,仅仅针对互联网的相关

17、法律法规就有数十个,其中有宪法与法律,有司法解释,有行政法规、部门规章和部门通知,还有地方法规和行业规范。而面对新媒体不断涌现的新应用,已有政策法规还将继续调整、修改,新的法规还会不7断颁布。作为新媒体从业人员,需要对这些政策法规有面上的了解,树立相应的法律意识,这也是避免触碰管理和法规红线,保障媒体正常运行的基本要求。与日常编务工作密切相关的主要集中在与信息内容安全、版权保护以及名誉权保护等几个方面,主要条款摘录如下:互联网信息服务管理办法,互联网电子公告服务管理规定,信息网络传播权保护条例,民法通则司法解释和中华人民共和国侵权责任法,中华人民共和国侵权责任法等等。李克强总理强调,大众创业、

18、万众创新。2015 年 5 月,李克强在中国科学院和中关村创业大街考察时,强调着力推动大众创业万众创新,汇聚起经济社会发展的强大新动能。通过大众创业、万众创新,发挥市场机制作用,加快农互联网新闻业的发展,把人工智能和新闻行业结合起来,使新闻行业与互联网产生叠加效应,对于促消费、扩内需,推动整个新闻行业的发展具有重要意义。图 3-2 李克强总理在启动仪式上发表讲话政策鼓励大学生创业。近几年来,国务院办公厅及有关部门,制定一系列相关政策,鼓励毕业生各种渠道、各种形式就业,支持毕业生自主创业。在国家倡导大众创业、万众创新的背景下,大学生无疑是创业队伍中的一支主力军。资金问题也是许多大学生“创业难”的

19、一大现实问题。为此,在多地的促进高校创新创业方案中,政府给大学生设计了创业“红包”。这对许多创业大学生是一个政策大礼包。8图 3-3 参与大学生创业比赛的人数简而言之,目前国内与新媒体相关的法律法规已经日趋完善,同时国家出台的相关政策大力支持,这为我们的公司发展提供了件事的法律保障和良好的环境,我们应该在大数据和人工智能时代下抓紧新媒体新闻行业发展契机迅速发展自身实力,提升竞争力。3.1.23.1.2 经济环境分析经济环境分析总的来说,我国经济发展新常态下速度变化、结构优化、动能转换的特征更加明显,稳中向好的态势不断巩固。从速度看,去年中国经济增长 6.7%,虽较过去两位数的高增长有所放缓,但

20、在全球主要经济体中仍位居前列。当前,我国经济正处于“增速换挡期”,面临着不小的下行压力,但我们认为,我国经济正在稳定向上发展。近几年的 GDP 增速在下降,但增长的绝对数额仍是稳定的。从 2016 年来看,虽然增速下滑 0.2 个百分点,但 GDP 多增加了近 1 万亿元。而从历年的增长额来看,20122016 年增长额分别为 5.1 万亿元、5.5万亿元、4.9 万亿元、4.5 万亿元、5.5 万亿元,增速从 2012 年的 7.9%下降到 2016 年的 6.7%,增速下滑了 1.2 个百分点,增加值却多了 0.4 万亿元综合来看,我国经济处于一个从快速降速转变为缓慢增长的阶段,总体仍是上

21、升趋势,我们应保持足够的信心,调结构、推改革、扩开放和回绿色、促共享的一些列举措将使我国继续走在持续、协调、健康发展的道路上。随着社会经济发展和人民生活水平的不断提高,人们的新闻以及摘要的观念逐渐改变,人民对日益剧增的信息量感到力不从心。与此同时,越来越多的人民开始愈发关注外界发生的一切。所以,能够快速检索满足人民需求的新闻摘要需求也逐渐提高。这对新闻行业提出更高要求的同时也带来了新的机遇。3.1.33.1.3 社会文化环境分析社会文化环境分析我国是人口大国,第六次人口普查登记的全国总人口为 1339724852 人。目前我国人口增速逐渐放缓,出生率逐步降低。而随着科学的发展和技术的进步,人民

22、生活水平的提高,人均寿命也逐步提高。出生率的下降和人均寿命的提高将我国的人口结构老龄化。一般来说,9社会结构老龄化,会造成生产能力的下降。虽然随着科学技术的进步,生产能力下降的影响会逐步降低。但由于退休后收入降低,消费能力下降,老龄化的人口结构还是会减缓经济的发展速度。在相关政策和宏观调控的影响下,我国城镇化比例不断上升。第六次人口普查显示居住在城镇的人口为66557万人,占总人口的49.68%,居住在乡村的人口为67415万人,占50.32%.与第五次年人口普查数据比较,城镇人口比重上升 13.46%。从乡村流入城市的人口多为青年劳动力,而年老的非劳动力人口通常会留守农村。这促使农村的老龄化

23、结构加剧,同时降低了城镇的老龄化率。农村的青年人口参与到城镇化进程中,给我国城镇经济发展提供了新的动力。通过人口普查数据可知,人们受教育程度普遍提高。另外,随着互联网技术,大数据以及人工智能的普及,人们获取知识的渠道更为便捷,在这样的大背景下,人们如何在海量的数据中获取自己想要的信息就显得尤为重要和急切。这种对数据获取和检索的观念转变,促使着新闻行业和相关互联网公司需要不断调整经营和研发方向,增加相应的营业项目,改变经营方向以适应和满足消费者不断变化的需求。图 3-4 当今时代人们对信息数据的需求特点3.1.43.1.4 技术环境分析技术环境分析毫无疑问,如今的时代是大数据以及人工智能的时代,

24、无论是 Alphago 的横空出世还是无人驾驶等相关技术的高速发展,都预示着一个前所未有的科学革命时代的到来。无论是企业还是高校以及研发机构,深度学习的研发以及应用都在如火如荼的进行中和日趋完善。互联网时代也让我们获取知识的途径变得愈加便捷和简单。同时,由于国家将人工智能上升为国家国防和科学技术的重点发展领域,各大互联网公司对此方向的投入力度也达到了前所未有的高度。在此背景下,人们获取信息的途径和对新闻质量的需求也一定会随着科学技术的发展而持续处于变化中。10图 3-5 当今时代的技术环境3.1.53.1.5 PESTPEST 分析总结分析总结通过 PEST 分析,得出结论如下:政治环境政治环

25、境1、国家新媒体相关的法律法规日渐完善2、国家政策大力扶持互联网+信息技术服务行业3、李克强总理鼓励大众创业、万众创新4、政策鼓励大学生创业经济环境经济环境1、人均可支配收入增长,人们生活水平提高2、城市人口多,需求大,市场广阔文化环境文化环境1、人均素质和受教育水平越来越高2、新闻成为人们了解外界的有力渠道3、大数据时代下信息量的剧增4、消费者对信息过滤处理需要的日益提高技术环境技术环境1、互联网技术的发展2、人工智能技术的发展113、国家对人工智能发展的高度重视4、相关企业,高校和研究机构的技术理论支撑表 3-1 PEST 分析总结3.23.2 波特五力分析波特五力分析五力模型是迈克尔.波

26、特(Michael Porter)于 1980 年代初提出的。波特认为行业中存在着决定竞争规模和程度的吴忠力量,分别为进入壁垒,替代品威胁,买方议价能力,卖方议价能力以及现存竞争者之间的竞争。这五种力量的不同组合影响着行业的发张潜力。以下针对新闻摘要行业对五种力量分别进行分析。图 3-6 新闻摘要行业对五种力量3.2.13.2.1 供应商的议价能力供应商的议价能力在我们所开发和研究的行业范围内,对于基于机器学习的新闻摘要,我们更多的是考虑供应商的市场影响力(市场渗透率),数据沉淀能力,用户忠诚度(对于供应商的继续使用意愿,使用频率和满意度)。3.2.23.2.2 购买者购买者12传统维度注重市

27、场上的供求关系和购买者的议价能力,在基于互联网的新闻摘要行业中,我们的关注点则是用户对于创新服务的需求和粘性(即留存);3.2.33.2.3 潜在进入者威胁潜在进入者威胁联网进入门槛较低,很多小众企业可以通过细分行业的服务创新快速进入市场,新型产品层出不穷。所以在这一力的研究上,我们会从产品形态和服务创新角度出发寻找小众形态潜入者;3.2.43.2.4 替代品威胁替代品威胁这个维度主要衡量不同企业内产品之间是否存在互为替代的可能。在互联网新闻领域,我们会着重关注产品的形态、行业上下游链路关系、数据的沉淀等是否可复制或存在被整合的风险。然而,我们认为互联网产品不依托硬件设计,而是依赖软件产品形态

28、,导致产品形态复制成本低,因此,产品形态并非是关注重点,我们的侧重点是行业上下游链路关系、数据的沉淀等是否可复制或存在被整合的风险;3.2.53.2.5 同业竞争者的竞争程度同业竞争者的竞争程度这一力我们并没有做任何互联网维度转化,分析维度仍然是关注行业内互联网产品的市场渗透率的表现,确定行业的集中程度和分布格局。目前国内的新闻软件虽然数量众多,但大多千篇一律,只是将海量数据堆砌摆放在人们面前,如何对互联网的新闻行业进行改革以满足人们在大数据时代下日益变化的需求,将是众多新闻互联网公司面临的一大难题。图 3-7 同业竞争者分析3.2.63.2.6 波特五力分析模型总结波特五力分析模型总结通过波

29、特五力分析,意本.文摘应着力于核心技术的研发,产品的开发和品牌建设。五力五力水平水平13现有竞争者的威胁现有竞争者的威胁中等替代品的威胁替代品的威胁低潜在竞争者的威胁潜在竞争者的威胁低供应商议价能力供应商议价能力中等购买者议价能力购买者议价能力中等表 3-2 波特五力分析3.33.3 SWOTSWOT 分析分析SWOT 分析法,即态势分析,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论,而结论通常带有一定的决策性。3.3.13.3.1 内部环境分析内部环境

30、分析3.3.1.13.3.1.1 竞争优势(竞争优势(S S)分析)分析(1)产品:意本文摘软件是为了满足大数据下人们对新闻信息处理的需要,并且结合当前计算机领域的神经网络技术而成的产品。(2)技术:小组成员皆为人工智能技术的狂热者,对神经网络领域涉及较早,研究较深入,具备相关技术的开发和研究能力。(3)团队:意本.文摘团队不仅在研究开发和运营方面做得出色,比赛经验也十分丰富,小组成员都在各项比赛中屡创佳绩,学习成绩优秀,学有余力。同时,得到老师同学的大力支持,具有励志、积极向上的良好形象。143.3.1.23.3.1.2 竞争劣势(竞争劣势(W W)分析)分析(1)创业初始经验不足:意本.文

31、摘团队成员基本是在校大学生,无法做到全职投入到工作中;且创业初始,经验不足,需要老师的指导、同学们和家长们的支持。(2)资金不足:缺乏资金支持,例如服务器等开发设施配套可能一时间跟不上。(3)品牌影响力不大:尚未做到大范围内品牌化,因此即使产品有优势但是与市面上的有老牌行业产品相比还是略逊色。3.3.23.3.2 外部环境分析外部环境分析3.3.2.13.3.2.1 机会(机会(O O)(1)大数据时代:现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。随着互联网信息量的急速膨胀,人们面对海量新闻信息往往感到力不从心

32、。(2)人工智能时代:随着 Alphago 的横空出世和无人驾驶,图像识别等技术的日趋完善,我们的社会正在经历着人工智能技术的更新换代。无论是企业或者高校,神经网络等技术的研究和开发都在如火如荼的进行当中,给我们的公司团队提供了技术理论支撑和发展机遇。(3)行业现状:虽然目前国内的互联网新闻行业众多,但大多并无真正与人工智能技术结合起来,也无法根据用户的个性化需求提供信息,让用户面对海量信息的时候还是感觉到无从下手。这也正为我们意本.文摘团队打入市场提供了一个契机,3.3.2.23.3.2.2 威胁威胁(1)传统互联网新闻的威胁传统的互联网新闻行业会对我们产生一定的威胁。一部分消费者可能会倾向

33、于使用传统的软件,对我们产品的品质持怀疑态度;此外,还存在低端产品依靠不健康的信息吸引消费者。(2)潜在竞争对手不排除新产品或新技术的出现导致我们竞争力下降的可能。3.3.33.3.3 SWOTSWOT 分析总结分析总结根据上述分析,得出以下 SWOT 分析总结:内部环境内部环境竞争优势(竞争优势(S S)竞争劣势(竞争劣势(W W)151、拥有满足消费者新需求的产品2、运用神经网络等技术3、团队优势:拥有优秀的团队,拥有专业的管理人才,拥有积极奋进、勇于开拓的市场团队1、创业初始经验不足2、资金不足3、品牌影响力不大机会与威胁机会与威胁潜在机会(潜在机会(O O)潜在威胁(潜在威胁(T T)

34、1、大数据时代孕育新需求2、人工智能时代的机遇3、互联网新闻行业存在的不足为我们提供了契机1、传统互联网新闻企业的威胁2、潜在竞争对手的出现表 3-3 SWOT 分析总结3.43.4 竞争优势分析竞争优势分析(1)针对性强。该 app 主要是对新闻文本进行自动摘要。(2)摘要准确度高。由于是针对新闻文本进行摘要,因此内部使用的算法也是具有比较强 的针对性,得出来的摘要也能得到质量上的保证。在实现自动摘要时还会优化各种算法最终使得在原有的文本准确率上提高 10%左右,即达到 90%95%,能十分接近人工摘要。(3)内存小,运行快。因为该 app 自身不具备自动摘要功能,或只具备比较有限的摘要能力

35、。app 获得摘要的主要来源是链接网络获取,因此 app 自身不需要占用过多的内存和运行时间。(4)生成新闻摘要数量多。因为在后端,摘要能持续不断的在通过爬虫获得之后生成,而每当软件链接网络时都能获取这些生成的摘要。因此生成的摘要数量是十分可观的。(5)能及时浏览国内外重大新闻摘要。该 app 在获取新闻源文本时,会优先获取比较有权威的新闻网站上的重大新闻,从而为用户优先提供这些新闻的摘要。因此该项目除了能为 android 平台提供一个功能强大、小巧玲珑的摘要文件之外,还能为自动摘要的研究提供宝贵的经验。3.53.5 市场需求分析市场需求分析根据调查显式,在 2016 年至今的新闻移动客户端

36、使用用户的基数极大,但用户人数的16增长趋势不明显,现今有两类新闻资讯应用客户端占据大部分市场,一类为媒体新闻客户端,一类为聚合新闻客户端。媒体新闻客户端是一种手机用户提供持续、实时、全方位新闻资讯更新,内容涵盖国内、国际、军事、社会、财经、体育、娱乐等方面的新闻类应用软件。而聚合新闻客户端聚合了传统媒体以时事新闻为主的新闻信息,以及自媒体平台热点信息源,结合受众兴趣爱好及浏览历史,基于手中主动搜索个性订阅等操错,对全平台新闻信息展开精准推送的产品形式。媒体新闻是大部分新闻软件的选择,持续提供实时新闻,内容丰富。聚合新闻虽然只有诸如“一点资讯”“今日头条”但是占据了十分大的市场比重。因此,结合

37、当今的新闻客户端现状,我们将以时事新闻为新闻主体,加入订阅、收藏等多项功能,结合两类新闻客户端的特征属性,注入我们的产品“新闻速拾”。3.63.6 目标用户目标用户我们所设计的“新闻速拾”智能自动文本摘要 APP 提供的服务范围和内容,在调试阶段,我们主要面向大学生和大学教师。因为我们都是大学生,接触此类人群较多,更加容易宣传和推广我们的 APP。而且现在大学生活都相对来说比较忙碌,看新闻的时间较少,因此人们会更加期望一个可以间接阅读新闻的平台。而当软件可以正式投入运营时,我们的目标用户就可以拓展到普通大众。3.73.7 市场可行性分析市场可行性分析在快速的生活节奏中,由于新闻信息的过载,新闻

38、标题哗众取宠,人们迫切地希望有这么一个工具可以帮助自己用最短的时间了解最多的最有用的新闻。在万维网用户普遍面临信息过载的今天,自动文本摘要技术无疑能够有效地降低用户信息负载,帮助我们更好地从万维网来获取各类信息尤其是新闻。近年来,自动文本摘要技术在科技情报领域的应用不断扩展,有效地提高了科技工作者浏览的处理信息的效率,是当前信息检索领域的研究热点之一。在日常生活中,大多数工作者都迫切需要一种新闻自动文本摘要 App,以节省时间,提高新闻阅读效率。若引用国外公司的的产品,虽然方便,但是易使外国更深入的了解中国信息,有时甚至是属于中国的机密信息,容易倒是中国机密的泄露;与此同时,本行业在国内尚属朝

39、阳产业,本公司此行业的研究开发水平,在国内并不为倒数。同时,本公司将与多个新闻大户网站达成协议,形成一个新闻网络。产品在进入市场的过程中将通过报纸杂志、门户网站和微信微博等渠道提高产品的知名度和影响力。所以,我们公司所开发的本款产品,是建立在当今时代科学技术发展和用户真实需求的基础上的,是具有充足的市场可行性的。17四、四、产品服务产品服务4.14.1 产品简介产品简介新闻速拾是利用计算机(非人工)对大量的新闻文档进行计算处理,在短时间内为各篇新闻生成简短的、准确反映新闻主题、内容的摘要,并将这些摘要呈现给读者的手机 APP。当读者想要了解和某些主题相关的新闻的时候,只需在 APP 上输入相关

40、的关键词,进行搜索,APP 就能自动搜索各大新闻网站获取相关新闻,将新闻的链接和网页标题呈现出来,同时为每篇搜索得到的新闻自动生成摘要,当读者通过阅读摘要觉得文章具有可继续阅读的价值后,就能点开相关链接进行深入的阅读。项目将现在高校发展,再逐步走向社会。该项目的亮点在于,迎合市场刚需,可以使用户快速高效地浏览新闻。图 4-1 项目图标图 4-2 APP 主界面4.24.2 产品理念产品理念当今处于碎片化阅读时代,人们已经不习惯于曾经的大篇幅阅读,尤其是对于每日成千上万条内容繁复的新闻,逐字逐句的阅读不仅浪费时间,而且缺乏现实意义。18当今人们阅读新闻大多使用手机新闻软件、网页新闻页面,甚至于许

41、多非新闻软件也每日推出相应新闻吸引眼球新闻的获取途径增多,而软件与各大新闻app推出的新闻的侧重点不一,许多软件侧重的重点新闻并非每日热点,而是博人眼球的生活异象。01途径多样02种类良莠不齐03标题党众多第一,为了吸引读者阅读新闻主题内容,增加新闻点击量,新闻的标题大多希望达到爆炸性的效果,而忽视了事实性以及重要内容提炼。图 4-3 当今新闻获取三个特征近几年,新闻移动客户端使用用户的基数极大,有两类新闻资讯应用客户端占据大部分市场,一类为媒体新闻客户端,一类为聚合新闻客户端。媒体新闻客户端是一种手机用户提供持续、实时、全方位新闻资讯更新,内容涵盖国内、国际、军事、社会、财经、体育、娱乐等方

42、面的新闻类应用软件。而聚合新闻客户端聚合了传统媒体以时事新闻为主的新闻信息,以及自媒体平台热点信息源,结合受众兴趣爱好及浏览历史,基于手中主动搜索个性订阅等操错,对全平台新闻信息展开精准推送的产品形式。媒体新闻是大部分新闻软件的选择,持续提供实时新闻,内容丰富。聚合新闻虽然只有诸如“一点资讯”“今日头条”但是占据了十分大的市场比重。结合当今的新闻客户端现状,我们将以时事新闻为新闻主体,加入订阅、收藏等多项功能,结合两类新闻客户端的特征属性,注入我们的产品“新闻速拾”。“新闻速拾”,即在当今新闻阅读环境下,力求在还原新闻原意以及原内容的条件下,能够节省用户阅读新闻的时间,提炼出相应的新闻真实内容

43、、重点内容,用户通过阅读摘要,便可以极大程度地抓住新闻主旨,从而根据自己的兴趣需要选择是否深入阅读。4.34.3 产品特色产品特色4.3.14.3.1 产品技术的特色与创新产品技术的特色与创新19利 用深 度学 习的 方法 自动 生成 句子 作为 摘要,即利用“从序列到序列”来实现“从原文到摘要文本”的映射。同时应用注意 递归 神经 网络 编解 码器 模型 到文 本摘 要中,以提高摘要效果。注 意利 用 传 统方法。在设计编码 器模 型 的 时候,会利用机器学 习来 对 各 种浅 层文 本 特 征进行学习,还会引 入语 言 网 络的 方法 链 接 浅层 方法 和 深 层方 法使 得 进 一步

44、深度 的 分 析文本。深度学习和传统方法相结合。两者的结合实现文本的自动摘要是当前自动摘要下一步研究的热点与重点。这也是此次项目中一大科研特色。4.3.24.3.2 产品服务特色产品服务特色因此该项目除了能为 Android 平台提供一个功能强大、小巧玲珑的摘要文件之外,还能为自动摘要的研究提供宝贵的经验。4.3.34.3.3 产品服务对象产品服务对象20调试阶段:主要面向大学生和大学教师。因为我们都是大学生,接触此类人群较多,更加容易宣传和推广我们的 APP。而且生活忙碌的他们会更加期望一个可以间接阅读新闻的平台。正式投入运营:目标用户就可以拓展到普通大众。4.44.4 产品后台技术产品后台

45、技术4.4.14.4.1 采用基于采用基于 seq2seq+attentionseq2seq+attention 模型的深度学习文本摘要方法模型的深度学习文本摘要方法4.4.1.14.4.1.1 文本的表达文本的表达这一部分分为分词处理以及文本表现形式处理。分词处理算法大致分为机械分词方法、基于统计及机器学习的分词方法。需要解决的问题有:匹配方法;消除歧义。文本表现形式处理,采用分布式向量表现方式,这样就可以用一个实数矩阵/向量表示一句话/一个词。4.4.4 4.1.2.1.2 文本特征提炼文本特征提炼关于文本特征的,我们研究 TF-IDF 方法,以统计评估单词描述文本的能力以及区别文档的能力

46、作为特征提取评判标准。此外也将研究采用互信息算法,比较在不同类别中词条出现的频率,以此判别特征词和类别之间的关系。4.4.4 4.1.3.1.3 文摘生成文摘生成本项目所研究的文摘生成算法包括机器学习、Seq2Seq 架构、混合神经网络。机器学习方面,项目中将研究把深度学习和强化学习相结合。采用由 AI 实验室提出的 ConS2S 模型.Seq2Seq 模型有效地建模了基于输入序列,预测未知输出序列的问题。模型有两部分构成,一个编码阶段的”Encoder”和一个解码阶段的”Decoder”。Seq2Seq 架构分为编码器和解码器。编码器负责将输入的源文本编码成一个向量,该向量是原文本的一个表征

47、,包含了文本背景。解码器负责从这个向量提取重要信息、加工剪辑,生成文本摘要。混合神经网络包括卷积神经网络、递归神经网络等,将神经网络操作应用到用分布式向量表现的文本中进行。4.4.4 4.1.4.1.4 文本摘要评价系统文本摘要评价系统21评估摘要部分,完成三项任务,可以通过人工评价方法和自动评价方法实现摘要评估。原则如下。1、决定原始文本最重要的,需要保留的部分2、在自动文本摘要中识别出 1 中的部分3、基于愈发和连贯性评价摘要的可读性对于自动评价方式,需要比较人工摘要和生成摘要,通过一个或若干指标进行自动评价,目前最常用且认可的指标有 ROUGE-n 及 ROUGE-L 和 ROUGE-S

48、U 等。4.54.5 产品产品 AndroidAndroid 前端设计前端设计整个项目的空间实例获取使用第三方库 Butter Knife 实现解耦,总体功能结构图如下:图 4-4 总体功能结构图4.5.14.5.1 登录与注册模块登录与注册模块使用 Material Design 设计风格,实现用户的登录和注册界面。具体采用了相关的 MaterialDesign 控件,如 CardView、FloatingActionBar、TextInputLayout 等。另外,不同于市面上一般 APP,这里设计了相关的跳转动画,符合 Material Design 的设计思想,给用户良好的体验感。22

49、图 4-5 登录与注册界面4.5.24.5.2 首页模块首页模块使用多个自定义的 View(如 HorizontalNavigationBar、HorizontalNavigationItemView、MyHorizontalNavigationBar、RoundImageView)搭建个性化的首页,其中用户可以通过切换不同 tab 页来查看不同种类的新闻。另外也设计了三个 Activity 界面(SearchPageActivity、NewsBriefActivity、FullContentActivity),分别实现首页新闻项的搜索界面、新闻摘要的阅览界面、新闻正文的阅览界面。4.5.34

50、.5.3 新闻论坛模块新闻论坛模块使用自定义的字体对标题栏进行格式化,然后使用原生的 WebView 控件,对后台指定的 URL 发送请求,返回后台搭建的论坛 HTML 代码,WebView 调用浏览器内核对其进行解析,最终展示一个网页给用户操作。其中对 WebView 进行了相关设置,用户可以在 WebView中点击网页上的超链接跳转至任意网页,而始终停留在 WebView 界面中,点击手机 Back按键即可回退至上一个浏览过的网页。23图 4-6 APP 首页(左)及新闻论坛界面(右)4.5.44.5.4 新闻摘要生成模块新闻摘要生成模块图 4-7 新闻原文与新闻摘要244.5.54.5.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 行业资料 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服