1、创业计划书移动设备上基于实时视觉信息的旅行翻译系统团队名称: 艾伦博信息技术公司(筹)团队成员姓名:吴廷耀,刘新海,李敏,周俊峰,谭畅技术顾问:杨琼联系方式:Address: Celestijnenlaan 13/0302, 3001 Heverlee, BelgiumE-Mail: Tingyao.WuTel: +32 (0) 486 87 25 18日期:2010年7月13日保密须知本商业计划书属商业机密,所有权属于艾伦博创业团队。其所涉及的内容和资料只限于已签署投资意向的投资者使用。收到本计划书后,收件人应即刻确认,并遵循以下规定:1) 若收件人不希望涉足本计划书所述项目,请按上述邮件地
2、址尽快将本计划书完整退回;2) 在没有取得艾伦博创业团队的书面同意前,收件人不得将本计划书全部或部分复制、影印或以其他方式传递,泄漏或给予他人;3) 应该象对待贵公司的机密资料一样的态度对待本计划书所提供的所有机密资料。目录摘要4第一章 团队概况及公司规划5(一)团队成员情况5(二)团队成员情况介绍5第二章 项目产品及服务9(一)主导产品功能介绍9(二)产品前期开发研究进展情况10(三)对产品未来发展方向的预测10第三章 技术术来源及前景11(一)产品技术范围11(二)国内外同行业产品11(三)本产品与同行业产品的技术比较12(四)公司的技术路线、关键技术、技术发展规划的介绍13(五)公司未来
3、5年在研发资金投入和人员投入计划13第四章 市场及行业分析16(一)国内外市场情况16(二)国内外主要竞争对手的比较17(三)为提高竞争力拟采取的措施及竞争策略17(四)产品/服务的市场分析18(五)公司对市场变化的应对策略18第五章 营销策略19(一)目标客户与渠道19(二)营销模型19第六章 融资需求及财务预测22(一)基本财务状况分析22(二)投入资金的用途和使用计划22第七章 投资风险及资本退出24(一)项目实施过程中可能遇到的风险及控制、防范手段24(二)资本退出方案25第八章 附件-财务报表261.预测损益表262.预测资产负债表273.预测现金流量表28摘要 本产品旨在提供移动设
4、备上基于实时视觉信息的旅行翻译系统。随着中国出境旅行者的逐年增加,境外旅行者语言困难问题也逐渐凸显。目前需要使用翻译时,旅行者通常在移动设备上借助基于手动输入的字典查询软件。但是字典软件已经远远无法满足旅行者的要求。旅行者需要更方便快捷的方法来全面地获取境外旅途相关信息。例如,帮助境外旅行者在未知当地语言的情况下,迅速了解旅游景点介绍、餐馆菜单、地名等,让旅行者更好地享受旅行乐趣。为此,我们开发了基于实时视觉信息的旅行翻译系统。用户只需要用移动设备的摄像头视频录入或者拍摄所需要翻译的文字,我们的产品将自动跟踪视频中的文字信息,从视频或图像背景中切分文字,并作光学字符识别(optical cha
5、racter recognition),最终将所识别的文字从源语言自动翻译成目标语言。同时,根据用户的需要,产品可通过无线互联网(例如HSDPA、GPRS或WiFi)查询所翻译的文字,提供给用户一体化的翻译和全方位的相关信息。与目前一些研究所和公司研发的基于静止图像的翻译系统相比,我们的产品具有如下特点:(1) 基于实时视频,有更好的用户体验;(2) 与手持设备芯片组硬件细节结合紧密,算法针对芯片信号处理部分结构的特点进行专门优化后来实现。一方面能够达到高效能低功耗的目标,另一方面也大大提高了技术壁垒,很难被仿制,因而能够更好地保护知识产权;(3)字符识别中双重纠错,有力保证光学字符识别的正确
6、性。本产品具有可持续发展性强,可扩展性强,后续研发目标明确,前景明朗等优点,在投资方面具有技术新、发展快,短期回报低,但长期回报高且持久,同时人员精简、投入较低的特点。上述特点与我们的商业模型结合后,本产品在不远的将来有广阔的市场前景和丰厚的利润。第一章 团队概况及公司规划(一) 团队成员情况姓名性别出生日期最高学历专业职务及分担的任务所在单位吴廷耀男1976.7博士信号与信息处理软件设计与开发阿尔卡特-朗讯贝尔实验室刘新海男1976.8博士讲师通信与信息处理软件设计与开发比利时鲁汶大学武汉科技大学李敏男1979.3博士研究员信号处理电路与系统硬件系统设计与开发IMEC周俊峰男1977.4博士
7、微电子芯片设计与开发比利时鲁汶大学谭畅女1981.3硕士经济学预测财务状况及编制预测财务报表通用汽车金融服务公司欧洲财务中心杨琼女1976.7博士模式识别与图像处理技术顾问IMEC(二) 团队成员情况介绍吴廷耀,阿尔卡特-朗讯贝尔实验室高级研究工程师,比利时鲁汶大学工学博士 学习工作经历 1998年北京大学电子学系理学学士,2003年北京大学信息科学中心工学硕士,2009年鲁汶大学电子工程系工学博士。 现就职于阿尔卡特-朗讯贝尔实验室(安特卫普) 科研成果 在国际期刊和国际会议上以第一作者身份发表科技论文13篇,领域涉及模式识别,语音识别,说话人识别,网络技术,网络视频传输等 获奖情况 200
8、7年国家优秀自费留学生奖学金 2003-2009年比利时鲁汶大学博士奖学金 2001年北京大学诺基亚奖学金(一等) 2000年北京大学五四奖学金(一等)刘新海, 比利时鲁汶大学电子工程系博士生,武汉科技大学信息学院讲师 学习工作经历 曾就职于武汉科技大学信息学院,担任讲师职位 现在比利时鲁汶大学电子工程系攻读博士学位 科研成果 参与或主持多项横向或纵向课题,并申请专利一项 参与多项欧盟或比利时政府科研项目 自2006年来,以第一作者身份在国际期刊和会议上发表论文6篇,领域涉及信息检索、图像处理和计算机视觉。 获奖情况 2005年,获湖北省科技进步二等奖 2009年,Academic Trave
9、l Grant, Academische Stichting Leuven 2009年,Doctoral Student Forum Fellowship, SIAM International Conference on Data Mining, USA李敏, IMEC研究员 学习工作经历 1997.9 2001.7:浙江大学信息工程学院 本科 2001.9 2004.7: 浙江大学信息工程学院 研究生 2005.3 2009.9: 比利时鲁汶大学和IMEC微电子中心 博士 2003.2 2003.9: 朗讯贝尔实验室中国基础科学研究院 研发实习生 2008.9 2008.12: 美国伊利诺
10、伊大学香槟分校(UIUC)电子系 访问学者 2009.9 现在: 比利时IMEC微电子中心 研究员 学术职务 2011 IEEE世界通信大会(ICC 2011)技术委员会成员 (TPC member) 2010 IEEE世界通信大会 (ICC 2010) 技术委员会成员 (TPC Member) 2010 欧洲电子设计自动化与测试大会 (DATE 2010)技术委员会成员 (TPC Member) 获奖情况 德州仪器公司信号处理成就奖 (The Texas Instrument Excellence in Signal Processing Award) IMEC微电子中心论文冠军奖 (Pub
11、lication Champion of IMEC) IEEE信号处理系统2007年会最佳论文奖 (Best paper award at IEEE SIPS 2007) 2008 年国家优秀留学生奖学金 两项美国专利,一项欧盟专利 项目经历: 某日本公司基带芯片项目(IMEC完成)主要负责人 多个欧盟FP6,FP7项目(Multibase等)主要参与人 科研成果 两项美国专利,一项欧盟专利 30余篇国际会议与期刊论文周俊峰,比利时鲁汶大学电子工程系 微电子学 博士 学习工作经历 比利时鲁汶大学 ESAT-MICAS, 博士 (2005-2010) AMI Semiconductor Belg
12、ium,模拟和混合信号集成电路设计 (2005-2008) On Semiconductor Belgium, 模拟和混合信号集成电路设计 (2008-2009) 科研成果 在国际期刊和国际会议上以第一作者身份发表科技论文8篇,领域涉及低噪声模拟和混合信号电路设计,电源管理芯片设计和集成电路的电磁兼容性设计。 项目经历 2005.1-2006.9 IWT (比利时科学与技术创新研究所)项目“汽车专用芯片的电磁兼容性设计” 2006.10-2009.3 欧盟FP7项目“微电子系统设计及应用研究: 寄生参数提取和优化”(www.medeaplus.org) 2009.3-2009.12 IWT项目
13、“混合信号集成电路设计初期的电磁兼容性设计及其建模” 获奖情况 一项美国专利,一项欧盟专利谭畅,通用汽车金融服务公司欧洲财务中心高级金融分析师,比利时(法语)鲁汶大学经济学硕士 学习工作经历 2002年北京大学光华管理学院货币银行学专业获得经济学学士学位; 2004年获得比利时(法语)鲁汶大学经济学硕士学位。 2006-2007年就职于优美科(Umicore)集团财务控制部。 2007年至今就职于通用汽车金融服务公司欧洲财务中心结构性融资部。杨琼,IMEC高级研究员,清华大学博士 学习工作经历 现就职于比利时IMEC 2007年-2008年,就职于比利时鲁汶大学电子工程系 2004年-2007
14、年,就职于微软亚洲研究院 科研成果 主要研究方向为模式识别与图像处理。 在模式识别图像处理领域拥有多项专利,也在该领域的顶级杂志和顶级会议上发表多篇论文。 领导过“大规模人脸识别系统”、“基于人脸的门禁系统”、“综合笔迹和人脸特征的注册系统”等多个项目。第二章 项目产品及服务本章将介绍公司产品的主要功能,目前的研发状况和未来能提供的服务。(一) 主导产品功能介绍公司旨在提供各类移动手持设备上基于实时视觉信息的旅行翻译系统。本系统对实时录入的视频流或者静止图像中的文字信息进行检测、切分和识别,并将识别出的文字信息翻译成指定的目标语言,同时通过移动终端网络为该文字信息提供搜索服务,获得更多相关旅行
15、信息。公司产品的主要功能包括:1. 基于实时视觉信息,在移动设备上实现多语言的文字识别和翻译支持对于旅游景点介绍、菜单、地名等的多语种(中、英、法、日、德)印刷体识别,并且提供语言之间的即时翻译,比如中英互译、英法互译、英日互译、日德互译等。用户只需拍下旅游景点介绍、菜单、地名等的视频信息,我们的产品将会对视频中的文字进行自动处理,并提供即时翻译,使用户在旅行中拥有更好的体验。2. 基于文字识别和翻译的结果,通过互联网检索为旅行者提供更多相关信息。对于文字识别和翻译的结果,用户可以进一步通过手持设备中的无线网络,搜索互联网,得到更多的相关信息。比如:一名中国游客去法国旅行,在一家著名的法国餐馆
16、就餐。当他来到餐馆,仅需拍下餐馆的名字,我们的产品将会根据识别和翻译结果自动在互联网上进行搜索,并反馈给用户该餐馆的相关信息, 例如该餐馆的历史、风格、主要特色菜肴、其他用户对各菜肴的推荐和评价以及该餐馆提供的特色服务等。这样,他就可以在不懂法语的情况下获得很多信息,以便自己更愉悦地享受旅行。此外,由于拥有自动翻译系统,他还可以现场学习一些法语的常用词汇,帮助他和当地人的交流。在中长期计划中,产品功能还包括:1. 自动语言识别在前期的计划中,用户可以通过语言设定来选择特定语种的识别和翻译。在长期计划中,我们的产品将提供针对语言类型的自动识别功能,即通过获取的图像或视频,自动识别该文字的语言类别
17、,并提供相应的翻译。这样,用户不再需要进行语言设定。在用户经常穿梭于多种语言环境之间的情况下,这一功能将给用户提供方便。2. 自动图像理解在未来的研发计划中,我们的产品还将针对用户所拍摄的场景视频进行搜索匹配,并从互联网上自动获得相关信息。例如,一名日本游客来到罗马斗兽场,仅需拍下斗兽场的照片或者视频,我们的产品将自动在互联网上进行搜索匹配,并抓取相关的信息,例如历史、规模、建筑规划等。综上所述,我们的产品主要面向爱好旅游的客户和经常进行商务旅行的客户,适合用于帮助客户解决跨国旅行中的语言障碍问题,并结合手机强大的相机拍摄、信息处理和无线上网功能,给用户提供一体化的旅行翻译及信息服务。(二)
18、产品前期开发研究进展情况目前公司已自主开发多语种的印刷体识别系统,运用语言模型和词典匹配对识别结果进行自动更正。公司在主流手持设备芯片组上开发高度优化的系统,从而使我们的产品与同类产品相比具有成本低、节能等多方面的优势。(三) 对产品未来发展方向的预测在加大研发力度的前提下,公司产品将朝多元化、多功能化和更好的用户体验方向发展,同时针对不同的客户,公司将开发功能、效果和服务有区别的产品。具体而言,公司产品预计在3-5年内在技术领域,应用领域和市场领域会有如下发展:1. 技术领域方面在研发初期阶段,产品是基于静止图像的翻译系统,且需要移动设备用户的协作(例如,用户帮助定位文字在图像中的位置);在
19、中期阶段公司将研发基于实时视觉信息的翻译系统,开发自动文字跟踪技术、自动文字分割技术和自动翻译技术;而公司的远期研发目标则是开发能够让用户随时随地随心所欲地拍摄且获得翻译结果或者相关信息的产品。2. 应用领域方面在研发的初期阶段,公司的产品将主要面向主流智能手机,向手机生产厂商提供解决方案。在中期阶段,公司将扩展产品应用范围,面向市场上流行的所有计算能力强且拥有高分辨率摄像功能的手机。在中期或者后期阶段,公司将研发面向不同手持移动设备的产品,例如,PDA,数字摄像机,MP3等等。3. 市场领域方面针对不同的客户,我们将开发具有不同功能的产品,并收取不同的费用。例如,一个经常去日本出差的客户只需
20、要日汉或者汉日的翻译系统;而一个经常在世界各地出差的客户很可能就需要安装产品的多语言扩展包。公司根据目标客户的需求,将研制不同的产品来满足不同客户的要求。第三章 技术术来源及前景本章主要介绍公司产品所采用的三个技术模块,并与国内外类似产品相比较,讨论公司产品的优缺点。最后,我们列出公司未来5年内的研发计划以及资金投入状况。(一) 产品技术范围本产品采用多种高科技技术,实行模块化无缝连接。产品所包含的主要技术包括在视频和图像中文字分割和切分、视频中自动追踪文字信息、光学字符识别、基于统计语言模型的自动纠错、多语言翻译等等;另外由于本产品基于我们对手持设备芯片组硬件细节的深入了解来实现,高效率、低
21、功耗也是本产品的创新点。本产品还具有可持续发展性强,可扩展性强,后续研发目标明确,前景明朗等特点。目前公司已自主开发出多语种的印刷体识别,运用语言模型和词典匹配对识别结果进行自动更正的旅行翻译系统。自动语言识别,自动图像分析和理解等技术将是公司的中长期目标。(二) 国内外同行业产品由于本产品有着广阔的市场前景,目前国内外一些著名研究机构和公司也在研发类似功能的产品。其中具有代表性的是富士通,思根科技,谷歌和诺基亚。1. 富士通研究开发中心:其产品主要采用手机翻译技术,利用带有拍照功能的手机对餐厅菜单进行识别,将中文翻译成日语。过程首先是对拍照内容的识别,然后和菜单数据库中的信息进行匹配,并根据
22、反馈进行翻译。在图像处理方面对照片由于角度等问题画面会出现偏斜、构图比例失调、曝光过度或不足等问题进行自动调整。2. 思根科技:研发“嵌入式手机中/英/欧文名片识别及文本识别技术”,其主要功能是对名片的识别并存储。该产品具有嵌入式、小内核、多语种、拍照图像识别等多项特点。所采用的技术包括嵌入式、多语种、手指定位技术、名片识别技术、 图像拼合技术、汉字分词技术,但不提供翻译功能。3. Google Goggle:Google Goggle是谷歌推出的一款图像搜索工具,利用手机摄像头拍摄当地地标建筑、书籍封面、艺术作品、酒类标签以及产品商标等物体的照片后,软件自动在google上搜索相关信息,并予
23、以识别显示。该软件也可以通过GPS搜索附近区域的商业点,还能够自动记录名片的所有信息。4. 诺基亚 shoot-to-translate: 用户利用诺基亚照相手机拍摄任何物体表面上的文字后,安装于该手机上的即时翻译应用程序通过光学字符识别技术进行文字的自动抽取和识别,并借助语言处理技术将其翻译成另外一种语言。目前该产品只支持中文到英文的翻译处理。(三) 本产品与同行业产品的技术比较与上述产品相比,我们的产品在技术方面有如下几个特点:1. 本产品是基于实时视觉信息的上述同类产品都是基于静止图像的。这种解决方案在文字分布较广的情况下有可能无法在图像中获取正确的文字信息,从而导致翻译功能失效。例如,
24、世界著名的博物馆卢浮宫馆藏着许多巨幅油画,而在油画下方法语注释文字通常宽度很大。如果用户想用基于静止图像的手持设备拍照翻译技术对法语注释文字进行翻译,他需要站在较远的地方拍照,这样才能保证所拍摄的照片覆盖所有的文字信息。但是这必然使得照片中文字的分辨率降低,从而导致文本分割精度降低和OCR模块识别率降低。此外,在某些空间比较狭小,或者游人较多的情况下,用户很可能无法获得足够的距离来覆盖所有的文字信息。另一方面,如果用户站在离目标较近的地方拍摄照片,以期获得较高的文字分辨率,但是由于没有覆盖所有的文字信息,OCR识别出的是单独的字符或者单词,而不是完整的句子。这样就无法采用统计语言模型纠错技术,
25、从而导致后续的翻译模块有较大的偏差。相反地,本产品可以很好地解决这个问题:本产品是基于实时视觉信息的。用户可以在较近的距离用手机摄像功能来扫描宽度较大的文字信息,相应地系统获取到一个视频流。系统对视频流中的文字信息进行检测、追踪、拼接,识别并纠错,得到语义上完整的句子或者段落,大幅度提高翻译模块的准确度和可懂度。2. 本产品与手持设备芯片组硬件细节关系非常密切,被仿制难度大公司将针对各类手持设备芯片组的硬件特征来实现某些复杂算法。移动设备操作系统有存储空间较小,运算能力相对较低的特点,因此,本团队从算法到芯片细节的知识整合将成为本产品高效率、低功耗特征的最大支撑点。公司针对性地研发关键技术,大
26、幅度降低所需算法的计算量。同时,本产品的部分功能将针对不同手持设备芯片组的硬件细节做专门优化。比如,在某些含移动GPU的芯片组中,部分算法将使用GPU来加速;而在一些包含了媒体加速器的芯片组中,核心算法将针对媒体加速器的种类和特征进行重新调整。这不仅提高了计算速度,同时也很好地降低被仿制的危险,保护知识产权。由于各芯片组细节往往相差较大,简单复制破解的方法将无法移植本产品。另一方面,本产品开发融合了从算法到芯片体系结构的大量知识,很难在短时间内被复制者吃透。3. 本产品在技术上采用双重语言模型纠错实时的视觉信息提供了实现双重语言模型纠错的可能性。语言模型在本产品中占据很重要的地位。它对OCR的
27、识别错误进行纠正,是提高翻译模块准确率的有力保证。双重语言模型纠错包含两个步骤,第一个步骤是在词层,即通过对识别结果和字典里的词匹配,使用动态规划算法纠正某些识别错误的字母。第二个是在句层,即通过统计语言模型,计算识别出来的单词组成语义上完整句子的概率,对可能出现的某些识别错误的单词再次纠错。这种双重纠错的模式将极大地降低在OCR阶段出现字母或者单词识别错误。另外完善的语言模型也有利于提高翻译模块的准确率。4. 本产品具有更好的用户体验由于本产品是基于实时视觉信息的,用户可以随时随地随心所欲地享受本产品提供的便捷服务,而不用刻意地调整照片大小和距离远近,极大地方便了用户。此外,除了手机外,本公
28、司还拟研发基于其他手持设备的产品线,可以用于数字摄像机、装了摄像头的MP3、PDA、导航仪等等。本产品相对于竞争对手的产品也具有一定的劣势。例如,Google goggle依托于谷歌自身的产品,相对较容易地在该公司的平台上进行二次开发,并与该公司其他功能对接。另外几家公司分别在图像或者OCR或者嵌入式系统的开发研究中具有相当经验,占有一定的优势。但是正如上文指出的,目前所有的同类产品都是基于静止图像的;基于移动视频技术的产品研发还未开始。随着移动设备摄像技术的成熟,视频分辨率的提高,我们的产品性能也将稳步上升。基于实时视频的旅行翻译系统能够给予用户更好的旅行体验,所以必将占领这部分市场。(四)
29、 公司的技术路线、关键技术、技术发展规划的介绍公司将研发具有自主产权的关键技术。这些关键技术包括:视频和图像中文本切分、自动追踪文字信息、光学字符识别、自动纠错、统计语言模型、自动翻译等等。其产品流程如图1所示。这些关键技术可以结合成三大模块,也就是,视频分析模块、光学字符识别模块和机器翻译模块。视频分析模块的主要功能是文字分割,即在视频流中分离文字信息与别的背景噪音,并用于后续的模块。为了提高文字分割的准确性,视频前端处理,包括图像增强和图像拼接,是必须的。图像增强是针对视频抖动、偏斜、光线不足等问题进行纠正;而图像拼接是通过理解视频拍摄移动方向构建语义完整的句子或段落。光学字符识别模块是将
30、视频流里的文字信息转换成文本,并通过字典查询和统计语言模型对识别出的文本进行纠错。机器翻译模块是将识别出的文本信息从源语言翻译成目标语言。在产品研发的初期阶段,用户需要指定源语言和目标语言,产品将识别出的文本翻译到目标语言;在后期开发阶段,我们将开发自动语言识别功能,自动识别出源语言。将源语言翻译成目标语言后,将翻译结果输出,并根据需要,通过互联网查询相关信息。(五) 公司未来5年研发资金投入和人员投入计划公司在成立初期(1-2年间)将大部分资源和资金都投放在研发上,在中期(3-5年)则研发与市场营销并进。在中期目标达到后,我们将评估公司业绩,以决定未来的走向。5年内的研发资金投入和人员投入计
31、划如表1所示。包含文字的图像文本信息源语言识别,用户指定目标语言用户指定源语言和目标语言输出翻译结果,并搜索互联网,得到相关信息1. 视频解码2. 图像增强3. 图像拼接4. 文字检测5. 文字分割1. 字体匹配2. 字符识别3. 词层纠错4. 句层纠错视频分析模块用户拍摄视频光学字符识别机器翻译模块视频分析模块字符识别模块机器翻译模块图1:产品技术流程表1:公司未来5年研发计划年限研发项目目标资金人员投入第一年(1) 视频解码(硬件实现),1人(2) 图像拼接,2人(3) OCR(双重纠错,软件实现),2-3人(4) 使用已有的翻译器(例如google 翻译)来实现英译汉,1人在某种移动设备
32、上(例如手机)软件实现基于静止图像的英汉(或者日汉)旅行翻译系统V1.0。文字分割部分由用户划定框范围来分割;翻译部分由字典或者互联网翻译器完成。200万6-7人第二年(1)图像和视频中文字检测和分割,2-3人(2) 图像增强,1人(3) OCR多字体多语言,2人(4) OCR在嵌入式系统上的实现,1人(5) 翻译系统的研究和开发,2人对V1.0系统进行扩展,初步与手机中芯片对接。初步在视频中自动检测限定语言的文字。实现V2.0系统。100万8-9人第三年(1) 文字检测和分割,2人(2) OCR多字体多语言,4人(3) OCR的多语言(加统计语言模型)在嵌入式系统上的实现,2人(4) 多语言
33、翻译系统的研究和开发,4人(5) 最新视频格式的处理,1人(6) 考虑相关信息模块,1人(7) 其他移动设备的扩展,1人在手机上完全实现英汉(或者日汉)旅行翻译系统V3.0。视频流中自动检测文字移动、分割和拼接。100万15人第四年(1) 文字检测和分割,2人(2) OCR多字体多语言,4人(3) OCR的多语言(加统计语言模型)在嵌入式系统上的实现,4人(4) 翻译系统的研发,4人(5) 最新视频格式的处理,1人在手机上完全实现英汉(或者日汉)旅行翻译系统V4.0,融合信息搜索模块。初步实现多语言旅行翻译系统。初步实现在其他移动设备上的系统开发。50万15人第五年(1)OCR多字体多语言,4
34、人(2)自动语言识别的研发,2人(3) 翻译系统的研发,4人(4) 系统维护和后续开发,4人在多种手持设备上实现多语言旅行翻译和查询系统V5.0,并进一步研究翻译系统和自动语言识别,以期后续发展。0万14人第四章 市场及行业分析本章主要介绍公司产品所面向的市场,并分析我们的产品在市场中所占据的位置。为了提高我们的产品竞争力,我们提出产品升级、投放广告和合作经营三大策略。同时,为了应对瞬息万变的市场,我们认为公司将以市场为导向,以技术为核心,灵活地应对市场的变化。(一) 国内外市场情况 1. 出境旅行业务的发展随着社会的发展,旅游业已成为全球经济中发展势头最强劲和规模最大的产业之一。在中国,出境
35、旅游已经成为国民的一种新时尚。仅上海市为例,2009年组织出境旅游85.8万人次,较上年增长16.31%,净增12.2万人。其中出国游63.9万人次,增长14.92%,净增8.5 万人次。另外还有其他出国方式使得大量国人走出国门,例如 (1)公务/商务旅行;(2) 出国留学;(3) 海外就业等等。这些出国的朋友大都不同程度地存在对即时语言翻译的应用需求。这些数量庞大而且规模不断上升的出国人群构成了我们潜在的终端用户市场。 2. 手持移动设备的发展随着信息技术的迅猛发展,越来越多功能强大的手持设备出现,例如手机、卡片相机、MP3 和MP4等, 而且出货量巨大, 产业链环节众多。 仅以手机为例,市
36、场调研机构Informa表示,全球手机用户数于2007年11月达到33亿,为全球人口数量的一半。移动世界分析师John Tysoe预测,全球手机用户总数将在2010年7月份的第一周超过50亿,约占全球人口总数73%。泰索还预测,到2014年全球68亿人口将平均每人拥有一部手机。另据思科公司预测,到2013年,全球移动通信数据量中的64是视频信息。手持设备运营商是我们的直接用户, 所以快速发展和激烈竞争的手持设备市场为本公司的产品开发提供了良好的契机。3. 手机摄像头手机产品将是我们研发初期所面向的主要移动设备。目前大量手机都提供摄像服务。根据Strategy Analytics统计,2006年
37、全球摄像手机出货量已超过5亿部。Strategy Analytics还预测,到2011年带摄像头手机的全球市场规模将超过1200亿美元。而且伴随3G终端性能的持续增强,手机已逐渐成为一种“智能终端”,手机摄像头可以采集实时图像、视频,并发送至平台进行处理、存储、比对。基于庞大的潜在终端用户群,手持设备运营商的激烈竞争,以及手机摄像头的日益普及和逐渐强大的视频处理功能,这种通过手持设备视频采集提供翻译服务技术存在巨大的潜在市场和商业价值。 (二) 国内外主要竞争对手的比较手持移动设备上的翻译软件根据输入方式的不同可以分成两大类。第一大类是目前在市场上占据统治地位的基于手工输入的翻译软件。提供商包
38、括各大手机厂商、有道、金山词霸等。这种软件的特点是简单易用。但是手工输入需要翻译的文字,费时费力。此外在很多情况下手动文字输入并不容易实现。例如,用户若不通晓日文,就无法手工输入日文文字。因此用户迫切希望能有更方便快捷的翻译系统。第二大类就是本产品所采用的基于静止图像或者移动视频的翻译系统。这种系统可以给用户更大的自由度和更好的用户体验。与目前还尚处于研发阶段的同类产品相比,我们的产品面向的市场和受众群体不同:1. 富士通研究开发中心研发的手机翻译技术,可以在带有拍照功能的手机上对菜单进行识别,将中文翻译为日语。该类产品仅限于中文和日文的翻译,并且面向餐饮业的菜单识别。其产品目前尚处于研发阶段
39、,还没有进入市场。2. 厦门思根科技有限公司研制的 “嵌入式手机中/英/欧文名片识别及文本识别技术”。该技术已经在TCL今年推出的 E787手机上得到应用。该产品将是本产品在市场上的竞争对手,但是目前该产品仅限于名片识别,和我们的市场定位存在较大区别。3. 谷歌2010年6月6日发布了语言翻译软件Goggles,该软件专为Android操作系统的智能手机设计。由于谷歌强大的技术优势,该产品将会是本产品的主要竞争对手。与Goggles相比较,我们的产品具有以下特点:(1) 目前goggles的目标翻译语言仅为欧美语言,不包括中文;而本产品支持中文与主要外语的互译,无特定的操作系统要求,从而能满足
40、我们在国内市场中主要目标用户对中文翻译的需求; (2) 可以与手机芯片结合,提供高效、低功耗的硬件实现方案,不易被仿制,有利于保护知识产权;(3) 本产品主要针对视频中的文字进行处理,而不限于静止图像。 因此尽管面对激烈的竞争,我们的产品还是有很强的竞争力。4. 诺基亚利用已有的multi-scanner 功能可以读取名片,扫描文档,并在诺基亚的E66和E71机型中已经实现。诺基亚正在开发命名为Shoot-to-Translate的同类产品。诺基亚可以视为本公司的潜在对手,同时作为手机生产商,诺基亚也有可能成为本公司的合作伙伴。 (三) 为提高竞争力拟采取的措施及竞争策略 1. 对产品进行相应
41、的技术升级。在文字识别和翻译方面,我们将进一步扩大适用语言的种类,以进一步扩大用户群。我们将不仅限于英语、中文、法语等大语种方面的服务,而且还会针对一些其他语种如韩语、阿拉伯语、西班牙语等进行产品开发和市场开拓,以适应旅游业的全球化。此外, 我们的产品将在降低成本、节约能耗方面进一步扩大我们的优势,提升我们在此方面的技术壁垒。我们将进一步优化开发过程,节约产品能耗,降低开发成本,并且提高开发效率,缩短开发周期,以期在产品拓展中期扩大我们的技术优势和市场份额。2. 适当地投入广告,推销本产品。3. 与手机生产商、旅游公司以及互联网公司进行战略合作。进一步增加与无线互联网的互动,更多地利用网络资源
42、给用户提供更多的旅行资讯。目前的互联网上已经有海量的旅行资讯,而不仅限于餐馆、旅馆等信息,如运动、娱乐、商务等各方面的信息。我们未来的产品将进一步拓展在综合信息方面的服务,加强用户对互联网的体验。同时,用户还可以更多地与互联网进行交互,即用户可更多地进行上传、信息共享与信息传播。增加用户全方位的体检,实现本产品与语音、上网、交友等服务的无缝连接。 (四) 产品/服务的市场分析 作为本产品的直接客户,手持设备运营商,如诺基亚、摩托罗拉、索爱、中兴、阿尔卡特、NEC 等,由于竞争的需要,争相推出各种各样的应用功能。这不仅是探索新盈利方式的需要,也是自身生存所必须的选择。应用程序数量是否足够、如何激
43、发用户消费热情以及产业链如何协同作战等是手持设备运营商所面临的几大问题。而本产品的研制开发满足激烈竞争中的手机运营商的需要。同时由于本产品采用了高科技识别模块,并有相应的硬件或芯片组,有很高的技术壁垒,使得本产品很难被仿制,这也将引起众多手持设备运营商极大的兴趣。 (五) 公司对市场变化的应对策略面对瞬息万变的市场,公司将以市场为导向,以技术为核心,灵活地应对市场的变化。对公司影响比较大的就是手机市场和旅行市场。目前随着金融危机的淡去,经济形势的回暖,手机市场上对应用功能的需求激增,所以本公司获得融资之后,将会迅速投入产品开发,占据市场;如果遇到市场疲软的情况,本公司将会调整战略,整合资源,寻
44、求合作,进行技术升级,积极寻找其他商业机会。 第五章 营销策略本章将介绍产品的目标客户及销售渠道,所采用的营销模型,以及如何为不同的客户寻找不同的市场定位,开发性能有差别的产品。(一) 目标客户与渠道由于手持设备的种类繁多,出货量巨大,产业链环节众多,本公司的产品有着极其广泛的目标客户群,包括手持设备整机生产商, 手持设备方案提供商以及手持设备芯片提供商。1. 手持设备整机生产商。此类客户从各种渠道采购或开发零部件以及软件系统,完成系统整合,直接向最终用户提供手持设备整机:(1) 手机生产商,例如诺基亚、索尼-爱立信、三星,LG、苹果、MT、多普达、黑莓等。(2) 卡片相机生产商,例如华旗、佳
45、能、柯达、索尼等。(3) MP3,MP4以及MID生产商,如苹果、Aigo、Unis、Onda、Oppo等。2. 手持设备方案提供商。此类客户向整机生产厂商提供全部或部分硬件以及软件解决方案,而不向最终用户提供手持设备整机。典型代表有Wingtech、 Longcheer、Eidolon、Hexing、Sigmatel、Huaqin、CKT、Kong Profit、Spreadtone、Prowave等。3. 手持设备芯片提供商。传统的手持设备芯片提供商主要向整机生产厂商以及方案商提供芯片。但是,今年以来崛起的一批手持设备芯片提供商逐渐开始自己整合产业链,进一步在自己提供芯片的基础上提供优化的
46、软件解决方案。4. 芯片组提供商。此类客户提供包含射频、基带等在内的整个芯片组,例如MTK、ST-Ericson、TI等。5. 应用处理器提供商。此类客户仅仅提供应用处理器,应用处理器内部可能包含单独的DSP。例如瑞芯微、君正等。我公司将针对上述各类客户分别设定销售方案,配置销售队伍。(二) 营销模型本公司的销售收入包括两部分:1. 开发服务收入:指的是本公司为手持设备整机生产商、手持设备方案提供商、手持设备芯片提供商的某一款整机、某一款方案或者某一芯片组定制产品的开发服务费用。该部分费用仅收取一次。2. 后期版税收入:指的是本公司完成初期开发服务,产品由客户推向市场后,针对每一款客户销售机器所收取的费用。该部分费用在客户的产品未退市之前一直按出货量收取。此概念在图2中可以清楚地看到。目标客户按照营销模式分为三类:类别1不能承受太高的初期开发服务费用,则版税数额做相应提高;类别2则相反,对初期开发服务费用不敏感而对版税数额要求较高;类别3介于上述二者之间。对于单个产品出货量存在风险的客户属于类别3;单个产品出货量极大属于类别2。单个产品出货量