今日访问量:141,总访问量:905449
     
 
当前位置:首页 - 机构风采 - 详细信息
2016年优秀工程中心选编—北京市数字内容工程技术研究中心
来源:    日期:2017-09-26

北京市数字内容工程技术研究中心(以下简称中心),依托中国科学院自动化研究所建设,重点发展基于内容识别与理解的高端知识服务和人机交互技术,致力于用智能技术引领行业发展,为中国数字内容产业提供前瞻性和引领性的关键核心技术和系统整体解决方案,促进数字内容与文化创意领域的基础研究成果向产业应用的转化。

经过多年技术深耕,中心在面向网络安全和民用的语音语言处理、移动互联网口语翻译、大规模人群口语评测、广播电视大数据分析监管、数字版权服务、数字演绎、智能医疗等领域开展了大量的研究和成果转化工作,成绩显著。承担了包括国家重点基础研究规划973项目、国家高技术计划863项目、国家科技支撑计划项目、国家基金委重大、重点项目、国家重点专项等多项国家和省部级重点工程技术研发工作,拥有扎实的科研积累和研究成果。同时,贯彻国家产学研工作指导思想,中心在联合实验室建设和院地合作基地建设方面开展多项工作,公共技术平台对外开放,充分整合资源,加强与企业、地方在技术研发和成果产业化上的合作。

中心注重对科研成果的知识产权保护工作,已授权专利和登记软件著作权60多项,在国际国内著名专业期刊和国际会议上发表数字内容与系统相关技术领域论文数百篇,并参与国家标准《中文语音识别通用技术规范》、《数字家庭服务资源分类与代码》、《电子商务交易产品信息描述家居产品》、《信用标准化总体架构》等起草工作,主持撰写了《中国数字媒体技术发展白皮书》。

中心现有固定职工45人,包括研究员4人,副研究员12人,科研骨干均具有博士学位。目前中心在读博士研究生35人,硕士研究生20人。中心贯彻国家人才强国战略,重视科研队伍建设和人才培养工作,面向国家和行业需求,已发展成为一支由中青年骨干科研人员为核心,博士、硕士研究生集体参与的多层次复合型技术研发团队,是目前国内在数字内容处理领域最著名的研究团队之一。
     中心以自身扎实的科研基础积极投身于支撑国家科研建设工作,不断积累原始创新,在领域内形成良好科研声誉。包括国家科技进步二等奖1项、新闻出版标准化先进单位奖1项,数字版权保护技术研发工程先进单位奖1项、王选新闻科学技术奖一等奖2项、国家广播电影电视总局高新技术研究与开发奖二等奖2项,文化部科技进步三等奖1项,最佳论文3项,中科院自然科学二等奖1项等荣誉。


图1.获奖证书

中心代表性成果如下:

1)语音识别/说话人识别/语种分类/关键语音检索技术与系统

成果简介:系统将语音信息智能处理技术(说话人识别/语种分类/关键语音检索等)运用到话音的处理与分析中,实现了鲁棒的、快速、高效的语音智能处理系统。系统具有如下技术特点:该系统在全面分析语音中噪音、说话人切换、话音分布情况的基础上,对话音部分进行综合处理;有效地从海量数据中检出关心的多目标语种或者方言,从而大大提高对特定语种数据排查能力和分类能力;有效地从海量数据中检出关心的多目标说话人的语音,从而大大提高对敏感目标人排查能力和过滤能力;有效地从海量数据中检索出用户关心的多个关键词的语音,从而发现感兴趣的相关话音内容。

产业应用:系统具有很高的实用价值,可广泛适用于各种类型语音的身份识别与关键内容识别,相关产品在多次产品技术评测中取得第一名的成绩,产品的应用性能得到各用户单位的广泛好评。

2)基于云计算的移动互联网口语翻译系统

成果简介:实现无障碍的跨语言沟通一直是机器翻译追求的目标。在口语交流的场合,比如旅游观光、对外交流和商务谈判等,这方面的需求尤其迫切。中心研发团队在多年的语音识别和机器翻译技术积累基础上,持续研究基于海量数据和云计算平台的口语翻译核心技术,推出了移动终端上的实用化口语翻译系统。系统可以安装运行在安卓、iOS等操作系统的智能手机或平板电脑上,使用者通过3G或者无线局域网访问口语翻译的云计算中心,能够随时随地获得口语在线翻译服务。在强大的云计算集群和高速网络连接的支持下,整个口语翻译交互过程在数秒钟之内就能完成,识别和翻译结果均能达到可用的水平,为用户带来了非常便捷和高效的使用体验。

产业应用:目前,口语翻译系统上线用户数已达初步规模,形成了技术、服务滚动发展的良性局面。随着用户使用频率的增加,云计算后台也会逐步改进和完善,为用户更加个性化的和更准确的翻译服务。

3)智能电视口语人机交互技术

成果简介:随着三C融合、信息消费、4G时代的日益成熟,智能电视作为网络浪潮冲击下形成的新产品,已经日益成为电视的潮流趋势,其市场发展空间相当巨大。同时,如何冲破传统电视遥控器的控制壁垒,打造最好的用户体验,也成为智能电视生态圈关注的重点。基于多年语音语言处理和理解技术积累,中心研发团队持续研究人机交互技术,推出了智能电视口语人机交互系统。该技术整合国际领先的语音识别、语音合成和自然语言理解技术,可以为用户提供快速、精准、便捷的电视互动体验。

产业应用:该技术已经成功应用于国内某著名电视厂商的产品中。目前可以为电视厂商和开发者的提供完整的智能口语人机交互的整体解决方案,根据用户需求,解决实际语音交互环节的关键问题。

4)广电/互联网媒体内容监测监控系统

成果简介:在广播电视的媒体内容监测中,主要任务集中在对广告、新闻舆情、节目和频道的监管等,对互联网的媒体内容进行监控则主要任务集中在对互联网上的传统视听节目、P2P视听内容、播客、手机电视、文本舆情的监管等。在上述两种监管中,传统上以人工为主的监测方式,不仅劳动强度大、工作效率低,而且主观差错率较高,已不能满足日益凸现的广电与互联网媒体内容的监测需求,迫切要求引入基于计算机自动视音频智能处理的内容监测与监控技术。中心研发团队将视音频智能处理技术运用到广电/互联网媒体内容监测监控中,研究开发了广告监测、新闻内容监测、新闻专题监测、频道节目监测、互联网视听节目监控、P2P视听内容监控、互联网舆情监测等多个子系统,实现了对广电和互联网媒体内容的全面监测与监控。

产业应用:随着国家对广播电视和互联网媒体内容监管力度的不断加强,各地广电或互联网监管部门今后都将应用相似系统,这为本系统的推广应用提供了广阔的市场空间,而本系统所独创的内容监测与监控模式,将为系统的市场推广应用提供不可比拟的市场竞争力。

5)海量媒体智能处理、编目与搜索系统

成果简介:中心研发团队应用计算机智能音视频信息处理技术开发了海量媒体智能处理、编目与搜索系统,实现为海量音视频内容的互动性视频点播和个性化内容服务提供多媒体自动编目和检索功能。开发的海量媒体智能处理、编目与搜索系统将音视频智能处理技术综合应用于各类音视频的结构化和内容编目,并提供基于文本和音视频样例的多媒体检索。

产业应用:数字音视频内容消费领域,针对网络融合及智能终端不断普及的新时期,实现海量性、分散化和个性化音视频内容的结构化、编目和检索。解决现有人工处理方式效率低,且大量珍贵视频无法再利用的问题。

6)数字版权保护技术

研究简介:国家数字版权保护技术研发工程是列入国家十一五”“十二五文化发展规划纲要的重大科技专项。中心的研发团队负责和参与了国家专项工程5个分包的建设工作,包括系统总体集成富媒体报刊版权保护技术与系统开发及应用示范工程技术标准研究网络侵权追踪平台开发工程管控

产业应用:国家数字版权保护技术研发工程已整体通过验收,面向新闻出版全行业推广,中心研发团队在工程建设过程积累的技术成果和管理经验适用于新闻出版行业需求,也可以辐射到其延伸产业。

7)数字演绎技术

成果简介:当前,混合现实技术在舞美、展陈等文化创意领域的应用正日益普遍。数字演绎技术是一项重点将数字演员、数字场景和数字特效技术进行整合,可对一部作品实现全新的数字化演绎的新技术,通过全新的数字演绎为受众带来视觉、听觉和触觉上的冲击,不同于传统的游戏,也不同于传统的电影,而是一种融合游戏的互动性与电影画面的高质量的跨界技术。

产业应用:展览展示;文化休闲旅游;城市景观;文化基础设施;广播电视;演出团体;其他大型活动、集会、企业宣贯等。

8)基于虚拟现实的脊髓损伤康复训练并联机器人系统

成果简介:重点研究肌肉群训练模式的设计到机器人本体运动的映射、患者通过操纵虚拟环境实现对机器人的交互驱动、由患者生理EMG信号的变化引起虚拟环境的自适应调节,从而实现康复训练强度、频率等参数的自适应调整等内容。本成果的最大优点是通过虚拟现实软件模块实现的脑肌协同刺激,填补了02级肌力患者训练方法的空白,有效改善了传统ROM训练的关节活动度,促进患者康复。此外,利用本产品还可增强血液循环,促进肠蠕动,清除下肢水肿,增强肌力,借助后处理模块可对训练过程进行分析并出示报告,从而增强康复患者信心。

产业应用:成果产品适用于脑损伤、脑卒中、脑瘫、中风、偏瘫、脊髓损伤、帕金森、多发性硬化、阿尔茨海默症、骨质疏松患者、心血管康复患者平衡和行走能力的被动训练、助力训练和主动训练。

93D互联网媒体信息服务技术

成果简介:系统在互联网平台上实现了3D混合媒体内容的全流程制作、存储、搜索、修改、渲染、发布、分布式共享和实时交互,媒体内容涵盖音频、视频和3D图形。各环节基于虚拟化应用技术部署,用户无需安装操作,所有环节均在浏览器中完成。分布式共享3D环境中集成了视觉、听觉和触觉交互手段,能够为使用者带来身临其境的体验。